Καθώς η τεχνητή νοημοσύνη συνεχίζει να εισχωρεί στον τομέα της υγειονομικής περίθαλψης, η υπόσχεσή της να διευρύνει την πρόσβαση και να μειώσει το κόστος αντιμετωπίζει ένα κρίσιμο εμπόδιο: Την αξιοπιστία. Σύμφωνα με νέα έκθεση της Microsoft Research, Health & Life Sciences, ακόμη και τα κορυφαία πολυτροπικά συστήματα ιατρικής τεχνητής νοημοσύνης εμφανίζουν ευπαθή συμπεριφορά υπό πίεση, θέτοντας σημαντικά ερωτήματα σχετικά με την κλινική τους ετοιμότητα.
Η πρόκληση της αξιόπιστης τεχνητής νοημοσύνης
Για να είναι αξιόπιστη η τεχνητή νοημοσύνη στον τομέα της υγειονομικής περίθαλψης, πρέπει να επιδεικνύει:
- ισχυρή απόδοση σε συνθήκες αβεβαιότητας,
- έγκυρη συλλογιστική, βασισμένη σε αποδεικτικά στοιχεία και
- ευθυγράμμιση με τις πραγματικές κλινικές ανάγκες.
Ωστόσο, πρόσφατα ευρήματα αποκαλύπτουν ότι πολλά κορυφαία ιατρικά μοντέλα τεχνητής νοημοσύνης δεν ανταποκρίνονται σε αυτές τις προσδοκίες. Οι δοκιμές αντοχής δείχνουν ότι τα συστήματα παράγουν συλλογιστική που φαίνεται εύλογη, αλλά είναι κατασκευασμένη, δημιουργώντας μια ψευδαίσθηση ετοιμότητας: Αναγνωρίζουν πρότυπα, αλλά δεν έχουν πραγματική ιατρική κατανόηση. Τα μοντέλα μπορούν να συσχετίσουν συμπτώματα που εμφανίζονται ταυτόχρονα με διαγνώσεις, χωρίς να ερμηνεύουν εικόνες ή κλινικά στοιχεία, οδηγώντας σε υψηλές βαθμολογίες σε τυπικές δοκιμές, αλλά σε χαμηλή απόδοση σε πραγματικά σενάρια. Η αβεβαιότητα, τα ελλιπή δεδομένα και οι μικρές αλλαγές στη μορφή των δεδομένων εισόδου μπορούν εύκολα να εκθέσουν αυτές τις αδυναμίες.
Τι έδειξαν τα τεστ αντοχής
Η μελέτη σχεδίασε δοκιμές αντοχής για να διερευνήσει τη σύντομη μάθηση, την ακρίβεια της συλλογιστικής και την εξάρτηση από κοινώς χρησιμοποιούμενα ιατρικά κριτήρια αναφοράς. Οι ερευνητές αφαίρεσαν σκόπιμα εικόνες, τροποποίησαν στοιχεία και πρόσθεσαν παραπλανητικές πληροφορίες, προκειμένου να μετρήσουν την ανθεκτικότητα του μοντέλου.
Τα αποτελέσματα έδειξαν ότι:
- Η αφαίρεση εικόνων προκάλεσε σημαντική μείωση της ακρίβειας στο σύνολο δεδομένων.
- Στο υποσύνολο που επιμελήθηκε κλινικός γιατρός, τα μοντέλα διατήρησαν κάποια ακρίβεια, αλλά η απόδοση παρέμεινε χαμηλή.
- Η τροποποίηση στοιχείων μείωσε επίσης την ακρίβεια των αποτελεσμάτων.
- Όταν οι εικόνες δεν ταίριαζαν σκόπιμα με τις πληροφορίες, η ακρίβεια κατέρρεε.
- Η γραμμική αλυσίδα σκέψης της Τεχνητής Νοημοσύνης συχνά μείωνε την ακρίβεια.
Συνοπτικά, οι έλεγχοι αποκάλυψαν ότι τα μοντέλα μπορούσαν να παράγουν σωστές απαντήσεις σε συνδυασμό, όμως, με ελαττωματική λογική και παραπλανητικές περιγραφές.
Η μελέτη τονίζει ότι οι υψηλές βαθμολογίες δεν ισοδυναμούν με κλινική ετοιμότητα, γι΄αυτό και συνιστούν συστηματικές δοκιμές αντοχής, ώστε να αξιολογείται η ανθεκτικότητα των συστημάτων υπό ποικίλες, ρεαλιστικές συνθήκες. Χωρίς αυτές, η τεχνητή νοημοσύνη στον τομέα της υγειονομικής περίθαλψης ενέχει τον κίνδυνο να παρέχει αναξιόπιστα αποτελέσματα. Η διασφάλιση της κλινικής ακρίβειας και της ασφάλειας των ασθενών θα απαιτήσει αυστηρές πρακτικές αξιολόγησης, ώστε η πρόοδος της τεχνητής νοημοσύνης να ευθυγραμμιστεί με τις πραγματικές ιατρικές ανάγκες.
Διαβάστε επίσης
Νοσοκομείο Λάρισας: Καινοτόμο «έξυπνο» σύστημα διαλογής με ΑΙ στα Επείγοντα
«Έξυπνο» στηθοσκόπιο ανιχνεύει σοβαρές καρδιακές παθήσεις σε δευτερόλεπτα