Γενικά

Γιατί οι επιστήμονες δεν πρέπει να βασίζονται σε AI για επιστημονικές ανακαλύψεις, τουλάχιστον για τώρα

Ζούμε στη χρυσή εποχή των επιστημονικών δεδομένων που περιβάλλουντεράστια αποθέματα γενετικής πληροφορίας, ιατρικής απεικόνισης και αστρονομικά δεδομένα παρατήρησης. Οι τρέχουσες δυνατότητες των αλγορίθμων μηχανικής μάθησης επιτρέπουν την τεχνητή νοημοσύνη όσο το δυνατόν γρηγορότερα και παράλληλα μελετά πολύ προσεκτικά αυτά τα στοιχεία, ανοίγοντας συχνά την πόρτα σε πιθανές νέες επιστημονικές ανακαλύψεις. Ωστόσο, δεν πρέπει να εμπιστευόμαστε τυφλά τα αποτελέσματα της επιστημονικής έρευνας που διεξάγεται από την AI, δήλωσε ο εμπειρογνώμονας της έρευνας Rice Geneverera Allen University. Τουλάχιστον όχι στο τρέχον επίπεδο ανάπτυξης αυτής της τεχνολογίας. Σύμφωνα με τον επιστήμονα, το πρόβλημα έγκειται στο γεγονός ότι τα σύγχρονα συστήματα AI δεν έχουν τη δυνατότητα να αξιολογήσουν κριτικά τα αποτελέσματα της δουλειάς τους.

Σύμφωνα με τον Allen, τα συστήματα AI χρησιμοποιούν μεθόδουςη μάθηση μηχανών, δηλαδή, όταν η εκμάθηση συμβαίνει στη διαδικασία εφαρμογής λύσεων σε ένα πλήθος παρόμοιων εργασιών και όχι μόνο με την εισαγωγή και τη συμμόρφωση με νέους κανόνες και οδηγίες, μπορεί να υπάρξει εμπιστοσύνη σε κάποιες αποφάσεις. Για να είμαστε πιο ακριβείς, είναι πολύ πιθανό να αναθέσουμε καθήκοντα στο AI στην επίλυση προβλημάτων σε εκείνους τους τομείς όπου το τελικό αποτέλεσμα μπορεί εύκολα να επαληθευτεί και να αναλυθεί από τον ίδιο τον άνθρωπο. Για παράδειγμα, πάρτε, ας πούμε, την καταμέτρηση του αριθμού των κρατήρων στο φεγγάρι ή την πρόβλεψη επαναλαμβανόμενων μετασεισμάτων μετά από σεισμό.

Ωστόσο, η ακρίβεια και η αποτελεσματικότητα των πιο σύνθετωνΟι αλγόριθμοι που χρησιμοποιούνται για την ανάλυση πολύ μεγάλων σειρών δεδομένων για την αναζήτηση και τον εντοπισμό παλαιότερων άγνωστων παραγόντων ή σχέσεων μεταξύ διαφορετικών λειτουργιών είναι "πιο δύσκολο να δοκιμαστούν", σημειώνει ο Allen. Έτσι, η αδυναμία επαλήθευσης των δεδομένων που επιλέγονται από τέτοιους αλγορίθμους μπορεί να οδηγήσει σε εσφαλμένα επιστημονικά συμπεράσματα.

Πάρτε για παράδειγμα το ακριβές φάρμακο όταν γιαΑναπτύσσοντας αποτελεσματικές μεθόδους θεραπείας, οι ειδικοί αναλύουν τα μεταδεδομένα των ασθενών, προσπαθώντας να βρουν ορισμένες ομάδες ατόμων με παρόμοια γενετικά χαρακτηριστικά. Ορισμένα προγράμματα AI που έχουν σχεδιαστεί για να «κοσκινίζουν» τα γενετικά δεδομένα δείχνουν την αποτελεσματικότητά τους επιτυχώς εντοπίζοντας ομάδες ασθενών με παρόμοια προδιάθεση, όπως η ανάπτυξη καρκίνου του μαστού. Ωστόσο, είναι εντελώς αναποτελεσματικοί στην αναγνώριση άλλων τύπων καρκίνου, για παράδειγμα, του ορθού. Κάθε αλγόριθμος αναλύει τα δεδομένα με τον δικό του τρόπο, οπότε όταν συνδυάζουμε τα αποτελέσματα, μπορεί συχνά να υπάρχει σύγκρουση στην ταξινόμηση του δείγματος ασθενούς. Αυτό με τη σειρά του κάνει τους επιστήμονες να σκεφτούν ποια AI θα τελικά εμπιστεύονται.

Αυτές οι αντιφάσεις προκύπτουν από το γεγονός ότιοι αλγόριθμοι ανάλυσης δεδομένων έχουν σχεδιαστεί για να συμμορφώνονται με τις οδηγίες που ορίζονται σε αυτούς τους αλγόριθμους, οι οποίες δεν αφήνουν περιθώρια αναποφασιστικότητας και αβεβαιότητας, εξηγεί ο Allen.

"Αν ορίσετε μια εργασία για τον αλγόριθμο ομαδοποίησηςΑν βρείτε αυτές τις ομάδες στη βάση δεδομένων σας, θα εκτελέσει την εργασία και θα πει ότι έχει βρει πολλές ομάδες σύμφωνα με τις συγκεκριμένες παραμέτρους. Πες μου να βρω τρεις ομάδες, θα βρει τρεις. Ζητήστε να βρείτε τέσσερα, θα βρει τέσσερα ", σχολιάζουν οι Allen.

"Στην πραγματικότητα, η πραγματική αποτελεσματικότηταΈνα τέτοιο AI θα αποδειχθεί όταν το πρόγραμμα μπορεί να ανταποκριθεί σε κάτι τέτοιο: «Πιστεύω πραγματικά ότι αυτή η ομάδα ασθενών ταιριάζει με την απαιτούμενη ταξινόμηση, ωστόσο, στην περίπτωση αυτών των ανθρώπων των οποίων τα δεδομένα έχω επίσης ελέγξει και συγκρίνει, δεν είμαι σίγουρος" .

Οι επιστήμονες δεν τους αρέσει η αβεβαιότητα. Ωστόσο, έχουν αναπτυχθεί παραδοσιακές μέθοδοι για τον προσδιορισμό των αβεβαιοτήτων μέτρησης για εκείνες τις περιπτώσεις, όταν απαιτείται ανάλυση των δεδομένων που έχουν επιλεγεί ειδικά για την αξιολόγηση συγκεκριμένης υπόθεσης. Τα προγράμματα AI για εξόρυξη δεδομένων δεν λειτουργούν καθόλου. Αυτά τα προγράμματα δεν οδηγούνται από καμία ιδέα καθοδήγησης και απλά αναλύουν τις συστοιχίες δεδομένων που συλλέγονται χωρίς συγκεκριμένο στόχο. Ως εκ τούτου, τώρα πολλοί ερευνητές στον τομέα του AI, συμπεριλαμβανομένης της ίδιας της Allen, αναπτύσσουν νέα πρωτόκολλα που θα επιτρέπουν στα συστήματα AI της νέας γενιάς να αξιολογούν την ακρίβεια και την αναπαραγωγικότητα των ανακαλύψεών τους.

Ο ερευνητής εξηγεί ότι μια από τις νέες μεθόδουςη διεξοδική ανάλυση θα βασιστεί στην έννοια της επαναδειγματοληψίας. Ας πούμε ότι εάν το σύστημα ΑΙ υποτίθεται ότι κάνει μια σημαντική ανακάλυψη, για παράδειγμα, ορίζει ομάδες ασθενών που είναι κλινικά σημαντικές για τη μελέτη, τότε αυτή η ανακάλυψη θα πρέπει να εμφανίζεται σε άλλες βάσεις δεδομένων. Η δημιουργία νέων και μεγάλων συνόλων δεδομένων για την επαλήθευση της ορθότητας του δείγματος ΑΙ είναι πολύ δαπανηρή για τους επιστήμονες. Ως εκ τούτου, σύμφωνα με τον Allan, είναι δυνατόν να χρησιμοποιηθεί μια προσέγγιση στην οποία θα χρησιμοποιηθεί ένα υπάρχον σύνολο δεδομένων, στο οποίο οι πληροφορίες θα αναμειχθούν τυχαία με τέτοιο τρόπο ώστε να μιμούνται μια εντελώς νέα βάση δεδομένων. Και αν από καιρό καιρό ο AI θα είναι σε θέση να προσδιορίσει τα χαρακτηριστικά που επιτρέπουν την πραγματοποίηση της επιθυμητής ταξινόμησης, "στην περίπτωση αυτή, μπορείτε να υποθέσετε ότι έχετε μια πραγματικά πραγματική ανακάλυψη στα χέρια σας", προσθέτει ο Allan.

Εγγραφείτε στο Yandex μας Dzen για να ενημερώνεστε για τις τελευταίες εξελίξεις από τον κόσμο της επιστήμης και της τεχνολογίας.