Miért nem szabad a tudósok legalábbis most támaszkodniuk az AI-re a tudományos felfedezésekhez

A tudományos adatok környezetében élünk, a környező környezetbenóriási genetikai információk, orvosi képalkotás és csillagászati megfigyelési adatok. A gépi tanulási algoritmusok jelenlegi képességei a lehető leggyorsabban lehetővé teszik a mesterséges intelligenciát, és ugyanakkor nagyon alaposan tanulmányozzák ezeket az adatokat, gyakran megnyitva az ajtót potenciálisan új tudományos felfedezésekhez. Nem szabad azonban vakon bízni az AI által végzett tudományos kutatások eredményében, mondta a Rice Geneverera Allen Egyetem kutatási szakértője. Legalábbis nem a jelenlegi fejlesztés szintjén. A tudós szerint a probléma abban rejlik, hogy a modern AI rendszerek nem képesek kritikusan értékelni munkájuk eredményeit.

Allen szerint az AI rendszerek módszereket alkalmaznakgépi tanulás, azaz amikor a tanulás a hasonló feladatok sokaságának megoldása során folyik, és nem csak az új szabályok és utasítások bevezetésével és követésével, akkor egyes döntések megbízhatók. Pontosabban, teljesen lehetséges, hogy feladatokat rendeljünk az AI-hez a problémák megoldásában azokon a területeken, ahol a végeredményt maga a személy könnyen ellenőrizheti és elemezheti. Példaként említhetjük meg a holdkráterek számának számítását vagy a földrengés utáni ismételt utólagos ütések előrejelzését.

Azonban a bonyolultabb pontosság és hatékonyságAzok a algoritmusok, amelyeket nagyon nagy adat tömbök elemzésére használnak a korábban ismeretlen tényezők keresésére és azonosítására, vagy a különböző funkciók közötti kapcsolatok, „nehezebb tesztelni”, jegyzi meg Allen. Így az ilyen algoritmusok által kiválasztott adatok ellenőrzésének lehetetlensége téves tudományos következtetésekhez vezethet.

Vegyük például a pontos gyógyszertHatékony kezelési módszerek kidolgozása során a szakemberek elemzik a betegek metaadatait, próbálják megtalálni a hasonló genetikai jellemzőkkel rendelkező emberek bizonyos csoportjait. A genetikai adatok „szitálásához” tervezett egyes AI programok eredményességüket a hasonló prediszpozícióval rendelkező betegcsoportok, mint pl. Ezek azonban teljesen hatástalanok más ráktípusok, például kolorektális azonosítására. Minden algoritmus saját módon elemzi az adatokat, így az eredmények kombinálásakor gyakran lehet ellentmondás a betegminta besorolásában. Ez viszont azt jelenti, hogy a tudósok arra gondolnak, hogy melyik AI végül bízik.

Ezek az ellentmondások abból adódnak, hogyAz adatelemzési algoritmusokat úgy tervezték, hogy megfeleljenek ezekben az algoritmusokban meghatározott utasításoknak, amelyek nem hagynak helyet a határozatlanság és a bizonytalanság számára, Allen elmagyarázza.

„Ha a fürtözési algoritmus feladatát állítja behogy ilyen csoportokat találjon az adatbázisában, elvégzi a feladatot, és azt mondja, hogy az adott paraméterek szerint több csoportot talált. Mondd meg, hogy találjak három csoportot, háromat talál. Kérdezd meg négyet, négyet talál - jegyzi meg Allen.

"Valójában az igazi hatékonyságEgy ilyen AI-t akkor mutatnak be, amikor a program ily módon válaszolhat: „Tényleg úgy gondolom, hogy ez a betegcsoport megfelel a szükséges besorolásnak, azonban azoknál az embereknél, akiknek adataimat is ellenőriztem és összehasonlítottam, nem vagyok biztos benne” .

A tudósok nem szeretik a bizonytalanságot. A mérési bizonytalanságok meghatározására szolgáló hagyományos módszereket azonban azokban az esetekben dolgozták ki, amikor az adott hipotézis értékeléséhez speciálisan kiválasztott adatokat elemezni kell. Az adatbányászati AI programok egyáltalán nem működnek. Ezeket a programokat nem irányítja semmilyen irányadó ötlet, és egyszerűen elemzi az összegyűjtött adat tömböket semmilyen konkrét cél nélkül. Ezért az AI területén számos kutató, köztük az Allen is, új protokollokat dolgoz ki, amelyek lehetővé teszik az új generáció AI rendszereinek értékelését a felfedezéseik pontosságára és reprodukálhatóságára.

A kutató elmagyarázza, hogy az egyik új módszera mélységelemzés az újra mintavétel fogalmán alapul. Tegyük fel, hogy ha az AI rendszernek fontos felfedezése van, például olyan betegcsoportokat határoz meg, amelyek klinikailag fontosak a vizsgálathoz, akkor ezt a felfedezést más adatbázisokban kell megjeleníteni. Az AI-minta helyességének ellenőrzése érdekében új és nagy adatkészletek létrehozása nagyon drága a tudósok számára. Ezért Allan szerint lehetőség van olyan megközelítésre, amelyben "létező adatkészletet fognak használni, amelyben az információ véletlenszerűen összekeverhető oly módon, hogy egy teljesen új adatbázist utánozzon." És ha időről időre az AI képes lesz meghatározni azokat a jellemzőket, amelyek lehetővé teszik a kívánt besorolást, „ebben az esetben azt feltételezheti, hogy valóban igazi felfedezése van a kezedben” - tette hozzá Allan.

Iratkozzon fel a Yandex.Dzenre, hogy lépést tartson a tudomány és a technológia világának legújabb fejleményeivel.

Kapcsolódó cikkek