общ

Защо учените не трябва да разчитат на ИИ за научни открития, поне засега

Ние живеем в златния век на научните данни, обкръжаващиогромни запаси от генетична информация, медицински изображения и данни от астрономически наблюдения. Сегашните възможности на алгоритмите за машинно обучение позволяват възможно най-бързо изкуствен интелект и същевременно много внимателно проучване на тези данни, което често отваря вратата за потенциално нови научни открития. Въпреки това, ние не трябва сляпо да вярваме на резултатите от научните изследвания, проведени от AI, каза експертът по научни изследвания университет Rice Geneverera Allen. Поне не на сегашното ниво на развитие на тази технология. Според учения, проблемът се крие във факта, че модерните системи за изкуствен интелект нямат способността да оценяват критично резултатите от своята работа.

Според Алън, AI системи използват методимашинното обучение, т.е. когато обучението се осъществява в процеса на прилагане на решения на множество подобни задачи, а не само чрез въвеждане и следване на нови правила и инструкции, на някои решения може да се вярва. По-точно е възможно да се възложат задачи на ИИ при решаване на проблеми в областите, в които крайният резултат може лесно да бъде проверен и анализиран от самия човек. Например, вземете, да речем, преброяването на броя на кратерите на Луната или прогнозата за повтарящи се вторични трусове след земетресение.

Въпреки това, точността и ефективността на по-сложниАлгоритмите, които се използват за анализиране на много големи масиви от данни за търсене и идентифициране на неизвестни досега фактори или връзки между различни функции, са "по-трудни за тестване", отбелязва Алън. По този начин невъзможността за проверка на данните, избрани с такива алгоритми, може да доведе до погрешни научни заключения.

Вземете например точното лекарство, когатоРазработвайки ефективни лечебни методи, специалистите анализират метаданните на пациентите, опитвайки се да открият определени групи от хора със сходни генетични характеристики. Някои програми за ИИ, предназначени да „пресяват” генетични данни, показват тяхната ефективност чрез успешно идентифициране на групи пациенти с подобна предразположеност, като например развитие на рак на гърдата. Те обаче са напълно неефективни при идентифицирането на други видове рак, например колоректален. Всеки алгоритъм анализира данните по свой собствен начин, така че при комбиниране на резултатите често може да има конфликт в класификацията на пациента. Това на свой ред кара учените да мислят за това, което в крайна сметка ще има доверие в ИИ.

Тези противоречия произтичат от факта, чеАлгоритмите за анализ на данни са предназначени да отговарят на инструкциите, заложени в тези алгоритми, които не оставят място за нерешителност и несигурност, обяснява Алън.

„Ако зададете задача за алгоритъма за клъстеризиранеАко намерите такива групи във вашата база данни, той ще изпълни задачата и ще каже, че е намерил няколко групи според зададените параметри. Кажи ми да намеря три групи, той ще намери три. Помолете да намерите четири, той ще намери четири - коментира Алън.

"Всъщност реалната ефективностТакъв AI ще бъде демонстриран, когато програмата може да отговори по следния начин: „Наистина мисля, че тази група пациенти отговаря на изискваната класификация, обаче, в случая с тези хора, чиито данни също проверих и сравних, не съм съвсем сигурен“ ,

Учените не харесват несигурността. Въпреки това, традиционните методи за определяне на неопределеността на измерванията са разработени за случаите, когато е необходимо да се анализират данни, които са специално подбрани за оценка на определена хипотеза. Програмите за интелигентно извличане на данни не работят изобщо. Тези програми не се ръководят от каквато и да е водеща идея и просто анализират масивите от данни, събрани без конкретна цел. Затова сега много изследователи в областта на ИИ, включително самата Алън, разработват нови протоколи, които ще позволят на системите за АИ от новото поколение да оценят точността и възпроизводимостта на техните открития.

Изследователят обяснява, че един от новите методизадълбоченият анализ ще се основава на концепцията за повторно вземане на проби. Да речем, ако се предполага, че системата за изкуствен интелект прави важно откритие, например, тя дефинира групи от пациенти, които са клинично важни за изследването, тогава това откритие трябва да се покаже в други бази данни. Създаването на нови и големи набори от данни, за да се провери коректността на пробата за изкуствен интелект, е много скъпо за учените. Следователно, според Алън, е възможно да се използва подход, при който "ще се използва съществуващ набор от данни, в който информацията ще бъде смесена на случаен принцип по такъв начин, че да имитира напълно нова база данни." И ако от време на време ИИ ще може да определи характеристиките, които позволяват да се изпълни желаната класификация, "в този случай, можете да приемете, че имате наистина истинско откритие в ръцете си", добавя Алън.

Абонирайте се за нашия Yandex.Dzen, за да сте в крак с най-новите разработки от света на науката и технологиите.