כללי

למה המדענים לא צריכים להסתמך על AI עבור תגליות מדעיות, לפחות לעת עתה

אנו חיים בעידן הזהב של נתונים מדעיים, המקיפים אותנומלאי ענק של מידע גנטי, תמונות רפואיות ותצפיות אסטרונומיות. היכולות הנוכחיות של אלגוריתמים של למידה ממוחשבת מאפשרות אינטליגנציה מלאכותית במהירות האפשרית ובאותה עת בוחנות היטב את הנתונים הללו, ולעתים קרובות פותחים את הדלת בפני תגליות מדעיות חדשות. עם זאת, אנחנו לא צריכים לסמוך באופן עיוור על תוצאות המחקר המדעי שנערך על ידי AI, אמר מומחה המחקר רייס Genvera אלן האוניברסיטה. לפחות לא ברמה הנוכחית של פיתוח של טכנולוגיה זו. לדברי המדען, הבעיה טמונה בעובדה מערכות מודרניות AI אין את היכולת להעריך באופן ביקורתי את התוצאות של עבודתם.

לדברי אלן, מערכות AI באמצעות שיטותכלומר, כאשר למידה מתרחשת בתהליך של יישום פתרונות למספר רב של משימות דומות, ולא רק על ידי החדרת הכללים וההוראות החדשים, ניתן לקבל החלטות מסוימות. כדי להיות מדויק יותר, זה בהחלט אפשרי להפקיד AI עם פתרון בעיות באזורים שבהם התוצאה הסופית ניתן לאמת בקלות ונותחו על ידי האדם עצמו. לדוגמה, אנו יכולים לקחת, למשל, לספור את מספר מכתשים על הירח או לחזות רעידות חוזרות ונשנות לאחר רעידת אדמה.

עם זאת, הדיוק והיעילות של מורכבים יותרהאלגוריתמים המשמשים לנתח מערכי נתונים גדולים מאוד כדי לחפש ולזהות גורמים לא ידועים בעבר או יחסים בין פונקציות שונות הם "הרבה יותר קשה לבדוק", מציין אלן. לפיכך, חוסר האפשרות לאמת את הנתונים שנאספו על ידי אלגוריתמים כאלה יכול להוביל למסקנות מדעיות שגויות.

קחו למשל רפואה מדויקת כאשרפיתוח שיטות טיפול יעיל, מומחים לנתח מטא נתונים המטופל, מנסה למצוא קבוצות מסוימות של אנשים עם מאפיינים גנטיים דומים. כמה תוכניות AI שנועדו "לנפות" נתונים גנטיים מראים את היעילות שלהם על ידי זיהוי בהצלחה של קבוצות של חולים עם נטייה דומה, למשל, להתפתחות של סרטן השד. עם זאת, הם לגמרי לא יעיל בזיהוי סוגים אחרים של סרטן, למשל, המעי הגס. כל אלגוריתם מנתח נתונים בדרכו שלו, ולכן כאשר משלבים את התוצאות, לעתים קרובות יכול להיות קונפליקט בסיווג המדגם המטופל. זה בתורו גורם למדענים לחשוב על AI אשר בסופו של דבר אמון.

סתירות אלה נובעות מכךאלגוריתמי ניתוח הנתונים נועדו לעמוד בהוראות שנקבעו באלגוריתמים אלה, אשר אינם מותירים מקום להחלטה ואי-ודאות, מסביר אלן.

Msgstr "אם אתה מגדיר משימה עבור האלגוריתם באשכולותכדי למצוא קבוצות כאלה במסד הנתונים שלו, הוא יבצע את המשימה ויגיד שהוא מצא מספר קבוצות על פי הפרמטרים הנתונים. תגיד לי למצוא שלוש קבוצות, הוא ימצא שלוש. מבקשים למצוא ארבעה, הוא ימצא ארבעה ", אומר אלן.

"למעשה, את האפקטיביות האמיתיתAI כזה יוכח כאשר התוכנית יכולה להגיב על משהו כזה: "אני באמת מאמין כי קבוצה זו של חולים מתאימה את הסיווג הנדרש, עם זאת, במקרה של אנשים אלה, אשר הנתונים שלי גם בדקו והשוו, אני לא ממש בטוח" .

מדענים לא אוהבים חוסר ודאות. עם זאת, שיטות מסורתיות לקביעת אי וודאויות המדידה מיועדות לאותם מקרים בהם יש צורך לנתח נתונים שנבחרו במיוחד כדי להעריך השערה מסוימת. כריית נתונים AI תוכניות לא עובד בכלל. תוכניות אלה אינן מונעות על ידי כל רעיון מנחה ופשוט לנתח את מערכי הנתונים שנאספו ללא מטרה מסוימת. לכן, עכשיו חוקרים רבים בתחום AI, כולל אלן עצמה, מפתחים פרוטוקולים חדשים שיאפשרו מערכות AI של דור חדש להעריך את הדיוק ואת שחזור של תגליות שלהם.

החוקר מסביר כי אחת השיטות החדשותניתוח עומק יהיה מבוסס על הרעיון של הדגימה מחדש. נניח שאם מערכת ה- AI אמורה להפוך לגילוי חשוב, למשל, היא מגדירה קבוצות של מטופלים בעלי חשיבות קלינית עבור המחקר, אזי גילוי זה צריך להיות מוצג במסדי נתונים אחרים. יצירת ערכות נתונים חדשים וגדולים על מנת לאמת את נכונות מדגם AI הוא יקר מאוד עבור מדענים. לכן, לדברי אלן, ניתן להשתמש בגישה שבה "ישמש מערך נתונים קיים, שבו המידע יהיה מעורב באופן אקראי בצורה כזו שתדמה מסד נתונים חדש לחלוטין". ואם פעם אחר פעם AI יוכל לקבוע את המאפיינים המאפשרים את הסיווג הרצוי להתבצע, "במקרה זה, אתה יכול להניח שיש לך תגלית אמיתית באמת בידיים שלך", מוסיף אלן.

הצטרף כמנוי ל Yandex.Dzen שלנו כדי לעקוב אחר ההתפתחויות האחרונות בעולם המדע והטכנולוגיה.