מחשבות על סופר אינטליגנציה מלאכותית

עמית קמה

2024-12-23 00:00:00

האם השבוע חזינו בלידתה של ה-"סופר אינטליגנציה המלאכותית", ה-AGI , הגביע הקדוש של הבינה המלאכותית שכולם מצפים וחוששים ממנה בעת ובעונה אחת ?

זה היה אקורד הסיום של שבוע הכרזות מטורלל, הוא התחיל בהכרזה על 12 ימי הכרזות של OpenAI לתוכם השתרבבו ההכרזות על הדור השני של ג'מיני המולטימודלים של גוגל וכל זאת לצד ההכרזות הרגילות בתחום ה AI שהקצב שלהם מטורף גם ככה.

אז כאמור, השבוע חברתOpenAI המלכה המובילה של עולם הבינה המלאכותית, נתנה בראש (בלשעון העם) לכל הספקנים שטענו בחודשים האחרונים שהגענו למכשול רציני ביכולת לשפר את מודלי השפה הנוכחיים, זאת הרבה בזכות העובדה ש o1 של OpenAI הפגין שיפור שנוי במחלוקת אל מול GPT 4 שבאמת הפגין קפיצת דרך משמעותית אל מול הדור הקודם של מודלי השפה או יש לומר מולטימודלים מבוססי בינה מלאכותית.

ההבנה הזו שיותר גדול (כלומר השקעה במודלים הרבה יותר גדולים עם כוח מחשוב משמעותי יותר) לא בהכרח מניבה תוצאה הרבה יותר טובה, מה שמוביל את ענקי הבינה המלאכותית לבחון אלטרנטיבות בהם ניתן להפוך את המודלים ל"חכמים יותר" בדרכים אחרות.

למעשה בשנה האחורה אנו רואים יותר ויותר מודלים קטנים (SLM) אך "חכמים" וזאת בעיקר על ידי שיפור דרך ההפעלה שלהם שנועדה לדמות את אופן הסקת המסקנות של המודל בדומה לחשיבה אנושית.

ולא, המודלים שיש לנו כיום לא באמת חושבים, לפחות על פי דעת הרוב. הן למעשה מסדרות סטטיסטית נכון את המילים על בסיס האוסף האיסופי של אינפורמציה שהן למדו מראש (שלא תבינו לא נכון, זה קסם מדהים בפני עצמו - או פשוט מתמטיקה מאד מאד מסובכת).

ואז הגיע o3, אחיו הבכור של o1 וכמו כולנו אתם בטח שואלים את עצמכם לאן נעלם o2, אז ההסבר לדילוג האלגנטי הרבה פחות קונספרטיבי ממה שרבים נוטים לחשוב, המותג o2פשוט שייך כבר לחברת הסלולאר הבריטית Telefonica.

אז מה כל כך מיוחד ב o3, בדומה לאחיו הצעיר הוא מודל עם יכולות הסקה או הנמקה (reasoning model) שהמטרה המרכזית שלה היא לאפשר למודל לספק מענה מדוייק גם על מידע שהוא לא אומן עליו ספציפית. כלומר התשובה שתתקבל אינה מפויע במפורש בנתוני האימון של המודל.

איך אנחנו יודעים שהמודל אכן מציג תוצאות טובות יותר ביחס למודלים קודמים, זה הזמן לכמה מילים על מבחן ARC-AGI.

זהו מבחן או אתגר המתבסס על שאלות שמחייבות את מודלי הבינה המלאכותית להפעיל יכולות שדומות לאלו של בני האדם: היגיון בריא, הבנת מספרים, הפשטה, הנמקה ועוד. לצורך ההשוואה הסבא רבה של o3 המודל GPT3 קיבל במבחן ציון נכשל מלא, לפני כמה חודשים (כ 4 שנים מאז GPT3) המודל GPT4-omni ענה רק על 5% מהשאלות בצורה נכונה , o1המוכר ענה על 32% מהשאלות בצורה נכונה ואז באופן מפתיע o3 הציג זינוק שלא הותיר אף אחד אדיש עם ציון של 87.5%משאלות המבחן ) Score public eval כלומר 96.7%במתמטיקה מתקדמת, 88% במשימות תכנות ו-87.7%בשאלות ברמת דוקטורט במדעים.

האם נראה את ה AGI כבר בשנה הקרובה, תלוי את מי שואלים. סם אלטמן כבר הכריז שבשנת 2025 נדע איך לבנות בינה מלאכותית כללית, אבל ההגדרה שלו לבינה מלאכותית כללית טיפה שונה מהמקובל והיא "מערכות בעלות אוטונומיות גבוהה, שמשיגות ביצועים טובים יותר מבני אדם במרבית המשימות שיש להן ערך כלכלי", דריו אמודיי, מנכ"ל אנתרופיק, מאמין שנראה בינה מלאכותית כללית מוגבלת בשנת 2026. וג'ופרי הינטון, זוכה פרס נובל בפיזיקה, האיש שהזניק את התחום בגוגל, סבור שזה יכול לקרות בחמש השנים הקרובות.

מתי נפגוש את o3 כנראה שזה יקח קצת זמן, כמו כל המודלים של OpenAIגם המודל הזה נמצא בבדיקות ואינו זמין בציבור, אחת המגבלות העיקריות היא עלות ההפעלה (חישוב) של המודל, במצב חישוב גבוה (מתוך שלושת מצבי החישוב של המודל o3) העלות היא של עשרות ומאות דולרים למספר דרות של ביצוע משימה, מה שהופך את ההפעלה שלו ללא כדאית בשלב המיידי. בנוסף למרות ההצלחה במבחן ARC AGI המודל עדיין מתקשה בהבנה עמוקה או יצירתיות אמיתית. אז בנתיים נוכל להסתפק ב o3 mini הגרסה המוקטנת אמורה להיות זמינה לציבור בסוף חודש הבא.

לסיכום. יש סיכוי טוב שהסופר אינטליגנציה המלאכותית, זו שתעשה הכל ללא תיווך והנחיה של בני אדם קצת רחוקה, עצם העובדה אנו בכלל מדברים על זה במושגים של השנים הקרובות מדהימה ומפחידה באותו רמה. בנתיים יהיו לנו עוזרים הרבה יותר חכמים שיסייעו לנו בביצוע משימות שבשגרה האישית והמקצועית.