השבוע שהיה בבינה המלאכותית היוצרת

החדשה המרעישה של השבוע, גרסה 5 של ChatGPT בדרך ?

חברת OpenAI הגישה ב 18 ליולי בקשה לסימן מסחרי עבור GPT-5 בארה"ב, הגרסה הבאה של מודל השפה הגדול שלה. מודל זה מתואר כ"תוכנת מחשב הניתנת להורדה" עבור משימות כמו עיבוד שפה טבעית, יצירת טקסט ודיבור, הבנה וניתוח.

זהו צעד ראשון ומאד מוקדם דרך למודל החדש. הועסקים בתחום מעריכים שיקח עוד זמן מה עד שנפגוש את הגרסה החדשה, ובכל זאת על סמך הקפיצה ביכולות של המודלים הקודמים גם הפעם אנו צפויים לשדרוג משמעותי, ומאיתו שינוי מהותי בכל האקוסיסטם שעוסק בתחום או בונה יכולות על בסיס המודל.

קישור לפרטים נוספים
ולעוד פרטים לחצו כאן

ירידה בביצועים של ChatGPT-4.

משתמשים רבים דיווחו בתקופה האחרונה על הרעה משמעותית באיכות התגובות של GPT-4. עם זאת, טענות אלה היו אנקדוטליות במידה רבה. מחקר מקיף שנערך על ידי סטנפורד וברקלי מבסס את החששות, ומדגים שגרסת יוני של GPT-4 מתפקדת בצורה אובייקטיבית גרועה יותר מגרסה של מרץ במשימות שונות.

צוות המחקר בדק את המודל במספר שיטות שונות כולל פתרון בעיות עם שרשור מחשבות, מציאת מספרים ראשוניים, ומענה לסדרה של בעיות פשוטות יותר ומצא שהמודל ענה בצורה פחות טובה מבעבר.

יש כמה סברות לירידה בביצועים, האחת טוענת ש OpenAI משתמשים בכמה דגמי GPT-4 קטנים ומיוחדים שמתנהגים בדומה לדגם גדול אך זול יותר להפעלה. כאשר משתמש שואל שאלה, המערכת מחליטה לאיזה דגם לשלוח את השאילתה ובחלק מהפעמים מפנים למודלים הקטנים והפחות יעילים.

סברה נוספת שמסתובבת ברשת טוענת שהמודל לומד מההנחיות והשיח עם המשתמשים ואלו לא תמיד מדוייקים ולכן המהימנות והיכולת של המודל מדרדרת.

קישור לפרטים נוספים
קישור למחקר המקורי

נחשפה חולשה משמעותית במודלים מבוססי שפה גדולה.

חוקרים מאוניברסיטת קרנגי מלון והמרכז לבטיחות בינה מלאכותית גילו דרכים "פוטנציאליות" לעקוף את הגבלות הבטיחות של מודלי השפה הגדולים כמו ChatGPT, בארד של גוגל וקלוד של אנתרופי. השיטה היא יצירה של מספר מודלי שפה "שמזריקים" הנחיות למודלים המוכרים בכדי לנסות לגרום למודל לענות על שאלות שהוגבלו במודל כגון – "כיצד ניתן להשמיד את האנושות".

המודלים ניסו גרסאות שונות של אותן הנחיות במגוון עצום של אפשרויות, ומה שהחוקרים הופתעו לגלות הוא שילוש של סימנים ואותיות (שלנו בני האדם נראות חסרי משמעות) גרמו למודלים לענות על אותן הנחיות שהן לא היו אמורים לענות עליהם. לא זאת ועוד ששיטה זו פעלה לא רק על GPT4, למרות שבדיקה זו לא נעשה מולו אלא על רוב המודלים המוכרים בקוד פתוח וסגור.

הבעיה היא שעדיין, לא ברור איך מתגוננים בפני תקיפה שכזו, כי תקיפה מסוג זה יכול להמציא עוד ועוד חולשות כאלו כל היום.

קישור לפרטים נוספים
קישור למחקר עצמו

גרסה חדשה למודל יצירת התמונות של Stability AI.

חברת Stability AI הכריזה על השקת Stable Diffusion XL 1.0, מודל הטקסט-לתמונה שמתואר כגרסה ה"מתקדמת ביותר" של החברה עד כה. Stable Diffusion XL 1.0 זמין בקוד פתוח ב-GitHub בנוסף ל-API ואפליקציות הצרכניות של Stability AI בClipDrop ו-DreamStudio, המודל מספק צבעים "חיים יותר" ו"מדוייקים" יותר. ניגודיות, צללים ותאורה טובים יותר בהשוואה לקודמו טרבים מתארים את המודל כמתחרה רציני למידג'רני.

קישור להכרזה

רוצים להרוויח מליון דולר בשנה ולעבוד בנטפליקס?

על רק המחאה ושביתת השחקנים והכותבים בהוליווד – נטפליקס מפרסמת משרה למנהל מוצר AI. במודעת דרושים חדשה, נטפליקס מפרסמת שהיא מחפשת מנהל מוצר לתחום הבינה המלאכותית. השכר הצפוי ינוע בין $300,000 ל-$900,000 וחלק מההגדרות התפקיד יהיו להגדיר את החזון העתידי של הבינה המלאכותית היוצרת לשנים הקרובות בנטפליקס.

קישור לכתבה המקורית

מוצר חדש ל StackOverflow על רקע צניחה של 50% בתנועה באתר.

אין מפתח תוכנה שלא מכיר את Overflow הפורום שהפך לסטנדרט בתחום פיתוח התוכנה בזכות וי ירוק קטן שסימן את התשובה הנכונה שסייע למתכנת בפתרון הבעיה איתה התמודד המפתח. מאז הושק ChatGPT ובמיוחד מאז ההשקה של CoPilot התנועה באתר StackOverflow בצניחה חופשית. במרץ דווח ב similarweb שנצפתה ירידה של 14% בתנועה לאתר ובחודשים האחרונים כבר מדובר על צניחה של 50%.

ב StackOverflow הבינו את הבעיה והשבוע הכריזו על כלי חדש מבוסס בשם StackOverflow AI שיסייע לקבל תשובות לבעיות קוד במבנה צ'ט על בסיס המאגר העצום של 56 מיליון שאלות ותשובות בפלטפורמה שלהם. האם הפתרון הזה יצליח להתחרות בפשטות של CoPilot שפשוט כותב עבור המתכנתים את הקוד ? ימים יגידו.

קישור לסרטון ההשקה
קישור להכרזה

גוגל מציגה מודל חדש בשם RT-2 להפעלה של רובוטים על נתונים מתמונות וטקסט.

גוגל משיקה מודל חדש בשם Robotics Transformer 2 שמאפשר לרובטים פיזיים ללמוד ולהתאים את עצמם לסביבה הפיזית משתנה באמצעות מידע טקסטואלי ווזיאולי מהאינטרנט.

המודל נועד לעזור לרובוטים להבין ולבצע פקודות ללא צורך בהכשרה ספציפית. הוא משתמש במערכת חזותית-שפה-פעולה (VLA) כדי לתרגם את הפעולות הרצויות לתנועות רובוטיות.

טכנולוגיה זו מאפשרת לרובוטים ללמוד ממקורות שונים באינטרנט ולבצע משימות שלא נתקלו בהן בעבר כלומר מציאות של רובוטים אוטונומיים שמתמצאים בסביבה ומקבלים החלטות על בסיס הדאטה שהם למדו, ולאו דווקא על בסיס תכנות מוקדם.

על פי הפרסומים, RT-2 לומד מידע ותמונות מהאינטרנט כדי לפתח הבנה כללית, בניגוד למודלים קודמים, כאן נדרש הרבה פחות אימון על משימות ספציפיות. כלומר לפי גוגל המודל הזה יכול להבין הוראות ולבצע פעולות באופן עצמאי גם במצבים חדשים. למשל, בדוגמה אחת ביקש מהנדס אנושי מהרובוט "להרים את החיה הנכחדת", והרובוט הצליח לזהות ולאסוף דגם של דינוזאור. במקרה אחר הוא השליך אשפה לפח מבלי שאומן על כך ומבלי שתכנתו אותו לזהות אשפה ולהפרידה מבין עצמים אחרים.

בבדיקה, RT-2 הראה שיפור משמעותי, והשיג שיעור הצלחה של 62% בביצוע משימות חדשות, כמעט פי שניים מקודמו RT-1.

קישור לפרסום באתר של גוגל
קישור לפרטים נוספים

מודל חדש של מטה מאפשר יצירת מוזיקה מטקסט.

מטא מכריזה על כלי ש הוא בעצם שלוש מודלי בינה מלאכותית יוצרת משלובים בכלי אחד בשם AudioCraft.

המודל הראשון בכלי הוא MusicGen – מודל המאפשר יצירת קולות או צלילים על סמך הנחיות טקסטואליות בלבד. על פי מטא מודל זה אומן על 20 אלף שעות של מוזיקה ברישיון של החברה.

המודל השני יכול ליצור עבורכם אפקטים קוליים על סמך הנחיות טקסטואליות. במטא אימנו את המודל על סמך מאגרים ציבוריים של אפקטים קוליים כדי שזה יוכל להבין איך לייצר אותם על סמך קלט כתוב בלבד.

מודל השלישי הוא מקודד שפותח על ידי מטא וכעט משוחרר בגרסה משופרת, מקודד זה המאפשר דחיסה משמעותית של קובצי קול מבלי לפגוע באיכות שלהם.

יחד שלושת הכלים מאפשרים ליוצרים לאחד את כל יכולות הקוד שלהם במקום אחד. כפי שעשו בעבר מטב משחררת את שלושת המודלים בקוד פתוח ב GitHub.

קישור לפרטים נוספים
לעוד פרטים לחצו כאן

חוקרים במעבדת המחקר של MIT שחררו מחקר שנועד להגן על התמונות שלכם.

אנחנו נכנסים לעידן חדש שבו טכנולוגיות המופעלות על ידי בינה מלאכותית יכולות ליצור ולשנות תמונות בדיוק שמטשטש את הגבול בין מציאות לדמיון. דגמים גנרטיביים מתקדמים כגון DALL-E ו-Midjourney, מייצרים ומשנים תמונות בדיוק מרשים בממשק פשוט מה שהפך את ייצור תהליך ייצור התמונות ההיפר-ריאליסטיות לפשוט ביותר.

עם הורדת חסמי הכניסה, אפילו משתמשים חסרי ניסיון יכולים ליצור ולשנות תמונות באיכות גבוהה על בסיס הנחיות טקסטואליות, החל משינויי תמונה תמימים ועד שינויים זדוניים.

בכדי למנוע שימוש לרעה בטכנולוגיה החדשה חוקרים ב MIT פיתחו את PhotoGuard טכניקה המשתמשת בשינויים זעירים בערכי פיקסלים בלתי נראים לעין האנושית אך מזוהים על ידי מודלים ממוחשבים ולמעשה משבשים את היכולת של מודלים אלו לראות את התמונה האמיתית ובכך לשבש או להעתיק אותה.

קישור לפרטים נוספים
לעוד פרטים לחצו כאן

המשפיענים הסינטטיים הופכים לתופעה תרבותית.

יותר ויותר חשבונות של משפיענים סינטטיים מופיעים ברשתות החברתיות, הם זוכים לעשרות אלפי עוקבים ובמקרים רבים נדרש כסף תמורת אפשרויות נוספות כגון שיח עם הדמות, מוצרים, פרטי לבוש ועוד, הכל כמובן סינטטי לחלוטין ונותר על ידי בינה מלאכותית יוצרת. אחת מהן היא מילה סופיה, בת ה 19 עם למעלה מ-100,000 עוקבים ברשתות החברתיות, למעלה מ-30,000 באינסטגרם ולמעלה מ-90,000 ב TikTok בהם הדמות חולקת תמונות של חופשה ביעדים חלומיים כמו יוון, וזוכה לתשומת לב מעריצים ברחבי העולם.

קישור לפרטים נוספים
לחשבון האינסטגרם של סופיה לחצו כאן

השבוע שהיה בבינה המלאכותית היוצרת - 4/8/23

מאמרים קשורים

נושאים מרכזיים