השבוע שהיה בבינה המלאכותית היוצרת

1. מאבק הענקים שצפוי להגדיר את עתיד הבינה המלאכותית היוצרת הניו יורק טיימס נגד OpenAI ומיקרוסופט.

את חדשות השבוע כמובן נתחיל עם הידיעה אודות קרב הענקים והתביעה של הניו יורק טיימס נגד OpenAI ומיקרוסופט בגין הפרת זכויות יוצרים, על רקע שימוש במאמרים של העיתון מבלי לרכוש רישיון. העיתון טוען כי מודלי ה-AI של החברה עושים שימוש בתוכן הדיגיטלי של העיתון כמקור מידע בתשובות שהמודל מספק. התביעה כוללת דרישה לפיצויים בסך מיליארדי דולרים והשמדת מודלים שאומנו על בסיס המידע שפורסם בעיתון.
אין ספק שהמשפט או כל פשרה שתושג בין הצדדים תשפיע בצורה משמעותית על ענף החדשותף העיתונות ותחום ה-AI בכלל. במידה וה-NYT יזכו בתביעה חברות שמייצרות מודלי שפה יידרשו למצוא מקורות נתונים חדשים ולאמן מחדש את המודלים הקיימים.

לידיעה המקורית לחצו כאן

2. מהפכה ה GenAI בווידאו נמשכת – גוגל מציגה את VideoPoet.

מעבדות המחקר של גוגל מציגות מודל טקסט לוידאו חדש בשם VideoPoet. המודל החדש משלב יכולות שונות כמו המרת טקסט-לווידאו, תמונה-לווידאו, ווידאו-לאודיו. הפרויקט החדש נוצר כדי להדגים כיצד מודל שפה גדול אחד (LLM) יכול לבצע מספר משימות יצירת וידאו באיכות גובהה. המודל אומן על נתוני וידאו, תמונות, אודיו וטקסט.
הבדיקות של גוגל הציגו יכולות דיוק גבוהות יותר של VideoPoet בהתאמה של ההוראות הטקסטואליות והתנועה שנוצרת לעומת מודלים אחרים. באמצעות המודל החדש של גוגל ניתן ליצור וידאו ארוך יותר על ידי חיזוי טוב יותא של כל שנייה נוספת הוידאו. גוגל הציגה גם יכולת עריכה מדויקת יותר של קטעים שנוצרו על ידי שינוי ההוראות הכתובות.

לידיעה המקורית לחצו כאן
לוידאו הדגמה לחצו כאן
לעמוד הפרויקט לחצו כאן

3. הסטארטאפ Entrupy מצא פתרון מבוסס AI לבעיית החיקויים של מוצרי יוקרה.

חברת הסטאטאפ ההודית Entrupy פיתחה כלי המופעל על ידי בינה מלאכותית שיכול לאמת תיקי יד ונעלי ספורט יוקרתיים בשיעור דיוק של 99.1%. הטכנולוגיה שפותחה על בסיס מודלי בינה מלאכותית יוצרת מיועדת למשווקים
ויצרנים של מוצרי יוקרה, ויכולה לאמת מוצרים של מותגים גדולים כמו לואי ויטון, שאנל, בלנסיאגה, ברברי וגוצ'י.
התהליך כולל צילום תמונות מפורטות של המוצר באמצעות עדשה הטלפון והצלבה של תמונות אלו עם מסד נתונים עצום של פריטים אותנטיים באמצעות אלגוריתם AI. האפליקציה של החברה מייצר תעודת מקוריות עבור מוצרים שעברו את תהליך הבדיקה של המודל.

לידיעה המקורית לחצו כאן
לעמוד המוצר לחצו כאן

4. ארגון התקינה הבינלאומי (ISO) מפרסם את ה ISO הראשון בעולם לניהול מערכות מבוססות AI.

ארגון התקינה הבינלאומי (ISO) והנציבות האלקטרוטכנית הבינלאומית (IEC) פרסמו את ISO/IEC 42001, התקן הבינלאומי הראשון בעולם למערכות ניהול בינה מלאכותית (AIMS),
שתוכנן במיוחד עבור ארגונים המספקים או משתמשים במוצרים מבוססי בינה מלאכותית או שירותים.
תקן זה מתאר את ההנחיות וההגדרות להקמה, יישום, תחזוקה ושיפור מתמיד של AIMS, תוך הבטחת פיתוח אחראי ושימוש בבינה מלאכותית. תקן זה נועד לתת מענה לאתגרים המרכזיים בפיתוח ויישום בינה מלאכותית,
כולל שיקולים אתיים, שקיפות ולמידה מתמשכת, ומציע גישה מובנית לניהול סיכונים והזדמנויות בטכנולוגיה החדשה.
התקן נועד להקל על האיזון בין חדשנות וממשל AI, שימוש אחראי, שקיפות, אמינות וחיסכון בעלויות עבור ארגונים.

קישור ל ISO לחצו כאן

5. הצ'ט המוביל של OpenAI צפוי להפוך לפרסונאלי יותר על בסיס השיחות שלנו.

לפי עדות שפרסם מתכנת לשעבר ב OpenAI החברה מתכננת להפוך את השיחות שלנו עם הצ'ט למותאמות יותר ופרסונאליות יותר על בסיס שיחות קודמות שלנו. החשיפה של פרויקט Sunshine של OpenAI לוותה ב צילום מסך של האפשרות העתידית וקטעי קוד שפורסמו ברשת, לפי פרסום זה המודל צפוי ל-"זכור" וללמוד משיחות קודמות שלנו וכך להתאים את התשובות העתידיות שלו לצרכים המשתנים של כל גולש.
לפי המפתח טיבור בלאהו, הפרויקט החדש יאפשר שלוש תכונות מרכזיות - שיחות עקביות יותר, שיפורים במהלך הזמן על בסיס השיחות שלנו, ואפשרות להתאמה אישית והגדרה של התוכן וכמות ההיסטוריה המודל ישמור כחלק מהשיחות שלנו.

לידיעה המקורית לחצו כאן

6. עורך יצירת הוידאו של Pika Labs עכשיו פתוח לכולם.

מחולל הווידאו מבוסס ה AI של Pika Labs זמין עכשיו לכל המשתמשים. המודל שהיה זמין עד כה באמצעות דיסקורד זמין מעכשיו גם באמצעות ממשק משתמש באתר החברה, כאשר הגרסה החדשה מציעה ממשק אינטואיטיבי ונוח עם מגוון תכונות שניתנו עד כה בפרקודות בדיסקורד.
ניתן ליצור וידאו בעזרת תמונה, טקסט או שילוב שלהם. אפשרות נוספת ונפוצה היא יצירת תמונה איכותית בעזרת מחולל תמונות AI ואז הנפשה שלה ב-Pika Labs.
הממשק החדש מציע מגוון אפשרויות הכוללות תנועת מצלמה, יחס גודל תמונה ועקביות בין וידאו לטקסט. ניתן גם לערוך חלקים מהווידאו הנוצר או להתאים את גודל הרקע. הווידאו נמשך בין 8 ל-24 פריימים לשנייה וברירת המחדל היא ארבע שניות. ניתן להאריך את הווידאו עד 15 שניות.

לקישור לעורך לחצו כאן
לידיעה המקורית לחצו כאן

7. עתיד מודלי השפה הגדולים הוא במכשירים הביתיים הקטנים, חברת סמסונג רוצה להוביל את המגמה.

בהרצאות שלי אני תמיד אומר שהעתיד של הבינה המלאכותית היוצרת הוא בסביבה הפרטית ביתית שלנו, התחרות היום בין החברות השונות הוא הקטנה של מודלי השפה תוך שמירה על איכות המענה וה-"חוכמה" של המודל. אך החברות שמובילות את הקו הזה היא סמסונג שהציגה לא מזמן מודל שפה שיכול לרוץ על טלפונים חכמים וציוד ביתי.
במקביל החברה עובדת על מקרר חכם חדש לשנת 2024, הכולל תכונות AI כגון זיהוי פריטי מזון פנימיים באמצעות מצלמה ואפליקציה מחוברת המציעה מתכונים על פי מלאי המזון, הזמנה של מוצרים בצורה אוטומטית, והתראה על מוצרים שפג להם התוקף.
המקרר, Bespoke 4-Door Flex Refrigerator עם AI Family Hub+, יוצג בתערוכת CES. המקרר כולל אפליקציות עבור TikTok ו-YouTube, והמצלמה הפנימית ואפליקציית Family Hub שודרגו. האפליקציה Samsung Food מתחברת לפרופיל הבריאות של סמסונג ומתאימה מתכונים לצרכים התזונתיים ועוד.

לידיעה המקורית לחצו כאן

8. מיקרוסופט משיקה את Copilot בסמארטפון : גישה חינמית ל-GPT-4 ו-DALL-E 3!

מיקרוסופט השיקה את אפליקציית הסמארטפון Copilot, המאפשרת גישה חינמית ל-GPT-4 ול-DALL-E 3. האפליקציה, שהועלתה לחנות האנדרואיד לקראת חג המולד, מציעה את אותה פונקציונליות כמו אפליקציית האינטרנט של Bing: שאלות והוראות לצ'טבוט עם תגובות בטקסט או תמונה. באמצעות האפליצקיה ניתן גם להעלות תמונות ,לצלם ולשוחח על תוכן התמונה. להבדיל מ-ChatGPT של OpenAI, צ'טבוט Bing מספק מענה מבוסס מידע זמין מהאינטרנט לרוב התשובות.
האפליקציה מוגבלת לשש הודעות, ובכל שיחה יש הגבלה של 30 הודעות. הדבר המעניין ביותר באפליקציה הוא האפשרות להשתמש ב-GPT-4 בגרסתו האחרונה, בגרסת הדסקטופ וב-Bing Chat, שימוש ב-GPT-4 היה מוצנע מאחורי המצבים "יצירתי" ו"מדויק". במצב "מאוזן", מיקרוסופט השתמשה במיקס של LLMs עם GPT-4 ומודלי שפה ייחודיים שלה.

לידיעה המקורית לחצו כאן
לאפליקציה ב Google Play לחצו כאן

9. מערכת מבוססת GenAI מזהה מקומות פיזיים באמצעות תמונות.

מערכת בינה מלאכותית בשם Pigeon שפותחה על ידי סטודנטים מאוניברסיטת סטנפורד, מאפשרת לזהות מקומות פיזיים באמצעות תמונות של Google Street View. בדיוק של עד 92% עבור מדינות ושיעור דיוק של 40% עבור מיקומים בטווח של 25 ק"מ.
המערכת שמופעלת על ידי רשת העצבים בשילוב CLIP של OpenAI, קיבלה ציון גבוה יותר והציגה ביצועים טובים יותר בהשוואה לכלי המוביל כיום GeoGuessr. למודל שימושים רבים החל מצילום לקויים במרחב הפיזי ודיווח לחברות הרלוונטיות, דרך שילוב במערכות ניווט לרכבים וכלי תחבורה אחרים, ועד לשילוב המודל באפליקציות תיירות במטרה לשפר את תהליך תכנון הטיול והגעה ליעדים אטרקטיביים.

לידיעה המקורית לחצו כאן

10. השמעות הופכות למציאות - סם אלטמן וג'וני אייב משלבים כוחות ליצירת מוצר חומרה חדש מבוסס GenAI.

כבר דיווחנו בעבר על השמעות סביב השיתוף פעולה המעניין בין סם אלטמן וג'וני אייב ראש חטיבת העיצוב באפל. נראה שהשמועות הופכות בימים אלו למציעות שמרמזת על מוצר פיזי חדש מבוסס טכנולוגיות של OpeAI.
לאחר דיווחים קודמים שהשניים שוחחו על גיוס 1 מיליארד דולר מ-SoftBank למיזם החומרה החדש שלהם, דו"ח חדש מ-Bloomberg טוען כי הם שכנעו את טאנג טאן, היוצא מתפקידו כסגן נשיא לעיצוב מוצרי iPhone ושעון באפל, להצטרף למשימתם.
לפי הפרסום בבלומברג טאן יעזוב את אפל ויתמקד בהנדסת החומרה למכשיר ה-AI החדש בחברת LoveFrom, חברת העיצוב של אייב. ה-AI מיועד לשנות את עולם החומרה הטכנולוגית, כאשר AI גנרטיבי פותח עולם חדש של אפשרויות לממשק בין בני האדם למכשירים חכמים, לדוגמא המוצר של חברת Humane, שבה מספר עובדי אפל לשעבר, הודיעה לאחרונה על השקת Ai Pin, מכשיר נשיא שניתן להדביק לבגדים ונשלט בפקודות קוליות.

לידיעה המקורית לחצו כאן

השבוע שהיה בבינה המלאכותית היוצרת 29/12/23

מאמרים קשורים

נושאים מרכזיים