LOADING STUFF...
K a m e d i a

Loading Website

post01

השבוע שהיה בבינה המלאכותית היוצרת 29 - שבוע 15/03/2024

1. הכירו את דווין, עוזר ה-AI החדש שמבטיח לפתח מערכות שלמות עצמאית.
חברה אמריקאית בשם  Cognition AIהמתמחה במחקר בתחום הבינה מהלאכותית השיקה את דווין, מודל שפה המתמחה בפיתוח תוכנה ומוסגל לשתף פעולה עם מפתחים אנושיים וגם לבצע משימות באופן עצמאי. דווין מסוגל לטפל בספריות קוד חדשות עם מעט קוד מקור כבסיס לאימון, לתכנת אפליקציות מלאות (וזה מה שהקפיץ את הבאזז סביב המודל), למצוא באגים במאגרי קוד קיימים ולדווח על באגים במאגרי קוד פתוחים. אחד היתרונות של דווין הוא השימוש באלגוריתמים של למידת מכונה כדי ללמוד ולשפר את ביצועיו באופן קבוע.

בבדיקות מולן מודלי שפה אחרים דווין הציג תוצאות טובות יותר מדגמי שפה אחרים, כולל GPT-4 אך הוא עדיין לא נבדק מול המודלים העדכניים, דווין עדיין לא זמין לציבור הרחב וכרגע ניתן להירשם לרשימת המתנה למפתחים.

הדווחים הראשוניים של משתמשים נראים מבטיחים, דווין פיתח הרחבה פועלת מקצה לקצה ל Chrome והציג יכולות מפתיעות בפיתוח משחק שחמט על בסיס הנחיה..


Image


לכתבה המקורית לחצו כאן

2. הטרמינייטור כבר כאן, חברת Figure ו-OpenAI מציגים רובוט אנושי מתקדם.

לפני כחודש סיפרנו לכם על ההשקעות של מיקרוסופט, ג'ף בזוס ו OpenAI בחברת הרובוטיקה Figure, שצמחה לשווי שוק מדהים של כ-2.6 מיליארד דולר, עכשיו החברה מציגה סרטון של התוצאה, שילוב של רובוט אנושי פיזי עם מודל השפה של של OpenAI, יוצרת ChatGPT.

בסרטון הוצג הרובוט האנושי Figure 01, כשהוא מגיב לפקודות אנושיות, מוצא ומעביר עצמים, ומבצע משימות עצמאיות כמו לאסוף זבל ולשים כלים במתקן ייבוש. הרובוט מופעל על ידי מודל שפה-ראיה (VLM) שאומן על ידי OpenAI. זהו צעד חשוב בתחום הרובוטיקה האנושית, והמודל מציג אינטראקציה טבעית עם בני אדם.

ברט אדקוק, מנכ"ל ומייסד החברה, מציין שהמטרה היא לפתח רובוטים אנושיים, שישפיעו חיובית על האנושות ויחסכו עבודות לא רצויות או מסוכנות. הוא מודע לאתגרים ולסיכויים הנמוכים להצלחה, אך מתחייב להימנע משימוש צבאי או פגיעה בבני אדם.


Image

לידיעה המקורית לחצו כאן

3. לא עוד סרטים אילמים - Pika Labs משיקה אפקטים קוליים בוידאו באמצעות AI

חברת Pika Labs משיקה מודל חדש ליצירת אפקטים קוליים באמצעות תיאור טקסטואלי, מה שמאפשר למשתמשים להוסיף צלילים פשוטים לסרטונים שלהם. בסרטון ששלררה החברה היא מציגה אפקטיים קוליים לתרחישים שונים כגון רחש של בייקון על מחבת, צרחות נשרים או רעש של מנוע. עד כה, יצירת הקול הייתה תהליך נפרד מיצירת הוידאו, אך בעתיד של pika Lab ייתכן שמודלים יוכלו לבצע יצירת וידאו ואודיו בתהליך אחד.

התכונה החדשה זמינה כרגע רק למנויי התוכנית בתשלום, אך צפויה להתרחב בקרוב. העדכון מצטרף לעדכון האחרון שסקרנו בשבוע שעבר בו החברה הציגה יכולת סינכרון שפתיים שמאפשרת למשתמשים להוסיף קולות מסונכרנים לדמויות בסרטונים שנוצרו באמצעות הטכנולוגיה של החברה.

Image


לידיעה המקורית לחצו כאן

4. חברת Stability AI משחררת מודל בקוד פתוח ליצירת אובייקטים בתלת מימד.

חוקרים מ-Stability AI ו-Tripo AI הציגו את TripoSR, מודל בינה מלאכותית המאפשר שחזור תלת-ממדי של עצמים מתוך תמונה יחידה בפחות מחצי שניה על גבי כרטיסי Nvidia A100. המודל נחשב לעדיף על פני אלטרנטיבות קוד פתוח אחרות מבחינת איכות וכמות המודלים שניתן לייצר מתמונות.

המודל משתמש בתמונה RGB יחידה כקלט, שמשמשת כבסיס לשחזור התלת-ממדי. תחילה, התמונה עוברת עיבוד על ידי מקודד תמונות מאומן מראש המבוסס על מודל ראיה (DINOv1), שהופך את התמונה לסט של וקטורים נסתרים. מודל מפענח ממיר את הווקטורים הללו לייצוג NeRF של תלת-מימד שאמפשר יצירה של אובייקטים מעצמים וטקסטורות מורכבות.

להבדיל מגישות אחרות הדורשות פרמטרים של מצלמה, TripoSR "ניחש" את הפרמטרים הללו במהלך האימון מה שמגביר את הזמינות והשימוש במודל גם כאשר אין מידע מדויק מהמצלמה.

Image

לידיעה המקורית לחצו כאן

5. דמויות עקביות בלחיצת כפתור – עוד פריצת דרך מבית מידג'רני.

זוכרים את הימים שהיינו צריכים להילחם בכדי ליצור דומיות עיקביות במיד'גרני, אז לא עוד. החברה הציגה לאחרונה עדכון שמאפשר לשמר עקביות של דמויות בתמונות שונות, תוך שמירה על מאפיינים זהים כמו מראה הפנים, סוג הגוף והלבוש.

יכולת זו מתבצעת באמצעות תגית חדשה, "–cref", המאפשרת למשתמשים לציין את מאפייני הדמות באמצעות כתובת הפניה לתמונה קיימת באמצעות קישור. בנוסף, המשתמשים יכולים לשלוט במידת הדמיון בין הדמויות החדשות לאלו המקוריות באמצעות תגית "–cw", שמגדירה את מידת העקביות בין 1 ל-100. ככל שהערך גבוה יותר, הדמיון לדמות המקורית גבוה יותר. יתר על כן, הפלטפורמה מאפשרת איחוד מספר דמויות לתמונה אחת על ידי שימוש במספר תגיות "–cref".

Image

לידיעה המקורית לחצו כאן

6. האם Chat-GPT 4.5 ממש מעבר לפינה ?

פרטים על מודל הבינה המלאכותית החדש של OpenAI העונה לשם GPT-4.5 Turbo  דלפו בטעות דרך מנועי החיפוש Bing ו DuckDuckGo דף המוצר של GPT-4.5 Turbo הופיע בתוצאות החיפוש לפני השקה הרשמית, מה שהוביל לאין סוף השארות לגבי התכונות והיכולות של המודל החדש.

על פי קטעים מדף המוצר, GPT-4.5 Turbo מתואר כ"מודל המהיר, המדויק והגדול ביותר עד כה", התיאור מרמז על שיפורים משמעותיים לעומת הגרסאות הקודמות, כולל גידול ניכר בחלון ההקשר של המודל שגדל ל-256,000 טוקנים, כפול מהגרסה הקודמת GPT-4 Turbo שהכילה 128,000 טוקנים.

השאלה הגדולה היא כיצד יעובדו הטוקנים האלו. ומדלים גדולים אחרים עם חלונות הקשר גדולים נתפסו ככאלו שמתעלמים מחלקים מנתוני הקלט. אם GPT-4.5 Turbo יכול לטפל בבעיה זו, זה יהיה ניצחון גדול עבור OpenAI במאבק לשמר יתרון בשוק מול מתחרים שמתפתחים במהירות כמו המודלים החדשים של Anthropic ו-  גוגל שהושקו לאחרונה.

למרות שלא מוזכר תאריך שחרור ספציפי ייתכן שהתחרות מול Anthropic יגרמו לשחרור מוקדם מהרגיל. בפרסום הופיע ש-GPT-4.5 Turbo יהיה מעודכן עם מידע עד יוני 2024, מה שיכול להצביע על חלון זמן אפשרי לשחרור של המודל.

Image

לידיעה המקורית לחצו כאן

7. חברת Inflection AI משיקה מודל חדש לצ'אטבוט Pi.

החברה Inflection AI מפאלו אלטו, הכריזה על מודל בסיס חדש בשם Inflection-2.5 , המודל החדש מציג שיפורים משמעותיים ביכולותיו לעומת המודל הקודם Inflection-1 , לטענת החברה הוא מתמודד כמעט בשוויון עם מודל GPT-4 של OpenAI במיוחד בנושאים מתחומי המדע, ההנדסה, הטכנולוגיה ומתמטיקה (STEM).

מאז הקמתה Inflection AI שמה דגש על בניית מודלי שפה אמפתיים ובטוחים שפועלים באופן אישי ובלשון יומיומית יותר מדגמי ה GPT , החברה השתמשה בכיול רגשי ייחודי כדי לתת למודל מאחורי Pi אישיות ייחודית ורמת EQ (אינטליגנציה רגשית) יוצאת דופן.

עם השקת Inflection 2.5, הסטארטאפ משקיע גם בפיתוח ה-IQ של המודל, בתחומים כמו פיזיקה ומתמטיקה.

בבדיקות ביצועים, המודל המשודרג מציג שיפורים משמעותיים ומתקרב ל GPT-4 אך עדיין נותר מאחור. לדוגמא, במבחן MMLU, המודל Inflection-2.5 קיבל ציון של 85.5, לעומת 87.3 של GPT-4 במבחנים בתחום STEM, המודל הציג ביצועים כמעט זהים ל GPT.

לידיעה המקורית לחצו כאן

8. מיקרוסופט משיקה את Copilot GPT Builder ליצירת צ'אטבוטים מותאמים אישית

מיקרוסופט הודיעה על שילוב ה Copilot GPT Builder ברמת המינוי המתקדם שלה, Copilot Pro, בעלות של 30 דולר למשתמש לחודש. הכלי מאפשר למשתמשים ליצור ולשתף גרסאות מותאמות אישית של צ'אטבוטים דרך האפליקציה האינטרנטית שלCopilot .

ה-Copilot GPT Builder מאפשר למשתמשים ליצור אפליקציות מותאמות אישית ללא ידע טכני או תכנות, באמצעות הזנת הוראות בשפה טבעית. הכלי נועד לעזור לעובדים לשפר את הפעילות שלהם, המשימות, וסגנון העבודה העבודה שלהם.

למרות הקשר ההדוק בין מיקרוסופט ל OpenAI, במיקרוסופט מצהירים של OpenAI לא הייתה מעורבת בפיתוח ה Copilot GPT Builder  של מיקרוסופט. השקת הכלי מצביעה על כך שמיקרוסופט מנסה להפחית את התלות שלה ב OpenAI, באמצעות שותפויות חדשות ומודליAI  משלה כמו המודלים  Orca, Phi-2 ו.Deucalion  

Image

לקישור למחקר לחצו כאן

9. האם ג'מיני של גוגל בדרך לאייפונים ?

אפל וגוגל נמצאות במשא ומתן לגבי שותפות שתאפשר לפיצ'רים של אייפון להיות מופעלים על ידי מנוע ה-AI של גוגל, ג'מיני. עסקה זו תחזק את השותפות הוותיקה בין החברות, שבה גוגל משלמת לאפל כ-20 מיליארד דולר בשנה כדי להישאר כמנוע החיפוש המוגדר כברירת מחדל במכשירים של אפל

אפל מתכננת דגמי AI משלה ל-iOS 18, אך מחפשת שותף שישפר בנתיים את היכולות ליצירת תמונות וטקסט. כאמור גוגל היא שותפה המועדפת לאור שיתוף הפעולה בין שתי החברות. המשא ומתן עדיין מתקיים ועסקה כזו כנראה לא תוכרז לפני ועידת המפתחים של אפל ביוני. לפי הדיווחים, אפל גם שוחחה עם OpenAI ועשויה לשקול שותפים נוספים.

לידיעה המקורית לחצו כאן

10. גרוק-1, מודל הקוד הפתוח הגדול ביותר שוחרר לציבור הרחב.

כפי שהבטיח אילון מאסק משחרר את גרוק-1 כמודל שפה בקוד פתוח, ב-xAI אומרים כי הנתונים של המודל מעודכנים לאוקטובר 2023, משמע כל עוד הוא לא מחובר לאינטרנט המודל לא יידע לספק מידע עדכני. בנוסף מבהירים שהמודל לא אומן ליישומים ספציפיים במילים אחרות, אם תרצו לקחת את גרוק-1 ולהפוך אותו לצ'אטבוט שיתחרה בגרוק המקורי – יהיה צורך לבצע עליו אימון נוסף בצורה עצמאית.

המודל שוחרר עם כל הפרמטרים שלו אך הוא כמובן לא כולל את החיבור בזמן אמת למידע ב X כפי שקורה עם גרוק-1 שנמצא בלב הצ'אטבוט של החברה. המודל זמין ברישיון Apache 2.0 – כלומר, חברות יוכלו לקחת את המודל, לאמן אותו בתור המודל שבלב המוצרים שלהן ולהשתמש בו גם באופן מסחרי – ללא תשלום כמובן. עם זאת, xAI ומאסק לא לוקחים אחריות על התוצרים שיעשו עם המודל.

המודל זמין מעתה להורדה ולשימוש על ידי חוקרים, מפתחים ומשתמשים פרטיים. הריפו של המודל פורסם בגיטהאב, ונכון להיום מדובר במודל הקוד הפתוח הגדול ביותר שיש יותר מ-Llama 2 של מטא (עם 70 מיליארד פרמטרים) ו-Mixtral 8x7B  של מיסטרל הצרפתית (עם כ-45 מיליארד פרמטרים).

Image

לידיעה המקורית לחצו כאן

קישור למאגר ב GitHub לחצו כאן


שיתוף :