LOADING STUFF...
K a m e d i a

Loading Website

post01

השבוע שהיה בבינה המלאכותית היוצרת - 13/10/23

1. בגוגל החלו בתהליך הטמעת שילוב תמונות מבוססות בינה מלאכותית בתוצאות החיפוש במנוע.

ב-Google Search החלו להטמיע בינה מלאכותית יוצרת בתוצאות החיפוש, וכעת המנוע מייצר תמונות וטקסטים מתוך שאילתות חיפוש. התכונה החדשה ממשיכה את המגמה המתמשכת של ענקית הטכנולוגיה לשלב בינה מלאכותית יוצרת במוצרים ובשירותים שלה, עם או בלי המותג Bard, הקשור לבוט השיחה שלהם.

העדכון ב-Google Search כולל כלי טקסט-לתמונה, שבו משתמשים יכולים לתאר סצנה כמו "חללית רוכבת על סוס במאדים", ותוצאות החיפוש יכללו תמונות סינתטיות התואמות לשאילתה. משתמשים גם יוכלו לשפר את התיאורים ולהוסיף פרטים לפני הייצוא. ככלי בטיחות, התמונות יכללו מטאדאטה המסמן את מקורם "המלאכותי" וסימן מים מוטמע בכל התמונות שהמודל יוצר.

לידיעה המקורית לחצו כאן

2. ב Adobe הכריזו על גרסה 2 של מודל יצירת התמונות במוצרי החברה.

אדובי משיקה סדרה של יכולות מבוססות בינה מלאכותית באפליקציות שלה, זאת בעקבות הפופולריות של מודל הטקסט-לתמונה שלה ב Firefly, שהושק רק לאחרונה.

השינויים מתחילים עם גרסה מעודכנת של כלי הבינה המלאכותית היוצרת שלה, Firefly Image Model 2, והחברה חושפת שני מודלים נוספים לווקטורים ועיצוב. תכונות AI חדשות בגרסת בטא הגיעו גם ל-Photoshop, Illustrator, Premiere Pro ו-Express. אדובי חושפת שמשתמשים שלה יצרו מיליארד תמונות בחודש האחרון בלבד באמצעות הגרסה הראשונה של Firefly. זה הוביל את החברה להרחיב את כלי ה-AI שלה בכל שירותי ה Creative Cloud.

Firefly 2, שזמין בגרסת בטא דרך אפליקציית Adobe Firefly, כולל יכולות גדולות יותר אשר משפרות באופן משמעותי את איכות יצירת התמונות. כמו הגרסה הראשונה, המודל הוכשר בעיקר על תמונות של Adobe Stock כך שהתוצאות "בטוחות" לשימוש מסחרי.

לידיעה המקורית לחצו כאן 

3. חברת ElevenLabs הודיעה על השקת כלי תרגום ודיבוב חדשים מבוססי בינה מלאכותית.

ב ElevenLabs- סטארט-אפ בתחום סינטוז ושכפול הקול, שהוקם על ידי עובדים לשעבר מ-Google ו-Palantir, השיקו את AI Dubbing, מוצר המאפשר תרגום של תוכן וידאו ואודיו ללמעלה 20 שפות. השירות, זמין לכל משתמשי הפלטפורמה, ומציע דרך חדשה לדיבוב תוכן וידאו ואודיו, מה שמסייע ליוצרי תוכן קטנים לפרוץ לשווקים גלובליים. המוצר מסוגל לשמר את קולו המקורי של הדובר ואת הרגשות והאינטונציה שלו בתהליך התרגום.

הממשק מזהה את מספר הדוברים בתוכן, מפריד בין רעשי רקע לדיאלוגים, ומתרגם את הדיאלוגים לשפת המטרה תוך שמירה על איכות הקול המקורי. עד להשקת הממשק החדש, ElevenLabs הציעה כלים נפרדים לכפילות קול וסינתזת טקסט-לדיבור, שדורשו כפילות בתהליך. הכלי החדש מאפשר למשתמשים לייצר תוכן מדובב בקלות רבה יותר.

המוצר משתמש בדגם ה-Multilingual v2 האחרון של החברה, התומך במעל 20 שפות, כולל הינדי, פורטוגזית, ספרדית, יפנית, אוקראינית, פולנית וערבית, ומאפשר למשתמשים להפוך את תוכנם לגלובלי.

לידיעה המקורית לחצו כאן 

4. Opera מלמדת את העוזר האישי אריה לחקות את סגנון הכתיבה שלנו.

דפדפן האינטרנט Opera עדכן את עוזרת הבינה המלאכותית שלו ,Aria, והוסיף תכונות חדשות לעריכת תוכן. משתמשים יכולים אף ללמד את Aria שמשתמשת באותו מודל שפה גדול כמו של ChatGPT של OpenAI לחקות את סגנון הכתיבה שלהם על פי דוגמאות שהם מציגים למודל.

Aria היא תוכנה חינמית ופנימית עבור דפדפני Opera המאפשרת שיחה עם המשתמשים, חיפוש מידע, סיכום תוכן אתרים, ויצירת טקסט. השדרוגים מציגים אפשרויות חדשות בכלים האלו. התכונה "Rephrase" מאפשרת למשתמשים לבחור חלק מהטקסט ולבקש מה AI לעבד את אותו חלק ספציפי במקום את כל הטקסט. כמו כן, "Reuse"  מאפשרת לשלב יחד אלמנטים ממספר תגובות ליצירת שאילתה או פקודה חדשה, מה שחוסך הקלדה חוזרת או הסבר מחדש של ההקשר.

Opera מאמינה שתוצאת השדרוגים הללו תהיה תגובות ותוכן מהירים, מדויקים ושימושיים יותר של- Aria לדוגמא, מישהו שמתכנן טיול יכול לקבל הצעות רלוונטיות מAria  על פעילויות ולינה כדי ליצור תכנית טיול מותאמת אישית למספר ימים.

לדוגמאות לחצו כאן 

5. ב Walmart מרחיבים את יכולות הבינה המלאכותית היוצרת בחווית הקניה של לקוחות.

וולמארט הודיעה על סדרת ניסויים טכנולוגיים חדשים שנועדו להפוך את הקנייה ל"קלה ונוחה יותר" ללקוחות. הניסויים כוללים תכונות קנייה המופעלות על ידי בינה מלאכותית יוצרת, כולל עוזר עיצוב פנים, כלי חיפוש ועוזר קניות בפקודת קוליות.

תכונת החיפוש המופעלת על ידי בינה מלאכותית נועדה להמליץ על מוצרים לפי צרכי הרכישה של הלקוחות, עם יכולת להבין הקשר ולייצר תגובות רלוונטיות. לדוגמה, משתמש יכול לחפש "מסיבת יום הולדת לפעוט בנושא קרנף" והכלי יבין את התת-קטגוריות. התכונה כוללת גם "סיכום קצר של ביקורות" כדי לסייע לקונים לקבל החלטות מושכלות.

יכולת הקניות בפקודת קול מאפשרת ללקוחות לקנות בזמן שהידיים פנויות, באמצעות פקודות קוליות בלבד, כשעוזר קניות וירטואלי מציע המלצות מותאמות אישית ופרטים על מוצרים ספציפיים. התוכנית מתבססת על הצלחת "Text to Shop" של וולמארט שהושקה בשנה שעברה, ומאפשרת ללקוחות ליצור רשימת קניות וירטואלית.

וולמארט כבר השיקה את הכלי "My Assistant" לעובדי החברה באוגוסט, לסיוע במשימות אדמיניסטרטיביות. החברה מתכננת להפוך לאוטומטיות את מרבית הפעולות שלה, כאשר 65% מהחנויות יהיו מופעלות על ידי אוטומציה עד 2026, וכבר השיקה שירות משלוח רחפנים בשיתוף פעולה עם Wing בספטמבר.

לידיעה המקורית לחצו כאן

6. מודל הקוד פתוח מאיים על ההגמוניה של ChatGpt-4 Vision.

הגיעו האלטרנטיבות הפתוחות ל-GPT-4 Vision. תחום הבינה המלאכותית היוצרת מתפתח במהירות עם הופעתם של מודלים מולטימודלים גדולים (LMM). מודלים אלה משנים את אופן האינטרקציה שלנו עם מערכות הבינה המלאכותית, ומאפשרים שימוש בתמונות ובטקסט כקלט. GPT-4 Vision של OpenAI הוא דוגמה מובילה לטכנולוגיה זו, אך מהותו הסגורה והמסחרית יכולה להגביל את שימושו ביישומים מסוימים.

עם זאת, הקהילה הפתוחה נערכת לאתגר זה, עם LLaVA 1.5 כאלטרנטיבה מבטיחה ל-GPT-4 Vision LLaVA 1.5 משלב מספר רכיבים של בינה מלאכותית יוצרת והותאם ליצירת מודל יעיל מבחינת צריכת משאבי המחשוב הנדרשים לצורך ביצוע מגוון משימות בדיוק גבוה. למרות שאינו ה-LMM הפתוח היחיד, יעילותו החישובית והביצועים הגבוהים שלו יכולים לקבוע כיוון חדש לעתיד מחקרי ה-LMM.

לידיעה המקורית לחצו כאן

7. סטארט-אפ הוידאו Captions משיק אפליקציית דיבוב מבוססת בינה מלאכותית בשם Lipdub עם סלנג של Gen Z.

Captions, סטארט-אפ בתחום הווידאו של בינה מלאכותית שנוסד על ידי גאורב מישרא, לשעבר ראש צוות הנדסת עיצוב ב-Snap ומהנדס פיתוח תוכנה ב-Microsoft, ממשיך להתפתח. לאחר סבב מימון של 25 מיליון דולר מחברות הון סיכון מובילות, החברה משיקה גם אפליקציית דיבוב בינה מלאכותית חדשה בשם Lipdub, המתרגמת ומדבבת אוטומטית כל וידאו מוקלט עם אודיו מדובר ל-28 שפות, תוך התאמת תנועות השפתיים של הדובר למילים המדוברות של השפה המתורגמת.

האפליקציה זמינה בהתחלה רק למערכת ההפעלה iOS, היא חינמית להורדה ולא דורשת חשבון קיים של אפליקציית Captions. כמו ב-Captions, משתמשים יכולים לקחת את הווידאו שהם עורכים באמצעותה ולפרסם אותם בפלטפורמות פופולריות אחרות, כמו YouTube, TikTok ו-Instagram Reels.

לידיעה המקורית לחצו כאן 

שיתוף :