K a m e d i a

Loading Website

בינה שבועית - השבוע שהיה בבינה המלאכותית היוצרת

מציג 155 ידיעות
שוחרר מודל התמונות החדש של Black Forest Labs עם ביצועים משודרגים
שוחרר מודל התמונות החדש של Black Forest Labs עם ביצועים משודרגים
  04/10/2024   |     מודלי שפה

חברת הסטארט-אפ הגרמנית Black Forest Labs שחררה את עדכון למודל יצירת התמונות החדש שלה, Flux 1.1 Pro, אשר מהיר פי שישה מקודמו ומשפר גם את איכות התמונות.

המודל החדש הוכרז לצד השקת הבטא של ממשק ה-API של החברה, המאפשר למפתחים לשלב את מודלי Flux באפליקציות שלהם.

Flux 1.1 Pro מציע מהירות גבוהה יותר, איכות תמונה משופרת והתאמה מדויקת להוראות המשתמש, כאשר בקרוב גם תתווסף תמיכה בתמונות באיכות 2K.

בנוסף, הוציאה החברה גם את Flux 1 Pro המעודכן, שיהיה מהיר פי שניים מקודמו, אך Flux 1.1 Pro עדיין מהיר פי שלושה ממנו.

המודלים זמינים בפלטפורמות כמו Together.ai ו-Freepik, והחברה מתכננת תמחור תחרותי לכל מודל.

לידיעה המקורית

שדרוג חוויית העבודה עם ChatGPT: הכירו את Canvas
שדרוג חוויית העבודה עם ChatGPT: הכירו את Canvas
  04/10/2024   |     מודלי שפה

זה היה רק עניין של זמן עד ש OpenAI ידביקו את הפער אל מול ממשק ה Artifacts של אנטרופיק ומן הסתם יציגו כמה יכולות יייחודיות.

החברה הכריזה הלילה על ממשק חדש בשם Canvas, המיועד לשיפור חוויית העבודה עם ChatGPT בפרויקטים של כתיבה וקוד.

הממשק נפתח בחלון נפרד ומאפשר שיתוף פעולה צמוד עם ChatGPT, כך שניתן לעבוד יחד על רעיונות, לערוך ולשפר אותם בזמן אמת.

ממשק ה Canvas זמין כרגע למשתמשי ChatGPT Plus ו-Team, ותוך זמן קצר יושק גם ליתר המשתמשים.

ה Canvas מספק כלים רבים לשיפור הקוד והכתיבה. אפשר לסמן קטעים מסוימים ולבקש מ-ChatGPT להתמקד בהם, להציע שינויים, לתקן באגים או להוסיף הערות.

הממשק הופך את ChatGPT לשותף פעיל יותר, שיכול לעקוב אחר התקדמות הפיתוח ולספק משוב בזמן אמת.

הממשק מתעדכן אוטומטית כאשר ChatGPT מזהה תרחיש מתאים, וניתן גם להפעיל אותו ידנית בעזרת הפקודה "Use Canvas".

בבכדי להפעיל את הממשק החדש יש לבחור מתפריט המודלים ב Chat GPT 4o with canvas

קישור לידיעה המקורית


כותרות מוצעות:

  • Canvas: שיתוף פעולה חדשני עם ChatGPT בפרויקטים של כתיבה וקוד
  • OpenAI מציגה את Canvas: ממשק חדש לעבודה צמודה עם ChatGPT
  • האם התקציר מספיק טוב?
איך בינה מלאכותית יכולה לעזור לך לפגוש את עצמך בגיל 60
איך בינה מלאכותית יכולה לעזור לך לפגוש את עצמך בגיל 60
  03/10/2024   |     מודלי שפה

כלי חדש מבוסס בינה מלאכותית מאפשר לך לפגוש את עצמך העתידי בדמותך בגיל 60.

המערכת פותחה על ידי חוקרים מ-MIT, הרווארד, אוניברסיטת קליפורניה וקבוצת Business-Technology בתאילנד.

כדי לשפר את הרציפות האישית שלך ואת הרווחה הנפשית

הכלי משתמש במודל שפה גדול המבוסס על מידע שניתן על ידי המשתמשים במטרה ליצור דמות וירטואלית המבוססת על הגרסה העתידית של המשתמש.

הדמות עונה על שאלות, מציעה תובנות ועצות על החיים העתידיים, תוך יצירת סיפור רקע ייחודי לכל משתמש.

המחקר מצא ששיחה קצרה עם "העתיד שלך" עוזרת להפחית חרדה ולהגביר את התחושה של חיבור עצמי (עם העצמי העתידי) :-).

למידע נוסף אודות המחקר והכלי.

גוגל מפתחת מודל שיפתור בעיות מסובכות בדומה ל o1 של OpenAI
גוגל מפתחת מודל שיפתור בעיות מסובכות בדומה ל o1 של OpenAI
  02/10/2024   |     מודלי שפה

גוגל עובדת על מודל בינה מלאכותית חדש שמטרתו להתחרות ב-OpenAI, בדגש על שיפור יכולות ההסקה הלוגית של המודל.

לפי דיווחים פנימיים, הפרויקט מתמקד בשיפור ביצועי ה-AI במשימות מורכבות כמו מתמטיקה ותכנות.

דו"ח של בלומברג חושף כי צוותים בגוגל התקדמו בפיתוח תוכנה שיכולה לפתור בעיות מרובות שלבים באמצעות גישה הנקראת "שרשרת מחשבה".

גישה זו כוללת יצירת מספר תשובות, הערכתן ובחירת הטובה ביותר.

מחקר של Google Deepmind מגלה כי הוספת כוח מחשוב בזמן ניתוח הנתונים משפרת את ביצועי המודל, והחוקרים הצליחו לשפר את היעילות ביותר מפי ארבעה.

המודל החדש מפותח על בסיס מודלים מתמטיים קודמים של גוגל כמו AlphaProof ו-AlphaGeometry, שהצליחו בתחרות האולימפיאדה המתמטית הבינלאומית.

קישור לידיעה המקורית

הפתרון המושלם ליצירת וידאו בתקציב מוגבל - Pika 1.5
הפתרון המושלם ליצירת וידאו בתקציב מוגבל - Pika 1.5
  02/10/2024   |     מודלי שפה

פיקה מציגה את Video Model 1.5 ואת "Pika Effects" המאפשרים למשתמשים להחיל אפקטים מיוחדים על הסרטונים שנוצרו כמו "ריסוק", "לחיצה" ו"הפיכת התמונה לעוגה".

עם תנועות היפר-ריאליסטיות וטכניקות צילום מתקדמות, המודל מציע אפשרויות יצירתיות חדשות ליצירת תוכן קולנועי ואיכותי.

פיקה 1.5 מתאימה לכל המשתמשים בזכות ממשק פשוט ואינטואיטיבי כששילוב האפקטים המתקדמים יכולים לשנות את כללי המשחק עבור עורכי וידאו מקצועיים ובעלי עסקים קטנים שמחפשים לייצר סרטונים ברמה גבוהה בתקציב נמוך.

השימושים מגוונים ונעים ממודעות פרסום מרשימות ועד לשדרוג חומרי לימוד או פרסומות.

קישור לידיעה המקורית

Vera AI מציגה פלטפורמת AI Gateway להטמעה בטוחה ומהירה של מודלי AI
Vera AI מציגה פלטפורמת AI Gateway להטמעה בטוחה ומהירה של מודלי AI
  02/10/2024   |     מודלי שפה

חברת Vera AI השיקה את פלטפורמת "AI Gateway"  אשר נועדה לעזור לארגונים להטמיע טכנולוגיות AI בצורה בטוחה ומהירה יותר.

הפלטפורמה מציעה "מעקות בטיחות" מותאמות לארגון אשר יכולות לנתב מודלים, במטרה להפחית סיכונים ולשפר את היישום העסקי של ה AI.

המנכ"לית ליז או'סאליבן הדגישה את העובדה שהפתרון של Vera נותן מכנה לבעיות מורכבות שנראות פשוטות, כמו הפחתת סיכונים ושמירה על מדיניות AI מותאמת אישית.

 עוד צויין שהפלטפורמה מאפשרת שליטה מלאה בקביעת הגדרות התגובה של המערכת לאיומי ה AI השונים.

החברה כבר מטפלת בעשרות אלפי בקשות למודלי AI בחודש, והיא מציעה תמחור מבוסס API וניסיון חינם למשך 30 יום. Vera מקווה לסייע לחברות ליהנות מיתרונות ה-AI תוך צמצום סיכונים אבטחת המידע.

לפרטים נוספים
עדכון ל Copilot של מיקרוסופט - קול, ראייה מבוססת AI והסקה מתקדמת במקום אחד
עדכון ל Copilot של מיקרוסופט - קול, ראייה מבוססת AI והסקה מתקדמת במקום אחד
  01/10/2024   |     מודלי שפה

מיקרוסופט משדרגת את העוזר החכם שלה, Copilot, ומוסיפה לו יכולות חדשות כמו אינטראקציה קולית, ניתוח תמונות והסקה מתקדמת.

עם הפיצ'ר החדש "Copilot Voice" ניתן לדבר עם העוזר, לבחור מתוך ארבעה קולות שונים, ולקבל עדכוני חדשות ומזג אוויר ישירות מהשירות "Copilot Daily".

השדרוגים יופעלו על iOS, אנדרואיד, וינדוס ואפילו ב-WhatsApp.

בנוסף, העוזר ישולב בדפדפן Edge, ויאפשר לקרוא דפים, לסכם טקסטים ולתרגם בזמן אמת.

תכונות ניסיוניות כמו "Copilot Vision" מנתחות עמודים ותמונות בזמן אמת, ותכונת "Think Deeper" מציעה תשובות מעמיקות לשאלות מורכבות.

החידושים ישולבו גם ביישומים כמו Paint, עם אפשרויות להוספת אלמנטים מבוססי AI לתמונות והסרת עצמים באופן חכם.

בנוסף, חיפוש הקבצים בוינדוס יקבל שדרוגים חכמים שיאפשרו חיפוש תמונות באמצעות טקסט, גם אם לא מופיעות בשם הקובץ עצמו.

קישור לידיעה המקורית

תנועות מצלמה ויצירת וידאו במהירות שיא - עדכון ל Luma Dream Machine
תנועות מצלמה ויצירת וידאו במהירות שיא - עדכון ל Luma Dream Machine
  01/10/2024   |     מודלי שפה

לומה AI שחררה עדכון חדש למכונת יצירת הווידאו שלה, Dream Machine, בגרסה 1.6.

המודל המעודכן מאפשר יצירת סרטונים באיכות מלאה תוך פחות מ-20 שניות, פי עשר מהר יותר מהגרסה הקודמת. שיפור זה הושג מבלי להתפשר על איכות התוצאה.

בגרסה זו נוספה גם האפשרות לשלב תנועות מצלמה בסרטונים, על ידי הוספת המילה "מצלמה" להנחיות.

Dream Machine מבוססת על ארכיטקטורת Transformer מתקדמת שנועדה לייצר סצנות מדויקות פיזית ועקביות מבחינת אינטראקציה של אנשים, בעלי חיים וחפצים.

בנוסף, לומה AI השיקה API חדש שמאפשר למפתחים לשלב את יכולות יצירת הווידאו של Dream Machine באפליקציות משלהם.

השירות מוצע במחיר של $0.32 למיליון פיקסלים, ומאפשר המרה מטקסט לווידאו, המרת תמונות לווידאו ושליטה בתנועות המצלמה.

פינטרסט הופכת תמונות מוצרים למעוררות השראה עם GenAI
פינטרסט הופכת תמונות מוצרים למעוררות השראה עם GenAI
  01/10/2024   |     מודלי שפה

פינטרסט מצטרפת לחברות כמו גוגל ואמזון ומשיקה כלים חדשים מבוססי בינה מלאכותית יוצרת (GenAI) עבור מפרסמים.

החברה הציגה את הכלים החדשים באירוע Pinterest Presents.

הכלי החדש מאפשר למפרסמים לשדרג את תמונות המוצרים שלהם על ידי שינוי הרקעים בעזרת בינה מלאכותית, מה שהופך את התמונות למעוררות השראה.

לדוגמה, רשת Walgreens שהתנסתה בטכנולוגיה, דיווחה על עלייה של 55% בלחיצות וירידה של 13% בעלות לכל לחיצה הודות לרקעים החדשים.

בנוסף, הכלים של פינטרסט יפחיתו את כמות העבודה הנדרשת ליצירת קמפיינים ב-50%, והמפרסמים יוכלו לשלב כלים שונים לפי הצרכים שלהם.

במהלך ניסויים מוקדמים, המפרסמים ראו ירידה של 64% בעלות לפעולה ועלייה של 30% בשיעורי ההמרה.

קישור לידיעה המקורית

Open NotebookLM כלי חדש ומרשים להמרת PDF לפודקאסטים
Open NotebookLM כלי חדש ומרשים להמרת PDF לפודקאסטים
  30/09/2024   |     מודלי שפה

גבריאל צ'ואה, מדען נתונים מסינגפור, פיתח כלי בקוד פתוח בשם "Open NotebookLM" תוך אחר צהריים אחד בלבד

הכלי החדש ( כפי ששמו מרמז) מהווה תחרות ישירה ל-NotebookLM של גוגל.

הכלי ממיר מסמכי PDF לפודקאסטים מותאמים אישית, עם יתרון מרכזי אל מול הכלי של גוגל - הוא מבוסס קוד פתוח לשימוש.

הכלי משתמש במודל השפה של Meta Llama 3.1 ומערכת סינתזת הקול MeloTTS באמצעות ממשק ידידותי ב-Hugging Face .

הפיתוח המהיר של כלים כמו Open NotebookLM מדגיש את היתרון בשילוב כלים מבוססי קוד פתוח.

עם זאת, למרות היכולת לשכפל יישומי AI מורכבים במהירות, יש חשש לאיכות ולמהימנות של כלים כאלו לעומת מוצרים מסחריים כמו NotebookLM של גוגל.

הפצת כלים פתוחים יוצרת הזדמנויות אך גם סיכונים, במיוחד בתחום הפרטיות והאבטחה, ומציבה אתגרים סביב הפיתוח האחראי של טכנולוגיות AI.

קישור לאתר המפתח

קישור לכלי ב HuggingFace

קישור לכלי ב GitHub

מטא בוחנת תוכן מבוסס AI ומותאם  אישית באפליקציות השונות שלה
מטא בוחנת תוכן מבוסס AI ומותאם אישית באפליקציות השונות שלה
  28/09/2024   |     מודלי שפה

מטא בודקת תכונה חדשה שמכניסה תוכן שנוצר על ידי AI ישירות לפידים של פייסבוק ואינסטגרם, בהתאם לתחומי העניין של המשתמשים ולטרנדים עדכניים.

התוכן המותאם משתנה בזמן אמת לפי העדפות המשתמשים, שיכולים להנחות את הבינה המלאכותית באמצעות הוראות טקסטואליות (הנחיות).

בנוסף, מטא מוסיפה יכולות קוליות לעוזר האישי Meta AI, שמאפשרות למשתמשים לשאול שאלות על תמונות, לערוך אותן, ולקבל תרגום אוטומטי לסרטוני Reels.

החברה מדווחת כי 400 מיליון אנשים משתמשים במטא AI מדי חודש, כאשר 185 מיליון משתמשים בו מדי שבוע.

מטרת השינויים היא כנראה להגדיל את זמן השימוש בפלטפורמות של מטא ולהעלות את הכנסות הפרסום.

עם זאת, בחברה הדגישו שהם לוקחים בחשבון גם שיקולים כמו ההשפעות החברתיות והנפשיות של השימוש בתכנים שנוצרים על ידי AI, תוך שהם מוודאים שנקבעים כללים ברורים למניעת השפעות שליליות.

קישור לידיעה המקורית

חברת OpenAI משחררת את מצב הקול המתקדם לכל המשתמשים
חברת OpenAI משחררת את מצב הקול המתקדם לכל המשתמשים
  26/09/2024   |     מודלי שפה

חברת OpenAI השיקה את מצב הקול המתקדם ל-ChapGPT Plus ולמשתמשים ברישוי טימס.

הפונקציה החדשה מאפשרת אינטראקציות קוליות עם העוזר הבינה המלאכותית תוך שיפור האינטרקציה שהייתה קיימת עד היום במהירות ואיכות השיחה.

עם זאת, רוב היכולות שהוצגו בהדגמות עדיין לא זמינות, כמו עיבוד תמונות וסרטונים וזיהוי רגשות.

בנוסף, מצב הקול המתקדם אינו זמין באיחוד האירופי, בריטניה, שווייץ ומדינות אירופיות נוספות, ייתכן בשל הגבלות חוק ה-AI של האיחוד.

חברות אחרות כמו גוגל כבר הציגו מוצרים דומים, אך עם יכולות בינוניות ביחס למודל של OpenAI.

עם קולות חדשים וכלים לעריכת תמונות Meta משפרת את כלי ה AI שלה
עם קולות חדשים וכלים לעריכת תמונות Meta משפרת את כלי ה AI שלה
  25/09/2024   |     מודלי שפה

בכנס Connect ה-11 של מטא, הציג מארק צוקרברג חידושים במציאות מעורבת, בינה מלאכותית ומוצרים לבישים.

אחד הדגשים היה Meta AI, עוזר ה-AI של החברה, אשר משמש כ-400 מיליון אנשים בחודש ו-185 מיליון מדי שבוע.

לצורך שיפור התקשורת עם העוזר, מטא תשלב הזנת קול בפייסבוק, מסנג'ר, וואטסאפ ואינסטגרם, בתחילה באנגלית ובמדינות כמו אוסטרליה, קנדה וארה"ב.

הקולות של ידוענים כמו אקוופינה, דיים ג'ודי דנץ' וג'ון סינה ישמשו להעניק אישיות לעוזר ה-AI.

בנוסף, Meta בוחנת סנכרון אוטומטי של שפתיים בוידאו עבור רילס באינסטגרם ובפייסבוק, מה שיכול להרחיב את הגישה לתוכן בשפות שונות ולהשפיע על חברות סטארטאפ כמו HeyGen.

כלי עריכה מבוססי AI מאפשרים כעת לשאול שאלות על תמונות שהועלו ולשנות אלמנטים בתמונות אמיתיות באמצעות פקודות קוליות, הודות למודלים החדשים של Llama 3.2.

החברה ממשיכה לצמצם את הפער מול המתחרים כמו OpenAI, עם דגש על פונקציות מעשיות שמיועדות לשימוש יומיומי.

קישור לידיעה המקורית

אוריון - משקפי ה-AR של Meta נחשפים אחרי עשור של פיתוח
אוריון - משקפי ה-AR של Meta נחשפים אחרי עשור של פיתוח
  25/09/2024   |     מודלי שפה

משקפי Ray-Ban Meta Smart Glasses מקבלים עדכונים חדשים, כולל תזכורות, פקודות קוליות, סריקת קודי QR ,מספרי טלפון, ומדריך טיולים אישי בזמן אמת הודות לתמיכה מורחבת של Meta-AI.

בקרוב, המשקפיים יוכלו לתרגם ספרדית, צרפתית ואיטלקית בזמן אמת לאנגלית.

שיתוף הפעולה עם Be My Eyes מאפשר למשתמשים לחוות את הסביבה דרך עיני אנשים עם מוגבלות ראייה.

הקולקציה מתרחבת עם עדשות מעבר חדשות ודגם Wayfarer שקוף במהדורה מוגבלת.

אחת ההכרזות המרכזיות בכנס של מטא הייתה אוריון, אבטיפוס למשקפי ה-AR הראשונים של מטא, עליו עבדו בחברה במשך עשור.

המשקפיים האלחוטיים שוקלים פחות מ-100 גרם, כוללים עשרה שבבי סיליקון מותאמים אישית ותצוגות בהירות עם שדה ראייה רחב (70 מעלות).

המשקפיים כוללים שליטה קולית, מעקב עיניים וידיים, וצמיד EMG לאינטראקציה ושליטה בתפריטים.

קישור לידיעה המקורית

גרסה 3.2 ל Llama של מטא תמיכה בתמונות ופתרונות לעיבוד מקומי
גרסה 3.2 ל Llama של מטא תמיכה בתמונות ופתרונות לעיבוד מקומי
  25/09/2024   |     מודלי שפה

חברת מטא השיקה את Llama 3.2 עדכון למודלי ה AI של החברה עם מודלים קלים שמתאימים לסמארטפונים ומודלים מתקדמים המסוגלים להבין תמונות.

המודלים  הקלים כוללים מודלים עם 1 ו-3 מיליארד פרמטרים, שניתן להריץ על סמארטפונים ולבצע עיבוד מקומי לטקסטים, סיכומים, ושכתוב תוכן.

מטא עבדה עם יצרניות כמו קוואלקום ו-MediaTek כדי להבטיח מהירות ופרטיות בעיבוד מקומי.

בנוסף למודלים הקלים, מטא משחררת דגמים מתקדמים יותר עם 11 ו-90 מיליארד פרמטרים, שיכולים להתמודד עם משימות הבנת תמונות ברמת מורכבות גבוהה.

המודלים כוללים משקלות מיוחדים שמשלבים את קידוד התמונות במודל השפה. החברה גם השיקה מערכת API חדשה שנועדה לפשט פיתוח עם דגמי Llama, בשיתוף עם AWS ו-Databricks.

למרות החידושים, ל-מטא יש תחרות קשה מול פתרונות מקומיים של Android ו-iOS בתחום ה-AI למכישירים ניידים.

קישור לידיעה המקורית

מחקר חדש עוקף את reCAPTCHA של גוגל עם 100% הצלחה
מחקר חדש עוקף את reCAPTCHA של גוגל עם 100% הצלחה
  25/09/2024   |     מודלי שפה

מחקר חדש של חוקרים מ-ETH ציריך חושף כי מערכת reCAPTCHAv2 של גוגל ניתנת לעקיפה בצורה מלאה בעזרת אלגוריתמים מתקדמים לזיהוי תמונות.

החוקרים פיתחו שיטה לעקוף את reCAPTCHAv2 עם 100% הצלחה, תוך שימוש במודלי YOLO לפירוק תמונות וסיווגן.

השיטה פותרת אוטומטית את כל סוגי המשימות במערכת, כולל סיווג תמונות ברשת 3x3, פירוק תמונה יחידה, וטיפול בסיווג דינמי עם תמונות מתחלפות.

לצורך אימון המודלים, השתמשו החוקרים בכ-14,000 תמונות מסומנות.  להצלחת הפירוק הם השתמשו ב-YOLOv8 שעבר אימון קודם על מספר רב של קטגוריות.

השיטה עוקפת את reCAPTCHAv2 לחלוטין על ידי שימוש ב-VPN, תנועות עכבר ריאליסטיות ונתוני דפדפן, מה שמנע את זיהוי המערכת.

החוקרים פרסמו את קוד המקור לצורך מחקר נוסף והמליצו להרחיב את מאגר הנתונים לפירוק תמונות, וכן לבדוק באיזה שלב פתרון מתמשך של CAPTCHA מפעיל חסימה.

למחקר

כלי חדש מבית סטנפורד - STORM - מערכת ה-AI  שמבצעת אוטומציה לכתיבת מאמרים
כלי חדש מבית סטנפורד - STORM - מערכת ה-AI שמבצעת אוטומציה לכתיבת מאמרים
  25/09/2024   |     מודלי שפה

חוקרים מאוניברסיטת סטנפורד פיתחו את STORM, מערכת AI שמבצעת אוטומציה בכתיבת מאמרים בסגנון ויקיפדיה.

הכלי STORM חוקר את הנושא, אוסף מקורות ויוצר מתווה מפורט לפני הכתיבה.

המערכת משתמשת בשאלות מונחות פרספקטיבה ושיחות מדומות עם מומחים כדי לשפר את הבנת הנושא ולהכין את המתווה למאמר.  בשלב הבא, STORM הופך את המתווה למאמר שלם.

החוקרים בדקו את הביצועים באמצעות מאגר FreshWiki וגילו שהמערכת מציגה מבנה טוב יותר וסקירה רחבה יותר בהשוואה למערכות אחרות.

עם זאת, נמצאו אתגרים כמו העברת הטיות ממקורות מידע וקשרים בין עובדות בלתי תלויות.

למרות שהטקסטים ש-STORM מייצר לא מגיעים לאיכות של מאמרים שנכתבו וערוכים על ידי בני אדם, המערכת מבטיחה לייעל את תהליך ההכנה לכתיבה.

קישור לכלי

קישור לקוד ב GIT

קישור למחקר

המודל בקוד פתוח Molmo של Ai2 מציב סטנדרט חדש למולטימודאלים
המודל בקוד פתוח Molmo של Ai2 מציב סטנדרט חדש למולטימודאלים
  25/09/2024   |     מודלי שפה

מכון אלן לבינה מלאכותית (Ai2) השיק את Molmo – משפחה של כלי AI מולטימודאליים בקוד פתוח שלפי דברי החברה שמשתווים ואף עוקפים את המתחרים המובילים כמו GPT-4o ו-Claude 3.5 במגוון מבחנים.

המודלים במשפחת Molmo יכולחפ לנתח תמונות ומסמכים, והם עושים זאת בעזרת טכניקות אימון חדשניות שמשתמשות בהרבה פחות נתונים.

המטרה היא להנגיש את הטכנולוגיה בקוד פתוח, ולספק לחוקרים ולחברות מודלים חזקים שניתן לשלוט בהם בצורה מלאה.

המודלים במשפחה הם :

Molmo-72B: המודל המוביל עם 72 מיליארד פרמטרים, מבוסס על המודל Qwen2-72B של Alibaba Cloud.

Molmo-7B-D: מודל דמו עם 7 מיליארד פרמטרים, מבוסס על המודל Qwen2-7B של Alibaba.

Molmo-7B-O: מודל מבוסס על OLMo-7B של Ai2.

MolmoE-1B: מודל מבוסס על OLMoE-1B-7B, תערובת של "מומחים" (mixture of experts).

Ai2 מתכננת להוסיף עוד מודלים וכלים בעתיד הקרוב ולחלוק את הקוד עם הקהילה דרך פלטפורמת Hugging Face.

כל המודלים ניתנים לשימוש בקוד פתוח תחת רישיון Apache 2.0, מה שמאפשר חופש למחקר ושימוש מסחרי.

לידיעה המקורית

למודל ב HuggingFace

מיקרוסופט משיקה כלי לתיקון
מיקרוסופט משיקה כלי לתיקון 'הזיות' בטקסט שנוצר על ידי AI
  24/09/2024   |     מודלי שפה

מיקרוסופט השיקה כלי חדש ב-Azure AI Content Safety שמאתר ומתקן "הזיות" בטקסט שנוצר על ידי AI.

הכלי, הנמצא כעת בתצוגה מוקדמת, אופן הפעולה של הכלי הוא באמצעות השוואה של התוכן שנוצר למסמכים מקוריים כדי לזהות תוכן לא נתמך ולתקן אותו.

מיקרוסופט מדגישה שהכלי לא מבטיח דיוק מלא, אלא משפר את ההתאמה בין התוכן שנוצר למסמכים המקוריים.

המערכת מופעלת כאשר היא מזהה משפטים שאינם נתמכים, ומבקשת ממודל AI קטן לתקן את המשפט בהתאם למידע מהמסמך.

במקרים מסוימים המשפט מסונן לחלוטין, ובאחרים הוא נכתב מחדש כדי להתאים אותו למקור.

נתונים ראשוניים מראים שהשיטה יעילה בזיהוי ותיקון חוסר עקביות, אך אינה מבטיחה דיוק כללי.

מיקרוסופט מקווה שהכלי יקל על אימוץ AI בתחומים קריטיים כמו רפואה, אך יש מבקרים שטוענים שהשימוש ב-AI לתיקון שגיאות AI עשוי ליצור תחושת ביטחון כוזבת.

קישור לידיעה המקורית

דגמי Gemini 1.5 החדשים של גוגל: יותר כוח, מהירות ועלויות מופחתות
דגמי Gemini 1.5 החדשים של גוגל: יותר כוח, מהירות ועלויות מופחתות
  24/09/2024   |     מודלי שפה

גוגל מעדכנת את מודלי ה AI של Gemini ומציעה יותר כוח, מהירות בעלויות מופחתות.

המודלים החדשים, Gemini-1.5-Pro-002 ו-Gemini-1.5-Flash-002, מציגים שיפורים משמעותיים במיוחד בתחומים כמו מתמטיקה, הקשר ארוך ומשימות ויזואליות.

בנוסף, גוגל הפחיתה את מחירי הטוקנים ביותר מ-50% והגדילה את מהירות הביצועים של המודלים.

במבחני מתמטיקה כמו MMLU-Pro, הביצועים השתפרו בכ-7%, ובמבחני מתמטיקה נוספים, כגון MATH ו-HiddenMath, נרשמה עלייה של 20%.

שיפורים ניכרים גם במשימות ויזואליות ותכנות Python. גוגל טוענת שהמודלים מספקים תגובות מועילות יותר תוך שמירה על סטנדרטים של בטיחות תוכן.

המודלים המעודכנים זמינים דרך Google AI Studio, ה-API של Gemini ו-Vertex AI עבור לקוחות Google Cloud.

התמחור החדש ייכנס לתוקף ב-1 באוקטובר 2024.

קישור לידיעה המקורית