K a m e d i a

Loading Website

בינה שבועית - השבוע שהיה בבינה המלאכותית היוצרת

מציג 373 ידיעות
חברת OpenAI מציגה את GPT-4.5 - מרגיש כמו לדבר עם אדם אמיתי
חברת OpenAI מציגה את GPT-4.5 - מרגיש כמו לדבר עם אדם אמיתי
  28/02/2025   |     מודלי שפה

אני מציע מדד חדש, לא נבדוק איזה מודל חכם יותר אלא כמה זמן הוא מחזיק מעמד בראש הטבלה.

OpenAI משיקה את GPT-4.5: מודל הבינה המלאכותית "הגדול בעולם"  (נשמע לכם מוכר).

המודל החדש, ששוחרר כבטא מחקר (Research Preview), מציג שיפורים משמעותיים באיכות השיחה, הפחתת הזיות ותחושה טבעית יותר – אך במחיר גבוה משמעותית מהמודלים הקודמים.

המודל GPT-4.5 זמין בשלב זה למשתמשי ChatGPT Pro ולמפתחים, כאשר משתמשי Plus ו-Team צפויים לקבל גישה בשבוע הבא.

לפי ההכרזה של OpenAI המודל החדש שמוכר גם בשם Orion, הוא המודל הגדול ביותר שאי פעם אימנה החברה – ואף ייתכן שהוא מודל הבינה המלאכותית הגדול בעולם.

בניגוד למודלים מסדרת o והמודל החדש o3-mini, שמשתמשים בגישה מבוססת "היגיון" (reasoning), GPT-4.5 ממשיך את המסורת של מודלים גדולים קלאסיים, כשהשיפור העיקרי שלו מגיע מהגדלת כמות הנתונים ושיפור תהליכי האימון.

למרות עוצמתו, מציינים ב OpenAI שהם לא רואים בו מודל "פורץ דרך" לעומת מודלים עתידיים שהיא צפויה לשחרר.


במבחני ביצועים, GPT-4.5 הפגין שיפורים ניכרים בתחומים כמו בדיקת SimpleQA בה הוא הציג עלייה חדה בדיוק מ-38.2% (GPT-4o) ל-62.5%, וכן ירידה משמעותית בשיעור ההזיות מ-61.8% ל-37.1%.

במבחנים רב-לשוניים (MMMLU) ורב-מודליים (MMMU), הוא מציג תוצאות טובות יותר מקודמיו עם ציונים של 85.1% ו-74.4% בהתאמה.

עם זאת, בתחומים כמו מתמטיקה (AIME '24) הוא אמנם טוב יותר מ-GPT-4o (36.7% לעומת 9.3%), אך נופל משמעותית לעומת o3-mini (87.3%).

במבחני תכנות, הוא מציג שיפור ב-SWE-Lancer Diamond Test (32.6% לעומת 23.3% של GPT-4o), אך נותר מאחור במבחנים כמו SWE-Bench Verified Test (38.0% לעומת 61.0% של o3-mini).

סם אלטמן, מנכ"ל OpenAI, תיאר את המודל כ"ראשון שמרגיש כמו שיחה עם אדם חושב". לדבריו, המודל אולי לא שובר שיאים בבנצ'מרקים, אך יש לו קסם מיוחד שהופך את השיחה לחוויה עמוקה יותר.

אנדריי קרפתי, ממייסדי OpenAI, הסביר כי כל קפיצה של 0.5 בגרסאות משקפת בערך פי עשרה יותר חישובים באימון, אך הדגיש כי ההתקדמות אינה תמיד מוחשית במספרים – אלא בתחושת השימוש.

המודל החדש יוצר עניין רב בקהילה, במיוחד בשל השיפור בתחושת ה"שיחה הטבעית" עם AI. עם זאת, מחירו הגבוה – 75 דולר למיליון טוקנים נכנסים ו-150 דולר למיליון טוקנים יוצאים – מעורר תהיות לגבי זמינותו לשימוש רחב בעתיד.

קישור ל System card

קישור למידע נוסף

גרסה 2.2 של Pika הושקה, עם וידאו ארוך ואיכות קולנועית
גרסה 2.2 של Pika הושקה, עם וידאו ארוך ואיכות קולנועית
  27/02/2025   |     מודלי שפה

הסטארטאפ Pika עדכן את מודל הוידאו לגרסה 2.2  אשר מציגה מספר שדרוגים משמעותיים במודל.

גולת הכותרת היא תמיכה בסרטונים באורך של עד 10 שניות, שיפור משמעותי לעומת הגרסאות הקודמות.

בנוסף, איכות הוידאו קופצת ל-1080p, מה שמספק חדות מרשימה ותוצאה קולנועית.

חידוש נוסף הוא Pikaframes, פיצ'ר שמאפשר יצירת מעברים חלקים בין סצנות באורך 1-10 שניות, מה שמסייע לשלב תמונות וטקסטים לווידאו רציף.


המשתמשים בגרסה מתארים את התוצאה כ"מרהיבה" עם דיוק גבוה יותר בהיענות להנחיות טקסטואליות – דבר שהופך את הכלי לרלוונטי במיוחד בתעשיית הפרסום והקולנוע.

משתמשים יכולים כבר עכשיו להתנסות ב-Pika 2.2 דרך האתר הרשמי, כשגרסאות ה-Pro וה-Fancy מציעות שימוש מסחרי.

קישור להכרזה המקורית

אמזון חושפת: Alexa+ הדור החדש של העוזרת האישית
אמזון חושפת: Alexa+ הדור החדש של העוזרת האישית
  26/02/2025   |     מודלי שפה

ממש כמו בסרט iRobot דור רובוטים ישן עובר ומחסנים ודור חדש תופס שליטה על חיינו.

אמזון חושפת את Alexa+, גרסה מתקדמת של העוזרת החכמה על בסיס מודלי הבינה המלאכותית הגנרטיבית החדשים.

Alexa המחודשת היא שיתוף פעולה בין אמזון לאנטרופיק והמודל שלהם קלוד. Alexa+ מאפשרת שיחות טבעיות וזורמות, מבינה ביטויים מורכבים, ומגיבה באופן אינטואיטיבי כדי ליצור אינטראקציה הדומה לשיחה אנושית.

השדרוגים החדשים מבוססים על שילוב של מודלים שפתיים גדולים (LLMs) ו"מומחים" – מערכות ו-APIs ייעודיים שמרחיבות את יכולות הביצוע של העוזרת בגרסתה החדשה.

כפי שהיה בעבר Alexa+ יכולה לשלוט במכשירי בית חכם, לבצע רכישות, להזמין מצרכים, לנגן מוזיקה ולתאם שירותים – והכול תוך למידה מתמדת של העדפות המשתמש. בנוסף, היא פועלת כסוכן עצמאי שמבצע משימות באינטרנט, כמו קביעת תיקונים למכשירים ביתיים, ללא צורך בהתערבות ישירה.

התכונות החדשות משפרות משמעותית את חוויית השימוש והופכות את Alexa+ לעוזרת חכמה יותר מכל גרסה קודמת.

אמזון מציעה את Alexa+ ללא תשלום נוסף למנויי Amazon Prime, על בסיס הפריסה העצומה של כ 100 מיךיון מכשירים בעולם שמחוברים לאקלסה ישירות או באצעות צד שלישי.

קישור למידע נוסף

חברת Anthropic חושפת את Claude 3.7 Sonnet
חברת Anthropic חושפת את Claude 3.7 Sonnet
  24/02/2025   |     מודלי שפה

תעשו פרצוף של מופתעים - הגיע מודל חדש וחזק יותר מהמתחרים !

חברת Anthropic חושפת את Claude 3.7 Sonnet – גרסה מעודכנת של קלוד סונט עם יכולות חשיבה מתקדמות!

המודל החדש מציג יכולת "חשיבה מורחבת" המאפשרת לו לנתח ולתכנן תשובות בצורה מעמיקה יותר, תוך שיפור ביצועים בתחומים כמו מתמטיקה, פיזיקה ותכנות.

ב Anthropic מגדירים את המהלך כצעד לקראת אינטגרציה מלאה של יכולות נימוק במודלים חכמים, כשהיא מקדימה את OpenAI שהכריזה על תוכניות דומות עבור GPT-5.

אך העדכון המשמעותי באמת מסתתר בכלי החדש שהחברה שחררה אשר המבוסס על הגרסה החדשה 3.7 של קלוד.

Claude Code – כלי חדש למפתחים המאפשר אוטומציה של משימות תכנות מורכבות ישירות מטרמינל או סביבת הפיתוח (IDE) של המפתחים.

הכלי יודע לערוך קבצים, להריץ בדיקות, לעדכן קוד ל-GitHub ולחסוך עשרות דקות עבודה בכל משימה. כרגע הוא זמין כתצוגת מחקר מוגבלת, אך משתמשים רבים ברשת כבר מציגים תוצאות מרשימות עם הכלי החדש.

כבר תקופה ארוכה מפתחים שעובדים עם הגרסה הקודמת של קלוד Claude 3.5 Sonnet מדווחים על תוצאות מרשימות ומדוייקות בכתיבת קוד. החסרון שלו היה בצורך להעתיק כל פעם מקטעי קוד לסביבית הפיתוח וחוסר היכולת של המודל לראות את התמונה המלאה.

את כל זה קלוד פתרו עם הכלי החדש. למעשה לאור התחרות מהחברות האחרות נראה שקלוד בחרו למנף את החוזקה של המודל שלהם בתחו הקוד ליצירת יתרון אל מול המתחרים.

בחרה Anthropic מבטיחים שיפורים נוספים בביצועי המודל, כולל זיהוי חכם יותר של בקשות מזיקות מצד המשתמשים והפחתת סירובים מיותרים ב-45%.

החברה צופה פריצות דרך ב-AI רק ב-2027, אך כבר כעת Claude 3.7 Sonnet חוסך למשתמשים "שעות עבודה" בביצועים ברמת מומחים בתחומים השונים בהם קלוד נותן מענה.

קישור למידע נוסף

האם ההמודל החכם ביותר הגיע מבית מדרשו של אילון מאסק
האם ההמודל החכם ביותר הגיע מבית מדרשו של אילון מאסק
  18/02/2025   |     מודלי שפה

אילון מאסק ( xAI ) השיק את Grok 3, המודל החדש והשאפתני שלו, עם כוח מחשוב משודרג ותכונת חיפוש עמוק (DeepSearch).

החלטתי הפעם להמתין קצת עם שבחים ולבדוק את הצ'ט בעצמי במשימות קוד, חיפוש מעמיק ברשת, תמונות ועוד.

אם ננקה רגע את הפרזנטציה שהרגישה ממש כמו השקת OpenAI סידרתית - חבורה של חנונים סביב שולחן מציגים השוואות שרוב הציבור לא מבין והרוב לא באמת יודעים לתקף וחייבים לסמוך על טבלאות השוואה שרלוונטיות בדיוק לדקה בה נכנסים אליהם.

בחוויה האישית המודל באמת מציג יכולות מרשימות,

מאסק טוען כי הוא עולה בביצועיו על GPT-4o ומודלי AI אחרים. לדברי xAI, הוא אומן במרכז נתונים ענק המכיל 200,000 יחידות GPU, שנבנה בתוך 122 ימים בלבד. ההשקה כללה גם את DeepSearch, (והם כבר לא מתביישים לקחת אחת מהשני את שמות הפי'צרים בלי כלל להתאמץ לגוון) תכונת חיפוש שמנתחת מידע מרשת X והאינטרנט, ומספקת תובנות מעמיקות במקום רשימת תוצאות.


הנה עוד כמה נקודות חשובות שעלו בהשקה :

המודל Grok 3 הושק לפני השלמת האימון – למרות ש-Grok 3 כבר שוחרר, אימונו עדיין לא הושלם, מה שמצביע על כך שהוא עשוי להשתפר באופן משמעותי בתקופה הקרובה.

האצה במחזורי ההשקה – מאסק ציין שמשתמשים עשויים להבחין בשיפורים יומיומיים, מה שמרמז על עדכונים מהירים יותר בעקבות התחרות מול DeepSeek-R1 ומודלים אחרים.

יתרון הגודל, אך לא רק – ההצלחה של Grok 3 מיוחסת לא רק לעוצמת החישוב של ה-Colossus Supercluster, אלא גם לטכניקות חדשות ששימשו לשיפור הביצועים (הפרטים המדויקים עדיין לא פורסמו).

מדיניות קוד פתוח – מאסק אישר כי xAI תמשיך במדיניות של שחרור הקוד של הגרסה הקודמת ברגע שהגרסה החדשה תהיה יציבה, כלומר Grok 2 צפוי להפוך לקוד פתוח בעתיד הקרוב.

הגבלת שקיפות כדי למנוע העתקה – xAI לא תציג את מלוא תהליך החשיבה (CoT) של Grok 3 כדי למנוע זיקוק והעתקה על ידי מתחרים, אלא תספק תצוגה חלקית בלבד.

קישור לידיעת ההכרזה

מחקר מתקדם בלחיצת כפתור – Perplexity מציגה את Deep Research
מחקר מתקדם בלחיצת כפתור – Perplexity מציגה את Deep Research
  14/02/2025   |     מודלי שפה

הסטארטאפ Perplexity השיק בסוף השבוע כלי חדש למחקר מעמיק המבוסס אשר מסוגל לבצע עשרות חיפושים ולנתח מאות מקורות תוך דקה (או שתיים), תהליך שצפוי לקחת לאנשים שעות.

הכלי פועל בתהליך איטרטיבי תוך שהוא מחפש מידע, קורא מסמכים ומתעמק בהתאם למה שהוא מצא.

את המידע שהמודל יצר, ניתן לייצא לדוחות בפורמט PDF או לשתף אותם דרך Perplexity Pages.

המערכת מבוססת על המודל Deepseek-R1, מה שמאפשר לבצע מחקר מעמיק במחיר נמוך של 500 חיפושים ביום ב-20$ לחודש, לעומת 100 חיפושים ב-200$ אצל המתחרים מ OpenAI.

במבחני השוואה Perplexity התקרבה בביצועיה ל-Deep Research של OpenAI, אך זכתה לביקורת על הצגת נתונים ממוממנים בהשוואה למתחרים.

בחברת Perplexity מדגישים כי Deep Research מיועד לכל מי שרוצה לבצע מחקר ברמה מקצועית במהירות ובקלות, והוא מוצע בחינם לכל המשתמשים.

מנויים בתוכנית Pro יקבלו גישה בלתי מוגבלת, בעוד משתמשים חינמיים ייהנו ממספר מוגבל של חיפושים ביום.

הכלי כבר זמין בממשק בדפדפנים השונים והוא יושק בקרוב גם ב-iOS, Android ו-Mac.

קישור לידיעה המקורית

יותר חכם, יותר מהיר - כל החידושים בעורך הקוד של Windsurf
יותר חכם, יותר מהיר - כל החידושים בעורך הקוד של Windsurf
  13/02/2025   |     מודלי שפה

הסטארטאפ codeium ממשיך לחדש עם  המוצר Windsurf בגרסה Wave 3 שמציג שיפורים משמעותיים בעורך הבינה המלאכותית שלו למפתחים.

החידוש הגדול – תמיכה בפרוטוקול Model Context (MCP), שמאפשר לעורך לגשת למקורות מידע חיצוניים ולשלבם בתהליכי עבודה. כעת ניתן להגדיר שרתי MCP בקלות ולהשתמש בהם כמו כלי חיפוש קוד או פקודות טרמינל.

הפיצ'ר זמין למשתמשים פרטיים ויגיע בהמשך לתוכניות צוותים וארגונים. הפיצ'ר חדש נוסף הוא ה "Tab to Jump", מקדם את השלמה אוטומטית של קוד ב Windsurf.

מלבד קבלת השלמות חכמות, כעת ניתן לקפוץ במהירות בין נקודות עריכה רלוונטיות בקוד. משתמשים בתוכניות בתשלום מקבלים גם מצב "Fast Mode" שמאיץ את כל התהליך.

שיפורים כמו Turbo Mode לביצוע פקודות אוטומטיות, גרירה ושחרור של תמונות, ואפשרות להוספת אייקונים מותאמים אישית למשתמשי Mac

ב Windsurf מרחיבים את התמיכה במודלים חדשים, כולל DeepSeek-v3, GPT-4o ו-Gemini 2.0 Flash, עם התאמה חכמה ליכולות שלהם ולשימוש בקרדיטים לפי העלויות השונות.

בנוסף, הוכרז על "Windsurf Next" – גרסה מוקדמת למשתמשים שרוצים גישה ראשונה לחידושים לפני שהם מגיעים לגרסה הרשמית של המוצר.

קישור למידע נוסף

כותרות מוצעות:

  • Windsurf Wave 3: עורך ה-AI מתקדם לשלב הבא
  • Wave 3 כאן: מהפכת ההשלמה האוטומטית והאינטגרציות החדשות


https://codeium.com/blog/windsurf-wave-3
מודל הוידאו של גוגל Veo 2 נוחת ב-YouTube Shorts
מודל הוידאו של גוגל Veo 2 נוחת ב-YouTube Shorts
  13/02/2025   |     מודלי שפה

יוטיוב משדרגת את Shorts עם כוחה של הבינה המלאכותית!

הכלי Dream Screen, ליצירת רקעים עם בינה מלאכותית, מקבל שדרוג משמעותי עם Veo 2 – מודל הווידאו החדש של Google DeepMind.

כעת תוכלו לא רק לייצר רקעים אלא גם ליצור קליפים שלמים בהתאמה אישית שישתלבו בסרטוני Shorts שלכם.

אין לכם את הצילום המושלם? רוצים להפוך רעיון למציאות? פשוט הקלידו הנחיה טקסטואלית, ו-Veo 2 יפיק עבורכם וידאו איכותי שיתאים בדיוק לנרטיב שלכם.

המודל החדש מבין טוב יותר תנועות אנושיות ופיזיקה, ומאפשר גם בחירת סגנון, עדשה ואפקטים קולנועיים.

ליצירת קליפ, היכנסו למצלמת Shorts, בחרו "הוספה", ואז "יצירה". הזינו את ההנחיה, בחרו תמונה, והפכו אותה לווידאו מרהיב.

התכונה זמינה בארה"ב, קנדה, אוסטרליה וניו-זילנד – ובקרוב בעוד מדינות!

קישור למידע נוסף

גוגל משפרת את Gemini Advanced עם זיכרון שיחות וניתוח מתקדם
גוגל משפרת את Gemini Advanced עם זיכרון שיחות וניתוח מתקדם
  13/02/2025   |     מודלי שפה

גוגל הכריזה על שדרוג משמעותי ל-Gemini Advanced: היכולת לזכור שיחות קודמות ולספק תגובות מותאמות אישית.

מהיום, Gemini יכול להשתמש במידע משיחות קודמות כדי להמשיך דיונים קיימים, לסכם שיחות ישנות ולהציע תשובות חכמות יותר ללא צורך להתחיל מהתחלה.

המשתמשים שולטים במידע המאוחסן – ניתן לסקור, למחוק או להגדיר את משך הזמן שבו נשמר היסטוריית הצ'אטים. בנוסף, ניתן לכבות את פעילות Gemini Apps לחלוטין דרך "הפעילות שלי".

תכונה זו מתחילה להיפרס למנויי Google One AI Premium באנגלית דרך האפליקציה והאתר של Gemini, ובהמשך תתמוך בשפות נוספות ולקוחות Google Workspace עסקיים.

Gemini Advanced כולל גם יכולות עיבוד מתקדמות, תמיכה במסמכים, ניתוח נתונים, יצירת תמונות עם Imagen 3 ותמיכה בהעלאת קבצי קוד לניתוח ואופטימיזציה.

השירות נגיש בלמעלה מ-150 מדינות ותומך ביותר מ-45 שפות.

קישור לידיעה המקורית

חדש - ניתוח קצבים ותמונות במודלי o של OpenAI
חדש - ניתוח קצבים ותמונות במודלי o של OpenAI
  13/02/2025   |     מודלי שפה

OpenAI משדרגת את ChatGPT עם יכולות העלאת קבצים ותמונות!

העדכון החדש מאפשר למשתמשי o1 ו-o3-mini להעלות מסמכים (PDF, Word, CSV) ותמונות (PNG, JPEG) למודלים העדכניים.

כעת ניתן לסכם דוחות, לחלץ מידע מחוזים ולנתח נתונים בצורה מהירה ויעילה יותר.

השדרוג כולל גם תמיכה בזיהוי אובייקטים, ניתוח חזותי וזיהוי כתב יד, לצד יכולות חישוב וניתוח מתקדם של קבצי נתונים.

בנוסף, OpenAI מגדילה פי 7 את מגבלת השימוש ב-o3-mini-high למשתמשי Plus, מה שיכול לשפר משמעותית את זרימת העבודה בעיקר של חוקרים ואנשי מקצוע שנדרשים לספר פניות בכדי להגיע לתוצאה הרצויה.

השירות זמין בגרסת הווב, באפליקציות iOS/Android ובקרוב גם דרך ה-API.

קישור להכרזה המקורית ב X

אדובי משיקה את Adobe Firefly Video - הדור הבא של יצירת וידאו עם AI
אדובי משיקה את Adobe Firefly Video - הדור הבא של יצירת וידאו עם AI
  12/02/2025   |     מודלי שפה

Adobe משיקה את Firefly Video – המודל החדש של Firefly מאפשר יצירת וידאו גנרטיבי עם שליטה חסרת תקדים בתוצרים.

עכשיו תוכלו להפוך תמונות לווידאו, לתרגם אודיו למספר שפות וליצור קליפים בהתאמה אישית עם סגנונות מצלמה ואפקטים קולנועיים.

Firefly משלב וידאו, אודיו, תמונות ועיצוב וקטורי ביישום אחד, תוך אינטגרציה עם פוטושופ, אילוסטרייטור ו-Premiere Pro.

עם פיצ'רים כמו תרגום אוטומטי וליפ-סינק מתקדם, ניתן ליצור תוכן גלובלי בשפות שונות בקלות. חברת Adobe מבטיחה שכלי ה-AI שלה מבוססים על תוכן מורשה בלבד, כדי להבטיח זכויות יוצרים ותאימות מסחרית.


בנוסף, הושקו מסלולי Firefly Standard ו-Firefly Pro, עם אפשרות לגישה לתכונות פרימיום בוידאו ואודיו.

קישור למידע נוסף

https://blog.adobe.com/en/publish/2025/02/12/meet-firefly-video-model-ai-powered-creation-with-unparalleled-creative-control
סם אלטמן חושף את התוכניות למודלים הבאים של החברה
סם אלטמן חושף את התוכניות למודלים הבאים של החברה
  12/02/2025   |     מודלי שפה

סאם אלטמן, מנכ"ל OpenAI, חשף את מפת הדרכים של החברה למודלי הבינה המלאכותית הבאים: GPT-4.5 ו-GPT-5.

הוא הבטיח חוויה פשוטה יותר, ללא צורך בבחירת מודלים מסובכת, עם מעבר ל"אינטליגנציה אחידה".

המודל הבא, GPT-4.5 (המכונה "Orion"), יהיה האחרון ללא חשיבה מדורגת, בעוד ש-GPT-5 יאחד את מודלי OpenAI לכדי מערכת חכמה ואינטואיטיבית.

אלטמן הדגיש כי המטרה היא ליצור מערכת שתדע מתי לחשוב לעומק, תשתמש בכלי AI שונים, ותתאים למגוון רחב של משימות.

הגישה החדשה תאפשר גישה חופשית ל-GPT-5 למשתמשי ChatGPT החינמיים, בעוד שמנויי Plus ו-Pro יקבלו גרסאות חכמות יותר.

החברה מתכננת להשיק את המודלים הבאים תוך "שבועות או חודשים".

אלטמן הודה בצורך בגישה שונה כלפי קוד פתוח, אך ציין שזה אינו בראש סדר העדיפויות של OpenAI כרגע. 

קישור להכזרה ב X

כותרות מוצעות:

  • הסוף לבחירת מודלים? OpenAI מאחדת את מערכת ה-AI שלה
  • תחרות חזקה: OpenAI משיקה את GPT-5 מול האיום הסיני
https://x.com/sama/status/1889755723078443244
חברת Hugging Face משיקה את SmolLM2 - המודל הקטן שמנצח את Qwen ו-Llama
חברת Hugging Face משיקה את SmolLM2 - המודל הקטן שמנצח את Qwen ו-Llama
  10/02/2025   |     מודלי שפה

חברת Hugging Face משחררת את SmolLM2: מודל קטן שמנצח את Qwen ו-Llama ברוב המבחנים

חברת Hugging Face הכריזה על SmolLM2, מודל שפה חדש שמציע ביצועים מרשימים יחסית לגודלו. למרות שאינו פורץ דרך, הוא מהווה תוספת חשובה לפורטפוליו ה-AI של החברה, שממשיכה להוביל את תחום הבינה המלאכותית בקוד פתוח.

SmolLM2 מאומן על 11 טריליון טוקנים, תוך שילוב נתוני ווב, קוד ותוכן מתמטי.

לאחר האימון הראשוני, החוקרים שיפרו את המודל באמצעות התאמה מבוססת הוראות, למידה מבוססת דוגמאות ולמידת חיזוק – מה שהוביל לשיפור בהבנת משימות ובהתאמה לתגובות המשתמשים.

בנוסף לגרסת הבסיס עם 1.7 מיליארד פרמטרים, שוחררו גם שתי גרסאות קטנות יותר עם 360 ו-135 מיליון פרמטרים, המתאימות להרצה על מכשירים עם כוח עיבוד מוגבל.

בבנצ'מרקים של ידע והבנה, SmolLM2 מציג ביצועים טובים יותר מדגמים בגודל דומה כמו Qwen2.5-1.5B ו-Llama3.2-1B.

בעוד Meta ו-Qwen משתפות רק משקלים של מודלים, Hugging Face מאפשרת גישה מלאה לנתוני האימון, מה שמדגיש את מחויבותה לקוד פתוח.

החוקרים השתמשו בערכות נתונים מותאמות אישית כמו FineMath לבעיות מתמטיות, Stack-Edu לקוד מתועד היטב ו-SmolTalk לשיחות טבעיות.

קישור לפרטים נוספים

קישור למחקר

תוספת משמעותי למודל הוידאו Ray2 - יצירת וידאו מתמונה
תוספת משמעותי למודל הוידאו Ray2 - יצירת וידאו מתמונה
  10/02/2025   |     מודלי שפה

חברת Luma Labs הישראלי חשפה עדכון משמעותי למודל ה-AI שלה, Ray2, עם יכולות חדשות להמרת תמונות לסרטונים בפלטפורמת Dream Machine.

כעת, משתמשים יכולים להעלות תמונה סטטית, ו-Ray2 ייצור ממנה סרטון דינמי באיכות גבוהה עם תנועה טבעית ופיזיקה ריאליסטית.

Ray2 מציע סרטונים עם רמת פירוט משופרת, רצף אירועים לוגי ותוצאה שמתאימה לשימוש מקצועי.


המודל מאפשר יצירת סרטונים באורך של עד 10 שניות ברזולוציית 540p או 720p. התכונה החדשה זמינה למנויים בתשלום של Dream Machine.

בנוסף, Ray2 מספק כלים מתקדמים לעריכת וידאו, כולל ניהול פריימים מפתח (Keyframes), הרחבה ולולאות ליצירת נרטיב מדויק וזורם.

העדכון מהווה קפיצת מדרגה בתחום הווידאו מבוסס AI, ומעניק ליוצרים ומשווקים דרך חדשה להפוך תמונות סטטיות לחוויות ויזואליות מרתקות.

קישור להכרזה ב X 

לא סתם מנורה: Apple פיתחה מנורה עם בינה מלאכותית סטייל פיקסר
לא סתם מנורה: Apple פיתחה מנורה עם בינה מלאכותית סטייל פיקסר
  10/02/2025   |     מודלי שפה

מה אם המנורה שלכם יכלה לתקשר אתכם ממש כמו המנורה של פיקסר ? ושאלה נוספת, עד כמה סביבת העבודה שלנו צפויה להשתנות ?

כולנו מצפים לממשק השיח שצפוי לשלוט בסביבת העבודה שלנו, לאחר שהצ'ט (החכם) מזמן הפך לעובדה קיימת (ממש עוד רגע - מיושנת).

אז לצורך ההמחשה - צוות מהנדסים של Apple פיתח מנורת שולחן חכמה עם בינה מלאכותית, שמגיבה לסביבה וממלאת פקודות.

היא יכולה לראות באמצעות מצלמה, לשמוע דרך מיקרופון, לדבר עם רמקול ואפילו לזוז הודות למנועים קטנים.

בהשראת הסרט הקצר Luxo Jr. של פיקסאר, המנורה הזו "חיה" ממש כמו דמות – מתקרבת אם מזמינים אותה, מתרחקת אם מסמנים לה, ואפילו בודקת את מזג האוויר על ידי הצצה מהחלון לפני שהיא בודקת באינטרנט.

החוקרים מדגימים כיצד שילוב AI גורם לה להיות שימושית במיוחד – היא מזהה כשמשתמש מנסה להתמקד במשהו ומזיזה את עצמה כדי להאיר טוב יותר.

המנורה החדשה היא רק דוגמה לאופן שבו טכנולוגיה יכולה להפוך את חוויית השימוש / לקוח לחכמה ומלאת חיים. - לגמרי יציאה מהקופסה.

הכירו את Goku – המודל שמייצר סרטוני AI טבעיים
הכירו את Goku – המודל שמייצר סרטוני AI טבעיים
  07/02/2025   |     מודלי שפה

החברה הסינית ByteDance מציגה את Goku: מודל AI פורץ דרך ליצירת תמונות וסרטונים ריאליסטיים.

גו'ו היא משפחת של מודלים ליצירת תמונות ווידאו באמצעות טכנולוגיית Rectified Flow Transformers (RFTs).

המודל מתמקד בהפקת אנימציות חלקות וריאליסטיות, מה שהופך אותו לשימושי במיוחד עבור פרסום, רשתות חברתיות ותעשיות המדיה.

שלא כמו מודלי דיפוזיה רגילים, Goku משתמש בזרימה מתוקנת (rectified flow), המאפשרת מעברי תנועה טבעיים יותר, חישוב מהיר יותר ואיכות ויזואלית משופרת.

בנוסף, מנגנון Autoencoder תלת-ממדי (VAE) מקנה לו הבנה עמוקה יותר של דינמיקות תמונה-וידאו. הארכיטקטורה משלבת מנגנון תשומת לב מלא (Full Attention), אמבדינג RoPE תלת-ממדי ואלגוריתם Patch n' Pack המאפשרים גמישות ודיוק גבוהים.

במבחני ביצועים, Goku עוקף מודלים מתחרים כמו DALL-E 3 ו-SDXL בתחום יצירת תמונות וטקסט-ל-וידאו, ומשיג 84.85 בניקוד הכולל של VBench.

יכולתו לייצר וידאו מפורט עם תנועות טבעיות הציבה אותו כמוביל בקטגוריות כמו פעילות אנושית (97.60), אובייקטים מרובים (79.48) וסצנות ריאליסטיות (57.08).

קישור למודל ב Git

קישור למידע נוסף

חדש ב-Perplexity - העלאת קבצים ותמונות לניתוח מתקדם
חדש ב-Perplexity - העלאת קבצים ותמונות לניתוח מתקדם
  07/02/2025   |     מודלי שפה

Perplexity AI הכריזה על שדרוג משמעותי עם אפשרות להעלאת קבצים ותמונות לצד הרחבת חלון ההקשר ל-1 מיליון טוקנים.

משתמשים רשומים במצב "Auto" יכולים כעת להעלות מסמכים ותמונות לניתוח מעמיק, מה שמאפשר אינטראקציה חכמה ומקיפה יותר עם ה-AI.

השדרוג כולל תמיכה בפורמטים כמו PDF, JPEG, HEIF ו-PNG, עם מגבלת גודל של עד 25MB לכל קובץ.

המערכת מסוגלת לזהות תמונות ולפרש גרפיקה, בנוסף, Perplexity מדגישה כי התמונות אינן נשמרות בשרתים שלה, כדי לשמור על פרטיות המשתמשים.

הרחבת חלון ההקשר ל-1 מיליון טוקנים משפרת משמעותית את יכולת המערכת להתמודד עם מסמכים גדולים וניתוחים מורכבים.

עם זאת, ישנם דיווחים על חוסר עקביות בפונקציונליות כאשר הקבצים גדולים במיוחד.

קישור להכרזה המקורית ב X

השפעת התחרות - חברת OpenAI פותחת את o3-mini לכל המשתמשים
השפעת התחרות - חברת OpenAI פותחת את o3-mini לכל המשתמשים
  06/02/2025   |     מודלי שפה

אין ספק שאפקט DeepSeek ניכר בהחלטות של OpenAI ולמעשה גם באלו של שאר התעשיה.

למרות ש-OpenAI עדיין לא מציגה את המודל המלא של o3 ורק לפני שבוע השקיה את o3-mini, לאור התחרות הגוברת מצד המודלים הפתוחים מסין, החברה משחררת את o3-mini לשימוש הקהל הרחב ללא תשלום.

ב OpenAI טוענים שמצאו את האיזון הנכון: המודל o3-mini ישוחרר ללא עלות וגרסה "מחוזקת שלו" - o3-mini-high ישמש את המשתמשים בתשלום.

כזכור המודל o3 - "חושב בחופשיות" ואז מארגן את מחשבותיו לסיכומים מפורטים יותר. כדי לשפר את הבהירות והבטיחות, נוסף שלב עיבוד נוסף שבו המודל מסנן תוכן שעלול להיות בעייתי ומפשט רעיונות מורכבים.

בנוסף, שלב העיבוד החדש מאפשר למשתמשים שאינם דוברי אנגלית לקבל את תהליך החשיבה בשפתם, מה שהופך את החוויה לנגישה יותר.

לדברי OpenAI, מדובר בשדרוג משמעותי למשתמשים ברחבי העולם.

במהלך AMA ברדיט, קווין ווייל, סמנכ"ל המוצר של OpenAI, אישר כי החברה מתכוונת לחשוף יותר מתהליך החשיבה של המודל בעתיד הקרוב (כפי שקורה היום ב DeepSeek). עם זאת, עדיין נותר לקבוע כיצד ניתן לעשות זאת מבלי לפגוע בתחרותיות ובאיכות התשובות. 

קישור לידיעה המקורית
מהיר, מאובטח וזול יותר - הסטארטאפ הצרפתי מציג את Le Chat
מהיר, מאובטח וזול יותר - הסטארטאפ הצרפתי מציג את Le Chat
  06/02/2025   |     מודלי שפה

סטארטאפ הבינה המלאכותית הצרפתי Mistral AI השיק את האפליקציית הצ'ט - Le Chat לאייפון ולאנדרואיד, בתקווה להתחרות ב-DeepSeek וב-ChatGPT של OpenAI.

החברה, שזכתה למימון שיא של 640 מיליון דולר, מציעה מודלים מתקדמים תוך שימת דגש על פרטיות ואבטחת נתונים. בעוד OpenAI ו-Anthropic שולטות בשוק, עסקים מחפשים חלופות גמישות וזולות יותר.

Le Chat מציע גם תוכנית Enterprise לחברות פרטיות וגם תוכנית Pro בעלות של 14.99$ לחודש. להבדיל מ-DeepSeek הפועל תחת חוקי סין, Mistral פועל תחת רגולציות האיחוד האירופי (GDPR), מה שהופך אותו לאטרקטיבי עבור חברות הדואגות למקום בו הנתונים שלהם מאוחסנים.

האפליקציה מספקת ביצועים מהירים במיוחד עם "Flash Answers" במהירות של עד 1,000 מילים בשנייה, חיפוש בזמן אמת והשלמות מבוססות עובדות.

בנוסף, החברה מציעה כלים מתקדמים כגון ניתוח קוד, OCR לסריקת מסמכים, ויצירת תמונות מתקדמת בעזרת Flux Ultra של Black Forest Labs.

מבחינת תמחור, Mistral מתחרה ישירות ב  OpenAI שעולה 20$ לשירות הנפוץ, בעוד Le Chat Pro מוצע במחיר נמוך יותר, וכולל תכונות רבות ללא עלות.

קישור למידע נוסף

קישור לצ'ט

שדרוג וידאו כמו שמעולם לא ראיתם - פרויקט Starlight משנה את הכללים
שדרוג וידאו כמו שמעולם לא ראיתם - פרויקט Starlight משנה את הכללים
  06/02/2025   |     מודלי שפה

פרויקט Starlight של חברת Topaz Labs - מודל חדש ועוצמתי לשיפור וידאו עם בינה מלאכותית.

באמצעות טכנולוגיית דיפוזיה חדשנית, המודל של מעבדות טופז, מסוגל להפוך סרטונים ישנים, ברזולוציה נמוכה ואיכות ירודה – לרזולוציית 4K בצורה חדה וצלולה, ללא צורך בהתערבות ידנית.

בשונה מכלים כמו Runway ו-Sora שמשתמשים בדיפוזיה ליצירת וידאו חדש, המודל של Starlight ממנף את השיטה כדי לשדרג ולטייב וידאו קיים.

אחד ההישגים המרכזיים של המודל הוא שמירה על רצף תנועה חלק (Temporal Consistency), בזכות ניתוח של מאות פריימים מסביב לכל תמונה.

המודל של Starlight מציע איכות ויזואלית חסרת תקדים, בזכות מעבר ממודלים מבוססי GAN לדיפוזיה, המספקת הבנה עמוקה יותר של אובייקטים, תנועה ופיזיקה.

בשל עוצמת החישוב הגבוהה, הכלי זמין כרגע רק בענן אך צפוי להגיע לאפיקציית Topaz בחודשים הקרובים.

קישור לידיעה המקורית

קישור להכרזה ב X