K a m e d i a

Loading Website

בינה שבועית - השבוע שהיה בבינה המלאכותית היוצרת

מציג 108 ידיעות
גרסה חדשה למודל הריאה LLaVA עכשיו זמין ב GroqCloud.
גרסה חדשה למודל הריאה LLaVA עכשיו זמין ב GroqCloud.
  05/09/2024   |     מודלי שפה

חברת Groq השיקה את LLaVA v1.5 7B, גרסה חדשה מועדכנת של מודל הראיה המסוגל לשלב מענה על תמונות, אודיו וטקסט.

המודל מבוסס על CLIP של OpenAI ועל Llama 2 של Meta, ומציע מגוון יכולות כמו מענה לשאלות מבוססות תמונה, יצירת טקסטים על בסיס תמונו , זיהוי טקסט בתמונות ושיח עם משתמשים אודות התמונה שהוצגה למודל.

המודל יכול לשמש בחנויות קמעונאיות לניטור מדפים, בפלטפורמות מדיה חברתית לתיאור תמונות למשתמשים עם מוגבלות ראייה, וגם בשירות לקוחות וירטואלי לשאלות על מוצרים.

בנוסף, הוא מתאים לאוטומציה בתעשייה, פיננסים, קמעונאות וחינוך, ומאפשר לייעל תהליכים כמו בקרת איכות וניהול מלאי.

מפתחים יכולים להתחיל לעבודה עם LLaVA ב שרותי הענן של Groq ה-GroqCloud.

קישור לידיעה המקורית

אנטרופיק משיקה את קלוד אנטרפרייז עם אינטגרציה ל-GitHub וחלון הקשר עצום.
אנטרופיק משיקה את קלוד אנטרפרייז עם אינטגרציה ל-GitHub וחלון הקשר עצום.
  04/09/2024   |     מודלי שפה

אנטרופיק הכריזה על תוכנית קלוד אנטרפרייז, שמטרתה לסייע לארגונים לשתף פעולה בצורה מאובטחת עם קלוד תוך שימוש בידע פנימי.

התוכנית כוללת חלון הקשר מורחב של 500,000 טוקנים, קיבולת שימוש מוגברת, ואינטגרציה מובנית ל-GitHub ועבודה על בסיסי קוד שלמים עם קלוד.

בנוסף, היא מציעה מאפייני אבטחה ברמת אנטרפרייז, כמו SSO, הרשאות מבוססות תפקידים וכלי ניהול, שמגנים על המידע ועל העובדים בארגון.

עם קלוד, הידע של הארגון הופך קל לשיתוף ושימוש חוזר, מה שמאפשר לכל אחד בצוות לשפר את העבודה שלו בצורה איכותית במהירות ובאופן עקבי.

האינטגרציה עם GitHub, הזמינה כעת בגרסת בטא, מאפשרת לצוותי פיתוח לסנכרן מאגרי קוד, לעבוד על פיתוח תכונות חדשות ולתקן באגים.

בנוסף התוכנית כוללת כלים לניהול ואבטחת מידע, ומבטיחה כי קלוד לא מאומן על בסיס שיחות או תוכן פנימי של המשתמשים.

קישור לידיעה המקורית

באיחור אופנתי חברת Luma AI מציגה - שליטה מדויקת בתנועות מצלמה.
באיחור אופנתי חברת Luma AI מציגה - שליטה מדויקת בתנועות מצלמה.
  03/09/2024   |     מודלי שפה

חברת הסטרטאפ Luma AI מציגה יכולות חדשות במודל יצירת הוידאו שלה שזכתה לגרסה (הלא רישמית) Dream Machine 1.6.

היכולת החדשה מציגה יכולת שליטה מדויקת בתנועות מצלמה. בעוד מחוללי וידאו מבוססי AI סובלים מתנועות לא מציאותיות, הגרסה החדשה של Luma מציעה 12 תנועות מצלמה שונות, כמו "Pull Out", "Pan Left" ו-"Push In" אותן להוסיף באמצעות הקשת המילה "camera" בתחילת הפקודה.

השדרוג מאפשר למשתמשים ליצור סרטונים דינמיים עם תנועות מצלמה מוגדרות מראש, החברה הוסיפה אנימציות 3D מוקטנות שמדגימות כל תנועה לבחירה פשוטה של המשתמשים.

יוצרים בתחום ה-AI מציינים שהשדרוג חוסך זמן ומייעל את תהליך היצירה. היכולות החדשות מגיעות לאחר ההשקה של Dream Machine 1.5 בחודש שעבר.

היא מציבה את Luma בתחרות ישירה מול מודלים אחרים שכבר שילבו יכולת זו , תוך כדי שהיא מקרבת את הבינה המלאכותית לאיכויות של הפקות וידאו מסורתיות.

קישור לידיעה המקורית

מחולל הווידאו החדש מבית MiniMax מציב תחרות ל-Sora.
מחולל הווידאו החדש מבית MiniMax מציב תחרות ל-Sora.
  02/09/2024   |     מודלי שפה

חברת הסטארטאפ הסינית MiniMax חשפה את Video-01, מודל הAI הראשון שלה שמסוגל ליצור וידאו ברזולוציה גבוהה מהנחיות טקסטואליות.

המנכ"ל יאן ג'ונג'י הציג את המודל באירוע החברה, וציין כי הוא תומך ברזולוציה של 1280x720 פיקסלים ב-25 פריימים לשנייה, עם שליטה על תנועות המצלמה.

כרגע הסרטונים מוגבלים לשש שניות, אך החברה מתכננת להאריך זאת לעשר שניות בקרוב.

המשתמשים יכולים לנסות את Video-01 ללא עלות לאחר הרשמה באתר החברה, ויש לה גם API למפתחים.

לטענת המייסדים MiniMax שמה דגש על נגישות טכנולוגית. הסרטונים שנוצרים מזוהים בבירור כמודלי AI, עם מראה חלק ומעט רווי, כאשר הסגנונות כוללים אנימה, CGI, וגרפיקה ממשחקי וידאו.

החברה MiniMax נוסדה ב-2021 וגייסה כ-600 מיליון דולר בהובלת עליבאבא.

החברה מתחרה בשוק AI ליצירת סרטוני וידאו מול שמות מוכרים כמו KLING ו-Jimeng AI, כש-Sora של OpenAI נחשב עדיין לסטנדרט התעשייתי למרות שעדיין לא הושק רשמית.

קישור לידיעה המקורית
קישור לאתר החברה

חברת Cohere מציגה שיפור משמעותי במודלי Command R ו-R+
חברת Cohere מציגה שיפור משמעותי במודלי Command R ו-R+
  01/09/2024   |     מודלי שפה

חברת Cohere השיקה גרסאות מעודכנות למודלי ה-AI שלה, Command R ו-Command R+. המודלים החדשים מציעים שיפורים בקוד, מתמטיקה, לוגיקה וביצועי רשת, כמו גם יכולות מורחבת לניתוח נתונים מובנים ושפות מרובות.

המודל Command R שופר משמעותית והשתווה בביצועיו לגרסה הקודמת של Command R+ הגדול יותר, תוך תמיכה בלמעלה מ-10 שפות ומנגנון ציטוט מקוון שמוודא את התשובות.

המודלים החדשים זמינים למפתחים דרך ממשקי API של Cohere וב-Amazon SageMaker, במחירים נמוכים יותר מהמודל הקודם.

בנוסף, Cohere משתפת פעולה עם Fujitsu למתן שירותי AI לחברות ביפן.

מודל Command R+ מציע שימוש בכלים אוטומטיים לפתרון משימות מורכבות והוא מתחרה במודלים כמו GPT-4 עם תוצאות טובות יותר במבחני דיוק ובציטוט מקורות.

המודל מתאים במיוחד לשימוש עסקי ושם דגש על יצירת תשובות מדויקות תוך שימוש במידע חיצוני.

קישור לידיעה המקורית

חברת Magic AI מציגה מודל חדש שמסוגל לעבד 100 מיליון טוקנים.
חברת Magic AI מציגה מודל חדש שמסוגל לעבד 100 מיליון טוקנים.
  29/08/2024   |     מודלי שפה

חברת Magic AI פיתחה מודל שפה חדש בשם LTM-2-mini שמסוגל לעבד חלון קונטקסט של 100 מיליון טוקנים, המקבילים ל-10 מיליון שורות קוד או 750 ספרים.

זהו שיפור משמעותי ביחס למודלים הקודמים ומסמן שינוי מהותי ביכולת עיבוד הקונטקסט של AI

החברה ממקדת את הטכנולוגיה הזו בפיתוח תוכנה, כאשר מודל עם גישה לקוד מלא, תיעוד והספריות של פרויקט יכול לשפר משמעותית את יכולות יצירת הקוד.

כדי לבדוק את המודלים עם חלונות קונטקסט ארוכים, החברה פיתחה מדד חדש בשם HashHop, שנועד להחליף מדדים קודמים כמו "Needle in a Haystack".

המדד HashHop בוחן את היכולת של המודל לאחסן ולשלוף מידע רב מתוך חלון קונטקסט.

לפי Magic AI, האלגוריתם של LTM-2-mini יעיל פי 1000 ממנגנון הקשב של Llama 3.1, עם דרישות זיכרון נמוכות יותר.

החברה גייסה 320 מיליון דולר להמשך הפיתוח, כולל שיתופי פעולה עם Google Cloud ו-Nvidia.

קישור לידיעה המקורית

מודל ניתוח וידאו מהפכני Qwen2-VL מבית Alibaba.
מודל ניתוח וידאו מהפכני Qwen2-VL מבית Alibaba.
  29/08/2024   |     מודלי שפה

חברת Alibaba הכריזה על Qwen2-VL, מודל בינה מלאכותית חדש שמסוגל לנתח וידאו ארוך (יותר מ-20 דקות), לעבד תמונות במגוון רחב של שפות.

המודל מתחרה במודלים מובילים כמו GPT-4 של OpenAI ו-Gemini של גוגל, ומספק יכולות מתקדמות כמו זיהוי כתב יד, ניתוח אובייקטים מרובים בתמונות וניתוח וידאו בזמן אמת.

המודל Qwen2-VL מסוגל לספק סיכומי וידאו ולענות על שאלות מבוססות על התוכן בווידאו. המודל זמין בשלושה גדלים: 72B, 7B, ו-2B, כאשר הגרסאות הקטנות פתוחות לשימוש מסחרי ברישיון Apache 2.0.

הטכנולוגיה כוללת יכולות חדשות כמו חיבור לאפליקציות צד שלישי וראייה הדומה לתפיסת העולם האנושית, המאפשרות אינטראקציות מורכבות ומתקדמות.

קישור לידיעה המקורית

האם Strawberry ו-Orion של OpenAI יחליפו את GPT-4?
האם Strawberry ו-Orion של OpenAI יחליפו את GPT-4?
  28/08/2024   |     מודלי שפה

הספקולציות סביב המודל הבא של OpenAI מתגברות, לאחרונה צצו ברחבי הרשת כתבות שמתארות את שני המודלים החדשים שצפויים לשנות את תחום הבינה המלאכותית.

המודל הראשון, שם קוד "Strawberry" נועד לפתור בעיות מתמטיות ותכנותיות מורכבות בצורה טובה יותר אל מול המודלים הקיימים,

ו "Orion" יתבסס עליו כדי לשפר את הביצועים של GPT-4.

לפי אותם פרסומים המודל החדש הצליח לפתור פאזלים כמו "Connections" של הניו יורק טיימס, ואף עבר את מבחן המתמטיקה MATH עם מעל 90% הצלחה.

בנוסף, ייתכן שישתמשו בו עבור חיפושי אינטרנט אוטונומיים. לפי הדיווחים, Strawberry מבוסס על שיטת STaR שפותחה בסטנפורד, ויוכל לפעול ביעילות תוך שימוש בפחות כוח חישוב.

המודל "Orion" שעתיד להחליף את GPT-4 ישתמש בנתונים ש-Strawberry יפיק כדי לשפר את הביצועים שלו.

קישור לידיעה המקורית

שקיפות ב Anthropic - החברת חושפת את הנחיות ה System של מודלי קלוד.
שקיפות ב Anthropic - החברת חושפת את הנחיות ה System של מודלי קלוד.
  27/08/2024   |     מודלי שפה

חברת Anthropic חשפה את הפקודות ה System למודלי ה Claude שלה במטרה להגביר את השקיפות בפיתוח AI.

פקודות אלה, שבדרך כלל נחשבות לסודות מסחריים, פורסמו ביולי 2024 וכוללות הוראות מפורטות ליכולות ולמגבלות של מודלי Claude 3.5 Sonnet, 3 Opus, ו-3 Haiku.

הפקודות אוסרות על זיהוי פנים, פתיחת קישורים וטיפול בנושאים שנויים במחלוקת בצורה אובייקטיבית.

המודל Claude 3.5 Sonnet הוא המודל עם הפקודה הנרחבת ביותר.

חברת Anthropic, שהוקמה על ידי יוצאי OpenAI, בהם דריו ודניאלה אמודאי, שמה לעצמה מטרה להיות שקופה יותר מ-OpenAI, והיא מפרסמת עדכונים שוטפים על הפקודות שלה.

קישור לידיעה המקורית

גוגל חושפת: מודלים חדשים לשיפור ביצועי ה-AI.
גוגל חושפת: מודלים חדשים לשיפור ביצועי ה-AI.
  27/08/2024   |     מודלי שפה

גוגל חושפת שלושה מודלים ניסיוניים חדשים כולל גרסה קטנה יותר של Gemini 1.5 Flash עם 8 מיליארד פרמטרים, ושיפורים במודלים Gemini 1.5 Pro ו-Flash.

החברה משיקה את המודלים כדי לקבל משוב ולספק למפתחים עדכונים של המודלים האחרונים.

המודל Gemini 1.5 Flash 8B פותח על ידי צוות Google DeepMind ומיועד למשימות מרובות, כולל סיכום טקסטים מורכבים.

השיפורים במודלים Gemini 1.5 Pro ו-Flash כוללים ביצועים משופרים במבחנים פנימיים, עם Gemini 1.5 Pro שמציג יכולות מתקדמות בטיפול בשאילתות מורכבות ובקידוד.

החל מה-3 בספטמבר, בקשות למודל Gemini 1.5 Pro יופנו אוטומטית לגרסה החדשה.

המודלים זמינים דרך Google AI Studio ו-Vertex AI Experimental Endpoint.

קישור לידיעה המקורית

מטא מציגה את "Sapiens" - מודל ניתוח וזיהוי תמונות בני אדם ברמת דיוק חסרת תקדים.
מטא מציגה את "Sapiens" - מודל ניתוח וזיהוי תמונות בני אדם ברמת דיוק חסרת תקדים.
  27/08/2024   |     מודלי שפה

מטא השיקה סדרת מודלים חדשה בשם "Sapiens", המתמקדת בניתוח תמונות של בני אדם עם רמת דיוק חסרת תקדים.

המודלים אומנו על מאגר נתונים של 300 מיליון תמונות ומבצעים משימות כמו הערכת תנוחות דו-ממדיות, חלוקת גוף לחלקים, הערכת עומק וניתוח כיוונים בתלת-ממד.

המודל הגדול ביותר, Sapiens-2B, כולל 2 מיליארד פרמטרים ומנתח תמונות ברזולוציה גבוהה במיוחד, מה שמאפשר ניתוח מפורט יותר בהשוואה למודלים מסורתיים.

לפי מטא, המודלים החדשים מציגים שיפורים משמעותיים בהשוואה לשיטות קודמות, עם עלייה של 17% בדיוק בזיהוי חלקי גוף.

החוקרים טוענים שהביצועים משתפרים ככל שהמודל גדול יותר והנתונים מותאמים יותר לבני אדם, מה שמוביל לתוצאות טובות יותר בעולם האמיתי.

למרות ההישגים, צוות הפיתוח מודה שעדיין קיימים אתגרים עם תנוחות מסובכות, קהל צפוף ותמונות בהן מופיעים רק חלקי גוף.

קישור לידיעה המקורית

קישור למחקר

קישור למודל ב Github

אלקסה משודרגת בתשלום: כך אמזון מתכוונת להתחרות בעוזרות קוליות של המתחרים.
אלקסה משודרגת בתשלום: כך אמזון מתכוונת להתחרות בעוזרות קוליות של המתחרים.
  26/08/2024   |     מודלי שפה

אמזון מתכננת להשיק גרסה בתשלום של העוזרת הקולית אלקסה עם יכולות AI מתקדמות באוקטובר הקרוב.

הגרסה המשודרגת, שנקראת "Remarkable Alexa" או "Project Banyan", תציע תכונות חדשות כמו "Smart Briefing" – סיכומי חדשות מותאמים אישית אשר מיוצרים על ידי AI.

עם זאת, משתמשים של אלכסה כיום הביעו חשש לגבי הדיוק של אלקסה בטיפול בחדשות פוליטיות, במיוחד לקראת הבחירות בארה"ב.

הגרסה החדשה תהיה בתשלום של עד 10 דולר לחודש, כשאלקסה הקלאסית תישאר חינמית. אלקסה בגרסתה החדשה תהיה יותר שיחתית, תכיר קולות משתמשים שונים ותציע המלצות מותאמות יותר, כמו מתכונים והמלצות קניה חכמות יותר.

ההשקה של אלקסה החדשה נדחתה מספטמבר לאמצע אוקטובר, כשהחברה מקווה שהגרסה בתשלום תעזור לה להחזיר את ההשקעה בתחום ה-AI.

קישור לידיעה המקורית

שדרוג ל Dream Machine - גרסה 1.5 משנה את חוקי המשחק ביצירת וידאו מטקסט.
שדרוג ל Dream Machine - גרסה 1.5 משנה את חוקי המשחק ביצירת וידאו מטקסט.
  22/08/2024   |     מודלי שפה

סארטאפ הוידאו Luma Labs שדרג את מודל הווידאו שלו Dream Machine לגרסה 1.5.

הגרסה החדשה מציגה רמות ריאליזם גבוהות יותר ושיפור משמעותי במהירות.

המודל החדש מייצר 5 שניות של וידאו איכותי תוך כשתי דקות, ומפגין תנועות חלקות יותר ואמינות לצד הבנה פיזיקלית גבוהה יותר.

המשתמשים מציינים שיפור ניכר בתנועת הדמויות, ביצירת טקסטים קריאים ובמענה מדויק להנחיות.

למרות התחרות ממודלים כמו Sora של OpenAI, ל-Dream Machine יש יתרון בזמינותו הפתוחה לשימוש לכלל המשתמשים.

קישור לידיעה המקורית

כלי חדש לכתיבת קוד משגע את הרשת - Cursor מגייסת 60 מיליון דולר.
כלי חדש לכתיבת קוד משגע את הרשת - Cursor מגייסת 60 מיליון דולר.
  22/08/2024   |     מודלי שפה

חברת הסטארטאפ Cursor משגעת את הרשת עם כלי AI חדש לכתיבת קוד.

החברה גייסה לאחרונה 60 מיליון דולר בסבב גיוס בהובלת קרנות הון סיכון כמו Andreessen Horowitz ו-Thrive Capital, לצד שותפות עם OpenAI.

הצעת הערך של החברה הוא כלי אשר מאפשר האצה וכתיבת קול גם למשתמשים אשר אינם מתכנתים. בזכות שילוב של מודלים חדשניים הכלי החדש מאפשר יצירה מהירה של קוד.

הפלטפורמה מאפשרת אוטומציה בתהליך חיפוש מרכיבי קוד, צמצום רפקטורינג מכני לטאבים בודדים, והרחבת הנחיות קצרות לקוד פונקציונלי.

החברה משרתת כבר מעל 30,000 לקוחות, כולל ארגונים גדולים ומוסדות מחקר, ומציבה את עצמה לצד Github Copilot של מיקרוסופט.

קישור לידיעה המקורית

עתיד חדש בעיצוב תלת-ממד - Meshy-4.
עתיד חדש בעיצוב תלת-ממד - Meshy-4.
  22/08/2024   |     מודלי שפה

חברת הסטארטאפ Meshy מצגיה את עולם המדע הבדיוני בעיצוב תכנון מודלי תלת-ממדי.

החברה שחררה כלי חדש ליצירת מודלים בתלת-ממד בשם Meshy-4, ייחודו של המודל החדש היא שהוא כולל גיאומטריה משופרת ותהליך עבודה חדשני.

לאחר 16 חודשי פיתוח, השותף מייסד איתן הוא (Yuanming) שיתף בהתרגשות כי החברה לא ציפתה להגיע להישגים כאלה כל כך מהר.

המודל Meshy-4 מציג מודלים חלקים ומדויקים יותר, תוך הפרדת תהליך יצירת המודל לשני שלבים: מידול וטקסטורה, מה שמאפשר שליטה רבה יותר על המוצר הסופי.

בנוסף, נוספה אפשרות "Retry" ליצירת מודלים חלופיים במהירות במקרה שהתוצאה לא מספקת.

העדכון צפוי להשפיע על תחומים כמו פיתוח משחקים והדמיה אדריכלית, ומעלה שאלות על עתיד המקצועות היצירתיים, כאשר הגבול בין יצירה אנושית לממוחשבת הולך ומטשטש.

קישור לידיעה המקורית

חברת AI21 מציגה גרסה חדשה למודל Jamba.
חברת AI21 מציגה גרסה חדשה למודל Jamba.
  22/08/2024   |     מודלי שפה

חברת הסטארטאפ ההישראלית AI21 השיקה את Jamba 1.5 מודל טרנספורמרים ההיברידי לתמיכה ויצירה של סוכני AI מתקדמים.

המודל החדש Jamba 1.5 משלב בין טרנספורמרים למודל Structured State Space (SSM) כדי לשפר את הביצועים והדיוק של המודל.

השם Jamba הוא ראשי תיבות של Joint Attention and Mamba ומייצג את ההיתרונות של שתי הגישות.

הגרסאות החדשות כוללות יכולות נוספות כמו קריאה לפונקציות, מצב JSON, ניהול מסמכים מובנה ומצב שיח.

תכונות אלו נועדו לשפר את הפיתוח של מערכות וסוכנים מבוססי בינה מלאכותית.

המודלים של Jamba 1.5 מציעים חלון הקשר רחב של 256K טוקנים ומבוססים על ארכיטקטורת Mixture-of-Experts (MoE), עם מיליארדי פרמטרים פעילים.

מצב השיח במודלים החדשים מציע גישה משולבת שמאפשרת לתעד במדויק את מקורות המידע, מה שמגביר שקיפות ואמינות, בניגוד לשיטות מסורתיות כמו RAG.

קישור לידיעה המקורית

מיקרוסופט משיקה מודלים חדשים בסדרת Phi המתאימים לסביבות דלות משאבים.
מיקרוסופט משיקה מודלים חדשים בסדרת Phi המתאימים לסביבות דלות משאבים.
  21/08/2024   |     מודלי שפה

מיקרוסופט השיקה שלושה מודלים חדשים בסדרת Phi ו-vision-instruct.

המודלים מצטיינים בהיגיון ובתמיכה במספר שפות, אך יש להם מגבלות בידע עובדתי ובבטיחות.

המודלים החדשים בסדרת Phi-3.5 נועדו לשימוש מסחרי ומדעי, ומיועדים למשימות הדורשות משאבים מוגבלים בזמן קצר.

המודל Phi-3.5-mini-instruct, עם 3.8 מיליארד פרמטרים, מותאם לסביבות דלות משאבים ומצליח במבחנים מרובי שפות.

והמודל MoE-instruct כולל 16 תתי מודלים מומחים עם 60.8 מיליארד פרמטרים, ומבצע משימות כמו הבנת שפה ומתמטיקה.

המודל vision-instruct מסוגל לעבד טקסט ותמונות, ומצטיין במטלות כמו זיהוי תמונות וסיכום וידאו.

כל המודלים תומכים באורך הקשר של עד 128,000 טוקנים, שמאפשר עיבוד מסמכים ארוכים.

עם זאת, הם עלולים להציג חוסר דיוק בגלל היקף הידע המוגבל, ומיקרוסופט ממליצה לשלב אותם עם שיטות חיפוש כמו RAG כדי להתמודד עם החיסרון הזה.

קישור לידיעה המקורית

קישור למודלים ב huggingface

גרסה חדשה למודל יצירת התמונה Ideogram.
גרסה חדשה למודל יצירת התמונה Ideogram.
  21/08/2024   |     מודלי שפה

חברת הסטארטאפ Ideogram השיקה את גרסה 2.0 למחולל התמונות שלה, במטרה ברורה להתעלות על מתחרים כמו Midjourney ו-DALL-E 3 באיכות, בדיוק ובמחיר.

הגרסה החדשה כוללת סגנונות תמונה חדשים, אפליקציית iOS ו-API למפתחים בגרסת בטא.

המודל המשופר מצטיין בהתאמה בין טקסט לתמונה, דיוק להעדפות המשתמשים ודיוק בעיבוד טקסטים בתוך תמונות.

המשתמשים יכולים לבחור מתוך חמישה סגנונות: כללי, מציאותי, עיצובי, תלת-ממד ואנימה. הסגנון המציאותי מציג שיפורים בתכונות פנים אנושיות, והסגנון העיצובי מאפשר יצירת עיצובים גרפיים איכותיים.

הכלים "Describe" ו-"Magic Prompt" מסייעים בתהליך היצירתי על ידי הפקת וריאציות לטקסט המקורי ותמונות.

המודל החדש מוצג במחיר נגיש יותר, ומעל למיליארד תמונות כבר נוצרו בפלטפורמה.

קישור לידיעה המקורית

מודל חדש בשם HeAR מחולל מהפכה באבחון מחלות ריאה.
מודל חדש בשם HeAR מחולל מהפכה באבחון מחלות ריאה.
  20/08/2024   |     מודלי שפה

מודל AI חדש של גוגל בשם HeAR מסייע בזיהוי מחלות באמצעות קולות כמו שיעול ודיבור.

המודל, שאומן על כ-300 מיליון נתוני אודיו, כולל 100 מיליון קולות שיעול, מצליח לנתח תבניות ביו-אקוסטיות לבריאות, ולזהות רמזים מוקדמים למחלות כמו שחפת ומחלת ריאות חסימתית כרונית (COPD).

המודל יעיל בזיהוי תבניות גם עם כמות קטנה של נתונים, ומציע פתרון נגיש ומתקדם בתחום הבריאות.

חברת Salcit Technologies מהודו משתמשת ב-HeAR כדי לשפר את זיהוי השחפת באמצעות ניתוח קולות שיעול.

זהו צעד חשוב במאבק לשיפור האבחון ולהנגשת שירותי בריאות למיליוני אנשים ברחבי העולם, בעיקר באזורים שבהם אין גישה נוחה לשירותי רפואה.

המודל HeAR זוכה לתמיכה מארגונים כמו StopTB Partnership, שמסייעים במאבק במחלות ריאה. גוגל שואפת להרחיב את השימוש במודל לתחומי בריאות נוספים ולשפר את תוצאות הבריאות העולמיות.

קישור לידיעה המקורית

חברת OpenAI משתפת פעולה עם Condé Nast.
חברת OpenAI משתפת פעולה עם Condé Nast.
  20/08/2024   |     מודלי שפה

חברת OpenAI הכריזה על שיתוף פעולה עם חברת המדיה Condé Nast, שבמסגרתו תוכן ממותגים פופולריים כמו Vogue, The New Yorker ו-Wired ישולב במערכות ChatGPT ו-SearchGPT.

ההסכם מעורר חששות לגבי גיוון המדיה, כאשר לא ברור אם התוכן ישמש גם לאימון המודלים.

כזכור SearchGPT מספק קישורים ישירים לכתבות מקוריות, אך לא ברור אם המשתמשים ילחצו עליהם כמו במנועי חיפוש מסורתיים.

הסכם זה מצטרף לשיתופי פעולה קודמים של OpenAI עם ארגונים כמו Associated Press ו-News Corp, אולם חשש עולה לגבי פגיעה באתרים קטנים ועצמאיים שלא נבחרו להשתלב ב OpenAI.

קישור לידיעה המקורית