GPT-4o: OpenAI’s Multimodal Model

שואלים אותי הרבה על החידושים שOpenAI השיקה לאחרונה כולל את הגרסה החדשה ביותר שלה-GPT-4o, מדובר במודל AI מתקדם שמשלב טקסט, תמונות ועיבוד אודיו כל זאת בשביל לייצר סטנדרטים חדשים בביצועים. הוא יכול להבין קול, במספר רמקולים או רעשי רקע, ולהפיק צחוק, שירה או להביע רגשות. ההכרזה כללה מספר תכונות חדשות שחלקן גם זמינות בחינם ב-ChatGPT.

על הדגם:

GPT-4o עולה על הדגמים הקודמים, ומספק ביצועים מעולים בטקסט, תמונות, אודיו, קידוד, משימות רב לשוניות- חשוב לנסות כי ממש אפשר לראות את ההבדלים כשמנסים.

תכונות הטקסט והתמונה של GPT-4o פועלות ב-ChatGPT; מצב וידאו וקול יושק למנוי- ChatGPT Plus בשבועות הקרובים (חלק מהמשתמשים מקבלים גישה לפני כולם בחלק מרולאאוט של היישום).

כל הקלט והפלטים מעובדים על ידי אותה רשת עצבית כלומר המשכיות בכל השיחות- יש בזה חשיבות גבוהה בשל הדיוק של המידע וגם המהירות.

תכונות ושיתופי פעולה:

וידאו: ChatGPT תומך כעת באינטראקציות בזמן אמת עם אודיו וידאו. עם וידאו (כאמור התכונה של הוידיאו לא פתוחה עדיין לכולם) הוא יכול לנתח את הסביבה וההיגיון שלך דרך בעיות חזותיות באמצעות עדשת המצלמה שלכם.

אודיו: ל-GPT-4o יש הגדרות קבועות מראש של קולות שהוא יכול להשתמש בהם כדי לשוחח בצורה מציאותית. העוזרת הקולית החדשה יכולה לקלוט רגשות, מזהה תכונות אודיו כמו נשימה וגמגום ומטפלת בהפרעות בקלות.

תרגומים: מודל GPT-4o מציע תרגום בזמן אמת בלמעלה מ-50 שפות המתרגם קלט קולי באופן מיידי עם שיפור משמעותי בטקסט בשפות שאינן אנגלית- העברית למשל עובדת ממש מדהים מאז העדכון.

עזר חזותי: Be My Eyes משתמשים ב-GPT-4 כדי לעזור לאנשים עיוורים/ראייה לקויה “לראות” באמצעות מצלמות הטלפון שלהם. משתמשים יכולים כעת לנווט במשימות מורכבות, כמו מערכות רכבת או זיהוי תכולת המקרר, עם הדרכה נקודתית. שכוללת את ה- GPT-4 Virtual Volunteer הפיצ’ר החדש באפליקציה שלהם שמחקה סיוע אנושי- זה אחד הפרויקטים המדהימים ביותר שGPT יצרו איתם שיתוף פעולה, היכולת לספק לאנשים כבדי ראייה את ההתמצאות בסביבה באמצעות הטכנולוגיה.

עדכונים נוספים:

ChatGPT תומך כעת ביותר ממספר שפות בהרשמה וכניסה, הגדרות משתמש ועוד.

משתמשים בתשלום מקבלים מגבלות הודעות גבוהות יותר, כאשר משתמשי Team ו-Enterprise נהנים מהגבוהים ביותר.

OpenAI פרסמה אפליקציית ChatGPT חדשה עבור macOS עם ממשק מעודכן המשתלב ישירות עם זרימות העבודה של המחשוב של המשתמשים- ניסיתי את זה, ממש נחמד.

הפוסט בבלוג של OpenAI מדבר על שיפורים עתידיים שנראה בזמן הקרוב- כמו יצירת תוכן בתלת מימד, עיצוב גופן חדש, שיפור יצירת טקסט בתמונות, יצירת אפקט קול ועוד.

OpenAI הפכה את GPT-4o, יחד עם כלי הזיכרון וניתוח הנתונים שלה, לזמינים בחינם לכל המשתמשים, והביאה לראשונה את הכלים החזקים הללו לשכבה החינמית- חשוב לקחת בחשבון שמשתמשים בחינם מקבלים רק חלק מהיכולות וזאת בעיקר בשביל להסביר להם את ההבדל בין הגרסה החינמית לזו בכסף ואת ההבדל העצום (זה כמובן ניתוח שלי).

אינטראקציה קולית בזמן אמת ויכולות מולטי-מודאליות הופכות את הבינה המלאכותית מכלי לשותף שיתופי, המסוגל ללמוד ולצמוח יחד איתנו.

מוצרים שלי שכדאי לכם להכיר:

1. מפגש 1:1 ליעוץ על בינה מלאכותית גנרטיבית

2. קורס מזורז און ליין ללימוד על בינה מלאכותית גנרטיבית.

3. קורס למתקדמים!

4. חדש! קורס ללימוד ניתוח וחיזוי מגמות יחד עם GAI

https://zoharurian.com/book/course/

Share this on WhatsApp

GPT-4o: OpenAI’s Multimodal Model

urianzohar

Leave a Reply Cancel reply

Related Posts

How to Analyze Financial Reports with Gemini Notebook

Practical Guide for Using Claude Design || Part 2

My Cannes Lions 2026 Watch List