גוגל משיקה את Gemini 3: קפיצת מדרגה בבנצ'מרקים, בחיפוש ובסוכנים חכמים

גוגל הכריזה על Gemini 3, דגם ה-AI המתקדם ביותר שלה, עם שיפורי ביצועים חדים במתמטיקה, מדע, מולטימודלי וקידוד וגם שילוב מיידי בחיפוש. הכתבה מרכזת את העובדות, ההשוואות, ההשלכות העסקיות והזווית הישראלית.

תגיות
גוגלג'מיני 3מודלים שפתייםAgentic AI
מניות רלוונטיות:⚠️ ניתוח AI - אינו ייעוץ פיננסי
GOOGLAlphabet Inc.
השקת Gemini 3 מציעה שיפורים משמעותיים במודלי הבינה המלאכותית של גוגל, מה שיכול להוביל לעלייה בביקוש לשירותים שלה ולשיפור במעמד בשוק.

גוגל חשפה ב-18 בנובמבר 2025 את Gemini 3 – הדור הבא של מודלי הבינה המלאכותית שלה – במהלך השקה מתואמת היטב שחצתה מוצרים, פלטפורמות מפתחים וארגונים. לפי דיווחים ונתוני החברה, Gemini 3 Pro הוא הדגם האינטליגנטי ביותר של גוגל עד כה, עם שיפורים משמעותיים בהיגיון, בתכנון רב-שלבי וביכולת הבנה מולטימודלית. בניגוד להשקות עבר, גוגל שילבה את המודל החדש בחיפוש כבר ביום ההכרזה במסגרת AI Mode, לצד עדכון אפליקציית Gemini, זמינות ב-AI Studio וב-Vertex AI, והשקת Antigravity – סביבת פיתוח "agent-first" שממקמת סוכני קוד אוטונומיים במרכז תהליך העבודה. ההכרזה מסמנת לא רק מרדף אחר ציונים למדניים אלא שינוי כיוון: מעבר ממודל מחולל טקסט למערכת סוכנת שפועלת, בונה ממשקים ומבצעת משימות מקצה לקצה.

מה חדש ב‑Gemini 3: עומק מחשבה, מולטימודליות וסוכנים

בליבת ההשקה ניצב רעיון “Agentic AI”: מודל שמתרגם הוראות גבוהות לתוכניות פעולה מרובות שלביםכולל שימוש בכלים, הפעלת דפדפן וטרמינל, והפקת ממשקי משתמש דינמיים. ב‑Search, Gemini 3 מאפשר תשובות חזותיות חדשות: Visual Layout היוצר פריסות ויזואליות עשירות, ו‑Dynamic View שממש מקודד "על הדרך" כלים וסימולציות מותאמות לשאילתה. באפליקציית Gemini, החברה מציגה את Gemini Agentתכונה ניסיונית שמנהלת משימות כמו ארגון דוא"ל, תיאום ביומן או הזמנת שירותים, תוך בקשת אישור לפעולות רגישות. בנוסף, גוגל הודיעה על Gemini 3 Deep Think: מצב חשיבה מעמיקה שמיועד לבעיות מורכבות במיוחד ויגיע למנויי Ultra בשבועות שלאחר ההשקה. השילוב בין יכולות תכנון, הבנת הקשר ארוך טווח והבנה חזותית-טקסטואלית יוצר תחושת מוצר אחודה יותרולא רק "מודל חכם" במנותק מהחוויה.

“Gemini 3 הוא המודל האינטליגנטי ביותר שלנו, שנועד להבין עומק ונואנס ולבצע משימות מורכבות מקצה לקצה.”

נהלי החברה כפי שפורסמו בהכרזה הרשמית

בנצ'מרקים: הובלה חדשה במתמטיקה, מדע, מולטימודלי וסוכנות

לפי נתוני גוגל וסקירות עצמאיות, Gemini 3 Pro מדגים זינוק חד בביצועים. בגזרת ההיגיון המתמטי והמדעי דווח על תוצאות שיא ב‑AIME 2025 (ללא כלים ועם ביצוע קוד), ועל שיפור מדיד ב‑GPQA Diamond. בבנצ'מרקי מולטימודאל, המודל מציג קפיצה ב‑MMMU‑Pro וב‑Video‑MMMU, ובסביבות סוכנות-מחשב כמו ScreenSpot‑Proמבחן המסמן יכולת הבנה והפעלה של ממשקי משתמשהפער לעומת Gemini 2.5 הצטמצם באופן דרמטי. במבחני קידוד מבוססי-סוכן, נרשמו תוצאות טובות יותר ב‑LiveCodeBench, Terminal‑Bench 2.0 ו‑SWE‑bench Verified, מה שמצביע על יציבות גבוהה יותר בתכנון פעולות ובקריאת-כלים. חשוב להדגיש: חלק מהלוחות (כמו LMArena ו‑WebDev Arena) נשענים על הצבעות קהילה, ולכן התוצאות מוקדמות ודינמיות; עם זאת, הקונסיסטנטיות של המגמהשיפור לרוחב תחומיםבלטה בכל המקורות המרכזיים.

  • הישגים בולטים שדווחו: שיפור ב‑AIME 2025 וב‑GPQA Diamond; קפיצה ב‑MMMU‑Pro וב‑Video‑MMMU.
  • Agentic benchmarks: זינוק ב‑ScreenSpot‑Pro, Terminal‑Bench 2.0 ו‑SWE‑bench Verifiedמדד לביצועי סוכנים יציבים.
  • ARC‑AGI‑2: Deep Think הראה יתרון משמעותי, רמז לשיפור בחשיבה רב‑שלבית והסקת חוקים מופשטים.

מעבר לקונספטים טכניים, Gemini 3 זכה לאותות הצטיינות חיצוניים: ארגון Artificial Analysis הכתיר את Gemini 3 Pro כ"מנהיג החדש" במדד האינטליגנציה המצטבר שלו והעניק ציון 73קפיצה לעומת 60 בדגם 2.5 Proציון ששידרג את מעמד גוגל בטבלאות ההשוואה. במקביל, לוחות קהילה דוגמת LMArena דיווחו על הובלה ראשונית במקטעי טקסט, ראייה, קידוד ופיתוח ווב. גם כאן נדרשת זהירות: דירוגי קהילה נוטים להשתנות לאחר שחרור רחב ותיקוני מודל, אך המגמה הכוללתשיפור רב-תחומי וחדות גבוהה בהוראותמתיישבת עם תוצאות מבחני המעבדה שגוגל פרסמה.

חיפוש, ממשקים גנרטיביים ו‑Gemini Agent: מה המשתמש מרוויח

ב‑Search, גוגל מפעילה נתיב ניתוב חכם: שאילתות קשות ב‑AI Mode וב‑AI Overviews מופנות ל‑Gemini 3, בעוד שאילתות פשוטות מטופלות במודלים מהירים וזולים יותר. המשמעות למשתמש: תשובות שמבינות כוונה, לא רק מילות מפתח, ובמקרים מתאימיםכלי חישוב, סימולציות, טבלאות וויזואליזציות שנבנים בזמן אמת. אפליקציית Gemini קיבלה עיצוב מחודש עם "My Stuff", ו‑Gemini Agentתכונה ניסיונית למנויי Ultraממנפת יכולות כמו Deep Research, Canvas וחיבורי Workspace כדי לפרק משימות מורכבות לצעדים ולבקש אישור לפני פעולות רגישות (שליחה/רכישה). התפיסה: "שותף מחשבתי" שמספק תוצרים קצרים, ישירים ופחות מתחנפיםקו שהחברה מדגישה כדי לחזק אמון ולעודד אימוץ עבודה יומיומית עם הסוכן.

  • Visual Layout: תשובות בנויות כעמוד מגזיני עם תמונות, טבלאות ומודולים.
  • Dynamic View: קידוד בזמן אמת של כלי עזר וסימולציות מותאמות לשאלה.
  • Agent Mode/ Gemini Agent: פירוק מטרה למהלך רב‑שלבי, ניהול דוא"ל/לוח שנה וביצוע בדפדפןתחת אישור משתמש.

“זה המודל הטוב בעולם, בפער גדול מאוד!”

ציטוט שהופץ על ידי חוקר מ‑Google DeepMind ברשתותמסמן ביטחון פנימי ביכולות ההשקה

מפתחים ו‑Antigravity: IDE סוכני, ארטיפקטים ותמחור API

לצד המודל, גוגל השיקה את Antigravityסביבת פיתוח "agent-first" שבמרכזה סוכני קוד בעלי גישה ישירה לעורך, למסוף ולדפדפן. ה‑IDE מייצר "ארטיפקטים"רשימות משימות, תוכניות יישום, צילומי מסך והקלטות דפדפןהמתעדים כל צעד לשקיפות ובקרה. מפתחים יכולים לאציל למודל תכנון, כתיבה, הרצה ואימות קוד ברצף, ואף לארכב תוצרים לדיון ושיפור. מעבר ל‑IDE, גוגל פתחה פרמטרי API חדשים לשליטה ב"רמת חשיבה" וברזולוציית מדיה, הוסיפה כלי Bash בצד לקוח ושרת, וחיזקה כלֵי Grounding עם חיפוש ו‑URL context. מבחינת תמחור, Gemini 3 Pro זמין בתצוגה מקדימה ב‑$2 למיליון טוקנים נכנסים ו‑$12 למיליון יוצאים (עד 200K טוקנים לפרומפט), כאשר ב‑AI Studio מוצע שימוש חינמי עם מגבלות קצבמודל תמרוץ ברור לאימוץ מוקדם.

  • Antigravity (תצוגה ציבורית): Windows, macOS, Linux; תומך גם במודלים צד שלישי.
  • בנצ'מרקי קידוד/כלי‑מחשב: שיפור ב‑Terminal‑Bench 2.0, SWE‑bench Verified ו‑LiveCodeBench.
  • API: פרמטרי Thinking Level, Media Resolution ו‑Thought Signatures לשמירה על רצף חשיבה בשיחות מרובות פניות.

זמינות, מנויים ועסקים: לאן זה מגיע וכמה זה עולה

Gemini 3 Pro הושק באפליקציית Gemini, ב‑AI Mode בחיפוש (בשלב ראשון למנויי Google AI Pro ו‑AI Ultra בארה"ב), למפתחים ב‑AI Studio וב‑Vertex AI, וכן ב‑Gemini CLI ובפלטפורמות צד שלישי. מנויי Ultraשירות פרימיום שמחירו בארה"ב 249.99 דולר לחודשזוכים לגישה מוקדמת ליכולות ניסיוניות (כולל Deep Think ו‑Agent). בגזרת הארגונים, השילוב ב‑Vertex AI מספק שער לניהול מחזור חיי מודל, שילוב כלים, ניטור ותמחור לפי שימוש. חשוב לארגונים בינלאומיים לשים לב למיקום נקודות הקצה של Generative AIגוגל מציינת זמינות עיקרית בארה"במה שמעלה שיקולי ריבונות נתונים ו‑latency. עבור צוותים שמבקשים תוצרי UI גנרטיביים, גוגל מבהירה: עיצובי Visual Layout ו‑Dynamic View ממותגים ונגישים במלואם כרגע בחיפוש; ב‑API מתקבלים קוד/סכמות ליישום עצמאי.

המשמעות לישראל: דאטה רזידנסי, ענן אזורי ורגולציית פרטיות

לארגונים ישראליים, ההשקה מעלה הזדמנויות ואתגרים. מצד אחד, שילוב מהיר של Gemini 3 בכלי גוגל ואינטגרציות עשוי לקצר זמן פיתוח ל‑AI‑nativeממענה מולטימודלי ועד סוכנים תפעוליים. מצד שני, שאלת מיקום עיבודבעיקר ב‑Vertex AI Generativeדורשת בדיקה, שכן נקודות קצה זמינות לרוב באזורים בארה"ב. אף ש‑me‑west1 (ישראל) פעיל כשירותי ענן, לא כל יכולות Generative זמינות בו; לכן גופי פיננסים/בריאות וסטארטאפים הנתונים לדרישות ריבונות נתונים חייבים בחינה משפטית‑טכנית. במקביל, בישראל מתקדם מו"מ רגולטורי: רשות הגנת הפרטיות פרסמה באפריל‑מאי 2025 טיוטת הנחיות על תחולת חוק הגנת הפרטיות על מערכות AI, שעתידה לעמוד על תוקפה עם כניסת תיקון 13 באוגוסט 2025. המשמעות: שימוש ב‑Gemini 3 מול מידע אישי יחייב שקיפות, בסיס חוקי מתאים והגנות תואמות סיכון.

  • בדקו Data Residency: האם עיבוד המודל מתרחש בארה"ב? האם הנתונים רגישים/מזוהים?
  • מיפוי DPIA: הערכת השפעה על פרטיות עבור תהליכי AI סוכני (Agentic) וקריאות‑כלים.
  • ארכיטקטורת היבריד: Grounding מקומי + קריאות מודל מאובטחות; בקרה על לוגים וארטיפקטים.

איזון בין הישגים לסיכונים: בטיחות, אמינות והשלכות על אקוסיסטם

גוגל מדגישה כי Gemini 3 עבר את סט בדיקות הבטיחות המקיף ביותר שלה עד כה: הפחתת סיכרפנטיות (נטייה להסכים), עמידות טובה יותר ל‑prompt injection ושיפורי מיגון נגד שימוש לרעה. המודל מתוכנן לבקש אישור לפני פעולות רגישות ומספק תיעוד ארטיפקטים בסביבות סוכנות. עם זאת, שילוב סוכנים בחיפוש ובכלי פרודוקטיביות מעלה שאלות על הטיות, על חובת אסמכתאות ועל השפעה על תנועת גולשים לאתריםדאגה שכבר נשמעת בקרב מפרסמים ומו"לים. מנגד, גוגל מצהירה כי AI Overviews מגיעים ליותר מ‑2 מיליארד משתמשים בחודש ושהיא מתעדפת תשובות קצרות, בדוקות ומכוונות פעולה. ההכרעה תגיע בשטח: האם הגישה ה"סוכנת" תתרגם לפריון אמיתי בלי לפגוע באקוסיסטם התוכן.

תחרות ומה הלאה: מה המשמעות ל־LLMים מתחרים ולמפתחים

המסר האסטרטגי של גוגל ברור: יתרון יבנה לא רק מציון MMLU נוסף, אלא מחבילה כוללתמודל חזק + IDE סוכני + שילוב בחיפוש ואפליקציות צרכניות. השוואות מוקדמות מציבות את Gemini 3 בחזית לוחות פופולריים ולצד ציוני מעבדה מרשימים, אך היריבים לא נחים: מודלים מבוססי "חשיבה עמוקה" של מתחרות, מודלי קוד פתוח וחלופות זולות בענן מחוץ לארה"ב מאתגרים את מודל התמחור והזמינות. עבור מפתחים, הנוסחה לשנה הקרובה ברורה: בניית חוויות AI‑native עם סוכנים שמבינים מסכים, כלים ומדיה; תיעוד שקוף של פעולות; ושילוב Grounding עם מקורות אמינים. אם Deep Think אכן ישפר פתרון בעיות מופשטות (ARC‑AGI‑2), ייתכן שמפתחי אנליטיקה, רובוטיקה ו‑XR יקבלו בסיס חזק ליישומים שעד כה דרשו תפרים ידניים רבים.

בשורה התחתונה, Gemini 3 מציע לארגונים ולמפתחים קפיצת מדרגה מאוזנת: שיאים בבנצ'מרקים לצד תכל'סיות מוצריתמחיפוש ועד IDE סוכני. עבור הקורא הישראלי, המפתח הוא אימוץ מדוד: להתחיל בניסויים ב‑AI Studio/Antigravity, למפות זרימות סוכנות בארגון (תמיכת לקוחות, תפעול, פיתוח), ובמקביל לבחון היבטי פרטיות ונתיב נתונים ב‑Vertex AI אל מול טיוטת הנחיות רשות הפרטיות ותיקון 13. מי שישכיל לשלב נראות תוצאות, תיעוד ארטיפקטים ובקרותירוויח לא רק ציונים יפים, אלא גם ערך עסקי מדיד. זהו מהלך שבו גוגל לא רק "מיישרת קו" עם התחרותהיא מנסה לעצב מחדש את הקטגוריה: ממנוע מחולל למערכת שמבינה, מתכננת ופועלת.

טוען...