הכותרת הגדולה של re:Invent 2025 ברורה: AWS רוצה שתאמינו בסוכנים. בעוד המתחרות מציגות אסיסטנטים ויכולות אוטומציה ממוקדות, אמזון מנסה להפוך את "סוכני הבינה" לשכבת תוכנה ארגונית של ממש כזו שמבצעת משימות מורכבות, מתכננת, בודקת את עצמה ופועלת לאורך שעות וימים. לפי דיווחים מ-TechCrunch ומקורות בתעשייה, לצד מודלים ממשפחת Nova 2 והכרזה על שרתי Trn3 המבוססים על שבב Trainium3, אמזון הוסיפה גם הטבת מחירים משמעותית לעולמות בסיסי הנתונים שהקימה תרועות בקהל. כל זה נועד להראות שהענקית מסיאטל אינה רק ספקית תשתיות, אלא גם שחקנית מהותית בשכבות היישום והפרודוקטיביות של ה-AI.
מה אמזון הכריזה: סוכנים פרונטייר, AgentCore ומשפחת Nova 2
באירוע הוצגו שלושה "סוכני פרונטייר" קבוצה חדשה של סוכנים אוטונומיים שפועלים כהרחבה של צוותי פיתוח: Kiro כסוכן פיתוח שמבצע שינויים רוחביים במספר רפוזיטוריז ושומר הקשר לאורך זמן; AWS Security Agent שמכניס מומחיות אבטחה לפרקטיקות SDLC כולל ביקורת קוד ובדיקות חדירה לפי מדיניות הארגון; ו‑AWS DevOps Agent שמסייע בניטור, טיפול בתקלות והקשחת תהליכי פריסה. מעליהם יושבת שכבת Amazon Bedrock AgentCore שמספקת תשתית ניהול סוכנים: זיכרון מתמשך (כולל episodic memory), ריצה בקנה מידה גדול, זהות ואימות, וכעת גם יכולות Policy ו‑Evaluations חדשות שנועדו להציב גבולות ברורים, למדוד איכות ולשפר אמינות לפני עלייה לייצור.
- AgentCore Policy (תצוגה מקדימה): ניסוח מדיניות טבעית שמיתרגמת אוטומטית ל‑Cedar, ואכיפה בזמן אמת לכל קריאת כלי של הסוכן.
- AgentCore Evaluations (תצוגה מקדימה): 13 מעריכי איכות מובנים (דיוק, בחירת כלים, עמידה במדיניות ועוד) וממשק ניטור מאוחד מבוסס CloudWatch.
- AgentCore Memory: זיכרון אפיזודי ששומר הקשר בין אינטראקציות, לומד מהמשוב ומחזק עקביות לאורך זמן.
- תאימות למסגרות קוד פתוח וכל מודל: תמיכה מובנית ב‑LangGraph, CrewAI, LlamaIndex, OpenAI Agents SDK ואחרות.
במקביל, AWS הרחיבה את משפחת Nova 2: Nova 2 Omni (רב-מצבי) שמסוגל להבין טקסט, תמונה, וידאו ודיבור ולהפיק טקסט ותמונה; Nova 2 Sonic לשיחה קולית דו־כיוונית בזמן אמת עם חלון הקשר של מיליון טוקנים ותמיכה בריבוי שפות; ולצידם דגמי טקסט משופרים (כגון Nova Lite/Pro) למגוון עומקי הסקה ותקציב. החוליה המקשרת היא Nova Forge שירות פרימיום שמאפשר ללקוחות לבנות "נובלות" (Novellas) מותאמות, על בסיס נתוני לקוח ותוצרי אימון של אמזון, בנקודות חיבור בשלבי קדם־אימון, אמצע ואחרי‑אימון. לפי פרסומים בתעשייה, המחיר השנתי ההתחלתי עומד על כ‑100 אלף דולר, ומאפשר גמישות שאין בדרך כלל בארגונים מחוץ למעבדות עילית.
“המחסום הגדול ביותר להטמעה רחבה של סוכנים בארגון איננו הטכנולוגיה זו האמון.”
דברי מנכ"לית WRITER, מיי חביב, בהשקת אינטגרציית Bedrock
השבב, השרת והמפעל: Trainium3, UltraServers ו‑AI Factories
כדי שלסוכנים תהיה מהירות, עלות ותקרת קנה מידה סבירה, AWS דוחפת חזק את החומרה הביתית שלה. Trainium3, השבב החדש בייצור 3 נ״מ, מזין את שרתי Trn3 UltraServers שמאגדים עד 144 שבבים במערכת ומשיגים, לפי נתוני החברה, עד פי 4.4 ביצועי אימון ופי 4 יעילות אנרגטית לעומת הדור הקודם. AWS מדווחת גם על תפוקות טוקנים גבוהות יותר לאותה הסקה, ושירותי Bedrock כבר מריצים עומסים פרודקשניים על Trainium3. במקביל, דווח על שיתופי פעולה להמשך הדרך (לרבות טכנולוגיות קישוריות עתידיות) ועל "AI Factories" פריסת תשתיות AI ייעודיות של AWS בתוך דאטה סנטרים של לקוחות, לשילוב ריבונות נתונים וציות רגולטורי עם קצבי אימון והסקה מתקדמים.
ועדיין, דווקא ההכרזה הפרוזאית יותר פגשה את מחיאות הכפיים החמות: Database Savings Plans מודל רכישה חדש שמעניק עד 35% חיסכון לשירותי בסיסי הנתונים (Aurora, RDS, DynamoDB ועוד) בתמורה להתחייבות שימוש שנתית. לפי דיווחים מהאולם, זו הייתה אחת הנקודות הרועשות בקינוט של מנכ"ל AWS מאט גרמן, ושיקפה מציאות פשוטה: עבור רבים, ניהול עלויות ענן הוא הכאב המיידי יותר מהאימון הבא של מודל רב‑מודלי. גם ההוזלה הדרמטית של DynamoDB ב‑2024 והורדות מחיר של Guardrails ל‑Bedrock משתקפות כקו מנחה להפוך את ה‑AI לא רק חזק אלא גם כלכלי.
- Trn3 UltraServers: עד 144 שבבים במערכת, שיפור ביצועים ויעילות אנרגטית בדור החדש.
- Database Savings Plans: עד 35% חיסכון בעומסי בסיסי נתונים, עם גמישות בין מנועי DB ואזורים.
- Nova 2 Sonic: שיחה קולית דו־כיוונית, ריבוי שפות, חלון הקשר של מיליון טוקנים.
- AgentCore Evaluations: 13 מעריכי איכות מובנים ומדדים תפעוליים ב‑CloudWatch.
תחרות: מיקרוסופט וגוגל לא מחכות, ואמזון משנה נרטיב
מחוץ לאולם בלאס וגאס, התחרות מתעצמת. מיקרוסופט שמה את GPT‑5 בלב Azure AI Foundry Agent Service ומקדמת אורקסטרציית רב‑סוכנים, כלים לדפדוף מבוקר וקישוריות למערכות ארגוניות. בגוגל, Vertex AI Agent Engine הגיע לזמינות כללית כבר במרץ, עם זיכרון, סטרימינג דו־כיווני ובידוד ריצה, והושק Workspace Studio שמביא בניית סוכנים ישירות ל‑Gmail, Drive ו‑Chat ללא קוד. בתגובה, AWS מדגישה יתרון אחר: חופש בחירה במסגרת ובמודל, חיבור הדוק לתשתית על (כולל שבבים ייעודיים), ו‑AgentCore כסטנדרט דה‑פקטו להפיכת סוכנים ממוקאפ למערכת ייצור. גם במסר, בכירים באמזון מעדיפים תועלת אמיתית על פני מירוץ בנצ'מרקים ניסיון לשנות את שיחת ההשוואות המסורתית.
בזירת ה‑ROI, אמזון מביאה סיפורי לקוחות שמדגישים תוצאות מוחשיות: בליגת הגולף האמריקאית דווח על קיצור זמן יצירה של תכנים פי עשרה וצמצום עלויות 95% הודות למערכת מרובת סוכנים; חברות כמו MongoDB ו‑Swisscom התאימו AgentCore כדי לקצר שבועות של הערכה וכלי דבק תפעוליים לפלטפורמה אחת; ועסקים צרכניים מציגים פתרונות שירות לקוחות מבוססי Claude ב‑Bedrock עם ירידה דרמטית בזמני טיפול. מנגד, גם AWS עצמה מודה שסוכנים אינם דטרמיניסטיים: לכן היא מוסיפה שכבות הערכה, מדיניות, זיכרון וזרימה דו־כיוונית כדי להתמודד עם משימות רב‑שלביות, הפסקות ומעברים בזמן אמת.
זווית ישראלית: ריבונות נתונים, קול סלולרי ו‑il‑central‑1
הבשורה המקומית החשובה: Amazon Bedrock זמין כעת באזור ישראל (Tel Aviv). המשמעות היא שסוכנים, מודלים וכלי Guardrails יכולים לרוץ קרוב לנתונים רגישים, לציית לדרישות רגולציה וממשל נתונים, ולהקטין לטנטיות עבור לקוחות מקומיים. גם ההקשרים הטלפוניים מקבלים חיזוק: Nova 2 Sonic מתחבר לשחקני טלפוניה ומרכזי שירות כולל AudioCodes הישראלית ומקל על בניית סוכנים קוליים דו‑כיווניים שמבינים ומדברים עברית לצד שפות נוספות. עבור מגזרי בנקאות, בריאות וממשלה, השילוב של ריבונות נתונים, הקשחה (Policy/Evaluations) ושרשראות כלים בתוך VPC ארגוני עשוי להיות תנאי סף לאימוץ.
מעבר לעמידה בתקנות, המהלכים פותחים תרחישים מעשיים: צוותי פיתוח יוכלו להצמיד את Kiro לטיפול בחובות טכנולוגיים, הרצת refactoring רוחבי והעלאת כיסוי בדיקות; צוותי אבטחה יפעילו Security Agent כדי לבחון עקביות לאור מדיניות ארגונית ולייצר מבחני חדירה על פי דרישה; במוקדים, שילוב Nova Sonic עם ספקי טלפוניה ו‑CRM יאפשר שיחות טבעיות, הפעלות כלים אסינכרוניות ובניית תורים מרובי‑שלבים; ובמסחר דיגיטלי, שיתופי פעולה כמו זה של Visa ו‑AWS רומזים על דור חדש של תשלומים "אייג'נטיים" פעולה אוטונומית ומאובטחת של סוכנים עבור המשתמשים. לצד ההזדמנות, ארגונים יצטרכו להחמיר את בקרות האשרור, הזיהוי וההתחשבנות.
הסיכונים והחורים שצריך לסגור: הלוצינציות, הזרקות ושקיפות
אוטונומיה מביאה גם אחריות: תעשיית ה‑AI כולה מתמודדת עם הלוצינציות, הזרקת פרומפטים והתנהגויות בלתי צפויות אפילו בסביבות שולחניות וארגוניות מבוקרות. דיווחים אחרונים על סיכוני סוכנים ניסיוניים במערכות אחרות מזכירים שללא קווי מדיניות, ביקורות איכות רציפות ותכנון זכויות מינימלי, סוכן יכול להפוך לשחקן מסוכן. כאן נכנסות יכולות AgentCore Policy ו‑Evaluations: הגדרת גבולות בשפה טבעית שנאכפת בכל קריאת כלי, בדיקות אוטומטיות ותצוגות ניטור אחודות. ועדיין יש פערים: ספקי ענן נוטים לפרסם מעט מדי בנצ'מרקים בני השוואה אמיתית, ולקוחות מבקשים שקיפות טובה יותר סביב עלויות לא דטרמיניסטיות של זרימות סוכנים.
- מה המדדים המוסכמים לאמינות סוכן (דיוק, שלמות, זמן, עלות), וכיצד נמדוד אותם רציף?
- אילו כלים מותר לסוכן להפעיל, תחת איזו זהות, ואיך נאכוף עקרון המינימום (PoLP)?
- האם הזיכרון הארוך של הסוכן עומד במדיניות פרטיות ולוגי מחיקה/שכחה (right to be forgotten)?
- כמה תעלה הרצה לא דטרמיניסטית בתצורה אמיתית (זמן, טוקנים, קריאות API וכלים חיצוניים)?
- כיצד נמנע vendor lock‑in ונשמר ניידות בין AWS, Azure ו‑Google אם נרצה?
לאן זה הולך: בין תשתית ליישום
במבט קדימה, אמזון מציגה מהלך רוחבי שמכסה מודלים (Nova 2), תשתיות אימון/הסקה (Trainium3, UltraServers), שכבות סוכן (AgentCore) וארגז כלים ליישום (Evaluations, Policy) כשעלויות בסיסיות בענן מקבלות התאמות משמעותיות. זו הצעת ערך מעגלית: מחיר תחרותי, חומרה ייעודית, וכלים להפיכת אוטונומיה לבטוחה ושקופה יותר. האם זה יספיק לסגור את הפער מול מיקרוסופט וגוגל? זה תלוי במידת אימוץ המפתחים ובשקיפות התוצאות. אם 2025 הייתה שנת התשתית לסוכנים, 2026 תהיה שנת ה‑ROI: מי יצליח להראות פריסה רחבה, מדידה ועקבית של תהליכים מורכבים בלי להקריב אמינות ועלות.
לארגונים בישראל ההמלצה מעשית: להתחיל בפיילוטים תחומים היטב ב‑il‑central‑1 עם AgentCore, לנסח מדיניות וכללי איכות לפני קוד, ולבחון במקביל חלופות בעננים אחרים כדי לשמר גמישות. לחבר תפעולית את Nova Sonic, מערכות טלפוניה (כולל ספקים מקומיים), CRM ובסיסי נתונים לצד בקרות זהות והרשאות הדוקות. ובעיקר, להתייחס לסוכנים כאל "תוכנה" ולא כאל קסם: ארכיטקטורה, בדיקות, מדדים והחזר השקעה לפני שיווק. אמזון הציבה תשתית מרשימה; עכשיו מגיע תורם של מפתחים ו‑CIOs להכריע אם הסוכנים יהפכו מעוזרי משימות לבני צוות אמיתיים.
