OpenAI חשפה את Jalapeño: שבב ה-AI הראשון שלה ל-inference בשיתוף Broadcom

OpenAI הציגה את Jalapeño, שבב AI ייעודי ל-inference שפיתחה עם Broadcom עבור עומסי ההרצה של מודלי שפה גדולים. המהלך משתלב באסטרטגיית התשתיות של החברה, ונועד לשפר יעילות, להפחית עלויות ולהקטין תלות בספקיות שבבים חיצוניות. הכתבה בוחנת מה ידוע עד כה ומה המשמעות לשוק השבבים, לענן ולחברות AI בישראל.

תגיות
OpenAIBroadcomשבביםAIinferenceתשתיות AI
מניות רלוונטיות:⚠️ ניתוח AI - אינו ייעוץ פיננסי
AVGOBroadcom Inc.
החדשה מחזקת את Broadcom כשותפה מרכזית בפיתוח שבבי AI מותאמים ותשתיות רשת עבור OpenAI, מה שתומך בצמיחה עתידית בהכנסות מתחום ה-AI.
NVDANVIDIA Corporation
הכתבה מציינת במפורש שהמהלך נועד להפחית את התלות של OpenAI ב-Nvidia, ולכן זהו איתות שלילי מסוים לגבי בלעדיותה אצל לקוח אסטרטגי גדול.
AMDAdvanced Micro Devices, Inc.
המעבר של השוק לתשתיות AI היברידיות ופחות תלות בספק יחיד עשוי לתמוך גם ב-AMD כספקית חלופית למאיצי AI ותשתיות חישוב.

OpenAI עלתה שלב נוסף במאבק על שליטה בתשתיות ה-AI שלה, כשהציגה את Jalapeño, השבב הייעודי הראשון שתוכנן מטעמה ופותח לייצור יחד עם Broadcom. לפי דיווחים שפורסמו ב-TechCrunch, Axios וגופי תקשורת נוספים, מדובר במעבד שנבנה בראש ובראשונה עבור inference כלומר שלב ההרצה של מודלים קיימים עבור משתמשי ChatGPT, לקוחות API ומוצרים עתידיים מבוססי סוכנים. בניגוד למירוץ הציבורי סביב שבבי אימון ענקיים, כאן המיקוד הוא בכלכלה התפעולית של ה-AI: איך להריץ יותר שאילתות, בפחות זמן, בעלות נמוכה יותר ותוך שליטה טובה יותר בביצועים, בזמינות ובצריכת החשמל. במובן הזה, Jalapeño אינו רק הכרזה טכנולוגית; הוא גם הצהרה אסטרטגית שלפיה OpenAI כבר אינה מסתפקת ברכישת קיבולת חישוב מהשוק, אלא מבקשת לעצב חלק מהשכבה החומרתית בעצמה.

מה בדיוק הוכרז

לפי הפרסומים, Jalapeño הוא המאיץ הראשון בפלטפורמת חומרה רב-דורית ש-OpenAI בונה יחד עם Broadcom. OpenAI אחראית על תכנון המאיץ והמערכת ברמה הארכיטקטונית, בעוד Broadcom מביאה את יכולות המימוש הסיליקוני, התקשורת והאינטגרציה לרמת ה-rack. כבר באוקטובר 2025 הודיעו שתי החברות על שיתוף פעולה רחב להקמת 10 ג'יגה-ואט של מאיצי AI ומערכות רשת ייעודיות, עם תחילת פריסות במחצית השנייה של 2026 והשלמה מדורגת עד סוף 2029. ההכרזה הנוכחית ממחישה שהשותפות הזאת עברה משלב ההבטחה לשלב המוצר הקונקרטי. לפי OpenAI, השבב תוכנן מהיסוד עבור עומסי העבודה של מודלי השפה שלה, ולא כפתרון כללי לשוק כולו. מבחינת OpenAI, זו נקודה מרכזית: במקום להתאים תוכנה לחומרה גנרית, היא מנסה להתאים חומרה למאפייני התוכנה והשירותים שלה.

  • Jalapeño מיועד בעיקר ל-inference ולא לאימון מודלים.
  • השבב פותח בשיתוף Broadcom כחלק מפלטפורמה רב-דורית רחבה יותר.
  • המטרה המוצהרת היא להאיץ שירותי LLM, לשפר יעילות ולהפחית עלויות תפעול.
  • הפריסה המסחרית משתלבת בתוכנית רחבה יותר של OpenAI לבניית תשתיות בקנה מידה עצום.

הדגש על inference חשוב במיוחד להבנת המהלך. בשנים האחרונות, חלק גדול מהדיון הציבורי התמקד באימון מודלים גדולים, אך מבחינה עסקית, ההוצאה המתמשכת והמתרחבת ביותר של ספקיות AI רבות נמצאת דווקא בהרצה השוטפת. כל תשובה בצ'אט, כל קריאת API, כל חיפוש משולב AI וכל סוכן תוכנה שמבצע משימות ברקע דורשים חישוב רציף, אמין וזול ככל האפשר. לכן, אם OpenAI מצליחה לייצר חומרה שמתאימה טוב יותר לדפוסי ההרצה שלה למשל ברוחב פס זיכרון, בצריכת אנרגיה, ב-latency או בצפיפות פריסה היא יכולה לשפר לא רק את השוליים הכלכליים שלה, אלא גם את איכות המוצר. לפי Axios, זהו גם חלק מהמאמץ להפחית תלות ב-Nvidia, ששולטת כיום בחלק הארי של שוק מאיצי ה-AI.

למה OpenAI צריכה שבב משלה

הצעד של OpenAI נובע משלושה לחצים מצטברים: מחסור יחסי בקיבולת חישוב, עלויות גוברות ותלות גבוהה מדי בספק יחיד. OpenAI אמנם נשענת על שותפויות רחבות עם שחקניות תשתית גדולות, אך הביקוש לשירותיה גדל בקצב שקשה לספק באמצעות מדף סטנדרטי בלבד. בחודשים האחרונים החברה הדגישה שוב ושוב שהיא מרחיבה את בסיס המחשוב שלה באמצעות שילוב של דאטה סנטרים, ספקיות ענן, שותפויות תשתית ושבבים ממקורות שונים. לפי מסמכי OpenAI על בניית תשתיות ל"עידן האינטליגנציה", החברה רואה במחשוב משאב אסטרטגי לא פחות מהמודלים עצמם. בתוך המסגרת הזאת, שבב ייעודי הוא לא מותרות, אלא מנגנון שליטה: הוא נותן לחברה יותר יכולת לכוון ביצועים, צריכת אנרגיה, תמחור ומפת דרכים, במקום להמתין לדור הבא של חומרה חיצונית.

יש כאן גם מרכיב תחרותי ברור. OpenAI אינה היחידה שמנסה ליישר קו בין תוכנה לחומרה. Google מפעילה מזה שנים את משפחת TPU, Meta מפתחת את MTIA, וענקיות נוספות בוחנות מסלולים דומים. Broadcom עצמה נהפכה בשנים האחרונות לשותפה מרכזית עבור חברות שמעדיפות מאיצים מותאמים אישית על פני הסתמכות מלאה על GPU גנרי. לכן, מבחינת OpenAI, הישארות מחוץ למשחק הזה הייתה עלולה להפוך אותה לחריגה דווקא ברגע שבו התעשייה הגדולה עוברת ממודל של "קונים את מה שיש" למודל של "בונים את מה שמתאים". חשוב גם להדגיש: שבב פנימי אינו אומר ניתוק מ-Nvidia או מעבר מיידי לכל החישוב הביתי. סביר יותר שמדובר בשכבה נוספת בארסנל, שתשרת סוגי עומסים מסוימים ותשפר את כוח המיקוח והגמישות התפעולית של החברה.

Broadcom, Ethernet והמעבר מארכיטקטורת GPU טהורה

אחד הפרטים המעניינים בסיפור הוא התפקיד של Broadcom. החברה אינה נתפסת בציבור הרחב כמו Nvidia, אך בתעשיית התשתיות היא מחזיקה בעמדה חזקה מאוד בשילוב שבבים מותאמים, רשתות Ethernet, קישוריות אופטית ופתרונות PCIe. בהודעה המשותפת עם OpenAI הודגש כי המערכות ייבנו על בסיס Ethernet בקנה מידה רחב, גם ל-scale-up וגם ל-scale-out. זו אינה הערת שוליים טכנית: בעולם ה-AI, מבנה הרשת בין המאיצים קובע במידה רבה את היעילות, את זמן התגובה ואת עלות הבנייה של אשכולות חישוב. במשך שנים רבות, סביבת ה-AI המתקדמת נשענה בעיקר על תצורות המזוהות עם Nvidia, כולל חיבורים ייעודיים ומעטפת תוכנה הדוקה. Broadcom מקדמת חלופה של מערכות פתוחות יותר, מבוססות Ethernet, שיכולות להיות אטרקטיביות במיוחד כאשר בונים קיבולת עצומה עבור inference.

  • Broadcom מספקת לא רק סיליקון, אלא גם תכנון מערכת, רשת וקישוריות ברמת הדאטה סנטר.
  • הבחירה ב-Ethernet מאותתת על העדפה לסטנדרטים פתוחים ולעלות פריסה יעילה יותר.
  • עבור OpenAI, הערך הוא לא רק בביצועי השבב, אלא ביכולת לבנות אשכולות חישוב שלמים סביבו.
  • עבור השוק, זו הוכחה נוספת שמרכז הכובד עובר ממאיץ בודד לארכיטקטורת מערכת מלאה.

בהקשר הזה, Jalapeño הוא כנראה פחות "שבב בודד" ויותר אבן בניין בתוך מערכת רחבה בהרבה. לפי מקורות בתעשייה ופרסומים מוקדמים יותר, OpenAI בוחנת ומרחיבה במקביל שימושים בתשתיות מגוונות: Nvidia, AMD, ענן ציבורי, שותפויות ענק, וכעת גם חומרה בעיצוב עצמי. המשמעות היא ש-OpenAI אינה בוחרת הימור יחיד, אלא בונה תיק תשתיות רב-שכבתי. זהו מהלך רציונלי עבור חברה שהביקוש למוצרים שלה יכול להשתנות במהירות ושעלות החישוב שלה משפיעה ישירות על היכולת להציע מנויים, API וכלי סוכנים ברמות מחיר תחרותיות. אם Jalapeño יעמוד ביעדי הביצועים והיעילות, הוא עשוי להפוך למרכיב חשוב מאוד דווקא בשירותים המוניים, שבהם גם חיסכון קטן לכל שאילתה מתורגם לסכומים אדירים בקנה מידה שנתי.

מה ידוע על הרקע למהלך

העבודה על שבב עצמאי של OpenAI אינה חדשה. עוד ב-2024 דווח כי החברה פועלת עם Broadcom ו-TSMC כדי לפתח שבב פנימי, ובמקביל מצמצמת שאיפות שאפתניות יותר של הקמת רשת מפעלי ייצור משלה. הרציונל היה ברור כבר אז: בניית מפעלים היא מהלך יקר, איטי ומורכב מדי אפילו עבור שחקנית עתירת הון, בעוד שתכנון שבב בשיתוף שותפות מתמחות הוא מסלול ישים ומהיר יותר. במהלך 2025 התגבשה התמונה, עם הכרזה פומבית על שיתוף הפעולה בין OpenAI ל-Broadcom בהיקף של 10 ג'יגה-ואט. בחלק מהדיווחים אף עלו טענות על עיכובים ולחצים סביב יעדי הביצועים והלוחות הזמנים, אך עצם החשיפה של Jalapeño מצביעה על כך שהפרויקט הבשיל לפחות לשלב שבו OpenAI מוכנה להציגו כחלק מהאסטרטגיה הפומבית שלה.

הקשר הרחב יותר הוא שינוי עמוק בשוק ה-AI כולו. בעידן הראשון של הבינה המלאכותית הגנרטיבית, רוב החברות רדפו אחרי כל GPU פנוי. בעידן הנוכחי, המאבק עובר לשאלה מי שולט בשרשרת הערך: מי בונה את המודל, מי מפעיל את הדאטה סנטר, מי מספק את החשמל, מי קובע את פרוטוקולי הרשת, ומי מחזיק את הסיליקון שמתחת לשכבת התוכנה. OpenAI מאותתת שהיא רוצה להיות מעורבת בכמה שיותר מהחוליות האלה, גם אם לא לייצר הכול לבד. לכן, Jalapeño משתלב היטב עם מסרי החברה מהחודשים האחרונים סביב פרויקטי תשתית ארוכי טווח, הרחבת בסיס המחשוב ושותפויות רבות-משתתפים. מבחינתה, מודל חזק בלי אספקת חישוב יציבה, זולה וגמישה הוא יתרון חלקי בלבד.

המשמעות העסקית והטכנולוגית

אם Jalapeño ייכנס לפריסה בהיקף משמעותי, ההשפעה עשויה להיות מורגשת בכמה רמות. ראשית, עבור OpenAI עצמה, שבב מותאם ל-inference יכול לעזור להקטין את עלות ההגשה של מודלים פופולריים, במיוחד בעומסים חוזרים וצפויים. שנית, עבור Broadcom, מדובר בהוכחה נוספת לכך ששוק המאיצים המותאמים אישית מתבסס כקטגוריה אסטרטגית ולא כעסק נישתי. החברה כבר נהנית מצמיחה חדה בהכנסות ה-AI שלה, ובדוחות האחרונים הדגישה את הביקוש למאיצים מותאמים ולרכיבי רשת עבור אשכולות AI. שלישית, עבור Nvidia, גם אם לא מדובר באיום מיידי על ההובלה הטכנולוגית, זהו עוד סימן לכך שהלקוחות הגדולים ביותר שלה בונים במקביל מסלולי גיבוי, השלמה ולעיתים גם תחרות. בשלב זה, סביר שהשוק יישאר הטרוגני: GPU לאימון, מאיצים ייעודיים ל-inference, ורשתות שמותאמות לתמהיל החדש.

  • OpenAI עשויה לשפר את כלכלת השירות של ChatGPT, ה-API ומוצרי סוכנים עתידיים.
  • Broadcom מחזקת את מעמדה כספקית מפתח של AI custom silicon ותשתיות רשת.
  • Nvidia נשארת שחקנית דומיננטית, אך מאבדת מעט בלעדיות אסטרטגית אצל לקוחות על.
  • שוק ה-AI נע לכיוון של תשתיות היברידיות: פחות תלות בסוג שבב יחיד ויותר התאמה למשימה.

יש גם שאלה טכנולוגית מסקרנת יותר: האם OpenAI תרחיב בעתיד את קו השבבים שלה מעבר ל-inference. לפי Axios, החברה כבר בוחנת את האפשרות להתרחב גם לכיוון training, אך בשלב הזה אין לכך הכרזה ברורה. זהו צעד מורכב בהרבה, משום שעומסי אימון דורשים ארכיטקטורה שונה, סביבות תוכנה יציבות במיוחד, וקנה מידה של תקשורת בין שבבים שהוא לעיתים אכזרי יותר מזה של inference. לכן, הבחירה להתחיל ב-inference נראית שקולה. זהו אזור שבו ניתן להשיג תועלת מסחרית מהירה יותר, להוכיח התאמה לעומסי הייצור, ולבנות ניסיון ארגוני בחומרה מותאמת בלי להמר מיד על כל חזית המחשוב.

הזווית הישראלית: למה זה חשוב גם כאן

מנקודת מבט ישראלית, הסיפור של Jalapeño חשוב לפחות בשלוש רמות. ברמה הראשונה, הוא מעיד שוב שהערך בעולם ה-AI זולג במהירות מהמודל עצמו אל שכבת התשתיות: שבבים, רשתות, קירור, חשמל, תזמור עומסים ותוכנה מערכתית. עבור חברות ישראליות שפועלות בתחומי data infrastructure, observability, DevOps ל-AI, אופטימיזציה למודלים, edge inference או רשתות לדאטה סנטר, זהו שוק שנעשה עמוק ומשמעותי יותר. ברמה השנייה, ישראל מחזיקה היסטוריה חזקה בהנדסת שבבים, תכנון מערכות ותקשורת מהירה, ולכן המעבר לשבבים מותאמים פותח גם חלונות להזדמנויות כוח אדם, שיתופי פעולה והשקעות. ברמה השלישית, עבור ארגונים מקומיים שמטמיעים AI, המסר ברור: התחרות כבר אינה רק בין מודלים, אלא בין שרשראות אספקה שלמות של חישוב.

עבור מנהלי טכנולוגיה בישראל, המשמעות המעשית היא שיש מקום לחשוב מחדש על ארכיטקטורות inference, על בחירת ענן, על porting בין ספקי חומרה ועל עצמאות תפעולית. ככל שספקיות ה-AI הגדולות יבנו שבבים משלהן, כך גם הלקוחות הארגוניים יצטרכו להבין טוב יותר על מה הם רצים בפועל: איזה מודל משרת אותם, על איזו תשתית, באילו עלויות ולאילו SLA אפשר לצפות. במקביל, סטארט-אפים ישראליים שבונים שכבות תווך מעל מודלים יצטרכו להבטיח שהמוצרים שלהם נשארים גמישים לסביבות חישוב שונות. Jalapeño הוא אמנם מוצר של OpenAI, אך הסיפור הרחב שלו הוא מעבר של התעשייה מעידן של תוכנה מנותקת יחסית מהחומרה, לעידן של co-design שבו המודל, התשתית והשבב נבנים זה סביב זה.

בשורה התחתונה, חשיפת Jalapeño מסמנת ש-OpenAI רוצה להיות לא רק מובילת מודלים, אלא גם שחקנית תשתית בעלת השפעה ישירה על החומרה שמריצה את מוצריה. בטווח הקצר, זהו מהלך שנועד לשפר יעילות, להפחית תלות ולהבטיח קיבולת עבור inference. בטווח הבינוני, זו עשויה להיות תחילתה של שכבת חומרה פנימית רחבה יותר, שתשפיע על האופן שבו OpenAI מתמחרת שירותים, מתכננת מוצרים ומנהלת את הצמיחה שלה. ובטווח הרחוק, המהלך הזה תורם לעיצוב מחדש של מפת הכוחות בתעשיית ה-AI: פחות הסתמכות בלעדית על ספקית שבבים אחת, יותר שותפויות עמוקות בין מודלים, ענן וסיליקון, ויותר הבנה שהעתיד של הבינה המלאכותית ייקבע לא רק לפי איכות התשובה של המודל, אלא גם לפי הכלכלה וההנדסה של כל מה שקורה מאחוריה.

טוען...