Thinking Machines, החברה שהקימה Mira Murati לאחר עזיבתה את OpenAI, חשפה לפי דיווחים ב-TechCrunch ובכלי תקשורת נוספים תצוגה מוקדמת של מה שהיא מכנה "Interaction Models" מודלים שנועדו לנהל שיחה באופן רציף יותר, כך שהמערכת אינה רק ממתינה לסיום דברי המשתמש ואז משיבה, אלא מאזינה, מעבדת ומייצרת תגובה תוך כדי. במילים פשוטות, החברה מנסה להחליף את דפוס ה"פינג-פונג" שמאפיין כיום כמעט כל צ'טבוט קולי או טקסטואלי, במשהו שדומה יותר לשיחת טלפון אנושית. זהו שינוי שנשמע אינטואיטיבי, אך בפועל נוגע בלב הארכיטקטורה של מערכות שפה: תזמון, חביון, ניהול הקשר, תיעדוף אותות קוליים וחזותיים, והיכולת להבין מתי לדבר ומתי דווקא להמשיך להקשיב.
מה בדיוק Thinking Machines מציגה
לפי הפרטים שפורסמו, המערכת של Thinking Machines מיועדת לשיחות קוליות ואף לשיחות וידאו כמעט בזמן אמת, באופן שהחברה מתארת כ"full-duplex". כלומר, במקום חלוקה נוקשה בין שלב ההאזנה לשלב הדיבור, המודל מסוגל לכאורה לבצע את שתי הפעולות במקביל. המשמעות המעשית היא לא רק תגובה מהירה יותר, אלא גם התנהגות שיחתית טבעית יותר: סימני הקשבה קצרים, התערבות עדינה כשהמשתמש מתלבט, או תגובה מיידית לרמז חזותי בשיחת וידאו. לפי הסיקור ב-VentureBeat, החברה הדגימה תרחישים שבהם המודל מזהה בזמן אמת אירוע במסך או בסביבה, ומגיב לפני שהמשתמש מסיים לנסח בקשה מפורשת. אם היכולת הזו תעבוד באופן אמין בקנה מידה רחב, מדובר בשינוי מוצרי משמעותי, לא רק בשיפור קוסמטי של ממשק קולי.
- המודל מעבד קלט ומייצר פלט בו-זמנית, במקום לפי תורות.
- הוא מיועד לאינטראקציה קולית וחזותית כמעט בזמן אמת.
- המטרה היא לאפשר שיחה טבעית יותר, עם פחות השהיות מלאכותיות.
- החידוש אינו רק במהירות, אלא גם ביכולת לזהות הקשר תוך כדי התרחשות.
הבשורה כאן חשובה משום שרוב מערכות ה-AI הפופולריות, גם כשהן מוצגות כ"קוליות", עדיין פועלות למעשה כשרשרת של שלבים נפרדים: קליטת אודיו, תמלול, עיבוד טקסט, יצירת תשובה, המרה לדיבור והשמעה. כל אחד מהשלבים הללו מוסיף חביון ומגביל את הזרימה הטבעית של השיחה. Thinking Machines מנסה לבנות שכבת אינטראקציה שונה מהיסוד, שבה הדיבור, ההאזנה והבנת ההקשר אינם אירועים טוריים בלבד. זה מאתגר במיוחד מפני ששיחה אנושית מלאה בקטיעות, חפיפות, תיקונים עצמיים, אנחות, היסוסים ורמזים לא-מילוליים. כדי שמודל יתמודד עם זה באמת, הוא צריך לא רק להבין שפה, אלא גם לנהל דינמיקה שיחתית. כאן טמון ההבדל בין צ'טבוט משודרג לבין מערכת שנועדה להיות שותפה רציפה לאינטראקציה.
למה זה אתגר טכנולוגי עמוק יותר ממה שנדמה
במבט ראשון, אפשר לחשוב שמדובר בסך הכול בקיצור זמן ההמתנה לתשובה. בפועל, הדרישה הטכנית מורכבת בהרבה. מערכת שמדברת תוך כדי הקשבה צריכה להחליט בכל שבריר שנייה אם להמשיך לדבר, לעצור, לשנות כיוון או לפנות מקום למשתמש. היא צריכה להבין אם השקט הוא סוף משפט, היסוס רגעי או הזמנה להתערבות. היא צריכה להבחין בין אותות חשובים לרעש, ולהתמודד עם קונפליקט בסיסי: יצירת דיבור שוטף מחייבת רציפות, אבל הקשבה טובה מחייבת פתיחות לעדכון מתמיד. לפי מקורות בתעשייה, זו אחת הסיבות שמערכות רבות נותרו עד היום במבנה תורי ופשוט יותר, גם כאשר הממשק החיצוני מציג חוויה "שיחתית". הגישה של Thinking Machines מנסה לפתור את הבעיה הזו ברמת המודל או המערכת, ולא רק באמצעות תזמור של כמה מודולים נפרדים.
למודלים כאלה יש גם השלכות רוחב על עיצוב מוצרים. בעולם מוקדי השירות, למשל, מודל שמספק אותות הקשבה קצרים בלי לקטוע את הלקוח עשוי לשפר משמעותית את חוויית השיחה. בתמיכה טכנית, הוא יכול להצביע על בעיה על המסך ברגע שבו היא מתרחשת. בסביבות תעשייתיות או מעבדתיות, כפי שתואר באחד הסיקורים, מערכת כזו יכולה לזהות חריגה בפרוטוקול ולהתערב מיד, בלי לחכות שהעובד ישאל שאלה. המשמעות היא שמעבר מ-AI תגובתי ל-AI אינטראקטיבי משנה גם את מודל הערך העסקי: לא רק מענה לשאלות, אלא ליווי רציף, פיקוח, תרגום חי, אימון, תמיכה והכוונה בזמן אמת. זהו שוק שונה, עם רף גבוה יותר של אמינות, בטיחות ועקביות.
ההקשר הרחב: Mira Murati בונה חברה לתשתית, לא רק לדמו
כדי להבין את המשקל של ההכרזה, צריך להסתכל על Thinking Machines לא כחברת הדגמות, אלא כשחקנית שמנסה להיבנות בקנה מידה של מעבדת AI גדולה. החברה הושקה בפברואר 2025 עם מסר של בניית מערכות AI מובנות, ניתנות להתאמה ומשתפות פעולה יותר עם בני אדם. בהמשך היא השיקה את Tinker, ממשק אימון ו-fine-tuning שמאפשר לחוקרים ולמפתחים לעבוד על מודלים מבלי לנהל בעצמם את כל שכבת התשתית. בנוסף, החברה חתמה במרץ 2026 על שותפות אסטרטגית ארוכת טווח עם NVIDIA לפריסת לפחות ג'יגה-ואט אחד של מערכות Vera Rubin החל מהשנה הבאה, במהלך שממקם אותה בבירור בזירת החברות שמכוונות לאימון מודלים בקדמת התחום. כלומר, מאחורי דמו השיחה עומדת אסטרטגיה רחבה יותר: שליטה במודל, בתשתית ובממשק.
- Thinking Machines הוקמה ב-2025 בידי Mira Murati, לשעבר CTO של OpenAI.
- החברה כבר השיקה את Tinker, פלטפורמה לאימון והתאמה של מודלים.
- במרץ 2026 הוכרזה שותפות עם NVIDIA לפריסת מערכות Vera Rubin בהיקף של לפחות ג'יגה-ואט.
- לפי דיווחים קודמים, החברה גייסה סכום עתק בהיקף של כ-2 מיליארד דולר לפי שווי דו-ספרתי במיליארדים.
הרקע הזה חשוב גם משום ש-Thinking Machines פועלת תחת לחץ תחרותי ניכר. לפי דיווחים בחודשים האחרונים, Meta גייסה לשורותיה כמה מחברי הצוות המייסד של החברה, צעד שמדגיש עד כמה שוק הטאלנט בתחום תחרותי ויקר. ובכל זאת, עצם העובדה שהחברה ממשיכה להציג כיוון מוצרי חדש, לצד השקעה מאסיבית בתשתיות חישוב, מלמדת שהיא אינה מסתפקת במיצוב סביב שמה של Murati. היא מנסה לבסס זהות טכנולוגית מובחנת: AI שאפשר להתאים, לאמן ולשלב בעולמות שימוש מורכבים ועכשיו גם AI שאולי יודע לנהל אינטראקציה אנושית טבעית יותר. במובן הזה, ההשקה הנוכחית משמשת גם כהצהרה לשוק: Thinking Machines רוצה להתחרות בשכבה שבה נקבעת חוויית המשתמש, לא רק בבנצ'מרקים.
מה זה אומר עבור השוק, המפתחים והחברות
אם הגישה של Thinking Machines תתפוס, היא עשויה להשפיע על שלושה מעגלים במקביל. הראשון הוא שכבת המוצר: עוזרים קוליים, תמיכה ארגונית, כלי מכירה, הדרכה ותפעול. השני הוא שכבת הפיתוח: מפתחים יצטרכו לחשוב פחות במונחים של "prompt נכנס, תשובה יוצאת" ויותר במונחים של זרם אירועים מתמשך, תזמון, קטיעות, מצב שיחה וזיהוי כוונה דינמי. המעגל השלישי הוא שכבת המדידה והרגולציה. קל יחסית להשוות מודלי טקסט בשאלות ותשובות; קשה בהרבה למדוד שיחה חופפת, איכות האזנה, מתי נכון להתערב, ומה נחשב לקטיעה בעייתית. לכן, גם אם הטכנולוגיה מבטיחה, היא תדרוש כלים חדשים להערכה. בנוסף, כשמודל יוזם דיבור בזמן אמת, עולה גם רף האחריות: טעות אינה רק תשובה לא מדויקת, אלא התערבות לא במקום ברגע רגיש.
- חברות יצטרכו להחליט מתי AI רשאי ליזום התערבות בשיחה.
- מפתחים יידרשו לבנות לוגיקת שיחה רציפה ולא רק בקשות נפרדות.
- תחום ההערכה יצטרך מדדים חדשים לאיכות אינטראקציה, חביון וקטיעות.
- שיקולי בטיחות ופרטיות יהפכו מרכזיים יותר, במיוחד בשיחות קוליות וחזותיות.
מבחינה עסקית, יש כאן גם אמירה רחבה יותר על הכיוון של תעשיית ה-AI. בשנים האחרונות התחרות נסובה בעיקר סביב גודל מודל, איכות reasoning, חלון הקשר ומחיר לטוקן. כעת מתברר ששכבת האינטראקציה עצמה הופכת לזירת בידול מרכזית. המשתמשים כבר מצפים ממערכות קוליות להגיב מהר, אבל גם להבין הקשר, לא לקטוע, לאבד פחות מידע, ולהרגיש פחות מכניות. לכן, מי שיצליח להפוך שיחה עם AI למשהו שקרוב יותר לתקשורת אנושית יוכל לייצר יתרון מסחרי מובהק, גם אם המודל הבסיסי אינו בהכרח החזק ביותר בכל בנצ'מרק טקסטואלי. זה נכון במיוחד בשווקים ארגוניים, שבהם חיכוך קטן בחוויית השימוש מתורגם ישירות לירידה באימוץ.
הזווית הישראלית: הזדמנות למרכזי שירות, בריאות ותעשייה
מנקודת מבט ישראלית, הפיתוח של Thinking Machines רלוונטי במיוחד לכמה תחומים שבהם יש בארץ שילוב של עומק טכנולוגי וצורך מבצעי מובהק. במוקדי שירות, ביטוח, בנקאות וקופות חולים, שיחה קולית טבעית יותר יכולה לשפר גם את היעילות וגם את שביעות הרצון, כל עוד שומרים על בקרה הדוקה. בתעשייה, בייצור ובמערכות ביטחוניות-תפעוליות, עוזר שמנטר וידאו או טלמטריה ומגיב בזמן אמת עשוי להיות משמעותי הרבה יותר מצ'טבוט רגיל. גם לחברות ישראליות שבונות שכבות Orchestration, QA, ניתוח שיחות, Voice AI או אבטחת AI, הופעת מודלים אינטראקטיביים באמת יוצרת שוק חדש של כלים תומכים. מנגד, העברית נותרת מבחן חשוב: שיחה טבעית בעברית כוללת קצב, קיטועים, מעבר בין עברית לאנגלית, וריבוי הקשרים תרבותיים, כך שכל שחקן גלובלי שירצה להצליח כאן יצטרך להוכיח ביצועים גם מעבר לאנגלית.
בשורה התחתונה, Thinking Machines עדיין לא הציגה מוצר צרכני רחב שמוכיח שהמודל הזה עובד באופן עקבי בכל סביבה, ולכן נכון להתייחס להכרזה כאל כיוון טכנולוגי משמעותי אך עדיין מוקדם. ובכל זאת, עצם ההצבה של "האזנה בזמן דיבור" כמטרה מרכזית מצביעה על שינוי חשוב בשיח סביב AI: פחות דגש על צ'ט כממשק ברירת מחדל, ויותר דגש על אינטראקציה מתמשכת, רב-ערוצית ויזומה. אם החברה תצליח לחבר בין התשתית העצומה שהיא בונה, מוצרי הפיתוח שכבר השיקה והחזון האינטראקטיבי שהיא מציגה כעת, היא עשויה להפוך לשחקנית בעלת השפעה אמיתית על האופן שבו אנשים עובדים עם בינה מלאכותית. עבור השוק, זו תזכורת לכך שהמרוץ כבר אינו רק על מי "חושב" טוב יותר, אלא גם על מי "מקשיב" טוב יותר.