Chronosphere משיקה AI שחוקר תקלות בלי דרמה

פתרון ה-AI החדש לאובזרוויביליטי מציג חקירות מודרכות, גרף ידע זמני ותיעוד אוטומטי כדי להבין למה משהו קרה, לא רק מה קרה. פחות ניחושים, יותר שקיפות, ובסוף: מהנדסים שמקבלים תשובות מהר יותר.

מניות רלוונטיות:⚠️ ניתוח AI - אינו ייעוץ פיננסי
DDOGDatadog, Inc.
החדשות מצביעות על תחרות גוברת עם Chronosphere, מה שיכול להוביל לירידה בביקוש לשירותי Datadog.
SPLKSplunk Inc.
ההכרזה על יכולות חדשות של Chronosphere מציבה את Splunk בעמדה תחרותית קשה, מה שעלול להשפיע לרעה על המניה.
DTDynatrace, Inc.
ההתקדמות של Chronosphere בתחום ה-AI עשויה להקטין את נתח השוק של Dynatrace, מה שעלול להוביל לירידת ערך המניה.

ביום שני, 10 בנובמבר 2025, Chronosphere חשפה יכולות AI-Guided Troubleshooting – ניסיון שאפתני להפוך את האובזרוויביליטי לשקוף ומוסבר יותר, דווקא בתקופה שבה קצב כתיבת הקוד מואץ בזכות כלים גנרטיביים, אבל תחקור כשלים בפרודקשן נשאר ידני ומסורבל. לפי דיווחים, הפתרון משלב אנליטיקה מבוססת AI עם "גרף ידע זמני" – מיפוי מתעדכן של שירותים, תלותיות, שינויים והקשר אנושי לאורך זמן – כדי להציג למה משהו קרה, לא רק מה קרה. בשוק תחרותי שמובל על ידי Datadog, Splunk ודיינאטרייס, Chronosphere בוחרת להציג AI שמראה את עבודתו, מצרף ראיות ומאפשר למהנדסים לאמת או לדחות מסקנות. יכולות כמו Suggestions, Investigation Notebooks ושאילתות בשפה טבעית זמינות בהשקה מוגבלת, עם תכנון ל-GA בשנת 2026, בעוד שרת MCP לחיבור סביבות AI הפך זמין מיידית ללקוחות.

מה חדש: AI שמראה את עבודתו, לא מחליף את המהנדס

הגישה של Chronosphere מתנגדת לפיתוי של ״החלטות אוטומטיות בשחור״. במקום זאת, המערכת מציעה מסלולי חקירה מדורגים (Suggestions) שמבוססים על דפוסי שגיאות, תזמונים, תלותיות ושינויים אחרונים – כל זאת בליווי "למה הוצע לי זה" כולל מה נבדק ונשלל. מחברת החקירה Investigation Notebooks מתעדת אוטומטית כל צעד, שאילתה ומסקנה, כך שהידע הארגוני מצטבר והגרף הזמני משתפר. במצב אמיתי, לדוגמה, כאשר התראת SLO על צ׳קאאוט מופעלת, המערכת תציע לבדוק תחילה את שירות התשלומים ותציג עדויות; אם יימצא שעדכון פלג הפיצ׳ר קדם להתנפחות זיכרון, ניתן לשחזר את העדכון – והקשר הסיבתי יישמר למחקרי עבר. כך נשמרת שליטה אנושית, אך זמן האבחון מתקצר והאמון ב-AI גדל.

״כדי ש‑AI יהיה אפקטיבי באובזרוויביליטי, הוא צריך יותר מזיהוי תבניות וסיכומים.״

מארטין מאו, מנכ"ל ומייסד־שותף Chronosphere

הגרף שמוסיף ממד זמן: לא רק טופולוגיה, אלא סיבתיות

ה־Temporal Knowledge Graph הוא ליבה רעיונית וטכנולוגית: ״מודל חי״ של המערכת שמקשר מדדים, טרייסים ולוגים עם הקשר תשתיתי, אירועי שינוי (דיפלוימנטים, פלגי פיצ׳רים) ותשומות אנושיות כגון רנוּבוקים והערות. בשונה ממפות תלות קלאסיות של מתחרים, כאן הזמן הוא רכיב ראשון במעלה – מה השתנה, מתי, ומה נסמך על מה. יתרון חשוב הוא נרמול טלֶמטריה מותאמת־אפליקציה, לא רק אינטגרציות סטנדרטיות (קוברנטיס, שירותי ענן נפוצים). כך מצטמצמות ״נקודות עיוורון״ שהובילו בעבר לייעוץ בטוח־אך־שגוי מצד מודלים גדולים. ככל שיותר חקירות נסגרות, הגרף מזין את עצמו ויוצר בסיס ידע מצטבר שמקצר תחקורים עתידיים ומחזק הסקת מסקנות סיבתיות.

  • טלמטריה: מדדים, טרייסים ולוגים – כולל שדות מותאמים
  • הקשר תשתיתי: שירותים, תלותיות, עננים, קלאסטרים
  • אירועי שינוי: דיפלוימנטים, פלגי פיצ׳רים, קונפיגורציות
  • הקשר אנושי: רנובוקים, הערות, היסטוריית צעדי חקירה
  • ציר זמן: סדר אירועים וקישורם לתקריות בפועל

השוואת שוק: Datadog, Dynatrace ו‑Splunk מול תזה שקופה

מנהיגי השוק לא עומדים מנגד: Datadog משיקה את Bits AI – סוכני AI לתחקור התראות, הצעת תיקוני קוד וניהול אירוע; Dynatrace מרחיבה את Davis AI לניתוח סיבתי ומניעתי; ו‑Splunk (בבעלות סיסקו) משלבת Assistant גנרטיבי להאצת RCA בתוך Observability Cloud. ההבדל העיקרי בינו לבין Chronosphere הוא הדגשת ״הסבריות״ והימנעות מהחלטות אוטומטיות מאחורי הקלעים: ההנחה היא שבאירועים אמתיים תזדקק המערכת לא רק לקורלציה וסיכום אלא גם להבנה של שינויים מותאמי־אפליקציה לאורך זמן. לצד זאת, הרכבת פתרון ״קומפוזבילי״ סביב שותפים מומחים מאתגרת את מודל ה״הכול‑באחד״, והיא מנסה להעניק עומק בכל תחום – גם במחיר ניהול חוזים נפרדים וקונפיגורציה מורכבת יותר לארגונים גדולים.

  • Datadog Bits AI: חקירת התראות, טיוב סטטוסים ותיקוני קוד אסינכרוניים
  • Dynatrace Davis AI: ניתוח סיבתי וגילוי אנומליות מגובה Grail
  • Splunk AI Assistant: שאילתות בשפה טבעית, יצירת SignalFlow והכוונה ב‑RCA
  • Chronosphere: הצעות מודרכות עם ראיות, גרף ידע זמני ורישום חקירות

עלות לפני הכול: פחות דאטה מיותרת, יותר תוצאות

מנקודת מבט של CIO, עיקרון העל הוא שליטה בעלויות. Chronosphere ביססה את מיקומה סביב ״כלכלת הטלמטריה״ – צמצום נפחים מיותרים כבר בקליטה, ניתוח שימושיות לוגים והמלצות פרואקטיביות לצמצום או המרה למדדים. לפי החברה, לקוחות חווים בממוצע הפחתת נפחים ועלויות של עשרות אחוזים, ובמקרי בוחן מסוימים אף מעל 80% חיסכון, לצד ירידה בשכיחות תקריות חמורות ושיפור במדדי MTTR/MTTD. אנליסטים בתעשייה התריעו כי מעל 70% מהוצאות האובזרוויביליטי מופנות לאחסון לוגים שאינם נשאלים מעולם – ולכן מדיניות של ״פחות אבל מועיל״ מחייבת מדידה עקבית: כמה שאילתות נחסכו, אילו קפיצות כלי עזר בוטלו, וכמה זמן נותר לפעילות פיתוח נטו.

״ארגונים טובעים בנתוני טלמטריה; רוב התקציב הולך ללוגים שאיש לא שואל.״

פול נאשוואטי, CUBE Research

אסטרטגיית שותפים: עומק ייעודי במקום חבילה אחת

במקביל להשקה, Chronosphere חשפה תוכנית שותפים חדשה שמשלימה פערים בפלטפורמה בעזרת ספקים מומחים: ניטור מודלים ושגרירי LLM, RUM למובייל ולווב, פרופיילינג רציף, מוניטורינג סינתטי וניהול אינסידנטים. העיקרון פשוט: ארגונים גלובליים מעדיפים לעתים שכבות עומק ״Best-of-breed״ על פני חבילה אחת גורפת. נכון לעכשיו, רוב הלקוחות המשותפים מחזיקים חוזים נפרדים, אך הכוונה היא לפשט מולטי‑קונטרקט בהמשך. המהלך גם מתקשר לסטנדרטים פתוחים: תמיכת PromQL ואקו־סיסטם OpenTelemetry מאפשרים חיבוריות רחבה והפחתת נעילת ספק. עבור צוותי SRE גדולים, בחירה כזו עשויה להעניק דיוק ויכולת אופטימיזציה שלא תמיד ניתנים להשגה במערכות מונוליתיות.

  • Arize: ניטור LLM ומדדי ביצועי מודלים
  • Embrace: Real User Monitoring למובייל ולווב
  • Polar Signals: פרופיילינג רציף להקטנת עלויות CPU וזיכרון
  • Checkly: מוניטורינג סינתטי לבדיקות רציפות של מסעות לקוח
  • Rootly: ניהול אינסידנטים ושיתופי פעולה ישירות בערוצי תקשורת

הקשר עסקי: OpenAI, לחצי מחיר ותחרות בשכבת ה‑GPU

לחץ התחרות אינו תאורטי: אנליסטים דיווחו כי OpenAI מפעילה במקביל Datadog ו‑Chronosphere לניטור עומסי GPU – מצב דו־בתי שמאותת על הערכת אלטרנטיבות ועל פוטנציאל לחץ מחירים. מנגד, Datadog מרחיבה את Bits AI וממשיכה ליהנות מתנופת אינטגרציות וחדירה לשוק. Splunk, כחלק מסיסקו, מרחיבה יכולות AgenticOps, ודיינאטרייס דוחפת ל‑AIOps מונעת‑מראש. עבור לקוחות אינטרפרייז, מסר מפתח הוא בדיקה עצמאית: מה באמת מקצר אינסידנטים, מה מפחית עבודת יד ומה בונה ידע ארגוני ממוחזר. ברקע, הקצאת תקציבי AI בארגונים מזנקת, ותהליכי הפיתוח מעלים את קצב הקומיטים – מה שמעלה את רף האובזרוויביליטי סביב סביבות מודלי שפה, סביבות GPU וקוברנטיס מרובי קלאסטרים.

פרספקטיבה ישראלית: אמון, שקיפות וקונטרול־פליין בתקציב קשיח

לחברות ישראליות הפועלות בענפים עתירי רגולציה, פינטק וסייבר, שאלת האמון ב‑AI מבצעי איננה אקדמית. חקירה שמציגה ראיות, תזמון ושינויים – ומאפשרת בקרה ידנית – תסייע לאשר שימוש גם אצל בעלי עניין שמרניים (Risk, ComSec). תיעוד חקירות ב‑Notebooks תורם לצמצום תלות ב״שבטיות״ ומקצר חפיפה בצוותי פיתוח גלובליים. יתרון נוסף הוא השליטה בנתונים ובעלויות: יכולות shaping והמרת לוגים למדדים, בתוספת Control Plane שמדגיש מה לא לאסוף, מתיישבות עם עידן תקציבים קשיח. מעבר לכך, שרת MCP של Chronosphere מתחבר לסביבת סוכנים/עוזרים בדסקטופ וב‑IDE – היבט חשוב כאשר מיקרוסופט, לדוגמה, מקדמת תמיכת MCP ב‑Windows, ומכשירה אינטגרציות מאובטחות בין סביבות פיתוח ל‑Observability.

  • מדדי אימון ב‑AI: זמן עד אבחון, צעדים שנחסכו, חיתוך רעש
  • כיסוי טלמטריה מותאמת: שדות אפליקטיביים לא סטנדרטיים
  • תיעוד ידע: חקירות חוזרות ונשנות הופכות לרנובוקים ישימים
  • שילוב בזרימת עבודה: MCP מול כלים כמו Claude Code ו‑Cursor
  • צמצום עלויות: המרת לוגים למדדים ושליטה בקליטה

זמינות ומפת דרכים: זהירות מבצעית לפני פריסה רחבה

היכולות החדשות נכנסו ל־Limited Availability מ‑10 בנובמבר 2025 עבור לקוחות נבחרים; זמינות כללית מתוכננת ל‑2026. הבחירה בגלגול מדורג נועדה לצבור משוב ולהפחית סיכון של ״ביטחון־יתר״ מודלי בזמן אמת. במקביל, שרת MCP זמין כבר כעת – בגירסת אירוח מנוהלת ובקוד פתוח לצרכי פריסה עצמית – ומספק גשר קריאה־בלבד לנתוני תצפית, דשבורדים והתראות. בגישה זו, ה‑AI ניזון מנתוני אמת נקיים ומקונטקסט גרפי/זמני עשיר, אך מנוע מלפעול שגיאות ניהוליות (כמו מחיקה או שינוי אובייקטים תפעוליים). עבור ארגונים שמעדיפים ״לגעת״ בזהירות ב‑AI מבצעי, זהו איזון ראוי בין זמינות תובנות לבין משטר הרשאות שמרני.

כך רצוי להריץ פיילוט: קריטריונים מדידים ושאלות נכונות

כדי לבחון ערך אמיתי ולא הדגמה מרשימה, מומלץ להגדיר מראש אשכול אינסידנטים טיפוסיים (Checkout, תשלום, סשן, משמרות GPU) ולהשוות לפני/אחרי במדדים תפעוליים. יש לוודא שהמערכת אכן מאתרת שינויים רלוונטיים, מסבירה למה הציעה מסלול מסוים ומצמצמת קפיצות בין כלים. מעבר לזמני אבחון ופתרון, מדדו גם שיעור חקירות ששוחזרו במלואן מרנובוקים, שיעור לוגים שהומרו למדדים ללא פגיעה בכיסוי, ומספר השאילתות האד‑הוק שנחסכו. לבסוף, ודאו שה‑AI מתמודד היטב עם טלמטריה מותאמת־בית ושאינו משלים פערים ״בביטחון״ מופרז. אם הקריטריונים הללו מתקיימים, תוכלו לגלגל את הפתרון בהדרגה לשירותים נוספים ולמדינות נוספות.

  • האם ההצעות מדורגות כוללות ראיות, תזמונים ותלותיות?
  • כמה קיצרנו MTTR/MTTD באינסידנטים הנבחרים?
  • מה שיעור הקפאת לוגים/המרתם למדדים ללא פגיעה באיתור תקלות?
  • כמה ״טאבים״ וחילופי הקשר נחסכו למהנדס בתחקיר ממוצע?
  • האם Notebooks הפכו לרנובוקים הנצרכים שוב ושוב?

רקע ותמונה גדולה: מאובר להובלה אנליסטית

שורשי Chronosphere נטועים בשנות מהפכת המיקרו־שירותים של Uber, שבהם תקלות בלילות שיא כמו האלווין ושנה אזרחית חדשה אילצו לבנות תשתית תצפית בקנה מידה חריג. מאז, החברה גייסה מעל 340 מיליון דולר, הוכרה בשנת 2025 כמובילה במג׳יק קוודרנט לאובזרוויביליטי בפעם השנייה ברציפות וקיבלה דירוגי לקוחות גבוהים ב‑Peer Insights. ברמת המוצר, לצד לוגים 2.0 ואופטימיזציית טלמטריה, היא שמה דגש על סטנדרטים פתוחים (PromQL, OpenTelemetry) וחוויית שליטה־בנתונים. התזה האסטרטגית רחבה: בעידן של מערכות מורכבות וזרם דאטה אדיר, הזוכה לא תהיה בהכרח זו שמבטיחה אוטומציה פְּרֶאֶמְפְּטִיבִית, אלא מי שתשיג אמון – תסביר מה ידוע, מה לא, ומדוע – ותשאיר את ההגה בידי המהנדסים.

טוען...