בתחילת גל ה‑GenAI הוגדרו מסדי נתוני וקטורים כשכבת התשתית הבאה: ממנועי Pinecone ו‑Weaviate, דרך Milvus ו‑Qdrant ועד Chroma. ההבטחה הייתה חיפוש “לפי משמעות” במקום מילות מפתח, והזרמת הקשר עשיר למודלי שפה. שנתיים קדימה, המגמה מתבהרת: הווקטורים הפכו לרכיב חשוב – אך לא בלעדי – בתוך מערכות אחזור רחבות. ספקיות ענן ומאגרי נתונים מסורתיים הוסיפו יכולות וקטור כחלק מהפלטפורמה, וההפרדה בין “דאטהבייס וקטורי” ייעודי לבין “פיצ’ר וקטורים” נשחקה. במקביל, ארגונים גילו שהדיוק והאמינות נולדים מארכיטקטורה היברידית: שילוב סמנטיקה, טקסט לקסיקלי, מטא־דאטה ורי‑ראנקינג – לעיתים גם גרפים. זהו מהלך התבגרות מובהק: פחות קסם, יותר הנדסה.
שנתיים אחרי ההייפ: בדיקת מציאות לארגונים ולספקים
החזרה לקרקע מתבטאת בראש ובראשונה בתוצאות עסקיות. לפי דיווחי מחקר של MIT (פרויקט NANDA) משנת 2025, כ‑95% מהארגונים שהשקיעו ביוזמות GenAI אינם רואים השפעה מדידה על ה‑P&L; רק כ‑5% מצליחים לייצר ערך מהיר בקנה מידה. הממצאים מייחסים את הפער לא לאיכות המודלים אלא לאינטגרציה לקויה בתהליכי עבודה, היעדר שיטות למידה מתמשכת, והגדרה שגויה של בעיות. ההשלכה על תחום הווקטורים ברורה: אחזור סמנטי כשלעצמו אינו ערובה לנכונות עובדתית או לרלוונטיות; כדי להחזיר תשובות מדויקות במערכות פרודקשן צריך מרכיבי בקרה, פילטרים, כללי רלוונטיות ורי‑ראנקינג – ולעיתים גם ייצוג מפורש של קשרים בין ישויות באמצעות גרפים.
“סמנטי ≠ נכון.”
לקח מרכזי של ארגונים שהטמיעו אחזור מבוסס וקטורים ב‑2024–2025
הענקים סוגרים את הפער: וקטורים הופכים לפיצ’ר בכל פלטפורמה
ב‑2025, וקטורים כבר אינם נחלתם של סטארטאפים בלבד. Postgres אימץ את pgvector כשכבת הרחבה פופולרית ומנהליה בענן (AWS RDS, AlloyDB של גוגל, Azure Database for PostgreSQL) מספקים תמיכה מובנית כולל HNSW וסוגי אבדינג שונים. Elastic ו‑OpenSearch מציעות חיפוש היברידי עם Reciprocal Rank Fusion הממזג BM25, חיפוש סמנטי וחיפוש וקטורי. Azure SQL הוסיפה טיפוס נתונים וקטורי ופונקציות וקטור; Oracle השיקה את 23ai וממשיכה ל‑26ai עם AI Vector Search; MySQL HeatWave הציגה Vector Store. המשמעות בשטח: עבור חלק גדול מהמקרים, ארגון יכול להשאיר את הנתונים היכן שהם – במסד הנתונים הקיים או במנוע החיפוש הקיים – ולהוסיף וקטורים ויכולת היברידית מבלי להכניס מאגר חדש לארכיטקטורה.
- Elastic ו‑OpenSearch: חיפוש היברידי (RRF), האצת חישובי וקטור ושילוב מודלי Inference.
- Postgres/pgvector: תמיכה רחבה בעננים מנוהלים, אינדוקס HNSW ושיפורי פילטור וביצועים.
- Azure SQL: טיפוס וקטור ויכולות דומות ל‑Vector Store בתוך SQL מנוהל.
- Oracle 23ai/26ai: AI Vector Search לצד יכולות טרנזקציונליות.
- MySQL HeatWave: Vector Store כחלק מ‑Lakehouse ושילוב עם GenAI.
פיינקון במוקד: חילופי הנהלה ושאלת העצמאות
פיינקון, המזוהה יותר מכול עם הקטגוריה, עברה בספטמבר 2025 מהלך ניהולי משמעותי: המייסד עידו ליברתי עבר לתפקיד המדען הראשי, ואש אשוטוש מונה למנכ"ל עם מנדט לגדילה ולמסחור. במקביל דווח בתעשייה כי החברה בחנה אפשרויות מכירה – על רקע תחרות גוברת מצד קוד פתוח ומצד ענקי הענן שהפכו וקטורים לפיצ’ר מובנה. גם אם לפיינקון יש מותג חזק ופיצ’רים מתקדמים (כמו אינדקסים Sparse, רי‑ראנקינג ואינטגרציית Inference), הלקוח הארגוני שואל היום: האם דרוש לי מאגר נוסף או שהיכולות הקיימות ב‑Postgres/Elastic/ענן “טובות מספיק” וקלות יותר לניהול? זהו מבחן צמיחה של כל ספק עצמאי בקטגוריה שהפכה לסטנדרט פלטפורמי.
“מסדי נתוני וקטורים הם פיצ’ר – לא עסק בפני עצמו.”
אמירה שצוטטה ממנכ״ל Elastic בשנת 2025 ומשקפת את קונסולידציית השוק
מה עבד באמת: חיפוש היברידי ו‑GraphRAG
הקונצנזוס המהנדסי של 2025: וקטור לבדו לא מספיק. מערכות רציניות משלבות בין אחזור סמנטי וצפוף (Dense), אחזור דליל/מילולי (Sparse/BM25), רי‑ראנקינג ופלטרים על מטא‑דאטה. לשכבה זו מצטרף זרם גובר של GraphRAG – אחזור מועשר בגרפים, המייצג במפורש ישויות וקשרים ששכבות אמבדינג נוטות “לשטח”. על פי ניסויי שותפים ב‑AWS, גישה היברידית מסוג GraphRAG העלתה את שיעור התשובות הנכונות מכ‑50% ל‑80%+ במאגרי ניסוי בפיננסים, בריאות, תעשייה ומשפט. בנצ'מרקים אקדמיים ופתוחים מ‑2025 מראים שבמשימות רב‑שלביות או מרובות ישויות, GraphRAG או שילובים היברידיים עוקפים RAG קלאסי – במיוחד כאשר נדרשת עקיבה מדויקת אחרי קשרים, טבלאות וכללי דומיין.
- Lettria על גבי AWS: קפיצה לכ‑80% נכונות בתרחישים תעשייתיים לעומת ~50% ב‑RAG וקטורי.
- GraphRAG‑Bench (אביב‑קיץ 2025): הערכה שיטתית של רב‑קפיצות, היסקים וקונטקסט דומייני.
- הערכות OpenReview/arXiv: לכל גישה יתרונות, אך קומבינציות היברידיות מספקות ביצועים מיטביים.
- דיווחי FalkorDB: כאשר הדיוק הסכמטי קריטי, GraphRAG עשוי לשפר דיוק פי ~3.4.
המסר התפעולי: אחזור הוא מערכת, לא רכיב בודד. ארכיטקטורת “קסקדה” המשלבת Dense+Sparse+Rerank, ובמקרים רבים שכבת גרף עם טרנסלציה לשאילתות (למשל Cypher), מפחיתה הזיות, מעלה דיוק, ומקלה על הסבריות. עננים מוסיפים תמיכה ישירה: OpenSearch ו‑Elastic עם RRF; Bedrock משלב GraphRAG עם Neptune; Azure AI Search מפעיל היברידי מקביל ומדרג. לצד זאת, ספקים ייעודיים כמו פיינקון הכניסו Sparse Index, מודלי רי‑ראנקינג ואינפרנס מנוהל כדי לאגד את השרשרת מקצה לקצה. השורה התחתונה: “החדקרן” האמיתי הוא סטאק האחזור ההוליסטי – לא מאגר וקטורי מבודד.
שוק הווקטורים מתכנס ומתרכז בפתרונות פתוחים ומשולבים
היצף הסטארטאפים בתחום – Weaviate, Milvus/Zilliz, Qdrant, Chroma, Vespa, Vald, Marqo, LanceDB ואחרים – הפך ב‑2025 לשוק מקוטע שמתקשה להבדיל. קהילות פתוחות צוברות כוח (Milvus, pgvector), בעוד פלטפורמות נתונים מאוחדות (Elastic, OpenSearch, SingleStore, Oracle, Azure SQL) מסמנות שוקטורים הוא “צ’קבוקס” הכרחי אך לא בלעדי. תחזיות שוק אופטימיות נשמעות עדיין, אך המסר מהשטח הוא צנוע יותר: הבידול מגיע מיכולות נלוות – ניהול עלויות, פרטיות, כללי רלוונטיות, רי‑ראנקינג, תפעול סוכנים (agents) והסברים. מי שלא מציע סיפור שלם – ולא רק NNS מהיר – מתקשה לשמר יתרון.
- קוד פתוח זוכה לאימוץ תעשייתי (Milvus, pgvector) ומפחית נעילה לספק.
- “וקטורים כפיצ’ר” בפלטפורמות קיימות מייתר לעיתים מאגר ייעודי נוסף.
- יתרון יחסי מגיע משכבות על: גרפים, רי‑ראנקינג, ניהול איכות וסכמטיות.
הזווית הישראלית: תשתיות, מפתחים ולקוחות
מישראל ניכרת מעורבות משמעותית בשרשרת האחזור. Elastic נולדה בידי יזם ישראלי ומובילה חיפוש היברידי אצל לקוחות אנטרפרייז. Redis (לשעבר Redis Labs) הוסיפה סטי וקטורים וחיפוש היברידי לצד אינטגרציות לסוכנים. סטארטאפים מקומיים העוסקים באנליטיקה, פיננסים ובריאות מאמצים Postgres עם pgvector ו‑Elastic/OpenSearch כדי להימנע מריבוי דיסציפלינות תפעוליות. גם בצד הלקוח יש דוגמאות: חברות SaaS ישראליות מדווחות על אימוץ מנועי וקטורים ושילוב רי‑ראנקינג כדי לצמצם הזיות. לחלק מהספקים הבינלאומיים אף יש נוכחות בת״א, מה שמסייע באימוץ ובתמיכה. לכל אלה מצטרף עניין גובר ב‑GraphRAG בתחומים עתירי קשרים – רגולציה, תלות שרשרת אספקה ואבטחת ענן.
מדוע 95% לא רואים ROI – ומה כן עובד
המספרים של MIT משרטטים “תהום GenAI”: אימוץ גבוה אך טרנספורמציה נמוכה. ברוב הארגונים, פרויקטים מתמקדים בנוחות למשתמש (צ׳טבוטים כלליים) ולא בליבה תהליכית הנמדדת בתפוקה, SLA או סיכון. נוסף על כך, אחזור סמנטי טהור כושל בבקשות “פרט‑ספציפיות” (מספרי שגיאה, שמות דגמים, שדות בטבלאות), ומבלי שכבות מבקרות נוצרת אשליית דיוק. לעומת זאת, הארגונים שכן ראו ערך בנו צנרת אחזור הנדסית: היברידי כברירת מחדל, סט כללים עסקיים, גרפים כאשר נדרש היסק מרובה קשרים, ורי‑ראנקינג שמוודא שרק הקטעים המתאימים ייכנסו לקונטקסט. בנוסף, המיקוד עבר מ‑POC נוצץ למדדים תפעוליים – עלות לטוקן, דיוק מדיד, זמן תשובה וקלות ניטור.
- התמקדו בבעיות מדידות (KPI/SLA) ולא בדמויות גנריות.
- הפעילו Hybrid Search כברירת מחדל; הוסיפו רי‑ראנקינג מבוסס למידה.
- הכניסו GraphRAG כשנדרש היגיון מרובה ישויות או טבלאות.
- בנו ניהול עלויות ושקיפות – מעקב אחרי Recall@k, NDCG, לטנציה ועלות.
מבט קדימה: הנדסת אחזור, מטא‑מודלים ותזמור דינמי
הזוכה האמיתית של 2025 היא “הנדסת אחזור” – דיסציפלינה המשלבת טיוב אמבדינגים, בניית מדדים היברידיים, בניית גרפים, ורי‑ראנקינג. בהמשך, נראה מטא‑מודלים שידעו לבחור בזמן אמת אסטרטגיית אחזור לפי סוג שאילתה: מתי Dense מספיק, מתי להפעיל Graph Cypher, מתי להעלות משקל לספרס, ואיך לאזן עלות/דיוק. עבודות על Temporal GraphRAG ועל איחוד מולטימודלי (טקסט‑תמונה‑וידאו) כבר מתקדמות. במקביל, ספקיות דאטהבייס וענן צפויות להציע “סטאק אחזור מאוחד” – וקטורים+גרף+טקסט – כחלק מובנה מהפלטפורמה. במובן זה, ייתכן שעד 2027 מאגרי וקטורים ייראו לנו כתשתית בסיסית, חיונית אך שקופה, בעוד השכבות האורקסטרטיביות הן שיגדירו את היתרון התחרותי.
המסקנה לשלהי 2025 ברורה: מסדי נתוני וקטורים היו צעד חשוב – אך לא המטרה. האימוץ הנבון מחליף “אובייקט נוצץ” במערכת אחזור מרובדת, עם שילוב מדויק בין סמנטיקה, לקסיקון, גרפים וכללי רלוונטיות. למפתחים בישראל ובעולם, ההזדמנות היא בניהול ההנדסה הזו – פחות לשאול איזה מאגר לבחור, ויותר איך לתזמר שרשרת אחזור שנותנת למודלי השפה את המידע הנכון, בדיוק המתאים ובעלות הנכונה.