מחקר: מפתחים רואים ב־AI slop את טרגדיית נחלת הכלל של התוכנה
מחקר חדש מצא שמפתחים רואים ב־AI slop לא רק בעיית איכות, אלא עומס מצטבר על בודקים, מתחזקים, פרויקטי קוד פתוח וצוותי אבטחה. לא מדובר רק בקוד חלש, אלא גם ב־Pull Requests, תיעוד ודיווחי באגים שנראים סבירים אך מעבירים את עבודת הסינון והבדיקה לאחרים.
מחקר: יכולות הסייבר ההתקפיות של מודלי AI מוכפלות בערך כל חצי שנה
מחקר חדש ופרסומים משלימים מצביעים על קפיצה מהירה ביכולת של מודלי AI לאתר חולשות, לבנות מהלכי תקיפה רב-שלביים ולהשלים משימות שבעבר דרשו שעות של עבודה אנושית. הכתבה מסבירה מה בדיוק נמדד, איפה המודלים עדיין נופלים, ולמה הקצב הזה צריך להדאיג ארגונים, רגולטורים ותעשיית הסייבר.
Google Research: מדדי AI ובנצ'מרקים מפספסים אי־הסכמה אנושית
מחקר של Google Research טוען כי מדדי AI ובנצ'מרקים מקובלים מתעלמים מכך שבני אדם לא תמיד מסכימים זה עם זה ולכן עלולים להטות את הערכת המודלים. לפי החוקרים, שלושה עד חמישה מדרגים לכל דוגמה לרוב אינם מספיקים, והאופן שבו מחלקים את תקציב האנוטציה חשוב לא פחות מהיקפו.
Similarweb: תעבורת צ'אטבוטי AI צומחת פי 7 מהרשתות החברתיות אך עדיין קטנה בהרבה
ניתוח של Similarweb, שעליו דיווח The Decoder, מראה כי התעבורה לשירותי AI צומחת בקצב שנתי מהיר פי שבע מזה של הרשתות החברתיות. למרות הזינוק, הפלטפורמות החברתיות עדיין גדולות בערך פי ארבעה, והנתונים מצביעים גם על דפוסי שימוש שונים מאוד ממחשב שולחני מול מובייל ועד תנועה ישירה מול גילוי אורגני.
Alibaba חושפת את GSPO של Qwen: אלגוריתם למידת חיזוק חדש למודלי reasoning
Alibaba וקבוצת Qwen הציגו את GSPO, אלגוריתם למידת חיזוק חדש שנועד לשפר אימון של מודלי reasoning. לפי החומרים הטכניים, הוא מנסה לפתור בעיה מרכזית בתחום: חלוקת קרדיט לא מדויקת בין שלבי החשיבה. המטרה היא לייצב את האימון, לייעל את תהליך ההיסק ולשפר ביצועים.
NASA פתרה תקלה ב-Outlook על סיפון Artemis II ומה זה מלמד על מחשוב בחלל
NASA פתרה מרחוק תקלה ב-Microsoft Outlook במחשב האישי של מפקד Artemis II. מעבר לאנקדוטה, האירוע מדגיש עד כמה אמינות תוכנה, קישוריות ומחשוב בחלל הם חלק קריטי ממשימות לירח.
Xreal מול Viture: משקפי AR לגיימינג משתפרים, אבל עדיין לא בשלים
השוואה בין Xreal ל-Viture מראה שמשקפי AR לגיימינג כבר אינם גימיק אבל עדיין לא מציעים חבילה שלמה. התצוגה, עיגון המסך והניידות השתפרו, אך נוחות, אודיו, תאימות וערך למחיר עדיין נשארים נקודות חולשה.
סקירת Anker Nebula P1: מקרן נייד עם סאונד מצוין, אבל בלי סוללה
Anker Nebula P1 הוא מקרן נייד 1080p עם Google TV וזוג רמקולים נשלפים, שמציב את הסאונד במרכז החוויה. לצד זאת, הוא מציע בהירות בינונית וללא סוללה פנימית, ולכן מתאים לקהל ממוקד יותר מאשר לכל משתמש.
מבצע ב-Target: 30 דולר הנחה על שני משחקי Nintendo Switch ו-Switch 2
Target השיקה מבצע ממוקד לחלק מחברי Target Circle: 30 דולר הנחה ברכישת שני משחקים נבחרים ל-Nintendo Switch ול-Switch 2. מעבר להוזלה הנדירה יחסית על משחקי Nintendo, המבצע גם מדגיש כיצד Switch 2 משנה את כללי המשחק סביב עותקים פיזיים, הורדות ואחסון.
Sofa מתרחבת: ממעקב מדיה לכלי לניהול זמן פנאי במכשירי Apple
Sofa, שהחלה כאפליקציה למעקב אחר סדרות, סרטים, ספרים ופודקאסטים, מציגה את עצמה כיום ככלי רחב יותר לניהול זמן פנאי במכשירי Apple. הכתבה בוחנת מה השתנה במוצר, אילו יכולות מבדלות אותו מאפליקציות מעקב מדיה ייעודיות, ומה זה אומר למשתמשים שרוצים לרכז במקום אחד תכנים, המלצות ופעילויות.










