קפיצת המדרגה של הבינה המלאכותית: קלוד מיתוס

המודל החדש של קלוד מציג יכולות וביצועים פורצי דרך. אז למה הגישה שלו הוגבלה ל־50 משתמשים בלבד?

ג'ק קלארק, ממייסדי Anthropic, בהרצאה באוקספורד. מעריך תוך שנה ה־AI תגיע לתגלית שתזזכה בפרס נובל.

חדשנות כמעט אף פעם אינה תהליך ליניארי. Claude Mythos הוא השקת ה-AI החשובה ביותר מאז ChatGPT 3.5 ומסמנת את המעבר מבינה מלאכותית משוחחת למערכות מומחות אוטונומיות המסוגלות להסקה וביצוע מתמשכים ומרובי שלבים. Mythos הציתה מחדש את הטרייד על ה-AI, אך האם פריצת הדרך הזו עלולה גם להיות זו שתסיים אותו?

עד ש-Mythos נחשף ב-7 באפריל, הטרייד על ה-AI התקשה להתרומם, והוכבד ע"י החששות הגוברים מהשיפור השולי הפוחת במודלי שפה גדולים חדשים ומקצב האימוץ האיטי במגזר העסקי. ואכן, נכון ל-7 באפריל, הנאסד"ק היה בירידה מתחילת השנה. מאז השקת Mythos לעומת זאת, הנאסד"ק רשם זינוק חד. למרות שרק מעטים בכלל ראו את המודל, המשקיעים רותקו מהדיווחים על יכולותיו. Mythos צפוי להצטיין בתכנון מרובה שלבים, שמירה על מסלולי הסקה ארוכים, ביצוע אוטונומי והתאמה דינמית של אסטרטגיות. חוקרים מצאו ששיעור ההצלחה של מערכות AI בהשלמת משימה נוטה להיות במתאם הפוך למשך הזמן שיידרש לבני אדם להשלים את אותה משימה. במילים אחרות, ככל שמשימה ארוכה יותר ודורשת יותר מאמץ קוגניטיבי מבני אדם, כך גדל הסיכוי שמערכות בינה מלאכותית ייכשלו לפני שיצליחו להשלים אותה.

עפ"י הערכות של מכון METR להערכת המודלים וחקר האיומים של בינה מלאכותית, Claude Mythos הוא המודל הראשון שהשיג שיעור הצלחה ממוצע של 50% במשימה אוטונומית שדורשת בערך 16 שעות עבודת אדם. Mythos השיג גם ציון של 93.9% ב-SWE-Bench, אחד ממדדי ההשוואה המובילים בתעשייה ליכולות הנדסת תוכנה בעולם האמיתי, הכוללות משימות הסקה מורכבות ומרובות שלבים וקבצים. Mythos הוכיח לא רק שמודלי שפה גדולים עוד לא הגיעו לתקרה שלהם, אלא גם חיזק את האמונה שבינה מלאכותית כללית (AGI) עשויה להגיע מוקדם בהרבה מהצפוי. התוצאה הייתה הצתה מחדש של הראלי ב-AI.

בהנחה ש-Mythos עוצמתי כפי שמציגים אותו, האם הוא באמת שורי עבור טרייד ה-AI כפי שהשווקים מניחים כעת? ומה אם הוא טוב מדי? מהפכת ה-AI הולידה עידן חדש של מתקפות סייבר. ה-AI הופך מתקפות סייבר למהירות יותר, זולות יותר ומסוכנות יותר. Hoxhunt, פלטפורמה להכשרת סייבר ולניהול סיכונים אנושי, דיווחה בדצמבר אשתקד על זינוק של פי 14, כלומר 1,400%, במתקפות פישינג שנוצרו ב-AI, שעקפו מסנני דוא"ל ונחתו בדואר הנכנס. ומגמה זו נמשכה גם ב-2026. על פי SentinelOne, חברת אבטחת סייבר, 80% מהארגונים חוו לפחות פרצת אבטחת ענן אחת בשנה החולפת, ומתקפות כופרה פגעו ב-78% מהחברות במהלך השנה האחרונה. סקר תעשייה גרמני שנערך לאחרונה הראה שמתקפות סייבר, המבוצעות יותר ויותר על ידי סוכנויות מודיעין זרות ולא רק על ידי עבריינים, עלו לכלכלה הגרמנית כמעט 300 מיליארד אירו בשנה החולפת. על פי Verizon, ניצול חולשות תוכנה מהווה כעת 31% מפרצות הסייבר. וכל זה היה עוד לפני ש-Mythos בכלל הושק.

אף על פי ש-Mythos פותח כמודל שפה למטרות כלליות, יש לו יכולות סייבר חסרות תקדים. הוא כל כך טוב בזיהוי חולשות ברשתות, ש-Anthropic שחררה את Mythos עד כה רק למספר מצומצם מאוד של משתמשים, מתוך חשש שבידיים הלא נכונות, Mythos עלול להפוך לנשק סייבר בקנה מידה חסר תקדים. מכון אבטחת ה-AI של בריטניה מצא ש-Mythos מייצג קפיצת מדרגה ביחס למודלים מובילים קודמים, בסביבה בה יכולות הסייבר כבר משתפרות במהירות. בעוד שרק לפני שנתיים, המודלים הטובים ביותר שהיו זמינים בקושי יכלו להשלים משימות סייבר ברמת מתחילים, המכון מצא ש-Mythos, במידה וניתנת לו גישה, יכול לבצע מתקפות מרובות שלבים על רשתות פגיעות ולגלות ולנצל חולשות באופן אוטונומי, משימות שהיו דורשות מאנשי מקצוע אנושיים ימים של עבודה. חברת אבטחת הסייבר Paloalto, מצאה ש-Mythos יעיל במיוחד בזיהוי חולשות בקוד. בתוך פחות משלושה שבועות, הוא ביצע עבודה השקולה לשנה שלמה של מאמצי בדיקות חדירה.

מה שהופך את Mythos למסוכן באמת הוא יכולתו לשרשר כמה חולשות יחדיו ליצירת נתיבי תקיפה מבצעיים, וכל זה באופן אוטונומי.

יכולות הסייבר של Mythos מעלות חששות לביטחון הלאומי בבירות ברחבי העולם. ממשלות חוששות שמערכות כמו Mythos עלולות להאיץ דרמטית את ההיקף והתחכום של מתקפות סייבר. מוקדם יותר החודש, הוול סטריט ג'ורנל דיווח שטראמפ שוקל צו נשיאותי שיכפיף מודלי AI מובילים לבחינה ביטחונית ממשלתית לפני השקתם. לדברי אנשים שרואיינו על ידי העיתון, המטרה היא להגן על צרכנים ועסקים מפני מתקפות סייבר ושיבושים אחרים שעלולים לנבוע מהשקה מוקדמת מדי של מודלים כאלה. אבל ברור שאת זה קל יותר לומר מאשר לעשות.

הנקודה המרכזית היא ש-Mythos הוא מודל שפה למטרות כלליות. יכולתו לזהות חולשות סייבר אינה יכולת נפרדת, אלא הרחבה של חוזקותיו הרחבות יותר בהסקה ובביצוע משימות מורכבות ומרובות שלבים. במילים אחרות, קשה לראות איך אפשר להפוך את Mythos לבטוח יותר מבלי להגביל את אותן יכולות שהופכות אותו לחזק כל כך. לפי הדיווחים הגישה ל-Mythos הוגבלה ל-50 משתמשים בלבד. על פי דיווחים שונים, הבית הלבן דחה עד כה את בקשת Anthropic להרחיב את הגישה ל-120 משתמשים. ההיסוס הזה מובן. אפילו הרחבה קטנה של הגישה עלולה לעורר תגובת נגד פוליטית משמעותית.

טראמפ כבר נתפס כמי שמזוהה מדי עם תאגידים גדולים ועם אינטרסים בענף הטכנולוגיה. הגבלת הגישה ל-Mythos לתאגידים גדולים ולחברות טכנולוגיה גדולות תיתפס בעיני רבים כביצור נוסף של יתרונותיהם על פני עסקים קטנים ובינוניים. מבחינה פוליטית, זה לא יתיישב בקלות עם המסר האנטי-אליטיסטי שעומד בבסיס תנועת MAGA. מצד שני, הרחבה מהירה יותר של הגישה ל-Mythos עלולה להוביל לזינוק במתקפות סייבר, ולהותיר את טראמפ חשוף להאשמות שהוא שחרר את הטכנולוגיה לפני שנקבעו מנגנוני הגנה מספקים. גרוע מכך עבור טראמפ יהיה אם גישה רחבה יותר ל-Mythos תאיץ את יכולתן של מדינות עויינות להפוך את הטכנולוגיה לנשק נגד ארה"ב. הניחוש שלי הוא שהגישה ל-Mythos ולמודלי AI מובילים אחרים עם יכולות דומות תישאר מוגבלת מאוד בעתיד הנראה לעין.

אם אני צודק, המשקיעים צריכים לשאול כיצד יהיה ניתן בסופו של דבר להפיק הכנסות מהמודלים האלה והאם בכלל ניתן לעשות זאת מבלי ליצור סיכונים פוליטיים וביטחוניים בלתי מתקבלים על הדעת. שווי השוק של הנאסד"ק עלה ב-5 טריליון דולר מאז השקת Mythos. אני לא יכול שלא לחשוב שהשוק אולי הקדים את המאוחר. אם מוקדם יותר השנה המשקיעים חששו שיכולות ה-AI הגיעו לתקרה, הסיכון כעת הוא שיכולות ההנגשה הן שיגיעו לתקרה במקום זאת. תאורטית, אמור להיות הבדל קטן מאוד בין השניים עבור תמחור המניות, אבל מבחינת השווקים, יכולות שלא ניתן לפרוס בהיקף נרחב ולהפיק מהן הכנסות עשויות שלא להיות שונות בהרבה מיכולות שאינן קיימות.

ג'ק קלארק, המייסד השותף של Anthropic, חזה באירוע באוניברסיטת אוקספורד השבוע שבתוך 12 חודשים מערכות ה-AI יעבדו עם בני האדם כדי להגיע לתגלית שתזכה בפרס נובל. הוא גם חזה שעד סוף 2028, כלומר בעוד שנתיים, מערכות AI יוכלו לתכנן את היורשים שלהן בעצמן, כלומר, ש- Mythos 1.0 יתכנן את Mythos 2.0 או אפילו את Mythos 9.0. פירוש הדבר הוא שהבינה המלאכותית עשויה להתעצם אפילו מהר יותר. הוא גם אמר שיש תרחישים סבירים שבהם לטכנולוגיה יש "סיכוי לא אפסי להרוג את כל האנשים על פני כדור הארץ".

אני לא יודע מה איתכם, אבל זה לא נשמע שורי במיוחד עבור טרייד ה-AI. קלארק הודה שעדיף היה אם בני אדם היו יכולים להאט את פיתוח הטכנולוגיה, כדי לתת לנו כמין יותר זמן להתמודד עם ההשלכות של הכוחות שלה. אבל קלארק סומך על "יריבויות מסחריות וגיאופוליטיות" ש"יטביעו את ההיבט הקיומי הרחב יותר עבור המין האנושי בטכנולוגיות שנבנות". מה שהוא באמת אומר הוא שארה"ב רואה בהתקדמות המתמשכת של ה-AI צורך גיאופוליטי בתחרות הזו מול סין. זו הנחה חזקה, וכנראה אחד הכוחות המרכזיים שמניעים כעת את טרייד ה-AI. אבל קלארק ודאי נשמע בטוח יותר מכפי שהוא באמת. אחרת, למה Anthropic ו-OpenAI ממהרות כל כך, לפי הדיווחים, לקדם את הנפקתן? אני משער שהן פשוט מנסות להקדים את גל הרגולציה. מודלי AI מובילים נתפסים יותר ויותר כתשתית אסטרטגית. האם פירוש הדבר שחברות AI נועדו להפוך לחברות תשתית מפוקחות? בעיניי, זהו ללא ספק הסיכון הגדול ביותר עבור הטרייד על ה-AI.

מאמרים נוספים

שר הביטחון: ישראל יכולה לטפל באיראן לבדה אם תצטרך

110 שנה לקרבות הגדולים ששינו את ההיסטוריה

היועמ"שית ממשיכה לעכב את מינויי הממשלה ולפגוע בכולנו

כתיבת תגובה לבטל