DeepSeek - המהפכה הסינית שהכתה את השוק האמריקאי

התחלה סוערת

בשבוע האחרון, עולם הטכנולוגיה והבורסה נתקלו במה שניתן לכנות "רעידת אדמה" עם הופעתו של DeepSeek, סטארט-אפ סיני בתחום הבינה המלאכותית (AI), שהצליח לטלטל את שווקי המניות בארצות הברית ובעולם. DeepSeek, שהוקמה ב-2023 בשנגחאי על ידי ליאנג ונפנג, מנכ"ל קרן הגידור High-Flyer, הפכה במהרה לשם דבר לאחר שהשיקה את מודל ה-AI שלה, DeepSeek-R1, שמתחרה ישירות בגדולי התעשייה האמריקאית כמו OpenAI, Google ו-Meta.

מהפכת ה-DeepSeek

מודל ה DeepSeek-R1, שנחשף ב-20 בינואר 2025, להפתעתו של השוק, הציג ביצועים תואמים ואף עולים על אלו של מודלים מובילים כמו GPT-4 של OpenAI, וכל זאת בעלות מזערית של כ-5.6 מיליון דולר בלבד להכשרת המודל. השוואה זו להשקעות עצומות בסדרי גודל של מיליארדי דולרים על ידי חברות אמריקאיות הדהימה את המשקיעים. המודל החדש, המציג יכולות חישוב חסכוניות ופתרונות יצירתיים לבעיות חישוביות, שבר את התפיסה שהשקעה אדירה בחומרה היא דרישה בלתי נמנעת ליצירת AI מתקדם.

אימון המודל בצורה זולה

נראה כ DeepSeek השתמשה בשיטות חדשניות ובאופטימיזציה של תהליכי האימון כדי להפחית את עלויות ההכשרה של מודל ה-AI שלהם. כמה מהטכניקות שידועות עליהן כוללות:

  • שימוש ב-Nvidia H800 GPUs: החברה דיווחה כי השתמשה ב-2,048 יחידות של Nvidia H800 GPUs לצורך אימון ה-DeepSeek-V3, שהוא הבסיס ל-DeepSeek-R1. ה-H800 הוא גרסה מוגבלת של ה-H100, שנועדה לשוק הסיני בהתאם להגבלות הייצוא האמריקאיות. העלות הדיווחית עמדה על כ-5.6 מיליון דולר בלבד, מה שמצביע על יעילות גבוהה בשימוש במשאבים.

  • שיטות אופטימיזציה: DeepSeek מימשה טכניקות כמו "Test Time Scaling" ושימוש ב-"Reinforcement Learning" כדי לשפר את יעילות החישוב. הם גם שיפרו את מנגנון האיזון העומסים (Load Balancing) ואת הניהול של זיכרון לצורך אימון המודלים, מה שהפחית את הצורך בכמות עצומה של חומרה.

  • מודלים קטנים יותר: DeepSeek-R1 מורכב מ-671 מיליארד פרמטרים אבל משתמש רק ב-37 מיליארד פרמטרים פעילים בכל פעולת חישוב, מה שמאפשר לו להיות יעיל יותר בצריכת משאבים מאשר מודלים גדולים יותר.

נושא אמינות הנתונים

  • אמינות: יש ספקות לגבי האמינות של הנתונים ששחררה DeepSeek, כיוון שהם לא חשפו את כל הפרטים סביב העלויות והמשאבים שנדרשו. אנליסטים מהבנקים הגדולים כמו Bernstein ו-Citi הביעו חשד שהעלויות האמיתיות עשויות להיות גבוהות יותר, כולל הוצאות שלא נכללו בדיווח הראשוני כמו עלויות מחקר וניסויים.

  • שבבים של Nvidia: יש ספקולציות שמאחורי הקלעים DeepSeek עשויה להשתמש במספר גדול יותר של שבבים Nvidia מהדורות קודמים או אפילו בגרסאות מוגבלות של שבבים חדשים יותר שנרכשו לפני או במסגרת ההגבלות. עם זאת, יש להדגיש כי DeepSeek לא חשפה פרטים מלאים על חומרת האימון שלה, מה שמותיר פתח לפרשנויות שונות.

השפעה על השוק

נבידיה (Nvidia) - כבר ביום שני הראשון לאחר ההשקה, מניות נבידיה, שהובילה את המרוץ לפיתוח שבבים ל-AI, צנחו בכמעט 17%, ומחקו מהשווי השוקי שלה כמעט 600 מיליארד דולר. היום 29.01 החזירה המניה כ 6 אחוז בחזרה.

מיקרון (Micron) - גם חברת מיקרון, יצרנית זיכרונות, חשה בהשלכות. מניותיה ירדו בכ-11%, מה שמעורר חששות לגבי הביקוש העתידי לזיכרונות בעלי ביצועים גבוהים לשימוש ב-AI.

טייוואן סמיקונדקטור TSMC - למרות ש-TSMC, היצרנית הגדולה בעולם של שבבים מתקדמים, הראתה צמיחה בביקוש לשבבי AI, ההצלחה של DeepSeek עוררה דאגות לגבי היעילות והצורך בשבבים מתקדמים ברמה כזו ומניותיה ירדו בכ- -13.3%

השלכות לרצף האספקה

ההתפתחות הזו של DeepSeek מעמידה תחת סימן שאלה את כל שרשרת האספקה של רכיבים ל-AI, מיצרניות שבבים, דרך חברות התוכנה ועד לחברות האנרגיה שמספקות את הכוח הדרוש למרכזי הנתונים. היכולת של DeepSeek ליצור מודל AI מתקדם במשאבים מוגבלים יותר מצביעה על אפשרות להתייעלות בתעשייה, מה שעלול להקטין את הביקוש לרכיבים היקרים יותר כמו שבבי Nvidia או זיכרונות מיקרון.

המשמעות לטווח הרחוק

השוק עדיין מנסה להעריך את ההשפעה המלאה של DeepSeek. מצד אחד, זהו אתגור לדומיננטיות האמריקאית בתחום האינטליגנציה המלאכותית, ומצד שני, זהו זרז לחדשנות ולמציאת שיטות חסכוניות יותר. מומחים מצביעים על כך שבזמן שאנו רואים ירידות חדות במניות, זה גם עשוי לפתוח דלת לשחקנים חדשים ולאפשרויות חדשות בשוק האירופי והאסייתי.

בפוסטים שנמצאו ב-X, נשיא ארצות הברית דונלד טראמפ כבר התבטא בנוגע ל-DeepSeek, תוך שהוא מדגיש את הצורך באימוץ חדשנות בתעשייה האמריקאית כדי להתחרות עם התפתחויות בינלאומיות. הוא הצהיר שהשקת DeepSeek צריכה לשמש "קריאת השכמה" לתעשיות האמריקאיות להתרכז בתחרות כדי לנצח.

מסקנה

האם ל-DeepSeek יש כרטיסי Nvidia בסופו של דבר? קשה לקבוע בוודאות, אך סביר להניח שהם ניצלו את המשאבים שהיו זמינים להם במהלך האימון, כולל שימוש מסוים בכרטיסי Nvidia. עם זאת, ההצלחה שלהם מוכיחה כי ניתן לאמן מודלים מתקדמים גם תוך שימוש במשאבים מצומצמים, בניגוד לגישה המסורתית של השקעה עצומה בתשתיות חומרה.

השוק ממשיך להתגבש, וההתפתחות של DeepSeek מצביעה על כך שתחום ה-AI עדיין נמצא בשלבים מוקדמים. חברות אשר תלויות בטכנולוגיות AI יצטרכו לשפר את היעילות שלהן כדי להגיע לרווחיות, דבר שעשוי להפחית את הביקוש לשבבים ולפגוע ברווחי חברות בשרשרת האספקה החומרתית. עם זאת, מדובר בתהליך ארוך שייקח זמן להתממש, ולכן בטווח הקצר אנו צפויים לראות המשך מגמה חיובית, כפי שמשתקף בעלייה ההדרגתית במחיר מניית Nvidia. המקרה של DeepSeek מוכיח שפריצות דרך טכנולוגיות יכולות להגיע מכל מקום ולשנות את פני השוק במהירות ובעוצמה בלתי צפויה.