ארכיון הסקה - Chiportal

גוגל מרחיבה את ה־TPU מעבר לענן שלה ומגבירה את הלחץ על אנבידיה

אבי בליזובסקי — Tue, 23 Jun 2026 22:12:00 +0000

ערבויות פיננסיות של מיליארדי דולרים, שותפות ענן חדשה עם בלקסטון ודור שבבים נפרד לאימון ולהסקה: גוגל הופכת את מאיצי ה־AI שפיתחה לשימוש פנימי לפלטפורמה מסחרית רחבה יותר. עם זאת, אנבידיה עדיין נהנית מיתרון משמעותי בתוכנה, בקישוריות ובמספר הלקוחות

גוגל מגבירה את המאמצים להפוך את שבבי ה־TPU שלה מחומרה המזוהה בעיקר עם מרכזי הנתונים ושירותי הענן שלה לחלופה מסחרית רחבה יותר למערכות הבינה המלאכותית של אנבידיה. לצד פיתוח דורות חדשים של מאיצים, החברה משתמשת במאזן הכספי שלה כדי לסייע במימון מרכזי נתונים שיתבססו על חומרת גוגל.

המהלך אינו מסתכם בתחרות טכנולוגית בין שבבים. גוגל בונה סביב ה־TPU מערך הכולל מרכזי נתונים, רשתות תקשורת, תוכנה, מימון ושירותי ענן – מודל הדומה במידה מסוימת לאסטרטגיית המערכת המלאה של אנבידיה.

עם זאת, אין פירוש הדבר שגוגל כבר מוכרת שבבי TPU כמוצר מדף שניתן לרכוש ולהתקין בכל שרת. ההתרחבות מתבצעת בעיקר באמצעות שירותי מחשוב, מתקנים ייעודיים ושותפים שיציעו קיבולת TPU מחוץ למסגרת הרגילה של Google Cloud.

ערבויות המקלות על הקמת מרכזי נתונים

אחד הכלים המרכזיים באסטרטגיה הוא מתן ערבויות להתחייבויות של חברות השוכרות מרכזי נתונים. הערבות של גוגל מפחיתה את הסיכון מבחינת הבנקים והמשקיעים, ומאפשרת ליזמים לגייס חוב בתנאים נוחים יותר.

במתחם Lake Mariner שבמדינת ניו יורק חתמה מפעילת מרכזי הנתונים TeraWulf על הסכמים ארוכי טווח עם ספקית הענן Fluidstack. גוגל התחייבה לגבות חלק מהתחייבויות השכירות של Fluidstack בסכום מצטבר של כ־3.2 מיליארד דולר.

בתמורה קיבלה גוגל כתבי אופציה המאפשרים לה לרכוש מניות של TeraWulf במחיר סמלי. לפי הודעות החברה, מימושם עשוי להעניק לגוגל החזקה של כ־14% ב־TeraWulf. המתקנים מיועדים לעומסי מחשוב עתירי ביצועים ולמערכות בינה מלאכותית, ובהם עומסים של חברת Anthropic.

בפרויקט נוסף באברנתי שבטקסס מעניקה גוגל גיבוי של כ־1.3 מיליארד דולר להתחייבויות Fluidstack. המתקן אמור לספק בשלב הראשון כ־168 מגה־ואט של עומס מחשוב קריטי, במסגרת חוזה לתקופה של 25 שנה.

המשמעות היא שחלק מההון שגוגל מתחייבת להעמיד מסייע בהקמת תשתית שבה יותקנו מערכות המבוססות על השבבים, הרשתות והתוכנה שלה. כך החברה יוצרת ביקוש ל־TPU ובמקביל מפחיתה את סיכון המימון של הפרויקטים.

בלקסטון תשקיע חמישה מיליארד דולר בענן TPU חדש

בחודש מאי הודיעו גוגל ובלקסטון על הקמת חברה אמריקנית חדשה שתציע קיבולת מחשוב המבוססת על TPU. בלקסטון התחייבה להשקעה ראשונית של חמישה מיליארד דולר, והיעד הוא להפעיל במהלך 2027 תשתית בהספק של כ־500 מגה־ואט.

החברה החדשה תציע מרכזי נתונים, תפעול, רשתות ושבבי TPU במודל של מחשוב כשירות. בכך היא צפויה להתחרות בספקיות הענן המתמחות בבינה מלאכותית, ובהן CoreWeave ו־Nebius, שבנו חלק גדול מפעילותן סביב מערכות אנבידיה.

עבור גוגל, המיזם מספק ערוץ הפצה נוסף שאינו מחייב את הלקוח לצרוך את ה־TPU רק דרך סביבת Google Cloud הרגילה. מדובר בצעד משמעותי בדרך להפיכת השבבים לפלטפורמה חיצונית, אף שעדיין אין זו מכירה חופשית של השבב הפיזי ללקוחות.

גוגל מפצלת את הדור החדש לאימון ולהסקה

בכנס Google Cloud Next חשפה החברה שני מאיצים מהדור השמיני: TPU 8t המיועד בעיקר לאימון מודלים גדולים, ו־TPU 8i המותאם להסקה, למודלי חשיבה וללמידת חיזוק.

ה־TPU 8i כולל 384 מגה־בייט של זיכרון SRAM על השבב ו־288 גיגה־בייט של זיכרון ברוחב פס גבוה. גוגל טוענת כי הוא מספק שיפור של עד 80% ביחס ביצועים־למחיר לעומת דור Ironwood בעומסי הסקה בעלי השהיה נמוכה. ארכיטקטורת החיבור שלו מאפשרת לקשר 1,152 מאיצים במערך אחד.

ההפרדה בין שבב אימון לשבב הסקה משקפת את השינוי בשוק. ככל שיותר מודלים נכנסים לשימוש מסחרי, עלות הפעלתם ומענה למשתמשים נעשית חשובה לא פחות מעלות האימון הראשוני.

Anthropic משמשת לקוח עוגן

חברת Anthropic, מפתחת מודלי Claude, היא הלקוחה החיצונית הבולטת ביותר של ה־TPU. באפריל היא הרחיבה את שיתוף הפעולה עם גוגל וברודקום להספק של כמה גיגה־ואט של מערכות TPU מהדור הבא.

ההסכם מספק לגוגל לקוח עוגן בהיקף גדול, אך גם מדגיש את אחד האתגרים שלה: פעילות ה־TPU החיצונית עדיין מרוכזת במספר קטן יחסית של לקוחות גדולים.

מנכ״ל אנבידיה ג׳נסן הואנג טען כי Anthropic היא הלקוחה החיצונית המשמעותית היחידה של ה־TPU, וכי טווח השוק של אנבידיה רחב בהרבה. הוא גם הטיל ספק בטענות ליתרון עלויות של מאיצים ייעודיים לעומת המערכות של אנבידיה.

גוגל מציגה דוגמאות נוספות. Citadel Securities מסרה כי היא משתמשת במערכות Ironwood TPU לעומסי מחקר מסוימים וכי באותם עומסים השיגה שיפור של פי שניים עד פי ארבעה במהירות, לצד ירידה של כ־30% בעלויות. מדובר בנתוני לקוח הנוגעים לעומסים מוגדרים, ולא בהשוואה כללית בין כל מערכות גוגל ואנבידיה.

היתרון של אנבידיה עדיין משמעותי

אנבידיה ממשיכה לשלוט ברוב שוק מאיצי הבינה המלאכותית החיצוני. יתרונה אינו מבוסס רק על ביצועי ה־GPU, אלא גם על סביבת CUDA, ספריות תוכנה, מערכות תקשורת מהירות, מתגים, שרתים ורשת רחבה של יצרנים וספקי ענן.

לקוחות יכולים לרכוש מערכות אנבידיה ממספר גדול של יצרנים ולהריץ עליהן מגוון רחב של מודלים וכלי תוכנה. לעומת זאת, ה־TPU נותר קשור באופן הדוק יותר לתשתית ולתוכנה של גוגל.

גוגל גם אינה מנתקת את קשריה עם אנבידיה. Google Cloud ממשיכה להציע מערכות GPU של אנבידיה, ומתכננת להפעיל מופעים המבוססים על פלטפורמת Vera Rubin. שתי החברות משתפות פעולה גם בפיתוח טכנולוגיות תקשורת למרכזי נתונים.

זווית ישראלית במאמץ השבבים

בפיתוח השבבים של גוגל יש גם מרכיב ישראלי. אורי פרנק, לשעבר בכיר באינטל ישראל, משמש סגן נשיא להנדסה ומנהל את צוות Chip Implementation and Innovation של גוגל.

הצוות אחראי על הגדרה ופיתוח של שבבים לתשתיות גוגל, ובהם מאיצי למידת מכונה, שבבי תקשורת ומאיצים לעיבוד וידאו. פרנק הצטרף לגוגל ב־2021 לאחר כ־25 שנים באינטל, והיה שותף להרחבת פעילות פיתוח החומרה של החברה בישראל.

מעל פעילות התשתיות עומד כיום אמין והדאת, שמונה בסוף 2025 לטכנולוג הראשי לתשתיות בינה מלאכותית בגוגל. תחומי אחריותו כוללים שבבים מותאמים, מרכזי נתונים, רשתות, שרשרת אספקה ותפעול.

מאבק על פלטפורמת המחשוב של עידן ה־AI

היקף ההשקעה מלמד כי גוגל אינה רואה ב־TPU רק אמצעי להפחתת התלות שלה באנבידיה. החברה מבקשת ליצור עסק חיצוני שימכור כוח מחשוב, תוכנה ותשתית המבוססים על השבבים שפיתחה.

אלפאבית אף הגדילה ביוני גיוס הון מתוכנן לכ־84.75 מיליארד דולר, שנועד בין היתר לתמוך בהוצאות ההון הגדלות על מרכזי נתונים ותשתיות בינה מלאכותית.

בטווח הקרוב, ה־TPU אינו צפוי להדיח את אנבידיה ממעמדה. אולם ערבויות המימון, שותפות הענן עם בלקסטון, ההסכם רחב ההיקף עם Anthropic והרחבת מגוון השבבים מעידים כי גוגל כבר אינה מסתפקת בשימוש פנימי. היא מנסה להפוך את ה־TPU לפלטפורמה מסחרית שתתחרה על חלק גדול יותר משוק תשתיות הבינה המלאכותית.

הפוסט גוגל מרחיבה את ה־TPU מעבר לענן שלה ומגבירה את הלחץ על אנבידיה הופיע לראשונה ב-Chiportal.

AMD מסמנת את השלב הבא ב-AI: מעבר מהאימון אל ההסקה הארגונית

אבי בליזובסקי — Sat, 16 May 2026 22:23:00 +0000

מרטין הורן, ארכיטקט מערכות AI ארגוניות ב־AMD, אמר בכנס ChipEx2026 כי שוק ההסקה הופך למרכז הכובד החדש של תשתיות הבינה המלאכותית, וכי ארגונים יחפשו יותר פתרונות מקומיים, זולים ומבוזרים להפעלת מודלים

מרטין הורן, חבר סגל בכיר ב־AMD וארכיטקט מערכות AI ארגוניות, הציג בכנס ChipEx2026 את האופן שבו החברה רואה את השינוי הבא בשוק תשתיות הבינה המלאכותית. לדבריו, בעוד שהשיח הציבורי והמקצועי התמקד בשנים האחרונות בעיקר באימון מודלים גדולים, בפועל מרכז הכובד מתחיל לעבור אל ההסקה, כלומר אל הפעלת המודלים בסביבות אמיתיות, אצל משתמשים וארגונים.

הורן תיאר את AMD כחברה שפעלה במשך שנים במתכונת רזה מאוד, כמעט כמו חברת הזנק גדולה, והצליחה בשנים האחרונות להגדיל משמעותית את נוכחותה בשוק השרתים. לדבריו, אחת הסיבות המרכזיות לכך היא אימוץ מוקדם של טכנולוגיית צ'יפלטים. במקום לייצר שבב גדול אחד, AMD שילבה כמה פרוסות סיליקון קטנות יותר במארז אחד. כך ניתן היה לשפר את התפוקה בייצור, להשתמש בטכנולוגיות הייצור המתקדמות ביותר רק ברכיבי החישוב הקריטיים, ולהשיג צפיפות גבוהה יותר של ליבות במעבד.

בהמשך הציג הורן את דור המעבדים הבא של החברה, Venice, שלדבריו צפוי לכלול עד 250 ליבות במארז יחיד, או 512 יחידות עיבוד גלויות למערכת ההפעלה כאשר מופעל SMT. לדבריו, צפיפות כזו עשויה לאפשר עד כ־20 אלף ליבות CPU בארון שרתים רגיל, בלי לשנות את מערכת הקירור.

אבל עיקר הרצאתו התמקד בבינה מלאכותית. הורן הבחין בין שני דפוסי פריסה שונים: אימון והסקה. האימון דומה יותר לעולם מחשוב העל. הוא מתבצע באצוות, מנצל אשכולות גדולים של מאיצים גרפיים, ודורש רשת פנימית צפופה ומהירה. ההסקה שונה לחלוטין. היא מבוזרת, תנודתית, תלויה בעומסים משתנים, ודורשת איזון עומסים בין מופעי שירות רבים של מודלים. לכן, לדבריו, הבחירה בגודל המאיץ ובתצורת המערכת אינה תמיד ברורה מראש, ולעיתים היא דורשת התאמה עדינה בין דרישות הזיכרון, ההקשר והביצועים של כל מודל.

הורן העריך כי עד 2030 תשתיות האימון ימשיכו לגדול, אך יהוו רק כ־30% מהאספקה החדשה של תשתיות AI, בעוד שההסקה תתפוס את רוב הגידול. בניגוד לאימון, שצפוי להתרכז במרכזי נתונים גדולים, ההסקה תתפרס במקומות רבים יותר: בענן, במתקני אירוח מנוהלים, בארגונים, בקצה הרשת ובמחשבים מקומיים.

בהקשר זה הציג הורן את פורטפוליו ה־AI הרחב של AMD. בקצה אחד נמצאים פתרונות משובצים וטכנולוגיות FPGA שהגיעו עם רכישת Xilinx. בקצה אחר נמצאים מעבדי Ryzen Pro, שיכולים להריץ מודלים מקומיים במחשב אישי כאשר אין חיבור רשת או כאשר נדרש לשמור מידע רגיש בארגון. בנוסף הציג את משפחת Instinct, את כרטיס MI350P ואת מערכת Helios, המיועדת לפריסה בקנה מידה של ארון שלם.

לדבריו, יותר ארגונים צפויים להעדיף תשתיות AI בשליטה עצמית, לעיתים במתקני אירוח מנוהלים ולאו דווקא פיזית בתוך הארגון. הסיבות לכך הן עלות, שיהוי, פרטיות, מיקום הנתונים וריבונות דיגיטלית. הורן טען כי במקרים מסוימים עלות ההפעלה המקומית עשויה להיות נמוכה פי עשרה עד פי 15 מהפעלה בענן ציבורי.

בסיכום דבריו הדגיש הורן כי AMD רואה בבינה המלאכותית לא שוק אנכי נפרד, אלא שכבת תשתית שתשפיע על כל השווקים. לכן, לדבריו, אין פתרון AI אחד שמתאים לכולם. השוק ידרוש שילוב של CPU, GPU, מאיצים ייעודיים, מערכות ארגוניות, פתרונות קצה ותקני חומרה ותוכנה פתוחים.

הפוסט AMD מסמנת את השלב הבא ב-AI: מעבר מהאימון אל ההסקה הארגונית הופיע לראשונה ב-Chiportal.

מיקרוסופט משיקה את Maia 200: מאיץ הסקה ב-3 נ״מ שנועד להוזיל ולהוריד את התלות באנבידיה

אבי בליזובסקי — Tue, 27 Jan 2026 22:12:00 +0000

השבב החדש מיוצר ב-TSMC, כולל 216GB זיכרון HBM3e ומיועד להריץ מודלים בקנה מידה גדול — אבל מגיע אחרי עיכובים, כשמיקרוסופט עדיין תלויה ב-GPU של אנבידיה

מיקרוסופט הכריזה ב-26 בינואר 2026 על Maia 200, הדור השני של שבב ה-AI הפנימי שלה, שמוגדר כמאיץ ייעודי למשימות Inference (הסקה) – שלב “הרצת” המודל והפקת התשובה בפועל. לפי החברה, המטרה המרכזית היא לשפר את הכלכלה של יצירת טוקנים (token generation) בקנה מידה ענני: יותר ביצועים לכל שקל, ופחות תלות בתשתיות חיצוניות יקרות. (The Official Microsoft Blog)

בעוד שבשנים האחרונות הדיון הציבורי נסב סביב אימון מודלים (Training), אצל ספקיות הענן ההוצאה המצטברת הולכת ונוטה יותר לכיוון ההסקה: כל שאילתה בצ’אטבוט, יצירת תמונה או קוד – מתורגמת לעומס רציף על חוות שרתים. לכן השוק כולו מחפש מאיצים שמכוונים ליעילות אנרגטית ועלות תפעול נמוכה, ולא רק לשיא ביצועים תאורטי. (TechCrunch)

מה יש בתוך Maia 200

בפוסט הרשמי של מיקרוסופט נמסר כי Maia 200 מיוצר בתהליך 3 נ״מ של TSMC, כולל יותר מ-140 מיליארד טרנזיסטורים, ומביא ליבה חישובית עם תמיכה טבעית ב-FP8/FP4 (דיוקים נמוכים שנפוצים בהרצת מודלים). החברה מפרטת גם את מעטפת הביצועים: מעל 10 petaFLOPS ב-FP4 ו-מעל 5 petaFLOPS ב-FP8, בתוך מעטפת צריכת חשמל של 750W לשבב.

בצד הזיכרון, מיקרוסופט מצהירה על 216GB HBM3e עם רוחב פס של 7TB/s, לצד 272MB SRAM על־השבב – רכיב שנועד להקטין צווארי בקבוק בהאכלת המודל בנתונים.

אחד הדגשים הבולטים בהכרזה הוא התפיסה המערכתית. מיקרוסופט אומרת ש-Maia 200 בנוי לסקייל־אפ על גבי Ethernet סטנדרטי (ולא בד־פרופריייטרי), עם שכבת תעבורה ורכיב תקשורת משולב שנועדו להוריד עלות כוללת ולשמור על אמינות. החברה מציינת 2.8TB/s של רוחב פס דו־כיווני לרשת הסקייל־אפ, ותמיכה בעבודה “קולקטיבית” עד 6,144 מאיצים באשכול. בתוך “מגש” (tray) אחד, ארבעה מאיצים מחוברים זה לזה בקישורים ישירים כדי לשמור תקשורת מקומית מהירה.

איפה זה שם את מיקרוסופט מול אנבידיה, גוגל ואמזון

מיקרוסופט מציגה את Maia 200 כ”הסיליקון הראשון־צד (first-party) החזק ביותר” מבין ספקיות הענן, וטוענת ליתרון מול Trainium של אמזון ו-TPU של גוגל במדדים מסוימים (כולל FP4/FP8), אך בשלב זה מדובר בטענות יצרן שטרם קיבלו אימות ציבורי מלא בבנצ’מרקים בלתי תלויים.

ההקשר חשוב: כבר בקיץ 2025 דווח שפיתוח הדור הבא של Maia התעכב, בין היתר בגלל שינויי תכנון, מגבלות כוח אדם ותחלופה, ושדחיית הייצור ההמוני גלשה ל-2026. כלומר – Maia 200 מגיעה אחרי “חבלי לידה”, ובזמן שיריבות הענן צברו ניסיון בדורות קודמים של שבבים פנימיים.

גם כעת, השוק מעריך שמיקרוסופט לא “חותכת” את אנבידיה בטווח הקצר: תגובת המשקיעים הייתה רגועה יחסית, ובארונ’ס ציינו שמניית אנבידיה לא נחלשה בעקבות ההכרזה, בין היתר משום שההנחה היא שהוצאות הענק על תשתיות AI יימשכו – גם אם חלק מהעומס יעבור בהדרגה לשבבים פנימיים.

פריסה, שימושים וזמינות

מיקרוסופט אומרת שהשבב כבר נפרס באזור הדאטה־סנטרים US Central ליד דה־מויין, איווה, ושאזור US West 3 ליד פיניקס “הבא בתור”, עם הרחבה בהמשך לאזורים נוספים. עוד נמסר כי Maia 200 מיועד לשרת מספר מודלים ושירותים – כולל Microsoft Foundry ו-Microsoft 365 Copilot – ואף יפעיל “מודלים מהדור האחרון GPT-5.2” של OpenAI על התשתית של החברה. במקביל, מיקרוסופט מציגה תצוגה מוקדמת (preview) ל-Maia SDK עם כלי פיתוח ואופטימיזציה (כולל אינטגרציה ל-PyTorch ותמיכה ב-Triton).

הפוסט מיקרוסופט משיקה את Maia 200: מאיץ הסקה ב-3 נ״מ שנועד להוזיל ולהוריד את התלות באנבידיה הופיע לראשונה ב-Chiportal.