ארכיון הסקה - Chiportal https://chiportal.co.il/tag/הסקה/ The Largest tech news in Israel – Chiportal, semiconductor, artificial intelligence, Quantum computing, Automotive, microelectronics, mil tech , green technologies, Israeli high tech, IOT, 5G Fri, 15 May 2026 14:36:55 +0000 he-IL hourly 1 https://wordpress.org/?v=6.8.5 https://chiportal.co.il/wp-content/uploads/2019/12/cropped-chiportal-fav-1-32x32.png ארכיון הסקה - Chiportal https://chiportal.co.il/tag/הסקה/ 32 32 AMD מסמנת את השלב הבא ב-AI: מעבר מהאימון אל ההסקה הארגונית https://chiportal.co.il/amd-enterprise-ai-inference-chipex2026/ https://chiportal.co.il/amd-enterprise-ai-inference-chipex2026/#respond Sat, 16 May 2026 22:23:00 +0000 https://chiportal.co.il/?p=50103 יותר

הפוסט AMD מסמנת את השלב הבא ב-AI: מעבר מהאימון אל ההסקה הארגונית הופיע לראשונה ב-Chiportal.

]]>
מרטין הורן, ארכיטקט מערכות AI ארגוניות ב־AMD, אמר בכנס ChipEx2026 כי שוק ההסקה הופך למרכז הכובד החדש של תשתיות הבינה המלאכותית, וכי ארגונים יחפשו יותר פתרונות מקומיים, זולים ומבוזרים להפעלת מודלים


מרטין הורן, חבר סגל בכיר ב־AMD וארכיטקט מערכות AI ארגוניות, הציג בכנס ChipEx2026 את האופן שבו החברה רואה את השינוי הבא בשוק תשתיות הבינה המלאכותית. לדבריו, בעוד שהשיח הציבורי והמקצועי התמקד בשנים האחרונות בעיקר באימון מודלים גדולים, בפועל מרכז הכובד מתחיל לעבור אל ההסקה, כלומר אל הפעלת המודלים בסביבות אמיתיות, אצל משתמשים וארגונים.

הורן תיאר את AMD כחברה שפעלה במשך שנים במתכונת רזה מאוד, כמעט כמו חברת הזנק גדולה, והצליחה בשנים האחרונות להגדיל משמעותית את נוכחותה בשוק השרתים. לדבריו, אחת הסיבות המרכזיות לכך היא אימוץ מוקדם של טכנולוגיית צ'יפלטים. במקום לייצר שבב גדול אחד, AMD שילבה כמה פרוסות סיליקון קטנות יותר במארז אחד. כך ניתן היה לשפר את התפוקה בייצור, להשתמש בטכנולוגיות הייצור המתקדמות ביותר רק ברכיבי החישוב הקריטיים, ולהשיג צפיפות גבוהה יותר של ליבות במעבד.

בהמשך הציג הורן את דור המעבדים הבא של החברה, Venice, שלדבריו צפוי לכלול עד 250 ליבות במארז יחיד, או 512 יחידות עיבוד גלויות למערכת ההפעלה כאשר מופעל SMT. לדבריו, צפיפות כזו עשויה לאפשר עד כ־20 אלף ליבות CPU בארון שרתים רגיל, בלי לשנות את מערכת הקירור.

אבל עיקר הרצאתו התמקד בבינה מלאכותית. הורן הבחין בין שני דפוסי פריסה שונים: אימון והסקה. האימון דומה יותר לעולם מחשוב העל. הוא מתבצע באצוות, מנצל אשכולות גדולים של מאיצים גרפיים, ודורש רשת פנימית צפופה ומהירה. ההסקה שונה לחלוטין. היא מבוזרת, תנודתית, תלויה בעומסים משתנים, ודורשת איזון עומסים בין מופעי שירות רבים של מודלים. לכן, לדבריו, הבחירה בגודל המאיץ ובתצורת המערכת אינה תמיד ברורה מראש, ולעיתים היא דורשת התאמה עדינה בין דרישות הזיכרון, ההקשר והביצועים של כל מודל.

הורן העריך כי עד 2030 תשתיות האימון ימשיכו לגדול, אך יהוו רק כ־30% מהאספקה החדשה של תשתיות AI, בעוד שההסקה תתפוס את רוב הגידול. בניגוד לאימון, שצפוי להתרכז במרכזי נתונים גדולים, ההסקה תתפרס במקומות רבים יותר: בענן, במתקני אירוח מנוהלים, בארגונים, בקצה הרשת ובמחשבים מקומיים.

בהקשר זה הציג הורן את פורטפוליו ה־AI הרחב של AMD. בקצה אחד נמצאים פתרונות משובצים וטכנולוגיות FPGA שהגיעו עם רכישת Xilinx. בקצה אחר נמצאים מעבדי Ryzen Pro, שיכולים להריץ מודלים מקומיים במחשב אישי כאשר אין חיבור רשת או כאשר נדרש לשמור מידע רגיש בארגון. בנוסף הציג את משפחת Instinct, את כרטיס MI350P ואת מערכת Helios, המיועדת לפריסה בקנה מידה של ארון שלם.

לדבריו, יותר ארגונים צפויים להעדיף תשתיות AI בשליטה עצמית, לעיתים במתקני אירוח מנוהלים ולאו דווקא פיזית בתוך הארגון. הסיבות לכך הן עלות, שיהוי, פרטיות, מיקום הנתונים וריבונות דיגיטלית. הורן טען כי במקרים מסוימים עלות ההפעלה המקומית עשויה להיות נמוכה פי עשרה עד פי 15 מהפעלה בענן ציבורי.

בסיכום דבריו הדגיש הורן כי AMD רואה בבינה המלאכותית לא שוק אנכי נפרד, אלא שכבת תשתית שתשפיע על כל השווקים. לכן, לדבריו, אין פתרון AI אחד שמתאים לכולם. השוק ידרוש שילוב של CPU, GPU, מאיצים ייעודיים, מערכות ארגוניות, פתרונות קצה ותקני חומרה ותוכנה פתוחים.

הפוסט AMD מסמנת את השלב הבא ב-AI: מעבר מהאימון אל ההסקה הארגונית הופיע לראשונה ב-Chiportal.

]]>
https://chiportal.co.il/amd-enterprise-ai-inference-chipex2026/feed/ 0
מיקרוסופט משיקה את Maia 200: מאיץ הסקה ב-3 נ״מ שנועד להוזיל ולהוריד את התלות באנבידיה https://chiportal.co.il/%d7%9e%d7%99%d7%a7%d7%a8%d7%95%d7%a1%d7%95%d7%a4%d7%98-%d7%9e%d7%a9%d7%99%d7%a7%d7%94-%d7%90%d7%aa-maia-200-%d7%9e%d7%90%d7%99%d7%a5-%d7%94%d7%a1%d7%a7%d7%94-%d7%91-3-%d7%a0%d7%b4%d7%9e-%d7%a9%d7%a0/ https://chiportal.co.il/%d7%9e%d7%99%d7%a7%d7%a8%d7%95%d7%a1%d7%95%d7%a4%d7%98-%d7%9e%d7%a9%d7%99%d7%a7%d7%94-%d7%90%d7%aa-maia-200-%d7%9e%d7%90%d7%99%d7%a5-%d7%94%d7%a1%d7%a7%d7%94-%d7%91-3-%d7%a0%d7%b4%d7%9e-%d7%a9%d7%a0/#respond Tue, 27 Jan 2026 22:12:00 +0000 https://chiportal.co.il/?p=49392 השבב החדש מיוצר ב-TSMC, כולל 216GB זיכרון HBM3e ומיועד להריץ מודלים בקנה מידה גדול — אבל מגיע אחרי עיכובים, כשמיקרוסופט עדיין תלויה ב-GPU של אנבידיה

הפוסט מיקרוסופט משיקה את Maia 200: מאיץ הסקה ב-3 נ״מ שנועד להוזיל ולהוריד את התלות באנבידיה הופיע לראשונה ב-Chiportal.

]]>

השבב החדש מיוצר ב-TSMC, כולל 216GB זיכרון HBM3e ומיועד להריץ מודלים בקנה מידה גדול — אבל מגיע אחרי עיכובים, כשמיקרוסופט עדיין תלויה ב-GPU של אנבידיה

מיקרוסופט הכריזה ב-26 בינואר 2026 על Maia 200, הדור השני של שבב ה-AI הפנימי שלה, שמוגדר כמאיץ ייעודי למשימות Inference (הסקה) – שלב “הרצת” המודל והפקת התשובה בפועל. לפי החברה, המטרה המרכזית היא לשפר את הכלכלה של יצירת טוקנים (token generation) בקנה מידה ענני: יותר ביצועים לכל שקל, ופחות תלות בתשתיות חיצוניות יקרות. (The Official Microsoft Blog)

בעוד שבשנים האחרונות הדיון הציבורי נסב סביב אימון מודלים (Training), אצל ספקיות הענן ההוצאה המצטברת הולכת ונוטה יותר לכיוון ההסקה: כל שאילתה בצ’אטבוט, יצירת תמונה או קוד – מתורגמת לעומס רציף על חוות שרתים. לכן השוק כולו מחפש מאיצים שמכוונים ליעילות אנרגטית ועלות תפעול נמוכה, ולא רק לשיא ביצועים תאורטי. (TechCrunch)

מה יש בתוך Maia 200

בפוסט הרשמי של מיקרוסופט נמסר כי Maia 200 מיוצר בתהליך 3 נ״מ של TSMC, כולל יותר מ-140 מיליארד טרנזיסטורים, ומביא ליבה חישובית עם תמיכה טבעית ב-FP8/FP4 (דיוקים נמוכים שנפוצים בהרצת מודלים). החברה מפרטת גם את מעטפת הביצועים: מעל 10 petaFLOPS ב-FP4 ו-מעל 5 petaFLOPS ב-FP8, בתוך מעטפת צריכת חשמל של 750W לשבב.

בצד הזיכרון, מיקרוסופט מצהירה על 216GB HBM3e עם רוחב פס של 7TB/s, לצד 272MB SRAM על־השבב – רכיב שנועד להקטין צווארי בקבוק בהאכלת המודל בנתונים.

אחד הדגשים הבולטים בהכרזה הוא התפיסה המערכתית. מיקרוסופט אומרת ש-Maia 200 בנוי לסקייל־אפ על גבי Ethernet סטנדרטי (ולא בד־פרופריייטרי), עם שכבת תעבורה ורכיב תקשורת משולב שנועדו להוריד עלות כוללת ולשמור על אמינות. החברה מציינת 2.8TB/s של רוחב פס דו־כיווני לרשת הסקייל־אפ, ותמיכה בעבודה “קולקטיבית” עד 6,144 מאיצים באשכול. בתוך “מגש” (tray) אחד, ארבעה מאיצים מחוברים זה לזה בקישורים ישירים כדי לשמור תקשורת מקומית מהירה.

איפה זה שם את מיקרוסופט מול אנבידיה, גוגל ואמזון

מיקרוסופט מציגה את Maia 200 כ”הסיליקון הראשון־צד (first-party) החזק ביותר” מבין ספקיות הענן, וטוענת ליתרון מול Trainium של אמזון ו-TPU של גוגל במדדים מסוימים (כולל FP4/FP8), אך בשלב זה מדובר בטענות יצרן שטרם קיבלו אימות ציבורי מלא בבנצ’מרקים בלתי תלויים.

ההקשר חשוב: כבר בקיץ 2025 דווח שפיתוח הדור הבא של Maia התעכב, בין היתר בגלל שינויי תכנון, מגבלות כוח אדם ותחלופה, ושדחיית הייצור ההמוני גלשה ל-2026. כלומר – Maia 200 מגיעה אחרי “חבלי לידה”, ובזמן שיריבות הענן צברו ניסיון בדורות קודמים של שבבים פנימיים.

גם כעת, השוק מעריך שמיקרוסופט לא “חותכת” את אנבידיה בטווח הקצר: תגובת המשקיעים הייתה רגועה יחסית, ובארונ’ס ציינו שמניית אנבידיה לא נחלשה בעקבות ההכרזה, בין היתר משום שההנחה היא שהוצאות הענק על תשתיות AI יימשכו – גם אם חלק מהעומס יעבור בהדרגה לשבבים פנימיים.

פריסה, שימושים וזמינות

מיקרוסופט אומרת שהשבב כבר נפרס באזור הדאטה־סנטרים US Central ליד דה־מויין, איווה, ושאזור US West 3 ליד פיניקס “הבא בתור”, עם הרחבה בהמשך לאזורים נוספים. עוד נמסר כי Maia 200 מיועד לשרת מספר מודלים ושירותים – כולל Microsoft Foundry ו-Microsoft 365 Copilot – ואף יפעיל “מודלים מהדור האחרון GPT-5.2” של OpenAI על התשתית של החברה. במקביל, מיקרוסופט מציגה תצוגה מוקדמת (preview) ל-Maia SDK עם כלי פיתוח ואופטימיזציה (כולל אינטגרציה ל-PyTorch ותמיכה ב-Triton).

הפוסט מיקרוסופט משיקה את Maia 200: מאיץ הסקה ב-3 נ״מ שנועד להוזיל ולהוריד את התלות באנבידיה הופיע לראשונה ב-Chiportal.

]]>
https://chiportal.co.il/%d7%9e%d7%99%d7%a7%d7%a8%d7%95%d7%a1%d7%95%d7%a4%d7%98-%d7%9e%d7%a9%d7%99%d7%a7%d7%94-%d7%90%d7%aa-maia-200-%d7%9e%d7%90%d7%99%d7%a5-%d7%94%d7%a1%d7%a7%d7%94-%d7%91-3-%d7%a0%d7%b4%d7%9e-%d7%a9%d7%a0/feed/ 0