בראיון ל-CHIPORTAL הוא מסביר שהפלא נעשה באמצעות שיכוב שבב הזיכרון על המעבד כלומר שבב תלת ממד המשתמש בארכיטקטורה תלת ממדית שונה. הוא גם מזהיר שאם המערב לא יתעשת, סין תשתמש ביתרון שלה ב-AI כנשק להכנעת המערב
סין עשויה לנצח בתחום מיחשוב הבינה המלאכותית שהיא שדה הקרב של העתיד. כך אומר צבי אור-בך, MonolithIC 3D: בראיון ל-CHIPORTAL בעקבות מאמר שכתב בעיתונות המקצועית בו הוא מזהיר שאם המערב לא יתעשת, סין תשתמש ביתרון שלה ב-AI כנשק להכנעת המערב.
הוא מצטט מאמר שפורסם במסגרת כנס 2022 IEEE International Solid-State Circuits Conference ובו כותבים החוקרים העובדים בחברת עליבאבא (ALIBABA# נאסד"ק: BABA) כי השתמשו בשבב 55 ננומטר אך הצליחו להשיג שיפור רב בביצועי בינה מלאכותית על פני מעבד 14 ננומטר של אינטל רק באמצעות שיכוב הזכרון מעל המעבד וחיבור היברידי ביניהם. "אם אכן הדברים שנכתבו במאמר נכונים הרי שהם יגיעו לעליונות בתחום הבינה המלאכותית, וזה התווך שבו בעצם תתנהל המלחמה הבאה."
אור-בך מצטט את מנכ"ל אפלייד מטיריאלס גארי דיקרסון שאמר: "המנוע הטכנולוגי של עשר השנים הבאות הוא הבינה המלאכותית. האם אנחנו מוכנים להזדמנות הכי גדולה של ימי חיינו?" דיקרסון נוסע בעולם ומדבר עם יצרני שבבים וקובעי מדיניות על שאלה של 10 טריליון דולר: איך נלכוד את ההזדמנות הכלכלית של הבינה המלאכותית, שתשנה כמעט כל תעשייה ומוסד בשנים הקרובות? למעשה, הבינה המלאכותית היא מטרה נעה כי דרישות המחשוב גדלות פי שניים כל שלושה וחצי חודשים."
בשיחה עם Chiportal מסביר אור-בך: "במלחמה העתידית מי שיהיה לו AI חזק יותר ינצח. אם ההפרשים אדירים כמו שהמאמר מראה יכולה להיות לכולנו בעיה גדולה אני לא יודע כמה הסינים התקדמו מעבר למאמר ועברו לכיוון יישומי יותר אבל אני כן יודע לומר שהמאמר מראה על יתרון של פי אלף בביצועי AI. ואת כל זה עשו עם שבב של 55 ננומטר מול שבב של 14 ננומטר. אם העבודה הזו היא רק קצה הקרחון (משום שהסינים ממעטים לפרסם) אם לא נזוז מהר נהיה כולנו עבדים של הסינים."
הסינים ניגשו לבעיה בצורה שונה לגמרי ובארכיטקטורת תלת ממד שונה. ב-2017 הרציתי בכנס ChipEx והתרעתי על האפשרות להגדיל את ביצועי השבבים פי אלףביישומי AI באמצעות שימוש בארכיטקטורת תלת ממד. ההשג של הסינים לא מקרי, הוא אמיתי כמו שחזינו בעצמנו כבר לפני חמש שנים ואם המערב לא יתעשת אנחנו עלולים למצוא את עצמנו בנחיתות בתחום הבינה המלאכותית שיהיה קשה להדביק אותה."
"עד היום לא היתה סיבה מספיק חזקה להחליף את השיטה המסורתית של ייצור השבבים, משום שלפי חוק מור, כל דור מספק שיפור של 30% בביצועים. אבל בשנים האחרונות מדברים על כך שחוק מור מאט אם לא נעצר כליל. לסינים יש גם בעיה נוספת, כי המערב מונע מהם להשתמש גם בשבבים המתקדמים ביותר שכבר קיימים ולכן הם הלכו לתלת ממד וקיבלו שיפור ביצועים לא של 30% אלא של פי אלף בביצועי AI, ואני יודע לומר שזו רק ההתחלה." אומר אור-בך.
"ישנם עוד דרכים לשפר את ביצועי השבבים שאינם רק הקטנת הצומת כפי שהיה עד כה עם חוק מור. רק כדי לסבר את האוזן, כל המעגלים האלקטרוניים בעולם מורכבים משילוב של מוליכים – חוטי מתכת וטרנזיסטורים. בתחום של הטרנזיסטורים השתפרנו פי מיליון בעקבות חוק מור. חוטי המתכת לא השתפרו. להפך, ככל שהם יותר קטנים הם פחות טובים. תכנון חכם יכול לפצות קצת על איכות החוטים אבל לאורך זמן אי אפשר לפצות על החוטים. הדבר נכון עוד יותר כשמדברים על זיכרון."
"כיום אנו עובדים עם שני שבבים מעבד וזכרון שמתחברים דרך לוח והמידע מגיע משבב אחד לשני דרך רכיבי ה-I/O של כל אחד מהם. המצב הזה מגביל מאוד את הקישוריות העתידית ולמעשה את קצב שיפור ביצועי המיחשוב. ברגע שעליבאבא הלכו לקחו שבב מעבד ממפעל אחד ושמו שבב זכרון ממפעל שני והניחו אותו מעל מעל הראשון מדברים על צפיפות של 100 אלף חוטים למילימטר מרובע. זו חיבוריות גדולה יותר בסדרי גודל בין הלוגיקה לזכרון מאשר ניתן לעשות בצורה שעד היום עבדנו בה, קרי באינטגרציה של שני שבבים בנפרד."
לדברי אור-בך, הוא עושה נפשות לתובנה הזו בקרב תעשיית המיחשוב בעולם ובישראל בפרט. אני עדין מאמין שישראל יכולה להוביל בתחום הבינה המלאכותית כי זה עניין של ארכיטקטורה ולא של ייצור TSMC תייצר את מה שנבקש ממנה. יש בארץ את כל הידע הנדרש כדי להוביל אבל לא הצלחתי ליצר מומנטום. נפגשתי עם המדען הראשי (כיום רשות החדשנות) ואחרים אבל זה לא עזר.
אתה יכול לתת דוגמה של שימוש ב-AI כנשק?
"המלחמה העתידית לא תהיה כמו המלחמות בעבר המלחמה כרגע פרימיטיבית לחלוטין. דוגמה לכך להק של רחפנים שיפעלו באופן אוטונומי ויעשו את כל מה שנבקש מהם בלי להפעיל טנקים. דוגמה לכך היא הטור הארוך של טנקים רוסיים שזז לאט. זה קורה משום שלאוקראינים יש עליונות בתחום המל"טים. הם רכשו מל"ט טורקי והם מחסלים כל משורין או טנק רוסי שהם רואים. היום מדובר ברחפנים בודדים המופעלים מרחוק אבל אם אפשר יהיה להרים הרבה רחפנים ולשלוט עליהם באמצעות AI אפשר יהיה לפגוע מקומית בכל מי שרוצים. הכל עניין של שליטה ובקרה וכוחות מיחשוב שאם אתה חזק בהם אי אפשר לעצור אותך. כפי שציינתי במלחמות הבאות המנצחים יהיו אלו שיש להם יתרון בתחום הבינה המלאכותית, במיוחד אם ההפרש הוא משמעותי, ואם אנחנו לא נעשה את זה מישהו אחר יעשה את זה, וזה לא תמיד דבר טוב." מסכם אור-בך.
בשנים האחרונות גוברת המתיחות ביחסי ארה"ב וסין וכתוצאה מכך ארה"ב מונעת מסין גישה לטכנולוגיות וציוד מתקדמים לייצור שבבים. (תהליך שחזר על עצמו גם מול הרוסים, בשבועות האחרונים בשל הפלישה לאוקראינה) זה כולל גישה לכלים מתקדמים כמו ליתוגרפיית EUV. בהתאם, דווח שרק TSMC, סמסונג ואינטל נשארו במרוץ בצומתי טכנולוגיה שגודלם פחות מ-10nm. לכן יש הגיון בכך שחברות סיניות ימקדו משאבים חלופיים בטכנולוגיות שבבים בשלות, אומרים האנליסטים.
זה יכול להסביר את האימוץ של הצמדה היברידית כטכנולוגיית ליבה על ידי חברות סיניות רבות. הצמדה היברידית מאפשרת להן להחליף את ההגדלה המימדית של הצמתים בהגדלה תלת מימדית ברמת המערכת.
באוגוסט 2018 YMTC השיקה רשמית את הארכיטקטורה פורצת הדרך שלה Xtacking בפיסגת זיכרונות הפלאש וזכתה בפרס "הטוב ביותר בתערוכה". במוצר ה-3D NAND שלה, היא משתמשת בשני קווי ייצור של שבבים, אחד בשביל הזיכרון הרב שכבתי 3D NAND ואחד בשביל המעגלים ההיקפיים (הבקרה של הזיכרון).
בספטמבר 2020 חברה סינית אחרת, IC League, פרסמה התוצאות של טכנולוגיית השילוב ההטרוגני על שבב(HITOC) שלה, פיתוח של שבב מוכוון בינה מלאכותית, במאמר שכותרתו "פריצת חומת הזיכרון של שבבי בינה מלאכותית עם מימד חדש".
וכאמור מהמאמר הנוכחי עולה כי הסינים (במקרה זה מהנדסי עליבאבא) הצליחו להגדיל ביצועים של שבבים קיימים רק באמצעות שיכוב הזכרון מעל המעבד במה שמכונה שבב תלת ממדי.
מתוך המאמר: "ב-HITOC, יש לנו שתי פרוסות, פרוסה לוגית ופרוסת זיכרון, מוצמדות ביחד (באמצעות הצמדה היברידית). בפרוסה הלוגית, יש מאגרים של יחידות עיבוד. מתחת למאגר הלוגי הזה בפרוסה השנייה נמצאים מאגרים של מערכי DRAM". התוצאות שדיווחה IC League היו שיפור כולל בסדרי גודל. ב-ISSCC 2022 עליבבא הציגה במאמר שיפור של יותר מפי אלף בהתקני מחשוב של בינה מלאכותית המשתמשים בהצמדה היברידית.
"מאמר זה מציג פריצת דרך חשובה מאוד בביצועים והפחתת הספק. חוקרי עליבאבא מסבירים כי" "בהשוואה למערכת המסורתית -CPU-DRAM, השבב שלנו (עליבאבא) משיג מהירות של 9.78× (כלומר כמעט פי 10, א.ב.). הם מדגישים כי ניתן לשפר עוד יותר את התפוקה ואת קיבולת הזיכרון על ידי הגדלת מספר בלוקי החיבור ההיברידיים או שימוש בטכנולוגיות תהליך מתקדמות יותר כדי לשרת מודלים המלצות מסובכים יותר."
"מבחינת יעילות אנרגטית, שהיא משמעותית ביישומים הקשורים לזיכרון, העבודה שלנו משיגה 184.11QPS/W (QPS – Queries per Second), מה שעולה על מערכת ה-CPU-DRAM ב-317.43×. במונחים של יעילות שטח, ההדבקה ההיברידית בצפיפות גבוהה משפרת את QPS/mm2 ב-660×." התוצאות הושגו תוך שימוש בצומת תהליך ישן יחסית של 55 ננומטר עבור ההיגיון והושוו למעבד Intel Xeon Gold המוביל ב-14 ננומטר".