AWS ו-NVIDIA ישתפו פעולה בהנגשת תשתיות ושירותים לקידום בינה מלאכותית יוצרת

החברות ישלבו את הטכנולוגיות המתקדמות ביותר של NVIDIA ו-AWS, החל מפלטפורמות NVIDIA הכוללות GPUs, CPUs וסביבת תוכנה לפיתוח AI, ועד לטכנולוגיית האבטחה והוירטואליזציה AWS Nitro System, יכולות ההרחבה של UltraCluster, וטכנולוגיית Elastic Fabric Adapter (ר"ת EFA) – האידאליים לאימון מודלי בינה מלאכותית ובנייה של יישומי בינה מלאכותית יוצרת

AWS, מבית Amazon.com ו-NVIDIA הודיעו היום בכנס AWS: re:Invent, על הרחבת שיתוף הפעולה האסטרטגי ביניהן כדי לספק ללקוחותיהן את התשתית המתקדמת ביותר, התוכנה והשירותים לקידום חדשנות בבינה מלאכותית יוצרת. החברות ישלבו את הטכנולוגיות המתקדמות ביותר של NVIDIA ו-AWS, החל מפלטפורמות NVIDIA הכוללות GPUs, CPUs וסביבת תוכנה לפיתוח AI, ועד לטכנולוגיית האבטחה והוירטואליזציה AWS Nitro System, יכולות ההרחבה של UltraCluster, וטכנולוגיית Elastic Fabric Adapter (ר"ת EFA) – האידאליים לאימון מודלי בינה מלאכותית ובנייה של יישומי בינה מלאכותית יוצרת.

כחלק מהרחבת שיתוף הפעולה האסטרטגי להנעת פיתוחי בינה מלאכותית יוצרת:

AWS תהיה הספקית הענן הראשונה להציע שירותי ענן המבוססים על סופר-שבבים (Superchips) מדגם NVIDIA GH200 Grace Hopper עם טכנולוגיית NVLink ו-NVSwitch המחברות 32 סופר-שבבים מסוג Grace Hopper לכדי Instance אחד. כל סופר-שבב מדגם GH200 משלב CPU מדגם Grace עם GPU בארכיטקטורת Hopper על מודול יחיד. הם יהיו זמינים דרך Amazon EC2, כשבאמצעות יכולות הוירטואליזציה AWS Nitro System ויכולות Amazon EC2 UltraClusters יאפשרו ללקוחות AWS ואנבידיה להרחיב את המערכות להיקף של אלפי סופר-שבבים המחוברים יחד. Instance בודד מסוג EC2 עם GH200 NVL32 יוכל להציע עד ל-20 טרה-בייט של זיכרון משותף ויבוססו על הדור השלישי לטכנולוגיית התקשורת Elastic Fabric Adapter (EFA) עם רוחב פס של עד ל-400 גיגה-ביט לשנייה. EC2 מבוסס GH200 NVL32 יציעו עד ל-4.5 טרה-בייט של זיכרון HBM3e, פי 7.2 בהשוואה לדור הנוכחי של EC2 P5d המבוסס על NVIDIA H100.

אנבידיה ו-AWS ישתפו פעולה כדי לארח את שירות NVIDIA DGX Cloud לאימון מודלי בינה מלאכותית – על גבי שירותי הענן של AWS. תהיה זו הפעם הראשונה בה DGX Cloud יציע מערכות המבוססות על סופר-שבבים מדגם NVIDIA GH200 NVL32 שיציעו למפתחים את היקף הזיכרון הגדול ביותר ביחידת מחשוב אחת. DGX Cloud על גבי הענן של אמזון יציע משאבי מחשוב-על On-Demand שיאפשרו להאיץ את האימון של מודלי בינה מלאכותית יוצרת מתקדמים ומודלי שפה גדולים שיכולים להגיע לטריליון פרמטרים.

אנבידיה ו-AWS ישתפו פעולה בפרויקט Ceiba לבניית מחשב העל מבוסס מעבדים גרפיים המהיר בעולם לבינה מלאכותית, שיתבסס על סופר-שבבים מדגם NVIDIA GH200 NVL32 ו-Amazon EFA. מחשב העל יתארח על גבי תשתית הענן של AWS וישמש את צוותי המחקר והפיתוח של אנבידיה לקדם טכנולוגיות בינה מלאכותית, מודלי שפה גדולים, גרפיקה משופרת וסימולציות, פיתוחי רובוטיקה, נהיגה אוטונומית ופיתוחים לעולם הבריאות ומדעי החיים. מדובר במחשב-על ראשון מסוגו שיכלול 16,384 סופר שבבים מדגם GH200 ויציע 65 אקסה-פלופס של חישובי בינה מלאכותית. המחשב ישמש את אנבידיה לקידום פיתוח LLMs, רכבים אוטונומיים, ביולוגיה דיגיטלית, טכנולוגיות גרפיקה וסימולציה, רובוטיקה, מדעי אקלים ועוד.

AWS תציג שלוש מערכות Amazon EC2 חדשות: P5e, המונע באמצעות מעבדים גרפיים מדגם NVIDIA H200 GPUs עבור עומסי עבודה של בינה מלאכותית יוצרת ו-HPC, וכן G6 ו-G6e, המונעים באמצעות NVIDIA L4 GPUs ו-NVIDIA L40S GPUs, בהתאמה, למגוון רחב של אפליקציות AI, ובהן הסקה (Inference), וידאו וגרפיקה. G6e מיועד במיוחד לעומסי עבודת תלת-ממד, תאומים דיגיטליים ואפליקציות אחרות המבצעות שימוש בפלטפורמת NVIDIA Omniverse.

"AWS ו-NVIDIA משתפות פעולה כבר למעלה מ-13 שנה, החל מתשתית הענן הראשונה בעולם להתבסס על מעבדים גרפיים. כיום, אנחנו מציעים את המגוון הרחב ביותר של פתרונות מבוססי GPU מבית אנבידיה עבור עומסי עבודה שכוללם גרפיקה, גיימינג, HPC, למידת מכונה וכעת גם בינה מלאכותית יוצרת", אמר אדם סליפסקי, מנכ"ל AWS. "אנחנו ממשיכים להניע חדשות יחד עם NVIDIA על מנת להפוך את AWS למקום הטוב ביותר להרצת GPUs, באמצעות שילוב סופר-שבבים מהדור הבא ומדגם NVIDIA Grace. Hopper עם טכנולוגיית התקשורת EFA של AWS, הסקייל הרחב של EC2 UltraClusters ויכולות הוירטואליזציה של Nitro".

"בינה מלאכותית יוצרת מחוללת מהפכה בעומסי העבודה בענן, ומציבה את המחשוב המואץ בבסיס של יצירת תוכן מגוון", אמר ג'נסן הואנג, מנכ"ל ומייסד אנבידיה. "כשלנגד עינינו המשימה המשותפת לספק את יכולות הבינה המלאכותית היוצרת המתקדמות והיעילות ביותר, NVIDIA ו-AWS משתפות פעולה על פני כל מערך המחשוב, החל מתשתית הבינה המלאכותית, דרך ספריות האצה, ועד למודלי בסיס (Foundation Models) ושירותי בינה מלאכותית יוצרת".

תוכנה ובינה מלאכותית למערכות בריאות ופיתוח רובוטים לתעשייה – זמינות על הענן של אמזון

עוד הכריזה אנבידיה בכנס על NVIDIA NeMo Retriever, מיקרו-שירותי AI חדשים שיאפשרו לארגונים לחבר מודלי שפה מותאמים אישית למידע ארגוני על מנת לאפשר מענה מדויק באפליקציות הבינה המלאכותית הארגוניות שלהן, זאת כחלק מסביבת מוצרי NVIDIA NeMo – כלים וסביבות עבודה המיועדים לבנייה, התאמה אישית והפעלה של מודלי בינה מלאכותית יוצרת.

כמו כן, הוכרזה הזמינות של חבילת התוכנה והשירותים למערכות בריאות, NVIDIA Clara, עבור חוקרים ומפתחים בחברות תרופות וחברות ביוטק, שיוכלו כעת להפעיל את Clara על גבי שירותי הענן של אמזון. החוקרים והמפתחים יוכלו לשלב פתרונות ושירותים של אנבידיה, כגון מאגד מודלי הבינה המלאכותית NVIDIA BioNeMo לפיתוח תרופות, באמצעות שירותי מחשוב העל בענן NVIDIA DGX Cloud על גבי AWS. BioNeMo מאפשר להאיץ תהליכי פיתוח תרופות חדשות על ידי זיהוי חלבוני מטרה, חיזוי של מבנה חלבונים וסינון של תרכובות מוצעות בתהליך הפיתוח.

בנוסף, AWS תנגיש דרך הענן את פלטפורמת הפיתוח לרובוטיקה NVIDIA Isaac Sim ואת המעבדים הגרפיים המתקדמים NVIDIA L40S כדי לאפשר למפתחים לבנות ולהפעיל יישומי רובוטיקה דרך הענן. NVIDIA Issac Sim נבנתה על גבי פלטפורמת הפיתוח בתלת-מימד NVIDIA Omniverse באמצעותה ניתן לפתח יישומי גרפיקה בתקן OpenUSD.

פיתוח רובוטים בסימולציה מאיץ את הטמעתם ומאיץ תעשיות כגון קמעונאות, עיבוד מזון, ייצור, לוגיסטיקה ועוד. על פי חברת המחקר ABI, ההכנסות מרובוטים מסחריים ותעשייתיים במחסנים ברחבי העולם צפויות לגדול פי שלוש מ-12.2 מיליארד דולר ב-2023 ל-36.8 מיליארד דולר עד 2030. כך למשל, Amazon Robotics פרשה יותר מ-750 אלף רובוטים במחסניה ברחבי העולם, כדי לשפר את תהליכי העבודה של עובדיה ואת השירות ללקוחותיה.

פיתוח רובוטים בסימולציה מאפשר לאמן ולבדוק מערכות רובוטיות מבוססות בינה מלאכותית. על ידי הישענות על דאטה סינטתי, סימולציות מאפשרות לבדוק, לאמת ולייעל מערכות רובוטיות ואת האלגוריתמים שלהם לפני הפעלתן על רצפות הייצור או המחסן. סימולציות מאפשרות גם לשפר את העיצוב והתצורה של מפעלים לפני בנייתם בפועל או תהליכי שיפוץ וארגון מחדש, כדי למקסם את היעילות של הרובוטים ולהפחית בעלויות בגין שינויים פיזיים.