אמזון הופכת את שבב ה- Inferentia לזמין לעומסי עבודה של לקוחות
שנה לאחר שהכריזה על שבב מאיץ ה- AI העצמי שלה, Amazon Web Services (AWS) מציגה מקרים המבוססים על שבב ה- Inferentia לעומסי עבודה של לקוחות.
לקוחות AWS במגוון ענפים עברו את שלב הניסוי, והשבב כבר סייע להם לטענת אמזון להגדיל עומסי עבודה במערכות הדורשות לימוד מכונה.
אנדי ג'סי, מנכ"ל AWS, ציין בכנס AWS Re: "דיברנו הרבה על אימונים ללימוד מכונה והדבר זה זוכה לתשומת לב רבה. מדובר בעומסים כבדים, "אמר. " מי שמבצע פעולות לימוד מכונה בקנה מידה גדול, יודע שרוב העלויות הם בשלב האימון. ולכן חשוב לאסוף נתונים מהמערכות הפועלות כדי לשפר את עבודת לימוד המכונה.."
AWS מציעה גישה לשרתי EC2 Inf1 שלה, המבוססים על 16 שבבי Inferentia, הזמינים באופן מיידי. לעומת המחשבים הקודמים המבוססים על שבב , Nvidia T4 GPU מספקים מהירות אחסון גבוהה יותר, יכולת לימוד מכונה גבוהה פי שלושה ועלות נמוכה עד כ-40%.
אמזון מצטרפת לקבוצת עילית של חברות הענק שמפתחת שבבים משלהם לשימוש במתקני הענן שלהם. לגוגל יש את יחידת עיבוד הטנסור שלה (TPU), Baidu עיצב את סדרת Kunlun שלה ועל Alibaba יש את Hanguang 800 שלה, מיקרוסופט החלה להציע שבבי Graphcore לעומסי עבודה של לקוחות ML כחלק מ- Azure. על פי ההערכה, פייסבוק עובדת על ASIC להאצת AI במרכזי הנתונים שלה אך עדיין לא חשפה אם בכלל היא משחקת במשחק הזה.
{loadposition content-related} |