שירותי הענן החדשים של החברה – Picasso, NeMo ו-BioNeMo, יאפשרו לבנות ולהפעיל יישומי Generative AI המאומנים על גבי מידע קנייני בתחומים הרלוונטיים, ומותאמים לתחומי עיסוק ספציפיים. בנוסף חשפה NVIDIA פלטפורמות הסקה (Inference) חדשות ל-Generative AI, שיונגשו דרך Google Cloud
כנס הבינה המלאכותית והמטאברס של NVIDIA לשנת 2023 יצא לדרך, ונפתח בשורת הכרזות של מנכ"ל ומייסד החברה, ג'נסן הואנג, בתחום ה-Generative AI – הבינה המלאכותית היוצרת. הואנג הציג שורה של מוצרים, יישומים ושירותים חדשניים שפותחו על-ידי צוותי החברה בעולם, לרבות במרכז הפיתוח בישראל המונה למעלה מ-3,000 עובדות ועובדים.
NVIDIA AI Foundations – סדרת שירותי ענן לעידן הבינה המלאכותית היוצרת
NVIDIA הכריזה היום (ג', 21.3) על מספר שירותי ענן חדשים בשם NVIDIA AI Foundations, שיאפשרו לעסקים, ארגונים וסטארט-אפים מכל תעשייה לבנות, לייעל ולהפעיל מודלי בינה מלאכותית יוצרת ומודלי שפה גדולים (LLMs – Large Language Models), אותם ניתן לאמן על המידע הקנייני של הארגון, על מנת ליצור כלי Generative AI המאומנים לתחום-פעילות ומשימות ספציפיות. בנוסף, את מודלי השפה החדשים ניתן לעדכן באופן רציף ובזמן אמת עם מידע חדש, כך שהאימון של המודלים נמשך כל העת ואין להם פערי מידע – למשל על אירועים שקרו לאחרונה. שירותיNVIDIA AI Foundations רצים על גבי DGX Cloud, שירות הענן החדש של NVIDIA שהוכרז גם הוא היום.
בינה מלאכותית יוצרת (Generative AI) היא המנוע מאחורי האימוץ המהיר של בינה מלאכותית, וממציאה מחדש אינספור תעשיות", אמר ג'נסן הואנג, מנכ"ל ומייסד NVIDIA. "שירותי הענן NVIDIA AI Foundations מעניקים לארגונים מודלי-בסיס הניתנים להתאמה אישית באמצעות המידע והנתונים הקניינים שלהם, כדי ליצור את המשאבים היקרים ביותר של האנושות – אינטליגנציה ויצירתיות", הוא הוסיף.
NVIDIA AI Foundations כוללים שלושה שירותי ענן חדשים:
- NVIDIA Picasso – שירות ענן שמשמש לפיתוח, בנייה והטמעה של יישומים המבצעים שימוש ב-Generative AI ליצירת תמונות, וידאו ותוכן תלת-ממדי, תוך שימוש בטכנולוגיות טקסט-לתמונה, טקסט-לוידאו, וטקסט-ל-3D. פיקאסו מונע באמצעות סדרת מודלים ייחודיים המכונים Edify-Image, Edify-Video ו-Edify-3D, שפותחו ואומנו על ידי NVIDIA. מודלים אלו נגישים באמצעות ממשקי API פשוטים לענן, ויוכלו לשמש ארגונים ומפתחים כדי לבנות יישומים חדשניים, ולייצר במהירות ובקלות תוכן ייחודי לעולמות הבידור, המשחקים, עיצוב מוצרים, תאומים דיגיטליים תעשייתיים ועוד. עסקים יוכלו גם לאמן את המודלים על נתונים קנייניים שלהם כדי לבנות יישומים מותאמים, או להשתמש בשירות כדי לבצע אופטימיזציה ולהפעיל יישומי בינה מלאכותית יוצרת משלהם. למידע נוסף על NVIDIA Picasso.
- NVIDIA NeMo – שירות ענן להבנת-שפה הכולל מגוון רחב של מודלי שפה המבוססים על 8 עד 530 מיליארד פרמטרים, כמו גם מודל עיבוד שפה חדש בשם Inform. אלו מתעדכנים על בסיס קבוע ומיועדים לבניית שירותים, מוצרים, מודלים וטכנולוגיות מבוססי טקסט. כמו כן, NeMo תומך ב-100 שפות, לרבות עברית. באמצעות NeMo יכולים ארגונים לבנות מודלים ושירותים הממוקדים בתחום-ספציפי ועומדים בקו אחד עם הדרישות העסקיות שלהם, וכן לאמן את המודלים על גבי מידע קנייני. כך, הם יכולים לבצע התאמה של מודלים כדי להניע יישומי Generative AI מסוג צ'טבוטים, חיפוש ארגוני, שירות לקוחות ועוד. יתרון ייחודי של NeMo הוא יכולות של "משיכת מידע", כך שחברות המשתמשות בו יוכלו לעדכן את המודלים שלהם בזמן-אמת באופן רציף, ולמנוע פערי מידע בין שלב האימון לשלב היישום. למידע נוסף על NVIDIA NeMo.
- NVIDIA BioNeMo – שירות ענן זה פותח באופן ייעודי לתחומי הביולוגיה ועבור מחקר ופיתוח בתעשיית מדעי-החיים. שירות זה מאגד מודלי שפה המאומנים על שפת הביולוגיה, ורותם את יכולות הבינה המלאכותית היוצרת לטובת פיתוח תרופות, הנדסת-חלבונים, ומחקר כללי במדעי החיים. השירות מאפשר לחברות ביו-טכנולוגיה לבצע שימוש במידע הקנייני אותו צברו לאורך עשרות שנות פעילותן, על מנת לאמן מודלי שפה ו-Generative AI, או לבצע את תהליכי ההסקה (Inference) ישירות מהדפדפן באמצעות API. למידע נוסף על BioNeMo.
שלושת שירותי הענן המרכיבים את ה-NVIDIA AI Foundations יקלו על ארגונים ומפתחים להיכנס לתחום הבינה המלאכותית היוצרת, באמצעות מודלי בסיס מאומנים מראש (Pre-Trained Models), אותם הם יוכלו להתאים למידע ולידע הארגוני. כמו כן, ניתן להתאים את תוצרי המודלים לסוגי תוצרים ספציפיים אותם מעוניין הארגון לקבל, וכן ניתן להגדיר את גבולות המודל – ואילו סוגים של תוצרים הבינה המלאכותית לא תייצר.
NVIDIA AI Foundations פועלים על גבי NVIDIA DGX Cloud – שירות חדש שהושק גם הוא היום ובמסגרתו תנגיש NVIDIA את יכולות מחשוב העל לפיתוח בינה מלאכותית דרך הענן, עם גישה ישירה מהדפדפן ותוך שימוש ב-APIs לטובת שלבי האימון.