לדברי ד"ר שחר קוטינסקי, "למעשה יש לנו כאן חומרה שנועדה במקור לשימושים אחרים – גרפיקה, בעיקר – והיא אינה עומדת בקצב המהיר של הפעילות המתרחשת ברשתות הנוירונים. כדי לפתור את הבעיה הזאת אנחנו חייבים חומרה ייעודית שמותאמת לעבודה עם רשתות נוירונים עמוקות."
חוקרים בפקולטה להנדסת חשמל ע"ש ויטרבי בטכניון פיתחו חומרה חדשנית המאיצה את תהליך הלמידה של מערכות בינה מלאכותית. את המחקר הובילו ד"ר שחר קוטינסקי והדוקטורנטית צפנת גרינברג-טולדו, והשתתפו בו הסטודנטים רועי מזור ואמיר חג' עלי. מאמרם פורסם בכתב העת IEEE Transactions on Circuits and Systems שמוציאה האגודה הבינלאומית למהנדסי חשמל ואלקטרוניקה (IEEE).
בשנים האחרונות חלה התקדמות משמעותית בעולם הבינה המלאכותית, בעיקר הודות למודלים של רשתות נוירונים עמוקות (DNNs). רשתות אלה, שתוכננו בהשראת המוח האנושי ודרכי הלמידה של האדם, מבצעות בהצלחה חסרת תקדים משימות מורכבות כגון נהיגה אוטונומית, עיבוד שפה טבעית, זיהוי רגשות בטקסט, תרגום, זיהוי תמונה ופיתוח טיפולים רפואיים חדשניים. זאת באמצעות למידה עצמית מתוך מאגר עצום של דוגמאות – תמונות, למשל. טכנולוגיה זו מתפתחת במהירות בקבוצות מחקר אקדמיות כמו גם בחברות ענק כגון פייסבוק וגוגל, הרותמות אותה לצורכיהן.
מכיוון שהלמידה מתוך דוגמאות דורשת כוח מחשוב רב היא מבוצעת לרוב במחשבים המכילים מעבדים גרפיים (GPU) המצטיינים בכך. עם זאת, מהירותם של מעבדים אלה עדיין נמוכה יחסית לקצב הלימוד הרצוי של רשתות הנוירונים ולכן המעבד עדיין מהווה צוואר בקבוק בתהליך זה. יתר על כן, השימוש במעבדים צורך אנרגיה רבה. לדברי ד"ר קוטינסקי, "למעשה יש לנו כאן חומרה שנועדה במקור לשימושים אחרים – גרפיקה, בעיקר – והיא אינה עומדת בקצב המהיר של הפעילות המתרחשת ברשתות הנוירונים. כדי לפתור את הבעיה הזאת אנחנו חייבים חומרה ייעודית שמותאמת לעבודה עם רשתות נוירונים עמוקות."
ואכן, קבוצת המחקר של ד"ר קוטינסקי פיתחה, ברמה התאורטית, מערכות חומרה המותאמות במיוחד לעבודה עם רשתות אלה ומאפשרות לרשת הנוירונים לבצע את שלב הלמידה במהירות גבוהה ובאנרגיה מופחתת. לדברי ד"ר קוטינסקי, "בהשוואה לעבודה עם מעבדים גרפיים, החומרה שלנו משפרת את מהירות החישוב פי 1,000 ומצמצמת את הצריכה האנרגטית ב-80%."
החומרה שפיתחה הקבוצה מהווה פריצת דרך ושינוי תפישתי של ממש: במקום שיפור של מעבדים קיימים פיתחו חוקרי הטכניון מבנה של מכונת חישוב תלת-ממדית המשלבת בתוכה את הזיכרון. "במקום פיצול בין היחידות המבצעות את החישובים לזיכרון האחראי לשמירת המידע, אנחנו עושים הכל בתוך הממריסטור – רכיב זיכרון בעל כוח חישובי המשמש במקרה זה באופן ייעודי לעבודה עם רשתות נוירונים עמוקות."
אף שמדובר בעבודה תאורטית, הקבוצה כבר הדגימה את יישומו של הפיתוח ברמת הסימולציה. לדברי ד"ר קוטינסקי, "הפיתוח שלנו נועד לעבודה עם אלגוריתם הלמידה 'מומנטום', אבל הכוונה היא להמשיך בפיתוח החומרה כך שתתאים גם לאלגוריתמים נוספים. יתכן שבמקום כמה רכיבי חומרה שונים נפתח חומרה דינמית, רב תכליתית, שתוכל להתאים את עצמה לאלגוריתמים שונים."
למאמר לחצו כאן
לסרטון המדגים את המחקר לחצו כאן
{loadposition content-related} |