החלטות של מערכות AI במשימות מורכבות כמו בקרת תנועה עירונית, תוך חיסכון משמעותי בזמן ומשאבים
כידוע אחת הבעיות המתלוות למהפכת הבינה המלאכותית הינה צריכת החשמל האדירה של האלגוריתמים הן בעת האימון והן בעת התפעול. כעת חוקרים מ- MIT פיתחו אלגוריתם חדשני ללמידת חיזוק שמעצים את היכולת של AI לקבל החלטות במצבים מורכבים. האלגוריתם מתמקד בבחירת משימות אופטימליות לאימון, ומספק שיפור ביצועים משמעותי עם נתונים מינימליים – עד פי 50 ביעילות.
אלגוריתם זה לא רק חוסך זמן ומשאבים, אלא גם מציג אופקים חדשים ליישומי AI יעילים במצבים בעולם האמיתי, כמו בקרת תנועה, ייעול תחבורה, ומערכות ניידות מתקדמות.
אתגרים בלמידת חיזוק
מערכות AI מבוססות למידת חיזוק מתמודדות עם קושי משמעותי כאשר המשימות משתנות. לדוגמה, בבקרת תנועה עירונית, המודל עלול להיכשל בניהול צמתים שונים בעלי הגדרות מהירות, מבני נתיבים ודפוסי תנועה משתנים.
כדי להתמודד עם אתגר זה, החוקרים פיתחו אלגוריתם חדשני שמייעל את אימון ה-AI באמצעות בחירה אסטרטגית של משימות.
גישה אסטרטגית לבחירת משימות
האלגוריתם מבצע בחירה אסטרטגית של המשימות האפקטיביות ביותר לאימון סוכני AI, כדי לשפר את הביצועים הכוללים על כל קבוצת המשימות.
לדוגמה, בבקרת תנועה עירונית, כל משימה עשויה לייצג צומת יחיד מתוך המרחב העירוני. האלגוריתם מתמקד בצמתים בעלי תרומה משמעותית לביצועים הכוללים, ובכך ממקסם את האפקטיביות תוך שמירה על עלויות אימון נמוכות.
חדשנות באלגוריתם MBTL
חוקרי MIT פיתחו אלגוריתם בשםModel-Based Transfer Learning (MBTL) , שמאפשר לבחור משימות בעלות הערך הגבוה ביותר לשיפור ביצועים.
האלגוריתם מודד שני פרמטרים מרכזיים:
- ביצועי האלגוריתם אם היה מאומן במשימה בודדת.
- ירידת הביצועים כאשר האלגוריתם מוחל על משימות אחרות, מושג הידוע בשם "ביצועי הכללה " (Generalization Performance)
על-ידי התמקדות במשימות המבטיחות את שיפור הביצועים הגבוה ביותר, MBTL משפר משמעותית את יעילות תהליך האימון.
השלכות על עתיד הבינה המלאכותית
במבחנים על משימות מדומות, כגון בקרת תנועה, ייעוץ מהירות בזמן אמת ומשימות קלאסיות אחרות, האלגוריתם הראה יעילות גבוהה פי 5 עד פי 50 משיטות אחרות.
לדוגמה, בעזרת MBTL ניתן לאמן אלגוריתם על שתי משימות בלבד ולהשיג את אותם ביצועים כמו שיטה סטנדרטית שמשתמשת בנתונים מ-100 משימות.
לדברי פרופ' קתי וו, מובילת המחקר:
"הגישה שלנו מראה שייתכן שלא צריך את כל המידע מכל המשימות. למעשה, אימון על כולן עשוי להיות מבלבל לאלגוריתם ולהוביל לביצועים נמוכים יותר."
בעתיד, מתכננים החוקרים ליישם את MBTL על בעיות מורכבות יותר, כולל מרחבי משימות מרובי-ממדים, ולקדם את השימוש בגישה זו ביישומים בעולם האמיתי, במיוחד במערכות ניידות מתקדמות.