אנה ברנוב, מנכ"לית HowHardAI, חשפה בכנס ChipEx2025 שיטה לאימון ממוקד של מודלי שפה גדולים לפתרון בעיות אופטימיזציה שמטרתה לתכנן באופן אוטמטי את שלב ה- Netlist של שבבי הדור הבא
בפתח הרצאתה בכנס ChipEx2025 שהתקיים בתל אביב, הציגה אנה ברנוב, מנכ"לית HowHardAI, רעיון מהפכני להפיכת מודלי שפה גדולים (LLM) לסוכנים אוטונומיים המסוגלים לפתור בעיות טכניות מורכבות בזמן אמת. לדבריה, מרבית “Agentic Frameworks” המקובלים כיום – דוגמת Identity AI ואחרים – פועלים כמעין מעטפת תוכנה סביב ה-LLM, שבה היכולות המודליות נשמרות בגדר גנרי, והכוונה למשימות השונות מתבצעת באמצעות prompt engineering בלבד מבלי לשנות את המשקלים הפנימיים של המודל.
HowHardAI מנגישה במקום זאת גישה של Reinforcement Learning המבוססת על תהליך trial-and-error המוכר מעולמות אחרים בבינה מלאכותית. על פי ברנוב, כדי לאפשר למודל ללמוד באמת להפעיל אמצעים חיצוניים או לבצע סדרת פעולות מורכבות, יש לתרגם אתגרים כמו תכנון פריסה (floor planning) לסביבה סימולטיבית שסולקת ציון מוצקות לפעולותיו של המודל בכל איטרציה. רק כך ניתן לעדכן את המשקלים שלו באופו איטרטיבי, ולא להסתפק בפקודות טקסט בלבד
בתיאור הניסוי שהציגה, המודל התחיל במיקום ראשוני של שני רכיבי מפתח (MR ו-ML) וזכה לפידבק סביבתי שכלל דירוג תלוי־פעולות. באיטרציה הבאה הוא הריץ פעולת “rotate” לשיפור המיקום, ובאיטרציה השלישית הציע התאמות נוספות עד שהסביבה קבעה כי האופטימיזציה הושלמה ואתרו את נקודת העצירה האופטימלית. התהליך כולו נעשה ב–one shot גנרטיבי, ללא צורך בארגון המודל בפרדיקציה מוקדמת.
יתרונן של שיטות RL במרחב זה הוא ביעילות האימון ובהסתמכות על reasoning פנימי של ה-LLM, שאיננו מוגבל עוד למערכת חיצונית המורה לו מה לעשות. ברנוב מתחזקת כי ברגע שמגדירים נכון את הבעיה – את הסט המוגבל של הפעולות ואת אופן החישוב של ה-reward – ניתן להפעיל סוכנים חכמים שיבצעו אופטימיזציה בכל שלב של שרשרת הפיתוח, החל מנתוני post-silicon ועד לניתוב אוטומטי בין תהליכי ייצור בעלי node שונים.
HowHardAI נמצאת כבר כיום בשלבי שיתוף פעולה עם מספר חברות מובילות בתעשיית השבבים בישראל וברחבי העולם, במטרה ליישם את הגישה ולייעל באופן מהותי את שלבי התכנון והייצור. “ההצלחה תלויה קודם כל בפרמליזציה נכונה של הבעיה,” סיכמה ברנוב, “כשהמודל מבין בדיוק אילו פעולות הוא יכול לבצע ואיך לקבל על כך משוב, הוא הופך לכלי אימון רב־עוצמה.”
o4-mini-high