החוקרים ממעבדת אוק רידג' משתמשים במחשב העל Summit לקיצור משך החיפוש משנים לשעות בעזרת המעבדים הגרפיים של NVIDIA
אדה סדובה, חוקרת ביו-פיזיקה מהמעבדה הלאומית של ארה"ב באוק רידג', עובדת עם מחשב העל העוצמתי בעולם מהבית, לפעמים בפיג'מה. היא מחפשת מולקולות זעירות שיוכלו לבלום את נגיף COVID-19 המדביק בני אדם. "אני מקדישה את כל זמני לכך, כדי להציל בני אדם," היא תיארה בוועידת Nvidia Summit שהתקיימה לאחרונה בפורמט מקוון.
מחשב העל SUMMIT הוקם על ידי IBM ומורכב מ-9,216 מעבדי פאואר 9 של IBM ו-27,648 מעבדים גרפיים מדגם טסלה של NVIIDA . התקשורת שלו מבוססת על מערכות אינפיניבנד של מלאנוקס, שכידוע נרכשה על ידי אנבידיה, רכישה שהשלמתה בוצעה רק ברבעון האחרון.
מאמציה משתלמים במיוחד: שני מיליארד בדיקות של מולקולות ב-24 שעות בלבד.
סדובה מחפשת ליגנד, שהוא מולקולה אורגנית של פחות מ-6 אטומים. הליגנד הנכון נקשר לחלבון של נגיף הקורונה ומונע ממנו להדביק תאים בריאים.
אך איתור הליגנד הנכון בין כל החלבונים והליגנדים האחרים דומה לחיפוש מחט בערימת שחת. מומחים יכולים לבלות שנים במעבדות בבדיקת כל האפשרויות. אפילו חיפוש בעזרת Summit, מחשב העל של ORNL, יצריך ארבע שנים.
זו הסיבה שסדובה ועמיתיה פנו ל-27,648 המעבדים הגרפיים תוצרת אנבידיה שמאכלסים את Summit כדי להחיש את המאמצים.
בעזרת אנבידיה, העבירו החוקרים את הקוד ל-CUDA, כדי שיוכל לרוץ על Summit ובכך השיגו שיפור של פי 2.8 במהירות. חוקר אחר, ארון שיינברג, האיץ את המהירות פעם נוספת פי שלושה כאשר גילה דרך להשתמש ב-OpenMP להזנת הנתונים למעבדי אנבידיה.
מעבדים גרפיים צמצמו ביותר מסדר גודל את משך הזמן הנדרש לעיבוד בסיס נתונים של 1.4 מיליארד ליגנדים וגם צמצמו את השונות העצומה בתוצאות שהקשתה על תזמון הבדיקות במחשב העל.
הדמיה של 2 מיליארד תרכובות ב-24 שעות
סדובה מאמינה שעם שיפורים נוספים יוכל הצוות לבדוק עד שני מיליארד תרכובות ב-24 שעות. זו תהיה ההדמיה הראשונה בהיקף כזה וברזולוציה גבוהה.
זרם העבודה הסטנדרטי לאיתור קשרי חלבון-ליגנד הוא אטי מאוד ומתאים לכמה מאות תרכובות הנבדקות במחשב נייד. אך כאשר מדובר במאות אלפי קבצים, זרם כזה עלול להשבית גם את מחשב העל הגדול בעולם.
זוהי קריאה לפעולה למפתחי קוד פתוח ששואפים לסייע בהאצת המחקר המדעי.
הצוות של סדובה מוביל את המאמץ ומגבש זרם עבודה חדש אשר אמור להניב מספרים עצומים של משימות עבור Summit. סדובה מתייעצת עם מומחי קלט/פלט על הדרך הטובה ביותר ליצור בסיס נתונים של כל הליגנדים.
השלב הבא יהיה לערוך ניסוי של כמיליון תרכובות על 108 מתוך 4,608 ה-nodes של Summit. "אם זה יעבוד, נוכל לעבור להרצה הגדולה של 1.4 מיליארד תרכובות עם כל ה-nodes," היא אומרת.
צמצום המחקר על מולקולות מבטיחות.
אם חברי הצוות יצליחו במשימה, הם ישלחו לממפיס רשימה של כ-9,000 התרכובות המוצלחות ביותר שייבדקו במעבדה הקונבנציונלית עם נגיפים אמתיים. או אז, יידרשו החוקרים למצוא את המחט לא בערימת שחת אלא בכמות שמניף קלשון אחד.
הצוות של סדובה החל בעבודתו בינואר, כאשר חוקר מוביל של ORNL, ג'רמי סמית', הציג את העבודה הראשונה שעשתה שימוש במחשב –העל Summit למחקר תרופות למאבק בנגיף הקורונה. העבודה ההיא עדיין בתחילתה.
במבט לעתיד, לסדובה יש רעיונות לדרכים נוספות לגישור בין קשרי החלבון והליגנדים לשיטות המקובלות במחשוב עתיר ביצועים.