חוקרים מהאוניברסיטה העברית פיתחו את Annotatability—מסגרת חדשנית שמאפשרת זיהוי שגיאות בנתונים גנומיים, שיפור אנליזות ביולוגיות, וזיהוי מסלולים תאיים הקשורים להתפתחות ומחלות
חוקרים פיתחו מסגרת חדשנית בשם Annotatability שמספקת גישה רבת עוצמה להתמודד עם אחד האתגרים המרכזיים במחקר ביולוגי: הבנת האופן שבו רשתות עצביות מלאכותיות לומדות לתייג נתונים גנומיים.
נתונים גנומיים רבים מכילים כמויות עצומות של דוגמאות מתויגות, אך לעיתים קרובות תיוגים אלו שגויים או מעורפלים. בהשראת פריצות דרך עדכניות בתחומי עיבוד שפה טבעית וראייה ממוחשבת, השתמשו החוקרים ברשתות עצביות מלאכותיות (ANNs) בדרך לא שגרתית: במקום להשתמש ברשתות רק לצורך תחזיות, הם בחנו את רמת הקושי שלהן בלמידת תיוגים שונים של דוגמאות ביולוגיות.
בדומה לבחינת הקושי של תלמידים במצבים חינוכיים שונים, החוקרים השתמשו במידע הייחודי הזה כדי לזהות חוסר התאמה בנתוני תיוג תאים, לשפר את הבנת הנתונים ולגלות מסלולים תאיים קריטיים הקשורים להתפתחות ולמחלות. Annotatability מספקת שיטה מדויקת יותר לניתוח נתונים גנומיים ברמת תא יחיד, עם פוטנציאל משמעותי לקידום מחקר ביולוגי ובטווח הארוך לשיפור באבחון ובטיפול במחלות.
המחקר, בהובלת יונתן קרין, רשף מינטז, ד"ר ברק רווה וד"ר מור ניצן מהאוניברסיטה העברית, פורסם בכתב העת Nature Computational Science. המחקר מציע מסגרת חדשה לפרשנות נתוני אומיקס ברמת תא יחיד ובמיקומים מרחביים, באמצעות מעקב אחרי דינמיקת האימון של רשתות נוירונים עמוקות.
נתוני אומיקס ברמת תא יחיד וברמת מיקום מרחבי חוללו מהפכה ביכולתנו לחקור את המגוון התאי ואת התנהגות התאים בבריאות ובמחלות. עם זאת, ניתוח נתונים רב-ממדיים אלו מאתגר, בעיקר בשל הקושי לייחס תיוגים מדויקים וסופיים, כגון סוגי תאים או מצבים, לאוכלוסיות תאים הטרוגניות. תיוגים אלו לעיתים קרובות סובלים מסובייקטיביות, רעש וחוסר שלמות, מה שמקשה על הפקת תובנות משמעותיות מהנתונים.
טכניקות מתקדמות לזיהוי מסלולים תאיים
Annotatability עוזרת לזהות חוסר התאמות בנתוני התיוג ולתאר טוב יותר את המבנים הביולוגיים שבנתונים. באמצעות מעקב אחר דינמיקות וקושי באימון רשת נוירונים עמוקה, המסגרת מזהה אזורים שבהם תיוגי תאים מעורפלים או שגויים. בנוסף, היא מדגישה מצבי ביניים של תאים ואת אופייה הרציף והמורכב של התפתחות תאים.
במסגרת המחקר פותחה שיטת "השקעת גרפים מודעת אותות" (signal-aware graph embedding) שמאפשרת אנליזה מדויקת יותר של אותות ביולוגיים. טכניקה זו מזהה קהילות תאיות הקשורות לאותות יעד ומספקת כלים לחקר הטרוגניות תאית, מסלולי התפתחות ומסלולי מחלה.
המחקר מדגים את היישום של Annotatability על מגוון נתוני RNA מרמת תא יחיד ונתוני אומיקס מרחביים. ממצאים בולטים כוללים זיהוי תיוגים שגויים, אפיון מדויק של מצבים תאיים הקשורים להתפתחות ולמחלות, ושיפור הבנת ההטרוגניות התאית. תוצאות אלו מדגישות את הפוטנציאל של המסגרת לפענוח תהליכים תאיים מורכבים ולקידום ההבנה של בריאות ומחלות ברמת תא יחיד.
עבודת החוקרים מייצגת התקדמות משמעותית בפרשנות נתונים גנומיים ומציעה כלי רב עוצמה לחקר המגוון התאי. הכלים שפותחו עשויים לשפר את היכולת לחקור דינמיקות בריאות ומחלות ולהוות בסיס לשיפורים באבחון מחלות ובטיפול בהן.