הארכיטקטורה של המנוע NeuPro-M מאפשרת עיבוד מקבילי בשתי רמות — בין המנועים (אם משתמשים בכמה מנועים) ובתוך המנועים עצמם
סיוה חידשה את הקניין הרוחני של מנוע האצת הבינה המלאכותית שלה NeuPro, והוסיפה מעבדי עזר להתמרות וינוגרד ופעולות דלילוּת, ויחידה רב-שימושית לעיבוד וקטורים לצד מערך ה-MAC של המנוע. המנוע מהדור החדש, NeuPro-M, יכול להגדיל את הביצועים פי 5 עד 15 (תלוי בעבודה הספציפית) בהשוואה לליבה מהדור השני של סיוה NeuPro-S (שהושקה בספטמבר 2019). לדוגמה, הביצועים של ResNet-50 שופרו פי 4.9 ללא שימוש במנועים המיוחדים — והוגדלו לפי 14.3 עם שימוש במעבדי עזר מיוחדים, לדברי סיוה. התוצאות לגבי Yolo-v3 הראו האצות דומות. יעילות ההספק של הליבה צפויה להיות 24 TOPS/Watt בפעולה של 1.25 GHz.
הארכיטקטורה של המנוע NeuPro-M מאפשרת עיבוד מקבילי בשתי רמות — בין המנועים (אם משתמשים בכמה מנועים) ובתוך המנועים עצמם. במערך ה-MAC הראשי יש 4,000 MACs שיכולים לבצע פעולות דיוק מעורב (2-16 ביטים). לצידם נמצאים מעבדי עזר מיוחדים חדשים לכמה משימות בינה מלאכותית. זיכרון מקומי בכל מנוע מנתק את התלות בזיכרון המשותף של הליבה וב-DDR חיצוני. מעבדי העזר בכל מנוע יכולים לפעול במקביל על אותו זיכרון, למרות שלפעמים הם מעבירים נתונים מאחד לשני ישירות (מבלי לעבור בזיכרון). ניתן להגדיר את הגודל של הזיכרון המקומי הזה לפי גודל הרשת, גודל תמונת הקלט, מספר המנועים במערך וההשהיה ורוחב הפס של ה-DDR של הלקוחות.
אחד ממעבדי העזר המיוחדים הוא מאיץ להתמרות וינוגרד (משתמשים בהתמרת וינוגרד כדי לבצע בקירוב פעולות קיפול תוך שימוש בפחות חישובים). סיוה בנתה אותו להאצת קיפולי 3×3 – שהם הכי נפוצים ברשתות העצביות כיום. התמרת וינוגרד של סיוה יכולה פחות או יותר להכפיל את הביצועים בשכבות קיפול 3×3 8 סיביות, עם הפחתה של 0.5% בלבד בדיוק של הניבוי (בשימוש באלגוריתם וינוגרד מהאריזה/ ללא אימון). אפשר להשתמש בו גם בסוגי נתונים של 4, 12 ו-16 סיביות.
מנוע הדלילות הלא מובנית של סיוה יכול לנצל אפסים שנמצאים במשקלים ובנתונים של רשתות עצביות, אבל פעולתו טובה במיוחד אם הרשת עברה קודם אימון באמצעות הכלים של סיוה כדי לעודד דלילות. אפשר לשפר פי 3.5 בתנאים מסוימים. טכניקות של דלילות לא מובנית עוזרת לשמור על הדיוק של הניבוי לעומת סכמות מובְנוֹת.