מועדון השבבים: החיישן של ווקלזום מאפשר לשמוע רק את הדובר ולמחוק את כל הרעש מסביב

מנכ"ל ווקלזום טל בקיש הציג הערב במועדון השבבים את החברה שתעזור למחשב לשמוע אותנו טוב יותר. החיישן שפיתחה החברה אמור להתמקד אך ורק בדובר ומתעלם משאר הרעשים שמסביב.

טל בקיש, מנכ"ל VOCALZOOM, במפגש מועדון השבבים, 1/4/15.

חברת ווקלזום מיוקנעם פיתחה חיישן המודד את תנועות הפנים והגרון, וביחד עם המידע מהמיקרופון הוא מאפשר לבודד את הקול הדרוש ולהתעלם מהשאר.

מנכ"ל ווקלזום, טל בקיש הציג הערב במועדון השבבים את החברה שתעזור למחשב לשמוע אותנו טוב יותר. החיישן שפיתחה החברה אמור להתמקד אך ורק בדובר ומתעלם משאר הרעשים שמסביב.

"אם שואלים לקוחות על הממשק הקולי שייכנס אחרי מסכי המגע והמחוות. הם אומרים שהוא עדיין בחיתוליו". אומר בקיש. אך לדבריו הדבר לא נכון. היום כולנו מכירים את סירי ו-GOOGLE VOICE והן מהוות דרך יעילה לתפעל מכשירים, בעיקר בסביבת הרכב, שם מדובר בתכונה חיונית משום שהיא משפרת את בטיחות הנהיגה.

ואולם המערכות הללו פועלות היטב רק כאשר הסביבה שקטה, לרוב כאשר המנוע עדיין לא הותנע. בעת נסיעה והחשיפה לרעשים, למשל פתיחת חלון או שיחה של נוסעים אחרים ברכב, מורידה את יעילות הזיהוי של מערכות אלה. "הסיבה – בכל הקשור לזיהוי דיבור, המערכות הללו מעולות, הן מסוגלות לזהות כל מילה במבטאים רבים משום שמאמנים אותן לכך, ואולם לרעש אי אפשר לאמן, בכל סביבה יש רעש מסוג שונה."

"ווקלזום פיתחה חיישן אופטי המודד את רעידות הפנים והגרון, ומתרגם את זה לאודיו. אמנם מדובר בקול באיכות נמוכה יחסית, אבל כשמשווים את ה'פיענוח' של המילים כפי שקלט אותם החיישן. המיקרופון המקורי במכשיר הטלפון או במערכת השליטה של הרכב קולט אמנם את הקולות באיכות טובה, אך גם את הרעשים עימם, למרות כל הטכנולוגיות שקיימות עד כה להפחתת רעשים. המידע מהחיישן שלנו ביחד עם המידע מהמיקרופון, מאפשר לנטרל את הרעשים ולהגיע ל-80%-90% זיהוי."

בקיש השווה זאת לצילום – "מצד אחד יש צילום באיכות גבוהה ממצלמה צבעונית, אך אנו רוצים להתמקד רק בדוברת בשם ברחל. המקבילה של החיישן שלנו היא צילום באיכות נמוכה שבה רוב השטח מטושטש אך רחל בולטת ממנו וניתנת לזיהוי. וכך אנו מחלצים את הדובר שאנו רוצים מתוך הרעש. באופן כזה אין לנו צורך לאפיין את הרעש. מדובר בשינוי תפיסתי בכל התחום של ניקוי רעשים.

המערכת עובדת במכשירי קצה סלולאריים, קסדות וכדומה. ברכב היא ממוקמת על המראה או, אם היצרן משתף פעולה, בתוך לוח המכוונים. היא מצלמת את הדובר ומסוגלת לזהות את דבריו מזוויות שונות. המערכת מגלה את הפנים שלו ודואגת להשמיע בטלפון או במערכת של הרכב רק את כל הנהג. אנו עובדים בצמוד עם יצרני שבבים לאודיו ועם יצרני רכב כדי לפתח את הממשק."

בתשובה לשאלת הקהל אמר בקיש כי בחברה השקיעו עד כה חברות מובילות ובהן 3M; מוטורולה סולושן ו- FueTrek היפנית. עוד משקיעה בחברה היא קרן Ourcroud.

{loadposition content-related}