16 Oct
סוגיית איכות הקול באפליקציות להקראת טקסט

בשנים האחרונות חלה התקדמות דרמטית בטכנולוגיות המרת טקסט לדיבור (TTS). התקדמות זאת מתבטאת בהגייה מדויקות יותר של מילים ובקולות אנושיים יותר. האפליקציות השונות להקראה טקסט בעברית, העושות כולן שימוש במנועי TTS, כוללות מגוון של קולות – חלקם רובוטיים וחלקם טבעיים.
הדעות חלוקות בנוגע להשפעת איכות הקול על חווית ההאזנה לטקסט – יש הטוענים שהקולות הפחות טבעיים טובים דיים, ואחרים מתעקשים על הקולות הכי אנושיים שיש.


סתגלנותו של המוח האנושי
אלה האומרים כי הקולות הרובוטיים טובים דיים טוענים כי תלמיד שאינו מסוגל לקרוא באופן אפקטיבי לא יסבול מאיכות הקול, בהנחה והקול הרובוטי הוא האלטרנטיבה היחידה שיש לו לקריאת טקסטים. הם אומרים שמוח האדם מסתגל בצורה מצוינת להקראה פחות טבעית, וכי תלמידים שאינם יכולים לקרוא בעצמם יתרכזו בתוכן עצמו ולא בדקויות ההגייה. אנו מוצאים דוגמה לכך באפליקציית וויז: עניינו העיקרי של הנהג הוא להיעזר באפליקציה כדי להגיע ליעד באמצעות הדרכה קולית. הגייה בלתי מושלמת – של שמות רחובות למשל – היא משנית עבורו.
תלמידים שמתקשים לקרוא בעזרת העיניים מִתרגלים עם הזמן לקול של אפליקציית ההקראה, בין אם הוא רובוטי או טבעי, ומפתחים את היכולת להשלים ולתקן בראשם הגייה שגויה, בדומה לתלמידים הקוראים בעיניים והמתקנים בראשם מילים שקראו באופן שגוי, לפי ההקשר התוכני.


מהירות ההקראה חשובה יותר
מעבר לסוגיית איכות הקול, קיימת סוגיה חשובה אף יותר והיא מהירות ההקראה והיכולת לשנות אותה בהתאם לצרכי המאזין. מהירות הקראה נכונה היא קריטית ביותר, כיוון שהיא מאפשרת למאזין להבין ולזכור את התוכן המוקרא בצורה מיטבית, בהתאם לרמת הריכוז שלו, ליכולות הזיכרון שלו, ולמהירות החשיבה שלו. לרוב יגביר המאזין את מהירות ההקראה ביחס למהירות ברירת המחדל של האפליקציה. כאשר מהירות ההקראה תואמת את המהירות הטבעית של המאזין, איכות הקול הופכת משנית ואפליקציית ההקראה הופכת לכלי יעיל, נוח, ורב ערך.


קולות רובוטיים וטבעיים

נודה שהקול הרובוטי יכול להיות מציק, במיוחד כשמאזינים לטקסטים ארוכים מאוד. אף כי ניתן להבין את התוכן המוקרא, חסרים עומק רגשי והבעה אנושית, דבר שיכול להקשות על המאזין לשקוע בתוכן ולגלות בו עניין לאורך זמן.
הבת שלי, אוריין, אוהבת במיוחד את הקול הטבעי "הילה", שנכלל במוצרי מיקרוסופט כמו Word ודפדפן Edge. היא נעזרת בו לקרוא מאמרים וכתבות שונות ואפילו מעדיפה את השימוש בו להקראת תכנים אלה על פני הקראה של בן משפחה. אבל כשמדובר בקריאת ספרים, בהם קיימת מעורבות רגשית, היא לא תיעזר בקול "הילה" אלא תתעקש על הקראה אנושית: בספרייה לעיוורים, ב-iCast, ב-YouTube, וכו'.


מבחר הקולות העבריים
עתידם של הקולות העבריים נראה מבטיח. ככל שעובר הזמן אנו עדים לקולות הדומים יותר ויותר לקול האנושי. להלן הקולות העבריים הקיימים היום בשוק:

קולאיכותאפליקציה
אסףרובוטי
Word בגרסאות ישנות
הקראה ב-Windows
תוסף Read Aloud להקראה ב-Google Docs

כרמיתחצי רובוטיעלמה רידר, iPhone
Google StandardטבעיGoogle TTS, תוסף Read Aloud, ו- Google Chrome בנייד
Google TranslateטבעיGoogle Translate, Google Lens
SiriטבעיiPhone
Google Assistantטבעי מאודGoogle Assistant
הילה, אבריטבעי מאודMicrosoft Edge, Microsoft Office 365, Hebrew TTS, Natural Reader
הערות
* כתובת הדואר האלקטרוני לא תוצג באתר.