הרשומה הנוכחית מהווה חלק מסדרת פוסטים, אשר מפרקת לחתיכות קטנות את מצגת מגמות האינטרנט לשנת 2016 של האנליסטית המוערכת והחכמה Mary Meeker. הפוסט הנוכחי יעסוק בנושא Voice. כיצד פקודות קוליות הופכות להיות לחלק ממרקם החיים שלנו ומשפיעות הלכה למעשה על הדרך שאנחנו כאנשים עושים דברים, ובפועל- איך מפתחים, חברות טכנולוגיה ויזמים שונים משתמשים בכוח של הקול לטובת שינוי ההשפעות על האנשים ועל חייהם.
למי שרוצה להיות חשוף לסדרת הפוסטים המלאה, רצ”ב לינק הכולל רשומות נוספות אשר יורדות Drill Down לתוך ורטיקלים ספציפים ומנתחות את הנושא לעומק : Link.
מרי מיקר מציעה לדמיין מחדש את עולם ה-Voice ולבנות היפותזה רעננה על הדרך בה מחשוב ואנשים עושים אינטראקציה אחד עם השני. ישנה אינטראקציה בין מחשוב ואנשים כבר המון שנים (1830-2015)- והאבולוציה של היחסים כללה מגע- Touch שהתפתח לאורך השנים, ועכשיו אנחנו בעידן בו אנחנו עוברים למגע מבוסס קול.
סביבנו מתפתחות כל הזמן פונקציות באמצעות חיפוש קולי או עוזרים דיגיטלים במובייל, כמו כן פיתוחי Internet of Things כמו Echo אשר מאפשרים לאנשים להחזיק בבית עוזר דיגיטלי חכם, שמבצע פעולות עבורנו וזאת בהשען הקול שלנו בלבד.
הנחת היסוד הינה שהשימוש בקול– אמור להיות יותר יעיל בכל הקשור לקבלת אינפוט מהמחשב ולביצוע בפועל של פעולות. זה מאפשר למעשה לעשות את הכל הרבה יותר מהיר, בקלות- בלי מגע יד ובמידי, כמו כן ישנו חיבור מובהק פרסונאלי וקונטקסטואלי לצרכים שלנו.
ליחסים הללו בין מחשוב לאדם– קוראים בשם : Person to Machine או בקיצור- (P2M). כל זאת מתאפשר בזכות העובדה שכוח המחשוב והיכולות של התוכנות צומחות וגדלות ו-Speech Recognition כיכולת הופך להיות ליותר מדויק מ95 אחוז דיוק ל99 אחוז דיוק שזה כבר כמעט כמו להגיד מושלם.
האתגר בניתוח קול הינו לדעת לנתח קולות בסביבה מאוד רועשת ולבודד את האדם הנכון לפעולה הנכונה במבסס זיהוי קולו של המשתמש הספציפי.. זה מוגדר כפי שתוכלו לראות בשקף שנמצא מתחת לפסקה זו כ-Next Frontier היעד הבא. ככל שהטכנולוגיה משתכללת כך גם הדיוק שלה עולה בצורה משמעותית והיכולות מתעצמות כגון- זיהוי מבטאים ספציפים, בידוד המשתמש הנכון לפעולה הנכונה והיכולת כפי שאמרתי לזהות כל זאת בסביבת רעש מורכבת ולא שקטה.
תוכלו להיווכח בהתגברות והתעצמות היכולת– בכל הקשור לזיהוי קולי לאורך השנים במספר פלטפורמות מובילות בין השנים 2013-2015 ולהבין שרמת הדיוק עולה ומגיעה ל90 אחוז פלוס.
לצד השתפרותה של הטכנוולוגיה– ניתן לצפות במגמה מקבילה מצד המשתמשים אשר מאיצים את צמיחתו של הרעיון בשל שימושים מתגברים- הפקטור הראשון שגורם לכך הינו השתפרותה והתיעלותה של הטכנולוגיה כמו כן יכולת הדיוק שלה שלמעשה מייצרת הלכה למעשה שיפור באיכות החיים של האנשים- וכלי אמיתי שעוזר לנו לבצע ולערוך פעולות.
חשוב גם לאמר שעם הזמן אנשים גם נהיים יותר מודעים ליכולות של עוזרים קולים ואין ספק שבד בבד להתפתוחתה של הטכנולוגיה העובדה שאנחנו כאנשים נגישים יותר למובייל ועושים איתו דברים רבים יותר מיום ליום מגבירה הלכה למעשה את השימושים השונים בכלים החכמים שנמצויים כיוטיליטי עבורנו.
החיפוש הקולי בגוגל– גדל פי 35 משנת 2008, ופי 7 מ2010. החיפוש בGoogle מציג ללא ספק שאנשים משתמשים ביכולת לטובת פקודות שונות שהם מעוניינים לערוך ללא שימוש בידיים- זה יכול להיות רלוונטי מאוד לזמן נהיגה, ואין ספק שהחיבוריות בין היכולות הקוליות לעולם התחבורה זו חתונה מנצחת, אבל הרעיון יכול לפגוש אותנו גם במקומות נוספים- במטבח, זמן הכנת אוכל, בטיולים כשאנחנו הולכים ולא רוצים להקליד ועוד.
ההערכות הן שבתוך חמש שנים– עד 2020, לפחות חמישים אחוז מכל החיפושים יהיו באמצעות Image או Voice- חיפוש תמונה או חיפוש קולי.
כפי שאמרתי קודם לכן– הסיבה המרכזית לשימוש בכלי חיפוש קולי, או כלי כפונקציונאליות לפעולות מבוסס קולי- הינה הרצון לשחרר את הידיים ולעשות אינטראקציה ללא צורך בשימוש בהן. אנשים משתמשים בפונקציות של קול בבית, ברכב ועל הדרך. ו-61 אחוז מהאנשים שעונים לשאלה למה להשתמש בכלי של הקול עונים שהם רוצים לשחרר את הידיים שלהם זמן פעולה. 30 אחוז עונים כי זה מייצר תוצאות הרבה יותר מהירות, ו-24 אחוז מעידים כי יש להם בעיה להקליד על מכשירים מסוימיים (נגיד מבוגרים שצריכים להתמודד עם מכשיר סלולר קטן)- וזאת הסיבה לשימוש בפונקציה הקולית.
לאמזון יש פלטפורמה שנועדה עבור מפתחים בשם– Alexa Voice Service כשהרעיון שלה הוא לאפשר פונקציונאליות של ביצוע פעולות מבוסס קול בכל מכשיר, כפי שתוכלו לראות בויזואליזציה מתחת לפסקה זו- הרעיון הוא שהמערכת יכולה להיות רלוונטית לכל סיטואציה- לבית, לרכב ועל הדרך במובייל.
המטרה של המערכת– לייצר גישה לקניות הרבה יותר מהירות ונוחות בAmazon, אינטגרציה לכל סיטואציה ובכל מכשיר המאפשרת גישה מהירה ונוחה עבור משתמשים.
וניתן לראות את החוכמה של אמזון– בתוצאות, חמישה אחוז מהצרכנים של אמזון בארה”ב מחזיקים בEcho, ארבע מיליון יחידות נמכרו מאז ההשקה ב-11.2014.
מילת סיכום. אני חושבת שזהו אחד הנושאים המרתקים ביותר במסמך של מרי מיקר, יכולת רבודה שמשתמשת בצורה טבעית- Native בקול שלנו ודרך הוספת שכבת הקול לעולם של פעולות יוצרת מציאות חדשה. מצידי אמשיך לנתח עבורכם את המחקר המהמם הזה בפוסטים רלוונטים נוספים וכמו תמיד אני מוסיפה את המסמך המקורי במלואו לתחתית הרשומה.