כיצד Google משתמשת בזיהוי תבניות

כיצד Google משתמשת בזיהוי תבניות כדי לפרש תמונות

מחשבים לא יכולים "לראות" תמונות וסרטונים כפי שבני אדם רואים אותם. כשאתה מסתכל על תמונה, אתה עשוי לראות את החברה הכי טובה שלך עומדת לפני הבית שלה. מנקודת המבט של מחשב, אותה תמונה היא פשוט אוסף של נתונים שהוא עשוי לפרש כצורות ומידע לגבי ערכים של צבעים. אמנם מחשב לא יגיב כמוך כאשר אתה מתבונן בתמונה, אך ניתן ללמד אותו לזהות תבניות מסוימות של צבע וצורות. לדוגמה, ניתן ללמד מחשב לזהות את התבניות הנפוצות של צורות וצבעים המרכיבים תמונה דיגיטלית של פרצוף. התהליך הזה מוכר כזיהוי פנים, וזו הטכנולוגיה שעוזרת ל-Google להגן על פרטיותך בשירותים כגון Street View, שבהם מחשבים מנסים לזהות ולאחר מכן לטשטש את הפנים של כל האנשים שעמדו ברחוב כאשר הרכב של Street View נסע בו. זו גם הטכנולוגיה שעוזרת לשירותים כגון תמונות Google+‎ להציע לך לתייג תמונה או סרטון, מאחר שנראה שמופיעים בהם פנים. זיהוי הפנים לא יגיד לך למי שייכים הפנים, אך הוא יכול לעזור לך למצוא את הפנים שמופיעים בתמונות שלך.

אם נתקדם מעט יותר, אותה טכנולוגיה של זיהוי תבניות המפעילה את זיהוי הפנים יכולה לעזור למחשב לפרש את המאפיינים של הפנים שזוהו. לדוגמה, יכולות להיות תבניות מסוימות שמרמזות על כך שהפנים עוטות זקן או חובשות משקפיים, או שהן כוללות תכונות כאלה. מידע כזה יכול לשמש כדי לעזור בתכונות כגון הפחתת עיניים אדומות, או לאפשר לך להוסיף ציורים משעשעים על ידי הוספת שפם או משקפיים במקום הנכון על פניך כאשר אתה נמצא ב-Hangout.

מעבר לטכנולוגיית זיהוי חלקי הפנים, Google משתמשת בזיהוי פנים גם בתכונות מסוימות. זיהוי פנים, כפי שהשם מרמז, יכול לעזור למחשב להשוות פרצופים מוכרים לפרצוף חדש, ולראות אם יש התאמה סבירה או דמיון. לדוגמה, זיהוי פנים עוזר למשתמשים בתכונה 'מצא את הפרצוף שלי' לראות הצעות לגבי אנשים, שהם עשויים לרצות לתייג בתמונה או בסרטון שהם העלו ומעוניינים לשתף. קרא עוד על התכונה 'מצא את הפרצוף שלי' במרכז העזרה של Google+‎.

כיצד פועל חיפוש קולי

חיפוש קולי מאפשר לך לספק שאילתה קולית לאפליקציית לקוח של חיפוש Google במכשיר, במקום להקליד את השאילתה. החיפוש הקולי משתמש בזיהוי תבניות כדי לתעתק מילים מדוברות לטקסט כתוב. עבור כל שאילתה קולית שמבוצעת בחיפוש הקולי, אנחנו מאחסנים את השפה, המדינה, ההגייה ואת הניחוש של המערכת שלנו לגבי מה שנאמר. נתוני האודיו המאוחסנים אינם מכילים את מזהה חשבון Google שלך, אלא אם בחרת אחרת. אנחנו לא שולחים הגיות ל- Google אלא אם ציינת כוונה להשתמש בפונקציית החיפוש הקולי (לדוגמה, לחיצה על סמל המיקרופון בסרגל החיפוש המהיר או במקלדת הווירטואלית, או אמירת "Google" כאשר סרגל החיפוש המהיר מצביע על כך שפונקציית החיפוש הקולי זמינה). אנחנו שולחים את ההגיות לשרתי Google כדי לזהות מה אמרת. אנחנו שומרים את ההגיות כדי לשפר את השירותים שלנו, כולל לימוד המערכת לזהות בצורה טובה יותר את שאילתת החיפוש הנכונה.