Jak Google wykorzystuje mechanizmy rozpoznawania wzorców

Jak Google wykorzystuje mechanizmy rozpoznawania wzorców do interpretacji zawartości obrazów?

Komputery nie „widzą” zdjęć ani filmów tak samo jak ludzie. Kiedy patrzymy na zdjęcie, widzimy naszą najlepszą przyjaciółkę stojącą przed domem. Z punktu widzenia komputera to samo zdjęcie jest tylko zbiorem danych, które może zinterpretować jako kształty oraz informacje dotyczące wartości poszczególnych kolorów. Pomimo innej niż ludzka reakcji na „widok” zdjęcia komputer można tak „wyszkolić”, że będzie rozpoznawać określone wzorce kolorów i kształtów. Na przykład można nauczyć komputer rozpoznawania wspólnych wzorców kształtów i kolorów, z których składa się cyfrowy obraz ludzkiej twarzy. Ten proces nosi nazwę wykrywania twarzy – jest to technologia, która pomaga Google chronić prywatność w serwisach takich jak Street View. Za pomocą komputerów wykrywa się i zamazuje twarze ludzi, którzy znaleźli się w pobliżu przejeżdżających samochodów Street View i zostali uwiecznieni na fotografiach. Technologia znalazła również zastosowanie w usługach takich jak Zdjęcia Google+. Wskazuje ona zdjęcia oraz nagrania wideo, na których mogą znajdować się ludzkie twarze, umożliwiając dodanie do nich tagów. Wykrywanie twarzy nie informuje o tym, czyją twarz wykryto, ale pomaga zlokalizować twarze na posiadanych zdjęciach.

Bardziej zaawansowane użycie technologii rozpoznawania wzorców stosowanej do wykrywania twarzy może pomóc komputerowi zrozumieć charakterystyczne cechy wykrywanych twarzy. Na przykład mogą istnieć pewne wzorce sugerujące, że na twarzy jest broda lub okulary, lub że twarz posiada określone cechy. Tego typu informacji może używać na przykład funkcja redukcji efektu czerwonych oczu; mogą one również służyć do uzyskiwania zabawnych efektów, np. do umieszczenia wąsów lub monokla w odpowiednim miejscu twarzy podczas rozmów na Hangoucie.

Oprócz technologii wykrywania twarzy niektóre funkcje Google wykorzystują również mechanizmy rozpoznawania twarzy. Rozpoznawanie twarzy, jak sama nazwa wskazuje, może pomóc komputerowi porównywać twarze znane z twarzami nowymi pod kątem podobieństwa. Mechanizm ten umożliwia na przykład zasugerowanie użytkownikom funkcji rozpoznawania twarzy osób, które można by oznaczyć tagiem na przesyłanym i udostępnianym zdjęciu lub nagraniu wideo. Więcej informacji na ten temat zawiera artykuł Rozpoznawanie twarzy w Centrum pomocy Google+.

Jak działa wyszukiwanie głosowe?

Wyszukiwanie głosowe umożliwia głosowe podawanie hasła do wyszukania w kliencie wyszukiwarki Google zainstalowanym na urządzeniu zamiast jego wpisywania. Mechanizm wykorzystuje rozpoznawanie wzorców do przekształcania wymawianych słów na tekst pisany. W przypadku każdego zapytania głosowego użytego w ramach funkcji wyszukiwania głosowego przechowujemy informacje o języku, w którym zostało ono zadane i kraju użytkownika. Przechowujemy również brzmienie zapytań oraz naszą interpretację ich znaczenia. Gromadzone dane nie zawierają identyfikatora konta Google, jeśli użytkownik nie wyrazi na to zgody. Nie wysyłamy żadnych brzmień do Google, chyba że użytkownik zgłosi zamiar użycia funkcji wyszukiwania głosowego (na przykład naciśnie ikonę mikrofonu na pasku szybkiego wyszukiwania lub na klawiaturze wirtualnej bądź powie „Google” w przypadku, gdy pasek szybkiego wyszukiwania zawiera informację o dostępności funkcji wyszukiwania głosowego). Brzmienie zapytań jest wysyłane do serwerów Google w celu rozpoznania wypowiadanych słów. Przechowujemy brzmienia zapytań w celu ulepszania naszych usług, w tym uczenia naszego systemu lepszego rozpoznawania prawidłowych zapytań.