Pomysł używania głosu do sterowania tekstem bez użycia rąk jest kuszący, szczególnie w ruchliwych środowiskach miejskich, gdzie ciągłe patrzenie na telefon jest niepraktyczne. Telefony Pixel firmy Google przodują w tej dziedzinie, oferując najnowocześniejsze możliwości wprowadzania głosu, ale technologia pozostaje niedoskonała, zapewniając w równym stopniu wygodę i frustrację.
Bieżący stan wprowadzania głosowego
Nowoczesne systemy zamiany mowy na tekst wyszły poza prostą transkrypcję. Aktualne wersje na urządzeniach Pixel 6 i nowszych umożliwiają bezpośrednią edycję głosową : użytkownicy mogą powiedzieć „usuń ostatnie słowo” lub „wyczyść”, aby dostosować swoje posty w czasie rzeczywistym. Pixel 8 i nowsze modele wprowadzają funkcję „poprawnego” – narzędzie oparte na sztucznej inteligencji, które poprawia błędnie wymówione słowa jednym dotknięciem. Nowe modele pozwalają nawet użytkownikom szkolić sztuczną inteligencję w rozpoznawaniu własnej pisowni.
Jednakże doświadczenia pozostają niespójne. Czasami sztuczna inteligencja ma trudności z rozróżnieniem poleceń przeznaczonych do edycji od słów przeznaczonych do raportowania. Ta niezawodność zmusza użytkowników do wstrzymywania, ręcznej edycji i eliminacji części wygody zapewnianej przez wprowadzanie głosowe.
Moc sztucznej inteligencji na urządzeniu
Google przypisuje te rozbieżności temu, że telefony wykorzystują małe, lokalne modele AI, a nie pełną moc systemów chmurowych. Takie podejście priorytetowo traktuje szybkość i prywatność, ale ogranicza dokładność. Ta różnica uwydatnia zasadniczy kompromis : potężna sztuczna inteligencja wymaga znacznych zasobów obliczeniowych, a urządzenia mobilne mają nieodłączne ograniczenia.
Mimo to Google nadal udoskonala system. Zaangażowanie firmy w sztuczną inteligencję jest widoczne w jej strategicznym ukierunkowaniu: podczas gdy rywale tacy jak Samsung i Motorola konkurują pod względem specyfikacji sprzętu, Google wykorzystuje oprogramowanie i sztuczną inteligencję jako kluczowe wyróżniki.
Dlaczego to ma znaczenie
Dążenie do perfekcyjnego wprowadzania głosu to nie tylko kwestia wygody. Chodzi o przyszłość interakcji człowiek-komputer. Jeśli sztuczna inteligencja będzie w stanie niezawodnie przekładać myśli na tekst, odblokuje potencjał dostępności, produktywności i bezproblemowej komunikacji w świecie coraz bardziej zależnym od interfejsów cyfrowych.
W rzeczywistości funkcje te raczej się uzupełniają niż przekształcają. Konsumenci często postrzegają ulepszenia oparte na sztucznej inteligencji jako stopniowe ulepszenia, a nie radykalne zmiany w sposobie interakcji z technologią. Aby naprawdę osiągnąć przełomy, sztuczna inteligencja musi zapewniać spójne, intuicyjne doświadczenie, które będzie tak naturalne jak rozmowa.
Jak włączyć ulepszone pisanie głosowe na Pixelu
Aby rozpocząć, wykonaj następujące kroki:
- Otwórz aplikację Wiadomości.
- Wybierz kontakt.
- Naciśnij ikonę czterech kwadratów na klawiaturze.
- Przejdź do Ustawienia > Wprowadzanie głosowe.
- Włącz zaawansowane funkcje wprowadzania głosowego.
Po włączeniu możesz używać poleceń głosowych, takich jak:
- „Usuń ostatnie słowo”
- „Jasne”
- „Napraw” (Pixel 8 i nowsze modele)
- „Wyślij”
Funkcja „napraw”, dostępna wyłącznie w języku angielskim (USA), zapewnia poprawki oparte na sztucznej inteligencji. Aby uzyskać bardziej szczegółową edycję, użytkownicy Pixela 8 mogą również powiedzieć „Cofnij”, aby cofnąć zmiany.
Wniosek
Wprowadzanie głosowe oparte na sztucznej inteligencji firmy Google to obiecujący krok w kierunku płynnej komunikacji, pozostaje jednak technologią niedoskonałą. Zaangażowanie firmy w rozwój sztucznej inteligencji, zwłaszcza za pośrednictwem urządzeń Pixel, będzie miało kluczowe znaczenie dla wypełnienia luki między obecnymi ograniczeniami a pełnym potencjałem kontroli tekstu bez użycia rąk.
