Додому Najnowsze wiadomości i artykuły Google AI i pisanie głosowe: krok w kierunku płynnej komunikacji

Google AI i pisanie głosowe: krok w kierunku płynnej komunikacji

Pomysł używania głosu do sterowania tekstem bez użycia rąk jest kuszący, szczególnie w ruchliwych środowiskach miejskich, gdzie ciągłe patrzenie na telefon jest niepraktyczne. Telefony Pixel firmy Google przodują w tej dziedzinie, oferując najnowocześniejsze możliwości wprowadzania głosu, ale technologia pozostaje niedoskonała, zapewniając w równym stopniu wygodę i frustrację.

Bieżący stan wprowadzania głosowego

Nowoczesne systemy zamiany mowy na tekst wyszły poza prostą transkrypcję. Aktualne wersje na urządzeniach Pixel 6 i nowszych umożliwiają bezpośrednią edycję głosową : użytkownicy mogą powiedzieć „usuń ostatnie słowo” lub „wyczyść”, aby dostosować swoje posty w czasie rzeczywistym. Pixel 8 i nowsze modele wprowadzają funkcję „poprawnego” – narzędzie oparte na sztucznej inteligencji, które poprawia błędnie wymówione słowa jednym dotknięciem. Nowe modele pozwalają nawet użytkownikom szkolić sztuczną inteligencję w rozpoznawaniu własnej pisowni.

Jednakże doświadczenia pozostają niespójne. Czasami sztuczna inteligencja ma trudności z rozróżnieniem poleceń przeznaczonych do edycji od słów przeznaczonych do raportowania. Ta niezawodność zmusza użytkowników do wstrzymywania, ręcznej edycji i eliminacji części wygody zapewnianej przez wprowadzanie głosowe.

Moc sztucznej inteligencji na urządzeniu

Google przypisuje te rozbieżności temu, że telefony wykorzystują małe, lokalne modele AI, a nie pełną moc systemów chmurowych. Takie podejście priorytetowo traktuje szybkość i prywatność, ale ogranicza dokładność. Ta różnica uwydatnia zasadniczy kompromis : potężna sztuczna inteligencja wymaga znacznych zasobów obliczeniowych, a urządzenia mobilne mają nieodłączne ograniczenia.

Mimo to Google nadal udoskonala system. Zaangażowanie firmy w sztuczną inteligencję jest widoczne w jej strategicznym ukierunkowaniu: podczas gdy rywale tacy jak Samsung i Motorola konkurują pod względem specyfikacji sprzętu, Google wykorzystuje oprogramowanie i sztuczną inteligencję jako kluczowe wyróżniki.

Dlaczego to ma znaczenie

Dążenie do perfekcyjnego wprowadzania głosu to nie tylko kwestia wygody. Chodzi o przyszłość interakcji człowiek-komputer. Jeśli sztuczna inteligencja będzie w stanie niezawodnie przekładać myśli na tekst, odblokuje potencjał dostępności, produktywności i bezproblemowej komunikacji w świecie coraz bardziej zależnym od interfejsów cyfrowych.

W rzeczywistości funkcje te raczej się uzupełniają niż przekształcają. Konsumenci często postrzegają ulepszenia oparte na sztucznej inteligencji jako stopniowe ulepszenia, a nie radykalne zmiany w sposobie interakcji z technologią. Aby naprawdę osiągnąć przełomy, sztuczna inteligencja musi zapewniać spójne, intuicyjne doświadczenie, które będzie tak naturalne jak rozmowa.

Jak włączyć ulepszone pisanie głosowe na Pixelu

Aby rozpocząć, wykonaj następujące kroki:

  1. Otwórz aplikację Wiadomości.
  2. Wybierz kontakt.
  3. Naciśnij ikonę czterech kwadratów na klawiaturze.
  4. Przejdź do Ustawienia > Wprowadzanie głosowe.
  5. Włącz zaawansowane funkcje wprowadzania głosowego.

Po włączeniu możesz używać poleceń głosowych, takich jak:

  • „Usuń ostatnie słowo”
  • „Jasne”
  • „Napraw” (Pixel 8 i nowsze modele)
  • „Wyślij”

Funkcja „napraw”, dostępna wyłącznie w języku angielskim (USA), zapewnia poprawki oparte na sztucznej inteligencji. Aby uzyskać bardziej szczegółową edycję, użytkownicy Pixela 8 mogą również powiedzieć „Cofnij”, aby cofnąć zmiany.

Wniosek

Wprowadzanie głosowe oparte na sztucznej inteligencji firmy Google to obiecujący krok w kierunku płynnej komunikacji, pozostaje jednak technologią niedoskonałą. Zaangażowanie firmy w rozwój sztucznej inteligencji, zwłaszcza za pośrednictwem urządzeń Pixel, będzie miało kluczowe znaczenie dla wypełnienia luki między obecnymi ograniczeniami a pełnym potencjałem kontroli tekstu bez użycia rąk.

Exit mobile version