Ta funkcja w Gemini Live powinna być od początku. Na szczęście Google już nad nią pracuje

Google nie ustaje w ulepszaniu Gemini, stale umacniając swoją pozycję na rynku sztucznej inteligencji. W ostatnim czasie aplikacja na urządzeniach mobilnych zyskała naprawdę sporo nowości, a kolejne są już w przygotowaniu. Teraz odkryto następną zmianę, jaka powinna zawitać do Gemini Live w najbliższym czasie. Choć wydaje się niepozorna, to wielu osobom może naprawdę ułatwić życie.
Gemini
Gemini

Gemini Live dostanie nowy przycisk. Jedno kliknięcie i udzielane w trybie konwersacyjnym odpowiedzi staną się bardziej przystępne dla wszystkich

Latem 2024 roku gigant z Mountain View zaprezentował nowy model sztucznej inteligencji, którego celem nie jest wykonywanie zadań, bo to przecież robi już standardowa wersja Gemini i różne modele w niej zawarte. Gemini Live jest natomiast konwersacyjnym modelem, z którym możemy sobie po prostu pogadać. Wybieramy pasujący nam głos, a potem zaczynamy rozmowę głosową na dowolny temat. Wersja Live, podobnie jak prawdziwy rozmówca, ma zapamiętywać nasze słowa i rozumieć ich kontekst, choć jak to zwykle z AI bywa, nie oczekujmy tego na poziomie ludzki. Mimo wszystko model może się przydać i wielu użytkowników chętnie z niego korzysta.

Czytaj też: Darmowa wersja Gemini potrafi teraz jeszcze więcej

W połowie stycznia Google dodał też obsługę języka polskiego, czego do tej pory tam brakowało, więc także Polacy mogą już swobodnie rozmawiać ze sztuczną inteligencją. Jednak pomimo ciągłego poszerzania wsparcia dla kolejnych języków, gigant zdawał się zapomnieć o innej grupie użytkowników – tych z wadami słuchu. Choć na smartfonach mamy dostępne różne ułatwienia dostępu, a Gemini Live oferuje w obecnej wersji transkrypcje rozmowy, to dopiero po opuszczeniu trybu mówienia. Musimy więc zakończyć ten etap rozmowy, by zobaczyć napisane odpowiedzi. Jeśli mamy problem ze słuchem lub po prostu przebywamy w bardzo hałaśliwym otoczeniu, to rozwiązanie w takiej formie jest nieprzydatne, bo nie spełnia swojego podstawowego zadania – swobodnej konwersacji.

Czytaj też: Gemini zyskuje nowe eksperymentalne modele. Już można niektóre z nich wypróbować

Na szczęście to powinno się wkrótce zmienić, ponieważ w najnowszej wersji beta aplikacji Google (wersja 16.6.23) pojawiły się ciągu znaków, sugerujące, że wkrótce Gemini Live dostanie nowy przycisk „Caption”. Po jego wciśnięciu model będzie generował napisy w czasie rzeczywistym, więc słuchanie głosowych odpowiedzi Live nie będzie już potrzebne, bo wszystko zostanie wyświetlone w formie napisów na ekranie.

Napisy na żywo w Gemini Live | Źródło: Android Authority

Znaleziska dokonał serwis Android Authority i podzielił się zrzutami ekranu, jak to wygląd w praktyce – przycisk pojawia się w prawym górnym rogu, natomiast napisy na żywo wyświetlane są czytelnie na środku ekranu.

Ustawienia napisów na żywo w Gemini Live | Źródło: Android Authority

Co istotne, w ustawieniach Gemini dostępna będzie też odpowiednia opcja „Preferencje napisów”, w której będziemy mogli dostosować styl i rozmiar podpisów, poprzez przekierowanie nas do ustawień systemowych. W testach przeprowadzonych przez serwis funkcja działała bez zarzutów i chociaż nie jest dostępna w bieżącej wersji beta, wydaje się, że jest już gotowa na szersze wdrożenie. Nawet jeśli jeszcze nie w stabilnej wersji Gemini Live, to przynajmniej w wydaniu beta.

Czytaj też: OpenAI chce zdetronizować Wyszukiwarkę Google. ChatGPT z kolejnym ulepszeniem

To dobrze, że Google pamięta o ułatwieniach dla osób z wadami słuchu także w swoich modelach sztucznej inteligencji. Jak jednak wspomniałam, ostatnio Gemini zyskało już bardzo dużo nowości, ponieważ pojawiły się kolejne eksperymentalne modele, w tym jeden dostępny z poziomu darmowej wersji. Oprócz tego Gemini na Androidzie zyskało funkcję Deep Research, która wyręczy nas w żmudnych badaniach i analizowaniu dużej ilości danych. Ponadto darmowi użytkownicy zyskali też możliwość przesyłania do Gemini nowych rodzajów plików – tekstowych i tych z Dysku – do ich analizy przez AI. Wcześniej była to opcja zarezerwowana jedynie dla Gemini Advanced.