Google Gemini zapuszcza się coraz dalej. AI będzie podglądać ekran i otoczenie

Wpuszczamy generatywną sztuczną inteligencję coraz głębiej do swojego realnego świata. Niech za przykład posłużą dwie nowości w Google Gemini, które wkrótce trafi do abonentów Gemini Advanced w wersji dla Androida, przy okazji targów MWC 2025 w Barcelonie. Chodzi o zapowiadane już jakiś czas temu rozszerzenie Gemini Live, a więc funkcji umożliwiającej swobodną głosową konwersację z chatbotem. Już w sierpniu 2024 roku mogliśmy zobaczyć zwiastun tego, co właśnie nadeszło, a więc możliwości w zakresie rozpoznawania zawartości ekranu, a nawet bezpośredniego otoczenia użytkownika za pomocą kamer wbudowanych w telefon. Brzmi jednocześnie fascynująco i przerażająco.
Google Gemini zapuszcza się coraz dalej. AI będzie podglądać ekran i otoczenie

Gemini Live to w zasadzie pełnoprawny asystent AI, który porozumiewa się z użytkownikiem w płynny głosowy sposób. Oczywiście możemy go też spytać o to, co jest na zdjęciu, które wrzucimy do konwersacji, ale na tym możliwości chatbota się nie kończą. Pierwsza z nowości zapowiadanych już jakiś czas temu przy okazji dorocznych konferencji Google I/O to funkcja Screenshare. Chodzi o to, że w dowolnym momencie możemy poprosić Google Gemini o pomoc w zakupach, pozwalając mu zajrzeć na ekran smartfonu, jak ma to miejsce na załączonym klipie wideo. Chatbot pytany o opinię podpowiada dodatkowe elementy ubioru pasujące do spodni widocznych na ekranie.

Druga z funkcji korzysta z kamer wbudowanych w telefon. Google opublikował film pokazujący nową funkcję wideo na żywo w akcji. Osoba zajmująca się tworzeniem ceramiki pyta Gemini Live, jakie szkliwa poleciłby do nowo wypalanych wazonów, dążąc do “nowoczesnego wyglądu z połowy wieku”. Oczywiście mamy tu do czynienia z odpowiednio spreparowanym materiałem marketingowym, więc należy go traktować z przymrużeniem oka, ale ciągłość kontekstowa jest tutaj imponująca, gdy kamera się porusza. Nowość pojawia się na horyzoncie niedługo po poprzednich dużych ogłoszeniach związanych z Gemini 2.0 Pro oraz eksperymentalną wersją Gemini 2.0 Flash, który wykazuje dodatkowe zdolności w zakresie rozumowania.

Czytaj też: Dzięki tej nowej funkcji Gemini będzie znał nas jeszcze lepiej

Warto przypomnieć, że Google postanowił niedawno wprowadzić nową funkcję, która sprawi, że Gemini zapamięta różne szczegóły naszych konwersacji, ale to od nas będzie zależeć jakie. Dzięki temu przysłowiowy wilk będzie syty, a owca również pozostanie sama, bo chatbot nie zapamięta jakichś jednorazowych rzeczy, a jedynie to, co mu każemy. Do tego będzie służyć opcja „Zapisane informacje”, dostępna w menu ukrytym za naszym zdjęciem w aplikacji. Pozwoli ona podać Gemini ważne wytyczne, do których sztuczna inteligencja będzie się później stosować.