Google Gemini 2.0 odpala niezłą petardę dla wszystkich użytkowników

Wyścig narzędzi do generatywnej sztucznej inteligencji trwa, a stawkę po raz kolejny podnosi Google ze swoją platformą Gemini. Tym razem gigant wprowadza dwie nowe funkcje, a jedna z nich pochodzi wprost ze znakomitego, aczkolwiek dość niszowego narzędzia Google. Drugie natychmiast skojarzy się niektórym z rozwiązaniami konkurencji (m.in. Claude od Anthropic czy ChatGPT od OpenAI). Co chyba najbardziej cieszy, to fakt, że obie nowości są właśnie wdrażane globalnie dla subskrybentów Gemini i Gemini Advanced we wszystkich językach, w których dostępne są aplikacje z Gemini. Za ich używanie nie będzie trzeba więc płacić ani grosza.
Google Gemini 2.0 odpala niezłą petardę dla wszystkich użytkowników

PIerwsza z nowości to tzw. Canvas – interaktywna przestrzeń do pisania i edytowania dokumentów oraz kodu w czasie rzeczywistym, z natychmiastowym podglądem wprowadzanych zmian. Dostępna jest poprzez wybranie opcji “Canvas” bezpośrednio na pasku prompta. Funkcja ułatwia tworzenie pierwszych szkiców wysokiej jakości, oferuje sugestie ułatwiające dopracowywanie treści. Zawiera też narzędzia do szybkiej edycji, pozwalające na dostosowanie tonu, długości i formatowania zaznaczonych fragmentów tekstu (np. zmiana akapitu na bardziej zwięzły, profesjonalny lub nieformalny). Oczywiście w Canvas można też kodować i prowadzić bardziej zaawansowane operacje.

Narzędzie usprawnia proces przekształcania pomysłów w działające prototypy aplikacji internetowych, skryptów w Pythonie, gier i innych interaktywnych aplikacji. Umożliwia generowanie i przeglądanie kodu HTML/React oraz podgląd efektów pracy w czasie rzeczywistym (np. formularza subskrypcji mailowej). Ułatwia iteracyjne wprowadzanie zmian w kodzie z pomocą modeli z rodziny Gemini. Skupia proces tworzenia, edycji i udostępniania kodu w jednym miejscu, eliminując potrzebę przełączania się między wieloma aplikacjami. Treści stworzone w Canvas można łatwo wyeksportować do Dokumentów Google jednym kliknięciem, co ułatwia współpracę z innymi osobami.

Nie da się ukryć, że Canvas mocno przypomina funkcję o tej samej nazwie, która zadebiutowała w rodzinie modeli językowych OpenAI już w październiku ubiegłym roku. Zaletę Google stanowi w tym wypadku nieco szerszy ekosystem aplikacji oraz narzędzi, z którymi Canvas będzie można spiąć. Na obecnym etapie integracja będzie działać tylko w jedną stronę, ale docelowo ma być dwustronna. Jest jeszcze jedna istotna przewaga nad konkurencją – dostępność. Canvas od OpenAI jest dostępna tylko dla użytkowników z subskrypcją ChatGPT Plus lub wyższą. Zbliżony pomysł o nazwie Artifacts ma również w swojej ofercie Anthropic i rodzina modeli językowych Claude. Tam działa to w nieco inny sposób, ale nadal pozostaje dostępne również dla użytkowników bez abonamentu.

Narzędzie Artifacts w Claude 3.7 od Anthropic.

Czytaj też: Zaskakująca funkcja Google Gemini 2.0 Flash. Dajcie to ludziom, a zawsze na coś wpadną

Nie zapominam o drugiej ciekawej funkcji, jaką stanowią podsumowania audio, dostępne już od pewnego czasu w narzędziu NotebookLM i tam właśnie zyskały dużą popularność. Rozwiązanie ułatwia zrozumienie złożonych informacji zawartych w dokumentach, slajdach i raportach badawczych. Przekształca przesłane pliki w angażujące podcasty, prowadzone przez dwóch wirtualnych prowadzących. Generuje dyskusję, która podsumowuje materiał, wskazuje powiązania między tematami i przedstawia różne punkty widzenia. Odsłuchiwanie notatek z zajęć, artykułów naukowych, wątków e-maili i raportów Deep Research w formie audio to zdecydowane ułatwienie w procesie nauki. Na koniec tylko łyżeczka dziegciu – podsumowania są nadal dostępne wyłącznie w języku angielskim. Więcej języków? Rzekomo wkrótce.