Google Gemini 2.0 odpala niezłą petardę dla wszystkich użytkowników

PIerwsza z nowości to tzw. Canvas – interaktywna przestrzeń do pisania i edytowania dokumentów oraz kodu w czasie rzeczywistym, z natychmiastowym podglądem wprowadzanych zmian. Dostępna jest poprzez wybranie opcji “Canvas” bezpośrednio na pasku prompta. Funkcja ułatwia tworzenie pierwszych szkiców wysokiej jakości, oferuje sugestie ułatwiające dopracowywanie treści. Zawiera też narzędzia do szybkiej edycji, pozwalające na dostosowanie tonu, długości i formatowania zaznaczonych fragmentów tekstu (np. zmiana akapitu na bardziej zwięzły, profesjonalny lub nieformalny). Oczywiście w Canvas można też kodować i prowadzić bardziej zaawansowane operacje.

Narzędzie usprawnia proces przekształcania pomysłów w działające prototypy aplikacji internetowych, skryptów w Pythonie, gier i innych interaktywnych aplikacji. Umożliwia generowanie i przeglądanie kodu HTML/React oraz podgląd efektów pracy w czasie rzeczywistym (np. formularza subskrypcji mailowej). Ułatwia iteracyjne wprowadzanie zmian w kodzie z pomocą modeli z rodziny Gemini. Skupia proces tworzenia, edycji i udostępniania kodu w jednym miejscu, eliminując potrzebę przełączania się między wieloma aplikacjami. Treści stworzone w Canvas można łatwo wyeksportować do Dokumentów Google jednym kliknięciem, co ułatwia współpracę z innymi osobami.

Narzędzie Canvas w akcji. Mogę podejrzeć formularz, jaki właśnie stworzyłem na potrzeby swojego projektu.

Nie da się ukryć, że Canvas mocno przypomina funkcję o tej samej nazwie, która zadebiutowała w rodzinie modeli językowych OpenAI już w październiku ubiegłym roku. Zaletę Google stanowi w tym wypadku nieco szerszy ekosystem aplikacji oraz narzędzi, z którymi Canvas będzie można spiąć. Na obecnym etapie integracja będzie działać tylko w jedną stronę, ale docelowo ma być dwustronna. Jest jeszcze jedna istotna przewaga nad konkurencją – dostępność. Canvas od OpenAI jest dostępna tylko dla użytkowników z subskrypcją ChatGPT Plus lub wyższą. Zbliżony pomysł o nazwie Artifacts ma również w swojej ofercie Anthropic i rodzina modeli językowych Claude. Tam działa to w nieco inny sposób, ale nadal pozostaje dostępne również dla użytkowników bez abonamentu.

Narzędzie Artifacts w Claude 3.7 od Anthropic.

Czytaj też: Zaskakująca funkcja Google Gemini 2.0 Flash. Dajcie to ludziom, a zawsze na coś wpadną

Nie zapominam o drugiej ciekawej funkcji, jaką stanowią podsumowania audio, dostępne już od pewnego czasu w narzędziu NotebookLM i tam właśnie zyskały dużą popularność. Rozwiązanie ułatwia zrozumienie złożonych informacji zawartych w dokumentach, slajdach i raportach badawczych. Przekształca przesłane pliki w angażujące podcasty, prowadzone przez dwóch wirtualnych prowadzących. Generuje dyskusję, która podsumowuje materiał, wskazuje powiązania między tematami i przedstawia różne punkty widzenia. Odsłuchiwanie notatek z zajęć, artykułów naukowych, wątków e-maili i raportów Deep Research w formie audio to zdecydowane ułatwienie w procesie nauki. Na koniec tylko łyżeczka dziegciu – podsumowania są nadal dostępne wyłącznie w języku angielskim. Więcej języków? Rzekomo wkrótce.