Jesteście gotowi na Gemini Flash 2.5? Wersja eksperymentalna już w aplikacji

Kluczową innowacją Gemini 2.5 Flash jest jego w pełni hybrydowy model rozumowania. Oznacza to, że deweloperzy mają możliwość włączania i wyłączania trybu “myślenia” (reasoning) oraz ustawiania “budżetu myślenia” (thinking budget) w celu optymalizacji równowagi między jakością, kosztem i opóźnieniem. Nawet z wyłączonym myśleniem, model oferuje lepszą wydajność w porównaniu do 2.0 Flash. Użytkownicy mają bardzo precyzyjną kontrolę nad procesem myślenia Gemini 2.5 Flash. Mogą zarządzać zasobami obliczeniowymi przeznaczonymi na rozumowanie, włączając/wyłączając tryb myślenia i ustawiając wspomniany wcześniej “thinking budget” liczony w tokenach (do poziomu około 25 tys.). Co istotne, jeśli budżet myślenia nie zostanie ustawiony, model nadal będzie w stanie ocenić poziom skomplikowania zadania i ustawić do niego swój poziom myślenia.

Gemini 2.5 Flash jest multimodalny, a więc obsługuje różnorodne typy danych wejściowych, w tym tekst, audio, obrazy i wideo. Imponująca jest również wielkość okna kontekstowego, wynosząca do miliona tokenów. Model jest dostępny w wersji zapoznawczej poprzez Gemini API w Google AI Studio i Vertex AI, ale nie tylko tam. Mogą go sprawdzić również wszyscy użytkownicy aplikacji Gemini, gdzie można go używać z nowymi funkcjami, takimi jak Canvas (oczywiście bez tak dokładnej regulacji). Bardziej zaawansowanym warto polecić wspomnianą platformą Google AI Studio, które oferuje hojny darmowy pakiet startowy, umożliwiając wypróbowanie modelu. Można tam również łatwo uzyskać klucz API i eksperymentować z ustawieniami, takimi jak budżet myślenia i włączenie wyszukiwania Google.

Czytaj też: Zapłacisz za Gemini Advanced? AI od Google wprowadza możliwość generowania wideo

A jak wygląda kwestia kosztów, gdybyście chcieli się poważniej pobawić Gemini Flash 2.5? Ceny są nieco wyższe niż w Gemini 2.0 Flash – 0,15 dolara za milion tokenów wejściowych i 0,6 dolara za milion tokenów wyjściowych (bez myślenia) lub 3,5 dolara z włączonym myśleniem. To wciąż bardzo konkurencyjne ceny w porównaniu z innymi modelami. O ile Gemini 2.0 Flash jest tańszy, z niższymi kosztami za tokeny, o tyle nie oferuje opcji rozumowania, co może ograniczać jego zastosowanie w bardziej wymagających scenariuszach.