Oto Gemini 2.5 Pro. Google wprowadza nas w nową erę sztucznej inteligencji

Gemini 2.5 Pro – najinteligentniejszy model AI, jaki do tej pory powstał

Gigant z Mountain View kontynuuje rozwój Gemini i najnowszym tego przejawem jest kolejny model o nazwie Gemini 2.5 Pro. Jak twierdzi producent, może on „analizować informacje, wyciągać logiczne wnioski, uwzględniać kontekst i niuanse oraz podejmować świadome decyzje”. Nowy model ma cechować się zdolnością do „myślenia” przed udzieleniem odpowiedzi, za co odpowiadają mechanizmy rozumowania zintegrowane bezpośrednio w architekturze modelu. Te funkcjonalności, wcześniej znane jako „Flash Thinking” w Gemini 2.0, stały się teraz integralną częścią wszystkich modeli 2.5, a cały „proces myślowy” modelu możemy śledzić za pomocą opcji „Pokaż myślenie” w aplikacji.

W dziedzinie sztucznej inteligencji, zdolność systemu do ‘rozumowania’ wykracza poza samą klasyfikację i przewidywanie. Odnosi się do jego umiejętności analizowania informacji, wyciągania logicznych wniosków, uwzględniania kontekstu i niuansów oraz podejmowania świadomych decyzji.

Czytaj też: Chatboty AI a zdrowie psychiczne. Czy grozi nam kolejny kryzys?

Zagłębiając się bardziej w szczegóły, Google zapewnia, że jeśli chodzi o testy matematyczno-przyrodnicze, takie jak GPQA i AIME 2025, Gemini 2.5 Pro przewyższa inne modele, uzyskując rekordowe 18,8% w Humanity’s Last Exam. Model jest również o wiele lepszy w kodowaniu niż wersja 2.0 i wyróżnia się „tworzeniem wizualnie atrakcyjnych aplikacji internetowych i aplikacji kodu agentowego, wraz z transformacją kodu i edycją”. Żeby nam to lepiej zobrazować, firma udostępnia wideo demonstracyjne gry, będącej dziełem nowego modelu.

Teraz, dzięki Gemini 2.5, osiągnęliśmy nowy poziom wydajności, łącząc znacząco ulepszony model bazowy z udoskonalonym procesem post-treningu. W przyszłości będziemy wbudowywać te zdolności myślenia bezpośrednio we wszystkie nasze modele, aby mogły radzić sobie z bardziej złożonymi problemami i wspierać jeszcze bardziej zdolnych, świadomych kontekstu agentów — powiedział Koray Kavukcuoglu, CTO Google DeepMind, we wpisie na blogu.

Gemini 2.5 Pro obsługuje również natywną multimodalność, co oznacza, że może przetwarzać i integrować dane z różnych źródeł, takich jak tekst, audio, obrazy, wideo i repozytoria kodu. Oferuje też okno kontekstowe o rozmiarze 1 miliona tokenów, z planami rozszerzenia do 2 milionów.

Potrafi rozumieć obszerne zbiory danych i radzić sobie ze złożonymi problemami pochodzącymi z różnych źródeł informacji, w tym tekstu, audio, obrazów, wideo, a nawet całych repozytoriów kodu.

Czytaj też: Rewolucja w aplikacji Gemini — nowe menu “plus” i funkcje Audio Overwiev

Eksperymentalny model 2.5 Pro jest właśnie udostępniany subskrybentom Gemini Advanced i użytkownikom Google AI Studio, a w kolejnych tygodniach także w Vortex AI. Google planuje też wprowadzić cennik, który umożliwi użytkownikom korzystanie z 2.5 Pro z wyższymi limitami szybkości dla skalowalnego wykorzystania produkcyjnego.