Bard od Google trafił do ludzi. ChatGPT zostanie zdetronizowany?

Jestem na liście oczekujących. Na razie nie jest tak prosto dobić się do tego “wczesnego eksperymentu” – taki przydomek zyskał chatbot Bard od ludzi z Google’a. Nie bez powodu, bo wszystkie duże modele językowe (LLM) do doskonalenia swojego systemu wymagają sygnałów zwrotnych od użytkowników. Na razie łatwiejszą ścieżkę do Barda mają mieszkańcy USA oraz Wielkiej Brytanii, ale używając VPN-a możecie spróbować wbić się na tzw. waitlistę. Google obiecuje stopniowo rozszerzać terytorialnie program testów, więc może i u nas z czasem Bard zacznie być dostępny.

Google otwarcie przyznaje, że Bard może generować błędy, ale stopniowo będzie ich coraz mniej

Chatbot Google’a bazuje na jednej z lekkich wersji modelu językowego z grupy LamDA. Interfejs prezentuje się analogicznie do tego co mogliśmy obserwować w wyszukiwarce Bing, ale za nią stoi inny duży model językowy: GPT-4. Na razie Bard generuje wyłącznie treści angielskojęzyczne, ale daje użytkownikowi większą swobodę w pisaniu zapytań w mniej syntetyczny sposób. Co ciekawe, w oficjalnej komunikacji Google dość otwarcie pozycjonuje chatbota jako rozwiązanie uzupełniające dla własnej wyszukiwarki.

Pogromca ChatGPT? Bard to póki co bardzo wczesny eksperyment

Coś musi być na rzeczy, skoro pierwsze testy wskazują na to, że Bard fatalnie radzi sobie z prostym wyszukiwaniem. Według opinii opublikowanej na kanale AI Explained w serwisie YouTube, zdecydowanie lepiej wykorzystać do takich rzeczy standardową wyszukiwarkę Google. Następnie przyszła kolej na proste zadanie matematyczne z użyciem procentów, z którym Bard poradził sobie zdecydowanie gorzej od Binga.

Jedynym, co uratowało chatbota Google w drugim zadaniu okazały się dodatkowe warianty odpowiedzi (których Bing nie oferuje) – jedynie ostatni z nich był policzony prawidłowo. Z kolei Bing zasilany przez GPT-4 poradził sobie z tym zadaniem bezbłędnie. Niestety kiedy do gry weszła stosunkowo prosta algebra (wierzę na słowo), Bard wypluł wierutne bzdury i to we wszystkich dostępnych wariantach odpowiedzi. Ponownie Bing policzył wszystko za jednym razem i bez żadnych błędów.

Czytaj też: ChatGPT-4 gubi się w zeznaniach. Prześwietlamy nowe narzędzie OpenAI oczami zwykłego użytkownika

Zaskakujące w analizie AI Explained może wydać się zalecenie, aby nie ufać do końca żadnemu z chatbotów w zakresie dat. Wyszło to przy zadaniu, które wymagało podania liczby dni między otwarciem Wieży Eiffla w Paryżu i Statuy Wolności w Nowym Jorku. Zarówno Bing jak i Bard poległy, ale chatbot Google dodatkowo zaplątał się w liczbie miesięcy między marcem i październikiem. Poprawił się po interwencji użytkownika, co ewidentnie pokazuje jak daleka droga jeszcze przed nim. Co ciekawe, Bard odbił nieco punktów od Binga w umiejętnościach tworzenia śmiesznych żartów.

Jedną z podstawowych funkcji chatbotów będzie z pewnością asystowanie w poprawności językowej i gramatycznej tworzonych z ich pomocą tekstów. Bing oraz Bard zmierzyły się z wyzwaniem typowym dla testów GMAT (ocena umiejętności w zakresie języka angielskiego, logicznego myślenia, interpretacji danych i analitycznego pisania). Tego typu weryfikacja jest jednym z elementów w procesie aplikacji na programy MBA. Niestety tu również Bard poradził sobie nieco gorzej od Binga.

Bard słabszy w tekście, ale mocniejszy w grafice

Zaskakująco dobrze Bard spisał się podczas próby stworzenia opisów dla generatora grafik Midjourney. Bing dostarczył co prawda więcej informacji dodatkowych z linkami, ale treści dostarczone przez chatbot Google’a przełożyły się na uzyskanie lepszego efektu końcowego w obrazie. Oczywiście warto pamiętać, że wszystkie wspomniane narzędzia dużo lepiej radzą sobie z językiem angielskim. Na stosowne testy porównujące oba rozwiązania po polsku przyjdzie nam jeszcze zaczekać.

Jestem na liście oczekujących na dostęp do Google Bard

Czy jestem zaskoczony? Niekoniecznie, bo dobrze mieć z tyłu głowy, że to nadal wersja eksperymentalna, której premiera została mocno przyspieszona za sprawą kooperatywy OpenAi i Microsoftu. Google zaliczył już pierwszy falstart z Bardem, ale w obecnej sytuacji nie może być mowy o kolejnym. Otwarcie systemu na testy użytkowników to jedyna droga do tego, aby duże modele językowe udoskonalić i z czasem potraktować jako naturalne narzędzie w codziennej pracy oraz rozrywce.