Wybaczcie mi tę dziwną fantazję na wstępie, ale muszę. Widzę w głowie taki oto obrazek: Google i Microsoft siedzą sobie razem w knajpie (tak, wiem, za mało snu, za dużo leków). Microsoft dynda wesoło nóżkami na barowym krześle i z ekscytacją opowiada o swoich (a w zasadzie swojego dobrego kolegi, OpenAI) osiągnięciach w dziedzinie sztucznej inteligencji. Tymczasem wyraźnie mniej entuzjastyczny Google po chwili namysłu konkluduje: “stary, ja to robiłem zanim stało się modne”.
Ostatni “pojedynek na miecze świetlne SI” sprowokowany przez Microsoft w stosunku do Google nie wypada specjalnie dobrze na korzyść giganta na rynku wyszukiwarek internetowych. To jednak tylko niewielka część pewnego większego obrazka, który niepostrzeżenie powstawał na przestrzeni ostatnich kilku lat. Według informacji, do których dotarli dziennikarze The Wall Street Journal, Google mógł na dobre zdominować rynek konwersacyjnych chatbotów już lata temu. Zabrakło jednak odwagi, czynnika charakterystycznego dla mniejszych firm, które mają mniej do stracenia.
Przygoda Google z chatbotami zaczyna się już w 2013 roku
W czasach, kiedy firmie przewodził jeszcze Larry Page, jeden z jej ze współzałożycieli, rozpoczęła się współpraca z pewnym znanym amerykańskim naukowcem. Ray Kurzweil, wynalazca, futurolog, pisarz, piewca idei transhumanizmu i tzw. osobliwości (punktu, w którym sztuczna inteligencja przewyższa ludzką), rozpoczął pracę dla Google nad kilkoma chatbotami. Mniej więcej w tym samym czasie do portfolio giganta wyszukiwarek dołączyła brytyjska firma DeepMind.
Środowiska akademickie oraz specjalizujące się w technologiach związanych ze sztuczną inteligencją pierwszy raz zaczynały wtedy dostrzegać zagrożenia płynące z wykorzystania SI, chociażby w systemach do rozpoznawania twarzy. Presja na firmy pracujące nad rozwijaniem sztucznej inteligencji w szerokim spektrum zastosowań zaczęła być wyczuwalna również w szeregach Google. To pierwszy sygnał o ostrożność.
Na fali niepokoju o przyszłość rozwoju SI, grupa entuzjastów technologii w 2015 roku tworzy słynne dziś OpenAI, zyskując przy tym finansowe wsparcie ze strony Elona Muska. Organizacja stawia sobie za cel ochronę sztucznej inteligencji przed drapieżnymi zapędami korporacyjnych gigantów (z dzisiejszej perspektywy widać już, że to nie do końca wyszło).
Za sprawą zaangażowania Google’a w amerykański program wojskowy o nazwie Project Maven (SI miało w nim identyfikować potencjalne cele dla dronów), wybucha kolejny skandal. Firma wycofuje się z projektu w 2018 roku zapewniając, że nie będzie wykorzystywać rozwijanej przez siebie technologii sztucznej inteligencji do celów militarnych. Drugi poważny sygnał, który podnosi poziom ostrożności na nowy poziom. Przy okazji Sundar Pichai przewodzący Google zapowiada siedem zasad dla rozwoju SI, które miałyby utrudnić rozprzestrzenianie się technologii utrwalających stronniczość. Podsumowując: zanim coś wypuścimy na świat, to musi spełniać wysokie standardy.
W Google najpierw był Meena, a potem LaMDA
Mniej więcej w tym samym czasie Daniel De Freitas, inżynier tworzący oprogramowanie dla YouTube’a, rozpoczyna poboczny projekt o nazwie Meena. Buduje i wspólnie z niewielkim zespołem kolegów dopracowuje chatbota konwersacyjnego, który miałby lepiej naśladować typową wymianę zdań między dwiema osobami. Pierwszą oznaką istnienia projektu jest artykuł z 2020 roku opisujący chabota, którego nakarmiono 40 mln słów z konwersacji prowadzonych w mediach społecznościowych w domenie publicznej.
OpenAI wypuszcza z kolei model GPT-2, którego nakarmiono 8 mln stron internetowych, ale ze względu na wspomniane wyżej ryzyko generowania treści stronniczych i szkodliwych, projekt nie zostaje udostępniony publicznie, a jedynie do celów naukowych. Tę samą ścieżkę chciała przetestować ekipa odpowiedzialna za Meena, ale ze strony szefostwa Google zapaliło się czerwone światło – to jeszcze nie jest dobry moment.
Do projektu dołączył Noam Shazeer, specjalizujący się w uczeniu maszynowym i jeden ze współtwórców tzw. Transformera (nowego typu sieci neuronowych), które umożliwiły gwałtowne przyspieszenie dla rozwoju chatbotów konwersacyjnych, takich jak ChatGPT. Wraz z powiększeniem zespołu Meena zmienił się w LaMDA (Language Model for Dialogue Applications), został nakarmiony dodatkowymi danymi oraz mocą obliczeniową.
LaMDA jako nowy duży model językowy został wprowadzony na scenę Google I/O w maju 2021 roku. Sundar Pichai z ekscytacją opowiadał o technologii, prezentując możliwości konwersacyjne rozwiązania. Już w 2020 roku Freitas i Shazeer chcieli wykorzystać potencjał LaMDA w Asystencie głosowym Google, z którego codziennie korzysta nawet 500 mln użytkowników. I trzeba przyznać, że tym mogliby “pozamiatać” całą ówczesną konkurencję, na długo zanim świat zachwycił się chabotem OpenAI.
Niestety w gabinetach na samej górze znów zapaliło się czerwone światło. Szefostwo nie chciało udostępnić wersji demonstracyjnej modelu publicznie, z obawy o ryzyko potencjalnych wpadek w działaniu technologii, które mogły kosztować giganta utratę reputacji i wartości. Cierpliwość twórców projektu na tym się jednak skończyła. Odeszli z Google w 2021 roku, zakładając własny biznes – firmę Character Technologies.
Microsoft podjudził Google. Akcja kosztowała drugiego 100 mld dolarów
To co nie udało się autorom projektu, udało się jednemu z największych konkurentów. Kiedy OpenAI otrzymał potężne wsparcie finansowe ze strony Microsoftu i de facto stał się dla koncernu zapleczem SI, po informacjach o premierze nowego Binga zasilanego technologią OpenAI w Google przycisk z napisem PANIKA zaczął migotać jak stroboskop. Praktycznie w tym samym czasie odbyły się dwie prezentacje, które różniły się od siebie diametralnie.
Chatbot Bard, mający stanowić natychmiastową odpowiedź na ChatGPT wyłożył się już na samym wstępie, a całe wydarzenie spowodowało gwałtowny spadek cen akcji Google na giełdzie. Z wartości giganta wyparowało kosmiczne 100 mld dolarów. Oczywiście Bing AI również nie okazał się mistrzem dokładności, dlatego Microsoft postanowił go na wszelki wypadek opatrzeć metką “work in progress”.
Czytaj też: Wszyscy o nim mówią, mało kto go rozumie. Wyjaśniamy, co tak naprawdę potrafi ChatGPT
Było, minęło, ale potencjał do zmiany wydaje się ogromny, szczególnie w kontekście wykorzystania modelu LaMDA w Asystencie Google, o czym myśleli już kilka lat temu autorzy projektu. Specyfika korzystania z asystentów głosowych jest nieco inna – oczekujemy tam szybkich i precyzyjnych informacji, podanych w prostym i przyswajalnym języku. Wydaje się, że tam gdzie gigant na rynku wyszukiwarek ma o wiele większe doświadczenie od konkurencji, byłby w stanie najlepiej wykorzystać swoje dotychczasowe osiągnięcia.