Zanim doszło do tak imponującego postępu, sztuczna inteligencja przeanalizowała około 70 000 godzin nagrań z wirtualnego świata oraz nieco materiałów ukazujących, jak wykorzystywać mysz i klawiaturę na potrzeby gry w Minecraft.
Czytaj też: Układ oparty na sztucznej inteligencji funkcjonuje niczym klocki LEGO. Jakie są jego zastosowania?
Po przejściu szkolenia sieć neuronowa okazała się naprawdę dobrze radzić sobie z trudnościami. Model wytrenowany przez OpenAI jest teraz w stanie wykonywać wszelkiego rodzaju złożone czynności, na przykład pływanie, polowanie czy przetwarzanie żywności. Imponująca jest też jego zdolność do jednoczesnego podskakiwania i rozmieszczania bloków.
Poziom zaawansowania jest na tyle wysoki, że sztuczna inteligencja potrafi samodzielnie wykonywać narzędzia z diamentu. O tym, jak wymagające jest to zadanie, wiedzą chyba wszyscy, którzy mieli styczność z popularnym Minecraftem. Oczywiście na myśl przychodzi co najmniej jedno pytanie: i co w związku z tym? Słynna gra wideo nie jest obecnie równie rozchwytywana, jak jeszcze kilka lat temu. Nie zmienia to jednak faktu, iż nowe osiągnięcia są istotne z punktu widzenia sztucznej inteligencji.
Sztuczna inteligencja została przeszkolona z wykorzystaniem technologii VPT
Kluczem do sukcesu była bowiem technologia VPT, czyli Video PreTraining. Do tej pory występowało wiele trudności z wykorzystaniem nagrań w formie materiałów szkoleniowych dla sieci neuronowych. Dzięki VPT możliwe jest natomiast połączenie dużego zbioru filmów z etykietami z zakresu sterowania klawiaturą i myszą. W ten sposób powstaje model bazowy, który jest następnie dopracowywany – w tym przypadku było to zaprezentowanie nagrań, na których widać między innymi ścinanie drzew i tworzenie stołów do craftingu.
Czytaj też: Gry wideo korzystnie wpływają na inteligencję dzieci. Co z innymi rozrywkami?
Model sztucznej inteligencji był też nagradzany za wykonanie każdego kroku w sekwencji zadań. Sprawiło to, iż sieć neuronowa była w stanie zebrać wszystkie składniki potrzebne do stworzenia diamentowego kilofa, czyniąc to ze skutecznością równą ludzkiej. Tego typu metody będzie można zastosować również w odniesieniu do innych czynności, co powinno znacząco usprawnić szkolenie sieci neuronowych.