Rewolucja w systemach sztucznej inteligencji. Wszystko dzięki temu, że naukowcy rozwiązali 115-letni problem matematyczny
Problemy są po to, aby je rozwiązywać. Zwłaszcza w momencie, kiedy ich rozwiązanie może znacząco popchnąć coś w dobrym kierunku, czego najnowszym przykładem jest przypadek zespołu z MIT. Ten w zeszłym roku opracował specjalny algorytm uczenia maszynowego, który był zdolny do uczenia się i dostosowywania do nowych informacji nie tylko w początkowej fazie treningu, ale też w trakcie pracy. System dręczył jednak problem przepustowości danych i to właśnie on poszedł w zapomnienie, kiedy to ci sami naukowcy rozwiązali 115-letni problem matematyczny.
Czytaj też: Naukowcy obiecują tanie panele fotowoltaiczne. Ich prototyp zostawia konkurencję daleko w tyle
Można powiedzieć, że wspomniany system SI “gra w szachy 4D”, bo jego model wymaga do działania danych z szeregu czasowego. To czyni je idealnymi do wykorzystania w zadaniach wrażliwych na czas, a więc prognozowania pogody i inwestycji czy zapewniania nawigacji dla autonomicznych pojazdów. Z drugiej jednak strony wiążę się to z potrzebą skalowania systemów (co jest kosztowne), aby zapewnić im wyższe możliwości obliczeniowe. To jednak już przeszłość, bo we wtorek naukowcy z MIT ogłosili, że opracowali rozwiązanie tego ograniczenia.
Czytaj też: Unimon zwiększy dokładność obliczeń kwantowych. Naukowcy wreszcie mają alternatywę
Co ciekawe, dokonali tego nie poprzez najprostsze rozwiązanie (zwiększenie surowej przepustowości). Zamiast tego naukowcy rozwiązali 115-letni problem matematyczny (pochodzący z 1907 roku), które określa “równaniem różniczkowym leżącym u podstaw interakcji dwóch neuronów poprzez synapsy”, co “odblokowało nowy typ szybkich i wydajnych algorytmów sztucznej inteligencji”. Wszystko przez uzyskanie możliwości obliczania równań różniczkowych tak, aby zamiast obliczać skomplikowane wzory, co jest kosztowne w ujęciu mocy obliczeniowej, realizować zadanie w postaci “zamkniętej”. Takie rozwiązanie pozwala obejść ten problem poprzez funkcjonalne modelowanie całego opisu systemu w jednym kroku obliczeniowym.
Wyobraź sobie, że masz sieć neuronową typu end-to-end, która otrzymuje dane wejściowe dotyczące jazdy z kamery zamontowanej na samochodzie. Sieć jest trenowana do generowania danych wyjściowych, takich jak kąt skrętu samochodu. W 2020 roku zespół rozwiązał to za pomocą płynnych sieci neuronowych z 19 węzłami, więc 19 neuronów plus mały moduł percepcyjny mogłyby prowadzić samochód. Równanie różniczkowe opisuje każdy węzeł tego systemu. Z zamkniętym rozwiązaniem, jeśli zastąpisz go wewnątrz tej sieci, da ci dokładne zachowanie, ponieważ jest to dobre przybliżenie rzeczywistej dynamiki systemu. Mogą więc rozwiązać problem przy jeszcze mniejszej liczbie neuronów, co oznacza, że byłoby to szybsze i mniej kosztowne obliczeniowo– tłumaczą naukowcy.
Teraz zespół ma nadzieję, że będzie w stanie skonstruować modele ludzkiego mózgu, które mierzą w milionach połączeń neuronowych, co nie jest obecnie możliwe.