W zwyczajowo stosowanych sieciach neuronowych używanych do rozpoznawania obrazów obiekty docelowe są najpierw wyświetlane na czujniku obrazu. Ten przekształca światło w sygnały elektryczne, a później w dane binarne, które można przetwarzać, analizować, przechowywać i klasyfikować za pomocą układów komputerowych. Im szybciej zachodzi ten proces, tym lepiej, rzecz jasna.
Czytaj też: Sztuczna inteligencja tworzy własny język. Niepokojące odkrycie naukowców
Klasyfikacja obrazów znajduje zastosowanie między innymi w przypadku technologii rozpoznawania twarzy, automatycznego wykrywania tekstu na zdjęciach czy funkcjonowania autonomicznych samochodów. W obecnym stanie możliwe jest wykonywanie miliardów obliczeń na sekundę, jednak kiedy w grę wchodzi klasyfikacja obrazów, na przykład identyfikacja obiektów ruchomych bądź trójwymiarowych lub klasyfikacja mikroskopijnych komórek ciała, nawet najbardziej zaawansowane systemy mają z tym problemy.
Nowy układ scalony ma powierzchnię wynoszącą 9,3 milimetra kwadratowego
Podstawowym ograniczeniem jest fakt, że obliczenia opierają się na zegarze harmonogramu kroków obliczeniowych w procesorze komputerowym. W efekcie następują one jedne po drugich, zgodnie z liniowym harmonogramem. Autorzy nowych badań w tej sprawie, którzy przedstawili swoje dokonania na łamach Nature, usunęli cztery główne czasochłonne elementy tradycyjnego układu komputerowego. Było to możliwe dzięki bezpośredniemu przetwarzaniu światła odbieranego od wybranego obiektu za pomocą optycznej sieci neuronowej zaimplementowanej na układzie o powierzchni 9,3 milimetra kwadratowego.
Tak jak w przypadku ludzkiego mózgu, taki i tutaj sieć neuronowa jest zdolna do szybkiego przetwarzania informacji. Autorzy badań wykazali, że ich układ może wykonywać do zadanie w ciągu pół nanosekundy. W tym samym czasie “zwykły” układ komputerowy przeprowadza jeden etap obliczeń wynikający z harmonogramu opartego na zegarze. Poza oszczędnością czasu takie rozwiązanie zapewnia też niższe zużycie miejsca i energii. Wynika to z faktu, iż nowy układ nie musi przechowywać informacji, co eliminuje potrzebę stosowania dużej jednostki pamięci.
Czytaj też: Ten tranzystor organiczny zastępuje aż 12 normalnych, zwiastując rewolucję układów logicznych
Układ ten wymaga szkolenia, zanim nauczy się identyfikacji i przydzielania nowych danych. Wygląda to na podobnej zasadzie jak u ludzi. Po zapoznaniu się ze zbiorem danych, sieć pobiera informacje i dopasowuje je do wcześniej poznanych kategorii. Trening musi być na tyle szczegółowy, aby umożliwić dokładną klasyfikację obrazów, ale jednocześnie na tyle ogólny, aby okazał się użyteczny dla nowych zestawów danych. Dodanie kolejnych warstw neuronowych pozwala układowi na odczytywanie informacji z bardziej złożonych obrazów o wyższej rozdzielczości.