The Generative Query Network, published today in @ScienceMagazine, learns without human supervision to (1) describe scene elements abstractly, and (2) 'imagine' unobserved parts of the scene by rendering from any camera angle. @arkitus @DeepSpiker
Blog: https://t.co/mD8RR7CA4M pic.twitter.com/HxcqFAYhcz
— Google DeepMind (@GoogleDeepMind) June 14, 2018
Oczywiście stworzona w ten sposób reprezentacja przestrzenna jakiejś sceny będzie tym bardziej wierna i dokładna im więcej dwuwymiarowych zdjęć pokażemy sztucznej inteligencji. Celem DeepMind było opracowanie maszynowo uczonego kodu, który odtwarza to w jaki sposób ludzie postrzegają przestrzeń. My również na podstawie fotografii jakiegoś pomieszczenia jesteśmy w stanie odwzorować sobie w umyśle jego układ, a także fizyczne interakcje pomiędzy różnymi obiektami. Rozwiązanie to niweluje konieczność dokładnego opisywania zdjęć, co było dotychczas wymagane w używanych systemach wizualnego rozpoznawania.
Algorytm GQN imponuje swoją zdolnością uczenia się rzeczywistości z obrazów 2D. Niemniej rozwiązanie nie jest jeszcze pozbawione ograniczeń. Przede wszystkim badacze z DeepMind testowali nową SI jedynie na prostych scenach zawierających niewielką liczbę prostych obiektów. Jednak najważniejsze, że pierwszy krok został postawiony. Twórcy GQN skupią się teraz na optymalizacji kodu, by wymagał mniejszej mocy obliczeniowej, a także by był zdolny do szczegółowej analizy obrazów w wyższej rozdzielczości.
Algorytm GQN ma potencjalnie bardzo szeroki obszar zastosowań. Podczas redakcyjnych dyskusji nad tym tematem dostrzegaliśmy m.in. możliwość “inżynierii wstecznej” projektów 3D na podstawie ich zdjęć i rysunków dwuwymiarowych. Z kolei innym oczywistym zastosowaniem jest branża gier. W końcu możliwość stworzenia całej mapy 3D w grze typu FPS jedynie na podstawie dwuwymiarowych reprezentacji znacznie ograniczy koszty produkcji. Osobom szczególnie zainteresowanym tym tematem polecam lekturę pełnej treści naukowego artykułu na temat Generative Query Network (tekst w formacie PDF, w języku angielskim). | CHIP