Sztuczna inteligencja podstawą dla imponującego narzędzia, czyli jak świat zmienia się na naszych oczach
Sztuczna inteligencja zmieni nasz świat nie do poznania, a jej przeciwnicy będą musieli naprawdę się nagimnastykować, żeby uznać niektóre inicjatywy oraz narzędzia, które bez SI byłyby niemożliwe, za szkodliwe lub niebezpieczne. Jednym z przykładów tego jest przedstawiony właśnie na łamach arXiv system sztucznej inteligencji, który może tłumaczyć język migowy na tekst i mowę w czasie rzeczywistym oraz wysoką dokładnością.
Czytaj też: Sztuczna inteligencja ma konkurenta. Teraz obliczenia wykonuje się z użyciem układów opartych na mózgu
SignAll wykorzystuje kamerę i czujnik głębi, aby przechwytywać gesty oraz mimikę osób posługujących się językiem migowym, a następnie konwertuje je na mowę lub tekst przy użyciu przetwarzania języka naturalnego i syntezy mowy. Takie coś umożliwia osobom niemym nie tylko porozumiewanie się z asystentami oraz innymi narzędziami SI, ale też pozwala ludziom nieznającym migowego na to, aby tłumaczyć swoją mowę na język migowy za pomocą awatara.
Wedle samych autorów z Barcelona Supercomputing Center i Universitat Politècnica de Catalunya, jest to pierwszy system, który może tłumaczyć język migowy w sposób ciągły i dokładny, bez konieczności noszenia specjalnych rękawiczek czy zakładania na dłonie markerów. Twierdzą też, że po wprowadzeniu SignAll do powszechnego użytku, ten system może poprawić dostępność ogółu technologii oraz proces samej komunikacji u osób niesłyszących oraz niemych zwłaszcza w edukacji, opiece zdrowotnej i środowisku pracy.
Czytaj też: Coraz więcej krajów przeciwko ChatGPT. Sztuczna inteligencja musi podlegać kontroli
Wiele wskazuje na to, że SignAll może być rzeczywiście jednym z najbardziej zaawansowanych i niezawodnych systemów tego typu, bo konkurencja pokroju SLAIT i Google Project Euphonia może i też wykorzystuje SI do rozpoznawania języka migowego, ale cechuje się niższym współczynnikiem dokładności. W przypadku SignAll mowa o aż 95-procentowej dokładności i na dodatek obsługiwania wielu języków migowych.
Czytaj też: Sztuczna inteligencja wszędzie i dla każdego. Ten mózg dla AI ma szansę zmienić świat
Taki wynik był możliwy dzięki wykorzystaniu modelu uczenia maszynowego, który jest podobny do tych wykorzystywanych przez np. ChatGPT. Jego główne zalety obejmują rozumienie kontekstu oraz szybki proces szkolenia na zestawie danych, który w przypadku SignAll obejmował zbiór danych szkoleniowych z How2Sign, a więc publicznie dostępnych filmów instruktażowych w amerykańskim języku migowym z transkrypcjami o długości około 80 godzin. Aktualnie jednak nic nie wskazuje na to, że system ten szybko wejdzie na rynek, bo związany z nim model znajduje się w fazie eksperymentalnej.
PS – po więcej materiałów najwyższej jakości zapraszamy na Focus Technologie. Subskrybuj nasz nowy kanał na YouTubie!