Generatywna SI potrafi zdziałać prawdziwe cuda. Wszyscy już przywykli do pisanych przez nią tekstów, a także generowanych grafik, a wkrótce pojawią się tworzone przez nią filmiki. Gdy raz otworzyły się możliwości, wszyscy zainteresowani próbują wykorzystać je w jak najlepszy sposób. Najnowsze osiągnięcia naprawdę robią wrażenie.
Sztuczna inteligencja pracuje szybciej niż światło
Generowanie grafik odbywa się za pomocą procesu określanego jako “dyfuzja” (diffusion). W dużym skrócie wygląda to tak, że wykonywanych jest kilka kolejnych kroków prowadzących do osiągnięcia efektu zdefiniowanego w komendzie podanej przez użytkownika, czyli prompcie. Naukowcom z MIT – we współpracy ze specjalistami z Adobe Research – udało się zredukować ilość czynności, które musi wykonać sztuczna inteligencja w celu przeprowadzenia całego procesu i przy zapewnieniu efektu jak podczas standardowego działania.
W efekcie udało się osiągnąć imponującą szybkość generowania obrazów – 20 na sekundę, czyli możemy w ciągu minuty stworzyć 1200 unikalnych grafik o tej samej treści! Jak zdradzono, dokonano tego poprzez wytrenowanie dwóch modeli dyfuzji. I wynik taki jest możliwy do osiągnięcia przy każdym współczesnym GPU.
Czytaj też: Sztuczna inteligencja bada nieuchwytne cząstki. Dostrzega coś, co umyka naukowcom
Jak pokazuje powyższy klip wideo, model table Diffusion 1.5 potrzebuje na stworzenie grafiki 1,4 sekundy, podczas gdy model DMD w tym czasie generuje cały szereg grafik. Jest to kompromis pomiędzy szybkością działania a wydajnością, a efekty cieszą oko. A ponieważ nie ma żadnych ograniczeń co do tego, jakie słowa wpisywać do promptów, nic nie stoi na przeszkodzie, aby popuścić wodze wyobraźni.