Sztuczna inteligencja znowu wymiata. Darmowy generator New Stable Diffusion 2.0 tworzy dzieła sztuki

New Stable Diffusion 2.0 nie tylko generuje niesamowite grafiki, ale też ulepsza te niskie jakości

O powstaniu Stable Diffusion 2.0, czyli drugiej generacji narzędzia o tej samej nazwie, poinformowała firma Stability AI z siedzibą w Londynie i San Francisco. To oprogramowanie open-source do generowania obrazów, zapewnia szereg nowych funkcji oraz ulepszeń w stosunku do wersji oryginalnej. Mowa o nowych modelach tekstowo-obrazowych, które są trenowane z wykorzystaniem nowego kodera o nazwie OpenCLIP.

Czytaj też: Apple nie chciał się dostosować do nowego prawa, więc policja skonfiskowała iPhone’y ze sklepów

Samo trenowanie modelu należy do niespotykanie obciążających zadań, dlatego Stability AI musiało wykorzystać m.in. klaster ponad 4000 akceleratorów graficznych Nvidia A100 dostępnych z poziomu m.in. Amazon Web Services. W grę wchodzi bowiem karmienie sieci neuronowej ogromnymi zestawami stosownie opisanych grafik, na podstawie których Stable Diffusion 2.0 jest w stanie generować obrazy na podstawie komend tekstowych. Dokładnie tak, jak DALL-E 2 firmy Open AI.

Czytaj też: Masz drobne? Leica Noctilux 50 mm f/1.2 może być twoja już za jedyne 2 mln złotych

Wspomniany koder OpenCLIP został opracowany we współpracy z firmą non-profit zajmującą się uczeniem maszynowym LAION. Jego zastosowanie znacząco poprawiło jakość generowanych przez Stable Diffusion obrazów, umożliwiając tworzenie grafik w rozdzielczości 512×512 pikseli i 768×768 pikseli. W nowej wersji model posiada też funkcję Upscaler Diffusion, która ta zwiększa rozdzielczość obrazu o współczynnik czterech, czego przykład widzicie powyżej. Obecnie scaling z rozdzielczości 128×128 do 512×512 działa niezawodnie, ale w przyszłości wartości te wzrosną do ponad 2048×2048.

Czytaj też: Qualcomm nie może się chyba zdecydować, jak nazywać swoje układy. Nowy Snapdragon 782G wprowadza małe zamieszanie

Co być może najważniejsze, Stable Diffusion 2.0 doczekało się filtrów NSFW, co ma za zadanie zmniejszyć liczbę kontrowersji wokół tego open-source’owego narzędzia. Mogliście wprawdzie o nim nie słyszeć, ale prawda jest taka, że to dzieło firmy Stability AI zdobyło ogromną popularność w wersji pierwszej, a w kolejnej poprawia tak wiele w swoim działaniu, że z całą pewnością powtórzy ten sukces.