Tak się bowiem składa, że uczenie maszynowe, by było skuteczne, musi mieć się na czym uczyć. By AI było w stanie stworzyć przekonujący obraz, należy wcześniej „nakarmić” go możliwie dużą bazą danych do analizy. Zdjęcia, prace graficzne, malarskie – im więcej, tym lepiej.
Kradniemy i się do tego przyznajemy
Jak wygląda w praktyce taki proces opisał w wywiadzie dla „Forbesa” CEO Midjourney, David Holz:
To po prostu wielki kawałek internetu. Korzystamy z publicznie dostępnych otwartych zbiorów danych i szkolimy (Midjourney) z ich pomocą. To coś, co każdy robi. Nie jesteśmy wybredni. Postęp naukowy powoduje, że potrzebujemy coraz mniej danych do uzyskania dobrych jakościowo modeli. Za kilka lat, kiedy naprawdę ogarniemy, jak to robić, będziemy mieć takie, które dobry efekt osiągną niemal z niczego
Szkolenie na materiałach pobranych jak leci z internetu rodzi oczywiście pytanie, czy ktokolwiek pokusił się o zapytanie o zgodę autorów prac lub posiadaczy praw autorskich do nich. David Holtz w tej kwestii powiedział:
Nie, nie ma sposoby, by pobrać setki milionów obrazów i wiedzieć, skąd one są. Byłoby oczywiście fajnie, gdyby zawierały zabudowane metadane o posiadaczu praw autorskich, ale to i tak nie pomoże: nie są zarejestrowane. A więc nie ma sposobu, by znaleźć grafikę w internecie, automatycznie odnaleźć jej właściciela i w jakikolwiek sposób potwierdzić jego prawa.
Krótko mówiąc, w Midjourney mamy pana zdjęcia i co pan nam zrobi? Z dalszych wypowiedzi wynika bowiem, że nie ma póki co sposobu by artysta mógł zastrzec, by jego prace nie były wykorzystywane w szkoleniu AI – najlepsze, co mogą osiągnąć teraz, to „sprawdzamy, czy jest to wykonalne”. A to zdecydowanie zbyt mało.
Nie tylko Midjourney. Sprawa wbrew pozorom jest poważna
Nie chodzi bowiem o zabawę. Tylko początkowo obrazy generowane przez AI nadawały się wyłącznie do tego. Postęp spowodował jednak, że obecnie jakość sztucznie tworzonych przez Midjourney, Dall-E czy Stable Diffusion grafik nie odbiega poziomem od prac, które mógłby narysować, namalować czy sfotografować człowiek. Poważnym sygnałem ostrzegawczym jest pierwsza nagroda w dorocznym konkursie Colorado State Fair’s, którą w jednej z kategorii wygrała grafika Jasona Allena „Théâtre D’opéra Spatial” utworzona właśnie za pomocą Midjourney. Mimo podpisania jej tak, by nie budziło wątpliwości jak powstała i tak sprowadziła na głowę Allena serię oskarżeń o oszustwo.
Zaniepokojenie artystów jest oczywiste i zrozumiałe – także mój redakcyjny kolega Łukasz Kotkowski dał temu wyraz w swoim felietonie. Nieodległe mogą być bowiem czasy, w której algorytm utworzy potrzebną grafikę szybciej i taniej, niż opłacony grafik, który musiał poświęcić parę lat na nauczenie się swojej pracy. Kto by się wtedy przejmował, że powstała ona na bazie kradzionych prac innych ludzi? Skoro nie można wprost wskazać autora, którego prawa naruszono? Już dziś przecież duże serwisy stockowe akceptują grafiki wygenerowane przez AI.
Zdaję sobie oczywiście sprawę, że marudzę i czarnowidzę. Tak jak pojawienie się streamingu muzyki nie zabiło płyty CD i winylowej, a telewizja nie spowodowała odejścia w niebyt radia, tak zapewne i Midjourney et consortes nie zlikwidują zapotrzebowania na prace ludzi. Sądzę jednak, że jak najszybciej należałoby skończyć z wolną amerykanką i poddać temat niezbędnym regulacjom prawnym, jak zaczyna mieć to miejsce np. w Chinach. Póki twórcy AI nie uznają, że mają prawo do wszystkiego co stworzyliśmy i nie będzie za późno.