Patrzę na Midjourney v5 i zastanawiam się - kiedy fotografia w ogóle przestanie być potrzebna?

Już dziś w nocy niektórzy użytkownicy płatnej wersji Midjourney otrzymali testowy dostęp do piątej odsłony silnika, między innymi w celu oceny jakości prac.

Midjourney v5 bliżej fotorealizmu niż kiedykolwiek, chociaż wciąż ma błędy

Zaprezentowane przez nich przykłady wskazują na ogromny postęp jaki nastąpił w Midjourney v5. Szczególne wrażenie robią załączone przez Nicka St. Pierre porównania, jakie różnice występują między nową a starszą wersją przy interpretacji tego samego, stosunkowo prostego wsadu tekstowego.

Midjourney v5 is here! (for real this time, lol)

Here are some side-by-sides of my prompts, v4 vs v5, as well as some new prompts and crowd shots. I'll add more to this as I experiment.

🧵 pic.twitter.com/qSEZWQBXou
— Nick St. Pierre (@nickfloats) March 15, 2023

Przeglądając wątek widać doskonale, że Midjourney 5 popełnia znacznie mniej błędów, ale też jego styl jest dużo bardziej dokładny i wysmakowany. Lepiej sobie radzi z włosami, z dłońmi, poprawnie radzi sobie z szybami i odbiciami. Mercedes z przykładu poniżej w interpretacji silnika v4 ma liczne błędy obrazowania na szybie oraz masce, podczas gdy z tego samego opisu v5 wygenerowała wysokiej jakości obraz.

Editorial style photo, top-down camera shot, blue Mercedes-Benz SL-Class 1963, coastal road, beach, sunny lighting, elegant, refined, iconic, 4k –ar 16:9 pic.twitter.com/wsEXGvYxmb
— Nick St. Pierre (@nickfloats) March 15, 2023

Przy niektórych przykładach nawet wiedza o tym, że obraz wygenerowany został przez AI nie pomaga w znalezieniu różnic pozwalających na odróżnienie go od prawdziwej fotografii.

Midjourney v5 is releasing this week.

They're asking paying members to help rate images, I did my part and spent the morning on it.

The level of detail is wild. pic.twitter.com/pxPEWhxI3A
— phil desforges (@storybyphil) March 13, 2023

Szczegółowość jest znakomita, choć niektórzy komentatorzy zwrócili uwagę, że pierwszy z obrazów bardzo przypomina prawdziwe zdjęcie, które jakiś czas temu viralowo rozeszło się po sieci (i podobno dostępne jest na jakimś darmowym stocku), z kolei ja mam wrażenie, że widziałem już fotografię podobną do czwartego z obrazów. Warto tu przypomnieć, że twórcy Midjourney niewiele sobie robią z praw autorskich i do trenowania swojego silnika biorą zdjęcia jak leci, bez sprawdzania licencji i pytania o zgodę autorów. Już zresztą przeglądając zamieszczone w serwisie DeviantArt prace wygenerowane przez Midjourney v4 trafiałem na takie, w których mogłem wskazać konkretną osobę, która stała się (oczywiście bez swojej zgody) pierwowzorem dla grafiki.

Dennis Sylvester Hurd - Midjourney - Main Street in 1866 — Dennis Sylvester Hurd – Midjourney v4 – Main Street in 1866

Zobacz także: Twórca Midjourney przyznaje bez cienia żenady: tak, kradniemy miliony obrazków z internetu i co z tego? (chip.pl)

Midjourney v5 znacznie lepiej radzi sobie z dłońmi i palcami, bolączką starszej wersji

Z czterech przykładów poniżej widoczne błędy są w pierwszym – dłoń ma sześć palców, choć poza tym wygląda dość naturalnie. Pozostałe są znacznie lepsze, choć wciąż bez problemu da się je odróżnić od prawdziwych. Ale tu wciąż jest bardzo wiele do zrobienia, gdyż – jak widać – inne przykłady są raczej mało przekonujące:

Yeah no.

"photorealistic study of multiple human hand gestures against a naturalistic background –v 5" pic.twitter.com/XRsuNHnHJJ
— boggosort (@boggodan) March 16, 2023

Midjourney v5 i jego następcy będą trudnym przeciwnikiem dla serwisów stockowych

Wzrost realizmu obrazów generowanych przez AI stanowi znaczne zagrożenie dla serwisów fotograficznych oferujących odpłatnie zdjęcia stockowe. Po co bowiem szukać fotografii, skoro można wygenerować sobie potrzebny obraz w parę minut? Ciężkie chwile przeżyją fotografowie, dla których jest to źródło utrzymania, choć właściwie ich sytuacja pogarsza się od dawna, zanim jeszcze ktoś pomyślał o AI. Wciąż zresztą pozostaje sprawa prawnego uregulowania ram działania SI i praw autorskich, co gorsza jednak poza Chinami chyba nie widać pomysłu, jak się do tego zabrać, nie mówiąc o woli politycznej. Co prawda od jakiegoś czasu trwają prace nad The Artificial Intelligence Act, ale póki co nie widać, by prace te miały się ku końcowi.