Już dziś w nocy niektórzy użytkownicy płatnej wersji Midjourney otrzymali testowy dostęp do piątej odsłony silnika, między innymi w celu oceny jakości prac.
Midjourney v5 bliżej fotorealizmu niż kiedykolwiek, chociaż wciąż ma błędy
Zaprezentowane przez nich przykłady wskazują na ogromny postęp jaki nastąpił w Midjourney v5. Szczególne wrażenie robią załączone przez Nicka St. Pierre porównania, jakie różnice występują między nową a starszą wersją przy interpretacji tego samego, stosunkowo prostego wsadu tekstowego.
Przeglądając wątek widać doskonale, że Midjourney 5 popełnia znacznie mniej błędów, ale też jego styl jest dużo bardziej dokładny i wysmakowany. Lepiej sobie radzi z włosami, z dłońmi, poprawnie radzi sobie z szybami i odbiciami. Mercedes z przykładu poniżej w interpretacji silnika v4 ma liczne błędy obrazowania na szybie oraz masce, podczas gdy z tego samego opisu v5 wygenerowała wysokiej jakości obraz.
Przy niektórych przykładach nawet wiedza o tym, że obraz wygenerowany został przez AI nie pomaga w znalezieniu różnic pozwalających na odróżnienie go od prawdziwej fotografii.
Szczegółowość jest znakomita, choć niektórzy komentatorzy zwrócili uwagę, że pierwszy z obrazów bardzo przypomina prawdziwe zdjęcie, które jakiś czas temu viralowo rozeszło się po sieci (i podobno dostępne jest na jakimś darmowym stocku), z kolei ja mam wrażenie, że widziałem już fotografię podobną do czwartego z obrazów. Warto tu przypomnieć, że twórcy Midjourney niewiele sobie robią z praw autorskich i do trenowania swojego silnika biorą zdjęcia jak leci, bez sprawdzania licencji i pytania o zgodę autorów. Już zresztą przeglądając zamieszczone w serwisie DeviantArt prace wygenerowane przez Midjourney v4 trafiałem na takie, w których mogłem wskazać konkretną osobę, która stała się (oczywiście bez swojej zgody) pierwowzorem dla grafiki.
Zobacz także: Twórca Midjourney przyznaje bez cienia żenady: tak, kradniemy miliony obrazków z internetu i co z tego? (chip.pl)
Midjourney v5 znacznie lepiej radzi sobie z dłońmi i palcami, bolączką starszej wersji
Z czterech przykładów poniżej widoczne błędy są w pierwszym – dłoń ma sześć palców, choć poza tym wygląda dość naturalnie. Pozostałe są znacznie lepsze, choć wciąż bez problemu da się je odróżnić od prawdziwych. Ale tu wciąż jest bardzo wiele do zrobienia, gdyż – jak widać – inne przykłady są raczej mało przekonujące:
Midjourney v5 i jego następcy będą trudnym przeciwnikiem dla serwisów stockowych
Wzrost realizmu obrazów generowanych przez AI stanowi znaczne zagrożenie dla serwisów fotograficznych oferujących odpłatnie zdjęcia stockowe. Po co bowiem szukać fotografii, skoro można wygenerować sobie potrzebny obraz w parę minut? Ciężkie chwile przeżyją fotografowie, dla których jest to źródło utrzymania, choć właściwie ich sytuacja pogarsza się od dawna, zanim jeszcze ktoś pomyślał o AI. Wciąż zresztą pozostaje sprawa prawnego uregulowania ram działania SI i praw autorskich, co gorsza jednak poza Chinami chyba nie widać pomysłu, jak się do tego zabrać, nie mówiąc o woli politycznej. Co prawda od jakiegoś czasu trwają prace nad The Artificial Intelligence Act, ale póki co nie widać, by prace te miały się ku końcowi.