TechSpot bo kmalu praznoval svojo 25. obletnico. TechSpot pomeni tehnično analizo in nasvet, ki mu lahko zaupate.
Postaja bolje: Z vsemi nedavnimi novicami, ki se vrtijo okoli ChatGPT in drugih velikih jezikovnih modelov, je zlahka pozabiti, da se njihovi bratranci – generatorji slik AI – še vedno izboljšujejo. Morda je nekdo ugotovil, kako upodobiti oči in roke, ne da bi subjekt izgledal kot nekaj iz nočne more. vendar rezultati še vedno prestrašijo nekatere ljudi.
V začetku tega tedna je raziskovalni laboratorij Midjourney izdal beta različico 5 svoje samoimenovane programske opreme za slikanje AI. Glede na objavo prek Twitterja najnovejša različica dodaja višjo kakovost slike, bolj „raznovrstne” rezultate, obsežnejši nabor slogov, brezšivne teksture in še veliko več.
Od danes lahko naša skupnost testira Midjourney V5. Ima veliko višjo kakovost slike, bolj raznolike rezultate, širši slogovni razpon, podporo za brezhibne teksture, širša razmerja stranic, boljše prikazovanje slike, širši dinamični razpon in več. Raziskujmo!
— Midjourney (@midjourney) 15. marec 2023
Uporabniki so objavili že na stotine osupljivih rezultatov, občutki o izboljšavah pa so mešani. Večina je navdušena, ker je AI za slikanje težko ustvaril vidike, kot so sence, odsevi, oči in roke. Spodaj je slika, ki smo jo ustvarili z OpenAI’s Dall-E kot primer, kje ima stroj težave.
Kompozicija je nekoliko napačna, splošni občutek pa je risan. Razsvetljava je napačna. Oči in roke so močno deformirane. Noge so umazane z artefakti, prav tako posoda za pokovko in sedež poleg predmeta. Ta rezultat je eden od štirih s podobnimi težavami v različnih stopnjah.
Zdi se, da se je različica 5 Midjourney v tem pogledu izboljšala, vsaj glede na primere, ki so jih delili drugi. Rezultati preprostih pozivov mejijo na čudno dolino – dovolj realistični, da v mnogih primerih veljajo za profesionalne fotografije, vendar še vedno s to nenavadno kakovostjo, ki je ne morete povsem uvrstiti. Čeprav so slike neverjetno realistične, so jih mnogi opisali kot grozljive.
Midjourney v5 je tukaj! (tokrat zares, lol)
Tukaj je nekaj vzporednih mojih pozivov, v4 proti v5, pa tudi nekaj novih pozivov in posnetkov množice. Ko bom eksperimentiral, bom temu dodal več.
ð§µ pic.twitter.com/qSEZWQBXou
— Nick St. Pierre (@nickfloats) 15. marec 2023
Naš lastni Kishalaya Kundu je po ogledu serije skoraj brezhibnih fotografij Midjourney V5 rekel: „Če sem iskren, sem bolj prestrašen kot navdušen.” Strah je, da bi lahko dokaj enostavno ustvaril lažno podobo in jo izdal za pristno.
Če odmislimo faktor lezenja, ima Midjourney V5 dramatično izboljšano kakovost v primerjavi z V4. Grafična oblikovalka Julie Wieland že nekaj časa uporablja Midjourney V4 (izdan novembra lani) in pravi, da ima različica 5 „neverjetno realistične” teksture kože. Veliko boljši so tudi svetlobni učinki, vključno z odsevi, bleščanjem in sencami. Morda najpomembnejše je, da umetna inteligenca ustvari roke in oči, ki so večino časa videti naravne.
�”� MJ nasvet: streli skozi okno so končno mogoči z V5!
Hrepenim po estetiki „My Blueberry Nights”, odkar sem prvič preizkusil Dalle2 (in bil je v redu), toda v5 je osupljiv!
�’ poiščite poziv v besedilu ALT slik #synthography #midjourneyv5 pic.twitter.com/kAOagopucG
— Julie W. Design (@juliewdesign_) 17. marec 2023
„Oči so skoraj popolne in nič več majave,” je Wieland povedal za Ars Technica. „Roke so večino časa pravilne, s petimi prsti namesto 7-10 na eni roki. MJ v5 se mi trenutno zdi, kot da bi končno dobil očala, potem ko sem malce predolgo ignoriral slab vid. Nenadoma vidiš vse v 4k; zdi se nenavadno osupljivo, a tudi neverjetno.”
Fotografija mlade ženske v uličnem slogu iz 1960-ih, sedi, jadrnica, zelena dior obleka, svilena zelena obleka, zelena obleka, svila, biserna ogrlica, tiffanyjini biseri, tiffanyjina biserna ogrlica, sončni zahod, ocean, posneto na Agfa Vista 200, 4k –ar 16:9
v4 (levo) v5 (desno) pic.twitter.com/wz7GbI3fvA
— Nick St. Pierre (@nickfloats) 15. marec 2023
Midjourney je izboljšal tudi izvorno ločljivost s 512x512px na 1024x1024px. Povečanje ga usklajuje z Dall-E. Vendar bi različica 4 lahko nadvzorčila za podvojitev izvorne ločljivosti. Ni nerazumno pričakovati, da bo V5 uporabil isto tehniko za izdelavo slik 2048 x 2048, vendar je to za posodobitev v prihodnosti.
Bistvo je, da je MidJourney na sceno umetne inteligence prišel šele pred enim letom. Veliko (ne vse) od teh slik, ki ta teden preplavljajo vire Twitterja, je nedotaknjenih. Prej je Weiland uporabljal kombinacijo tehnik za izboljšanje vizualne kakovosti Midjourney 4, vključno z „preslikavo” z Dall-E in popravki v Photoshopu. Različica 5 obljublja manj pogeneracijskega urejanja in morda fotografsko popolne slike prej, kot si lahko predstavljamo. Ta možnost je res vznemirljiva in hkrati strašljiva.