Skrivet av ronz:
Hur fungerar Midjourney? Är det helt AI genererade bilder?
Det är sjukt imponerande.
Skriver en kort text med olika egenskaper som man hoppas att AI:n fattar på rätt sätt.
Jag ville få någon cool bild på en grupp D&D äventyrare i en grotta. Jag hade gjort lite olika försök tidigare, både för ute i en skog eller på berg/kullar och testat olika stilar.
Startade med texten "a band of adventurers the quest begins, d&d, Magic the gathering style"
Sedan lite extra detaljer "high fantasy, autumn adventure, World of Warcraft style, elves, orcs, humans, oil painting, ornate armor, heroic, intricate, elaborate, hyperrealism, hyper detailed, strong expressiveness and emotionality" lite mer nyckelord för AI:n att använda. Sedan hur många och vilka av dom den använder varierar.
Sedan dags att tala om själva stilen jag hoppas uppnå. "Alex Ross, Brandon Choi, Luis Royo, John Romita Jr."
Det är några kända målare av Fantasy bilder, så AI:n har mycket att använda där och kan blanda stilarna, låta en dominera totalt. Har testat olika målare och med en del blir det väldigt dåligt då det helt enkelt finns för lite data/offentliga bilder att använda som grund.
Sedan en massa instruktioner om hur ljussättning, kamera vinkel och liknade ska vara.
"cinematic lighting, visual clarity, 200mm, UHD, 32k, 16k, 8k, 3D shading, Tone Mapping, Ray Tracing, Global Illumination, Super-Resolution, gigapixel, color grading, retouch, enhanced, PBR, Blender, V-ray, Procreate, zBrush, Unreal Engine 5, Cinema 4D, ROMM RGB, Adobe After Effects, 3DCG, VFX, SFX, FXAA, SSAO"
En del kommandon gör nog inget alls, en del betyder nog samma sak. 16K, 8K, 4K är inte upplösningen på bilder utan har att göra med kamera fokus, som här anges att det ska helst se ut som om den tagits med en 200mm lins.
Har ingen aning om vad ens hälften av orden betyder eller gör, men såg en mycket snygg bild där någon använde just dessa, så kopierade dom rakt av.
Slutligen lägger man till -- kommandon. --ar 9:16 är Aspect Ratio. Sedan finns --test och --testp där man vill att AI:n ska använda senaste beta mjukvaran. Ofta snyggare detaljer, men kan även bli totalt mer kaos.
Hur som helst, med den där texten fick jag följande bild.
Okej grund, men inte vad jag ville ha. Så tryckte på "gör om igen med samma förutsättningar" och fick då den här:
Det här ser coolare ut, men inte vad jag vill ha som slutbild. Säger då till AI:n att göra en ny bild, men använda den där som bas.
Nu liknar det någon som påminner om en mer episk fantasy bild. Man ser även likheterna med tidigare bild med en slags inramning med monster på båda sidorna. Gör ny bild med den nya som grund.
Efter många "gör om med senaste bilden" och "gör om med tidigare version" är det här några av bilderna jag fått:
Samtliga bilder du har sett här hade samma identiska text, men det var sedan vad jag sa till AI:n att jag tyckte var bra och vad den skulle basera nästa bild på.
"a band of adventurers the quest begins, d&d, Magic the gathering style, high fantasy, autumn adventure, World of Warcraft style, elves, orcs, humans, oil painting, ornate armor, heroic, intricate, elaborate, hyperrealism, hyper detailed, strong expressiveness and emotionality, Alex Ross, Brandon Choi, Luis Royo, John Romita Jr., cinematic lighting, visual clarity, 200mm, UHD, 32k, 16k, 8k, 3D shading, Tone Mapping, Ray Tracing, Global Illumination, Super-Resolution, gigapixel, color grading, retouch, enhanced, PBR, Blender, V-ray, Procreate, zBrush, Unreal Engine 5, Cinema 4D, ROMM RGB, Adobe After Effects, 3DCG, VFX, SFX, FXAA, SSAO, --ar 9:16 --test --creative --upbeta --upbeta --upbeta --upbeta --upbeta --upbeta"
Men det går att få snygga bilder utan en massa konstiga extra kommandon. Här är ett lejon som bara innehåller information om VAD jag vill se, inte HUR den ska renderas med undantag för vilken stil (Sana Takeda och digital art) den ska använda.
"hero splash art, Leonin lionfolk anthro Lion person proportional, fighter paladin, moon blessed, in the style of sana takeda illustrator monstress, digital art"
Där fick jag två alternativ och jag gillade båda, så sa till MidJourney att göra nya versioner av båda och här är två olika slutresultat (fick många andra snygga bilder, men har spammat nog med bilder nu)
Blev många bilder så slutar nu, men ifall Ni vill kan jag lite senare ge fler exempel och visa hur olika miljöer kan bli med några olika nyckelord.