Przejdź do treści
Generowanie zdjęć

Generowanie zdjęć · · 8 min czytania

Midjourney: poradnik promptów

Anatomia promptu, parametry, sref i cref, spójne postacie i poprawianie dłoni. Praktyczny przewodnik.

Midjourney v7 nie czyta w myślach. Czyta prompt. Różnica między obrazem przypadkowym a takim, który trafia do moodboardu klienta, to nie „lepszy pomysł” — to lepsza struktura promptu i świadome użycie parametrów. Ten poradnik jest dla projektantów i twórców, którzy chcą przejść z „losowania” do powtarzalnego procesu. Bez magii. Z kontrolą.

Anatomia promptu

Dobry prompt ma sześć warstw. Nie musisz używać wszystkich w każdym obrazie, ale jeśli wynik cię nie satysfakcjonuje, prawie zawsze brakuje jednej z nich:

  • Temat (subject) — co widzimy: „starsza zegarmistrzyni przy biurku”.
  • Medium — technika: fotografia, akwarela, render 3D, ilustracja wektorowa.
  • Styl — referencja estetyczna: art deco, brutalizm, kino lat 70.
  • Światło (lighting)rim light, godzina złota, neon, miękkie światło okna.
  • Kompozycja — kadr i obiektyw: zbliżenie, szeroki kadr, ujęcie z góry, 35mm.
  • Nastrój (mood) — melancholijny, energetyczny, kliniczny, baśniowy.

Kolejność ma znaczenie. Midjourney waży słowa silniej na początku promptu. Najpierw temat, potem medium i styl, na końcu detale techniczne. To, co naprawdę chcesz dostać, idzie z przodu.

Parametry, których naprawdę używasz

Parametry dopisujesz na końcu promptu, po dwóch myślnikach. Lista, którą warto znać na pamięć:

  • --ar 16:9 — proporcje kadru. --ar 2:3 do plakatu, --ar 3:2 do fotografii, --ar 1:1 do ikon.
  • --stylize 100 — jak mocno model dokłada własny gust. Niżej = wierniej promptowi, wyżej = ładniej, ale „swobodniej”.
  • --chaos 25 — rozrzut wariantów w jednej siatce. Wysoki chaos daje cztery różne kierunki zamiast czterech podobnych.
  • --weird 250 — kontrolowana dziwność. Wprowadza nietypowe, czasem surrealne wybory estetyczne.
  • --srefstyle reference: dołączasz obraz (lub kod stylu), z którego model zapożycza estetykę, nie treść.
  • --crefcharacter reference: trzyma spójną postać między ujęciami (twarz, ubranie).
  • --no — wykluczenie. --no text usuwa napisy, --no people opróżnia scenę.

Zakresy: --stylize przyjmuje 0–1000, --chaos 0–100, --weird0–3000. Nie ruszaj trzech naraz na starcie — zmieniaj jeden parametr i obserwuj, co się dzieje. Inaczej nie nauczysz się, co który robi.

Kiedy podnosić, a kiedy obniżać stylize

To pytanie wraca najczęściej, więc konkretnie. --stylize to suwak między „rób dokładnie to, co napisałem” a „zrób to ładnie po swojemu”.

  • Niski (0–100) — gdy masz precyzyjny brief, layout produktowy, diagram, dokładną kompozycję. Model słucha słów.
  • Średni (100–300) — domyślna strefa do większości pracy komercyjnej. Balans między kontrolą a urodą.
  • Wysoki (500–1000) — gdy szukasz inspiracji, plakatu, czegoś efektownego i nie zależy ci na wierności co do detalu.

Praktyczna reguła: im bardziej szczegółowy prompt, tym niższy --stylize. Wysoki stylize na długim, precyzyjnym promptcie to przepis na frustrację — model zacznie „poprawiać” rzeczy, które chciałeś mieć dokładnie tak, jak napisałeś.

Prompty permutacyjne

Permutation prompts to najszybszy sposób na eksplorację wariantów bez ręcznego przepisywania. Klamry z opcjami rozdzielonymi przecinkami generują wszystkie kombinacje naraz. Przykład w prozie: piszesz temat, a w miejscu medium wstawiasz klamrę z trzema opcjami (fotografia, akwarela, render izometryczny), a w miejscu pory dnia drugą klamrę (świt, zmierzch). Trzy razy dwa daje sześć jobów jednym poleceniem.

Używaj tego do testów na starcie projektu: jedna oś to medium, druga to nastrój. W kilka minut masz tablicę kierunków, z której wybierasz jeden do dopracowania. Uwaga na koszt — permutacje mnożą liczbę generacji, więc trzymaj listy krótkie (2–4 opcje na oś).

Prompty obrazowe i blendowanie

Możesz wkleić jeden lub kilka adresów obrazów na początku promptu — Midjourney potraktuje je jako wizualny punkt startowy. Trzy zastosowania:

  1. Obraz + tekst — obraz nadaje kierunek, tekst dopowiada zmiany („ten budynek, ale o zmierzchu, w deszczu”).
  2. Blend dwóch obrazów — łączysz estetykę i formę z dwóch źródeł w jedną hybrydę.
  3. Image weight — parametrem --iw regulujesz, jak mocno obraz przeważa nad opisem tekstowym.

Rozróżnij to od --sref. Image prompt wpływa i na treść, i na styl. --srefbierze tylko estetykę — paletę, fakturę, sposób malowania światła — a temat zostawia twojemu opisowi tekstowemu. Do serii spójnej wizualnie używaj --sref, nie surowego image promptu.

Spójne postacie

Najtrudniejszy problem w pracy z Midjourney i najczęstszy powód, dla którego klienci wracają z uwagami. --cref rozwiązuje większość przypadków:

  • Wygeneruj najpierw jeden mocny portret postaci, który ci się podoba. To twój kanon.
  • Dołącz jego adres przez --cref do kolejnych promptów z nowymi scenami i pozami.
  • Parametrem --cw (0–100) sterujesz, ile model trzyma: wysoki --cw 100 kopiuje twarz, ubranie i fryzurę; --cw 0 trzyma tylko twarz, resztę puszcza.

Do zmiany ubrania bohatera między scenami obniżaj --cw, inaczej model uprze się przy tym samym płaszczu. Spójność to nie magia — to dyscyplina: jeden kanoniczny obraz i trzymanie się go w całej serii.

Łącz to z --sref, jeśli potrzebujesz nie tylko tej samej postaci, ale i tej samej estetyki w całej serii: --cref trzyma kogo widzimy, --sref trzyma jak to wygląda. Razem dają komiks, storyboard albo serię ilustracji do artykułu, które wyglądają jak narysowane jedną ręką, a nie zlepione z czterech różnych sesji.

Naprawianie dłoni i tekstu

Dwa klasyczne słabe punkty, na których model nadal się potyka, i dwa miejsca, w których klient najszybciej wytknie ci niedoróbkę. Dłonie poprawiły się w v7, ale przy złożonych gestach wciąż potrafią zawieść. Co działa w praktyce:

  • Dłonie — unikaj kadrów, gdzie ręce są na pierwszym planie i rozłożone. Użyj Vary (Region), zaznacz tylko dłoń i przegeneruj sam ten fragment.
  • Tekst — krótkie napisy w cudzysłowie czasem wychodzą, dłuższe prawie nigdy. Do logotypów i napisów realnie potrzebnych dorzuć je w edytorze graficznym — nie walcz z modelem o literowanie.
  • Jeśli nie chcesz przypadkowych napisów na obrazie, dopisz --no text.

Upscaling i Vary (Region)

Z siatki czterech obrazów wybierasz jeden i podbijasz rozdzielczość (Upscale). To etap finiszujący, nie eksploracyjny. Dwa narzędzia warto znać:

  • Vary (Subtle / Strong) — generuje warianty całego obrazu: subtle trzyma kompozycję, strong pozwala odpłynąć.
  • Vary (Region) — zaznaczasz fragment (tło, dłoń, detal) i przegenerujesz tylko jego, opcjonalnie z nowym promptem dla tego obszaru. To inpainting i najpotężniejsze narzędzie do poprawek bez utraty reszty kadru.

Reguła warsztatowa: najpierw skomponuj dobrą bazę przez prompt, dopiero potem poprawiaj przez Vary (Region). Próba załatwienia wszystkiego jednym idealnym promptem to strata czasu.

Częste błędy

Większość rozczarowań Midjourney ma kilka powtarzalnych przyczyn. Zanim obwinisz model, sprawdź, czy nie popełniasz którejś z nich:

  • Przeładowany prompt — dwadzieścia przymiotników nie daje obrazu bogatszego, tylko rozmytego. Model rozdziela „uwagę” na wszystkie słowa, więc żadne nie wybrzmiewa. Trzymaj się jednego wyraźnego tematu i kilku mocnych cech.
  • Sprzeczne sygnały — „minimalistyczny, bogato zdobiony, w stylu barokowym, czysty” to cztery kierunki naraz. Model uśredni je w papkę. Zdecyduj się.
  • Walka z parametrami zamiast z promptem — jeśli kompozycja jest zła, --stylize jej nie naprawi. Najpierw popraw opis tematu i kadru, parametry zostaw na koniec.
  • Wpisywanie negatywów do treści — „bez tła” w treści promptu czasem dodaje tło, bo model widzi słowo „tło”. Do wykluczeń służy --no, nie zdanie przeczące.
  • Porzucanie dobrego seeda — gdy złapiesz kompozycję blisko celu, nie zaczynaj od zera. Użyj Vary lub --sref z tego obrazu, żeby zachować to, co już działa.

Reguła nadrzędna: jeden prompt, jedna intencja. Eksploruj szeroko na starcie, potem zawężaj. Najlepsze wyniki rzadko padają w pierwszej siatce — padają w trzeciej lub czwartej, kiedy już wiesz, czego chcesz, i mówisz to modelowi prościej.

Pięć przykładowych promptów

  1. Portret produktowy: zegarek na ciemnym kamieniu, fotografia makro, miękkie światło okna z lewej, płytka głębia ostrości, nastrój minimalistyczny, --ar 4:5 --stylize 80.
  2. Plakat kinowy: samotna postać na pustej ulicy w deszczu nocą, neon, kino lat 80., szeroki kadr, --ar 2:3 --stylize 600 --chaos 20.
  3. Seria spójnej maskotki: kanoniczny portret + nowa scena (maskotka pije kawę w biurze), płaska ilustracja wektorowa, --cref [adres] --cw 80 --ar 1:1.
  4. Eksploracja stylu: temat stały, klamra permutacyjna na medium (akwarela, tusz, render izometryczny), --ar 3:2 --chaos 40.
  5. Render wnętrza: skandynawski salon o złotej godzinie, fotografia architektoniczna, obiektyw 24mm, ciepłe światło, --ar 16:9 --stylize 150 --no people.

TL;DR

Buduj prompt warstwami: temat, medium, styl, światło, kompozycja, nastrój — w tej kolejności. Niski --stylize do precyzyjnych briefów, wysoki do inspiracji.--sref kopiuje estetykę, --cref trzyma postać. Permutacje do eksploracji, image prompty do hybryd. Dłonie i detale naprawiaj przez Vary (Region), tekst dorabiaj w edytorze. Midjourney nagradza strukturę, nie szczęście.

Midjourney: poradnik promptów | vibecoding.pl