Midjourney v5: Jak používat AI na tvorbu obrázků? Návod a cena

Umělá inteligence v roli malíře

Umělá inteligence v roli malíře Zdroj: Midjourney

Souboj AI
Obraz „Théâtre D’opéra Spatial“ vytvořený pomoci AI. Autor Jason Allen
Takhle vidí skok z padáku umělá inteligence Midjoureney.
Investice 2023
Energetická krize v Evropě
23
Fotogalerie

K nejdiskutovanějším tématům v posledních měsících jednoznačně patří umělá inteligence (AI). Pozornost si získává zejména ChatGPT s vytvářením textů. AI ale zasahuje do mnoha dalších sfér. Díky službám, jako je Midjourney, o sobě nahlas dává vědět i v oblasti generování obrázků. Poslední verze Midjourney v5 přichází se snímky, které stěží rozeznáte od klasické fotografie.

Co je Midjourney?

Midjourney je online služba, která na základě textového zadání uživatele dokáže pomocí umělé inteligence vygenerovat požadované obrázky. Za nástrojem stojí stejnojmenná americká společnost Davida Holze, spoluzakladatele firmy Leap Motion zaměřené na bezdotykové ovládání počítače.

Služba byla v rámci veřejného testování spuštěna v červenci loňského roku. Díky principům, na nichž funguje umělá inteligence a strojové učení, se výstupy Midjourney neustále zkvalitňují. Nástroj tak přináší mnohem lepší výsledné obrázky než ve svých začátcích. V současnosti je k dispozici pátá verze Midjourney v5.

Jak funguje Midjourney?

Není vám jasné, jak funguje Midjourney a další podobné programy? Základní princip spočívá v tom, že dokážou rozpoznat význam mezi obrazem a textem. Algoritmus strojového učení je trénován na obrovském množství obrázků s textovým popisem, který uvádí, co je na nich zachyceno. Takže ve chvíli, kdy do chatbota napíšete svůj požadavek, je AI schopná vám vytvořit obrázek odpovídající vašemu popisu.

Co napíšete do textového pole, záleží pouze na vás. Požadavek může být velmi jednoduchý, například portrét kočky. AI si ale poradí i s detailním zadáním. Bez obav tak můžete v desítkách slov popsat, jak by obraz dané kočky měl přesně vypadat. Jen myslete na to, že vaše zadání musí být v angličtině.

Model je trénovaný na dostupných obrázcích z internetu. Nejlepších výsledků se proto dočkáte v případech, kdy má AI k dispozici velké množství podkladů – typicky u zvířat, krajin, známých osobností apod. Poznali byste například „AI fotku“ Elona Muska nebo Conora McGregora?

Cena Midjourney v5

Pokud chcete Midjourney v5 používat, musíte uhradit předplatné. Na výběr máte ze tří různých variant:

  • Basic (cena 10 dolarů za měsíc),
  • Standard (30 dolarů za měsíc),
  • Pro (60 dolarů za měsíc).

Ke zpracování vašeho příkazu Midjourney využívá grafické jednotky (GPU). V rámci tarifů si předplácíte čas, kdy jednotky pracují na vašich požadavcích (Fast GPU Time). Podle Midjourney potřebuje bot na vytvoření průměrného obrázku zhruba jednu minutu. S variantou Basic získáte 3,3 hodiny měsíčně, což přibližně odpovídá až 200 obrázkům. Na podmínky dalších tarifů se podívejte v tabulce. U plánů Standard a Pro obdržíte ještě neomezený Relax GPU Time. Jde o režim, v němž jsou vaše příkazy zpracovány s nižší prioritou, tedy výrazně pomaleji (podle Midjourney za asi 0–10 minut).

 Basic PlanStandard PlanPro Plan
Cena za měsíční předplatné10 USD30 USD60 USD
Cena za roční předplatné96 USD288 USD576 USD
Fast GPU Time3,3 h/měsíc15 h/měsíc30 h/měsíc
Relax GPU Time neomezenýneomezený

Lze používat Midjourney zdarma?

Ještě v průběhu března si uživatelé mohli Midjourney vyzkoušet 25 minut zdarma. Vzhledem k rostoucímu počtu případů zneužití a velkému zájmu, který kvůli nedostatečné výpočetní kapacitě způsoboval výpadky i platícím uživatelům, však vedení společnosti tuto možnost dočasně pozastavilo. V současné době tedy Midjourney zdarma k dispozici není.

Na vině jsou mimo jiné falešné obrázky osobností, které se začaly virálně šířit po internetu. K nejznámějším výtvorům patří například obrázek papeže Františka ve stylové péřové bundě pro hiphopery nebo „fotky“ ze smyšleného zatýkání Donalda Trumpa. Tyto realistické obrázky jsou ale vytvářeny v nejnovější verzi Midjourney v5, která ve zkušebním módu zdarma přístupná nebyla. Podobný krok proto nejspíš nebude mít na šíření falešných obrázků zásadní vliv.

Midjourney v5: Co umí nového?

Midjourney v5 sklízí chválu (a zároveň vyvolává strach) za vytváření velmi realistických obrázků, které lze někdy jen těžko odlišit od skutečné fotografie. V jakých oblastech udělala pátá verze největší pokrok? Jde zejména o:

  • vyšší rozlišení obrázků;
  • realističtější osvětlení;
  • lepší práci se stíny, odrazy či s odlesky;
  • detailnější rysy obličeje;
  • kvalitnější zpracování jazykových vstupů.

Obrazové generátory dlouhodobě bojovaly například se zobrazením lidské ruky. To se projevovalo třeba nestandardním počtem prstů nebo jejich zvláštními proporcemi. U Midjourney v5 došlo k velkému pokroku i v této sféře. Už byste se tak neměli dočkat dalších postav se šesti prsty (pokud o to bota vysloveně nepožádáte).

Registrace a založení účtu Midjourney

K tomu, abyste mohli začít zadávat příkazy pro vytváření obrázků, není potřeba žádný složitý návod. Registrace je rychlá a intuitivní.

  1. Na webu Midjourney.com klikněte na tlačítko Join the Beta. Stránka vás přesměruje na Discord – platformu, na níž probíhá generování obrázků.
  2. Zde si vyberete své uživatelské jméno, vyplníte telefonní číslo a zadáte ověřovací kód, který vám přijde SMS zprávou.
  3. Následně musíte provést ještě ověření za pomoci e-mailové adresy. Tím je registrace u konce.

Pokud účet na Discordu již máte, nemusíte se registrovat – pouze se přihlásíte.

Návod: Jak používat Midjourney 5?

Jak funguje používání Midjourney v5 v praxi?

  1. V Discordu si otevřete chat s botem.
  2. Do chatovacího řádku napíšete svůj příkaz. Ten bude v případě generování obrázku začínat lomítkem a slovem imagine (/imagine).
  3. Do rámečku, který se vám otevře, doplníte popis požadovaného obrázku v angličtině.
  4. Příkaz klávesou Enter odešlete.

Tak vypadá práce s jednoduchými požadavky. Po zadání příkazu /settings můžete upravovat své nastavení – především používanou verzi Midjourney či výslednou kvalitu generovaných obrázků.

Při zadávání pokročilých příkazů bude ovládání již trochu komplikovanější. Do chatovacího řádku lze uvést i URL konkrétních obrázků nebo specifické parametry, podle kterých je výsledný obrázek generován. Prostřednictvím parametrů můžete mimo jiné zadat, co na obrázku nechcete, případně blíže specifikovat stylizaci obrázku. Jak používat bota, zjistíte v manuálech dostupných přímo na webu Midjourney. Bohužel si zatím musíte vystačit s manuály v angličtině.

Lze používat Midjourney mimo Discord?

Jak jsme již uvedli, Midjourney běží přes Discord. Tuto komunikační platformu možná znáte. Svoji oblibu si díky nízké latenci (zpoždění) získala především mezi gamery. V případě, že Discord využíváte, si ušetříte proces registrace. Po přihlášení do Discordu si jen otevřete chat s botem. V současné době Midjourney jinde než na Discordu nespustíte. Do budoucna se ale počítá se zpřístupněním nástroje i na jiných platformách.

Copyright: Autorská práva a Midjourney

Oblast, v níž AI začíná vyvolávat velké vášně, jsou autorská práva. V první řadě jde o samotné trénování modelů. Midjourney v rámci učení zpracovává obrázky a texty dostupné na internetu. Autoři sice společnosti nedali souhlas s použitím svých děl, nicméně platné legislativy jsou nastavené ve prospěch rozvoje AI. Například evropská směrnice z roku 2019 umožňuje vytěžování dat (data mining) i z obsahu jinak chráněného autorským právem.

Pro výzkumné účely tato výjimka platí absolutně, při využití pro komerční účely ale mohou autoři a držitelé práv podobné využití odmítnout a uvést to třeba ve všeobecných podmínkách na webu. Jak potom ale zjistí, jestli jejich dílo bylo ze strany AI skutečně použito, či nikoli? Na to zatím nikdo nedokáže uspokojivě odpovědět. Obraz „Théâtre D’opéra Spatial“ vytvořený pomoci AI. Autor Jason AllenObraz „Théâtre D’opéra Spatial“ vytvořený pomoci AI. Autor Jason Allen|Jason Allen, Discord

Ožehavá je také otázka copyrightu konkrétních děl. Když v Midjourney zadáte příkaz na vytvoření obrázku ve stylu vybraného malíře, kdo by měl vlastnit autorská práva výtvoru? Vy, protože jste příkaz zadali? Nebo malíř (eventuálně jeho potomci), jehož dílo bylo do značné míry okopírováno a vykradeno? Například podle nedávného rozhodnutí amerického Úřadu pro autorská práva nemají obrázky vytvořené AI na copyright nárok.

Legislativní stránka věci bude v příštích měsících a letech nejspíš velkým tématem. Než se tyto klíčové otázky definitivně vyřeší, budeme s velkou pravděpodobností svědky mnoha soudních sporů. Vývoj AI v poslední době totiž nabral závratné tempo a v mnoha oblastech nejsou nastavená pravidla. Ostatně významné osobnosti technologického světa již volají po dočasném zastavení vývoje AI, aby si lidstvo mohlo ujasnit, jakým způsobem umělou inteligenci využívat.

Midjourney 5 vs. DALL-E 2

Jednou z hlavních konkurencí pro Midjourney je DALL-E 2 od OpenAI. Tato společnost stojí i za populárním chatbotem ChatGPT. DALL-E 2 byl dlouhou dobu vnímán jako vhodnější nástroj pro tvorbu realisticky vypadajících obrázků, zatímco Midjourney se doporučoval spíše pro generování kreativnějších výtvorů. Verze Midjourney v5 ale tento deficit v realističnosti smazala. Obecně se dá říct, že Midjourney nabízí více možností a pokročilejších funkcí. Na druhou stranu DALL-E 2 potěší uživatelsky přívětivějším rozhraním. Souboj AISouboj AI|Midjourney

Midjourney vs. Stable Diffusion

Spolu s Midjourney a DALL-E 2 se k nejpopulárnějším generátorům obrázků řadí Stable Diffusion od Stability AI. Na rozdíl od svých konkurentů není Stable Diffusion k dispozici jen na cloudu, program si můžete nainstalovat i přímo do počítače. Cloudová verze pak přichází pod názvem DreamStudio. Práci s generátorem si opět můžete vyzkoušet zdarma, stačí se přihlásit přes Google nebo Discord účet. Výstupy Stable Diffusion jsou rovněž ceněny hlavně pro svůj realistický vzhled. K nevýhodám patří menší rozlišení obrázků.