DALL-E 2 AI od OpenAI je špatná zpráva pro některé umělce

DALL-E 2 od OpenAI byl šokem pro ty, kteří si mysleli, že umělá inteligence nikdy (nebo alespoň ne brzy) nezačne pronikat do sféry kreativity. Ale DALL-E 2 je tu proto, aby umělce zaměstnal?

Jak funguje DALL-E 2?

DALL-E 2 je tak působivý, že to vypadá skoro jako kouzlo, ale obecné podrobnosti o tom, jak vytváří tak úžasné, živé obrazy, není tak těžké pochopit.

DALL-E 2 se skládá ze dvou hlavních komponent. Prvním z nich je GPT-3 , což je pravděpodobně dosud nejpokročilejší algoritmus strojového učení přirozeného jazyka. DALL-E 2 také používá další model OpenAI známý jako CLIP (Contrastive Language-Image Pre-training).

GPT-3 a CLIP umožňují počítači porozumět a vytvářet komplexní přirozený jazyk. Trénováním neuronové sítě DALL-E s miliardami obrázků a jejich popisy v přirozeném jazyce z (většinou) internetu se učí vztahy mezi pojmy.

Svým způsobem je DALL-E opakem běžné praxe strojového učení, kde poskytujete obrázek a AI se snaží popsat, co vidí.

Vzpomeňte si na nechvalně známou aplikaci „ Not a Hot Dog “ z televizní show v Silicon Valley . Rozdíl je v tom, že místo toho, abyste se AI zeptali, zda je obrázek hot dog nebo ne, popíšete hot dog a on vytvoří zcela originální obrázek hot dogu na základě všeho, co se o něm dozvěděla.

Druhou důležitou součástí DALL-E je způsob generování obrázků. Využívá techniku ​​známou jako „difuze“. Zejména porozumění popisu vytvořeného obrázku v lidské řeči se změní na obrázek pomocí modelu OpenAI nazvaného GLIDE . GLIDE pořídí snímek skládající se z náhodně generovaného šumu a poté tento šum postupně odstraňuje, dokud se neshoduje s obrazem, jak je popsáno v přirozeném jazyce. Je to něco jako sochař, který začíná kusem mramoru a odlamuje ho, dokud nezůstane jen socha.

Pro mnohem techničtější a podrobnější popis DALL-E 2 pod kapotou z celého srdce doporučujeme vysvětlení DALL-E 2 na blogu AssemblyAI deep learning.

Proč je DALL-E 2 tak revoluční

DALL-E 2 není zdaleka první software pro strojové učení schopný generovat obrázky. Existuje mnoho předchozích systémů a DALL-E 2 staví na zkušenostech získaných z těchto jiných projektů. Proč se tedy tato doba jeví jako zlomový bod?

Jedním z důležitých důvodů je, že obrázky, které DALL-E a DALL-E 2 vytvářejí, jsou esteticky příjemné. Jiné zobrazovací systémy AI často produkují obrázky, které lidé popisují jako znepokojivé nebo jako něco ze snu. Je to trochu jako Uncanny Valley, ale pro výtvarné umění. DALL-E 2 vytváří obrázky, které mají jasně umělecké oko nebo nějaký smysl pro estetiku.

Snímky, které DALL-E 2 vytváří, jsou tedy srovnatelné se snímky vytvořenými talentovanými umělci nebo fotografy, kteří celý život rozvíjeli své estetické cítění. Není těžké si představit, že se někdo takový dívá na obrázky, které DALL-E 2 dokáže vytvořit během několika sekund, a má pocit, že se stanou nepodstatnými.

Nejen, že systém dokáže vytvořit krásné obrázky s vysokým rozlišením během několika sekund z podnětů přirozeného jazyka, ale také může tyto obrázky přizpůsobit a upravit nebo poskytnout více variant existujícího obrázku – dokonce i toho, který poskytne uživatel. Znamená to, že by si umělci měli sbalit své stojany a kreslící tablety a „ naučit se kódovat “?

DALL-E 2 znamená, že se umělci změní, nikoli zmizí

OpenAI byla velmi opatrná, pokud jde o jednoduchou prezentaci své technologie světu. To je rozumné, protože je zde zjevně velký prostor pro zneužití. Nyní, když však ukázali, že to lze udělat, nebude čas, než komerční nebo nezávislí výzkumníci umělé inteligence zopakují to, co DALL-E dělá, a zpřístupní to všem. Velcí hráči ve strojovém učení mají také své vysoce výkonné umělce umělé inteligence, jako je  Google Imagen .

Protože Pandořinu skříňku nelze zavřít, budeme se muset smířit s tím, že svět výtvarného umění se nenávratně změní, ale to neznamená, že umělci odešli.

Jedním ze způsobů, jak se na to dívat, je, že tento druh technologie umožňuje vytvářet umění v rukou kohokoli. Důraz se nyní přesouvá od technické schopnosti vytvářet obrazy ke schopnosti přesně popsat a opakovat vaši vizi, dokud to, co vidíte na obrazovce, nebude odpovídat tomu, co jste měli na mysli. Jinými slovy, více lidí se nyní bude moci vyjadřovat vizuálně, stejně jako více lidí nyní bude moci provádět přesné výpočty díky existenci kalkulaček.

Některé typy umělců již nemusí mít životaschopné obchodní modely. Pokud vyděláváte provize za poplatek , budete mít problém konkurovat programu, který dokáže vytvořit stovky obrázků za hodinu na základě popisu zákazníka a téměř okamžitě tyto obrázky změnit. Místo toho můžete tyto nástroje použít k realizaci své vlastní vize a poté tyto jedinečné obrázky prodávat na základě svých pocitů.

Zákazník má vždy pravdu

Je také důležité si uvědomit, že tyto obrázky jsou nakonec vytvořeny pro lidskou spotřebu. My lidé máme vlastní soubor hodnot, který přesahuje pohodlí a technickou dokonalost. Ve světě, kde je generované umění hojné, a proto relativně levné a na jedno použití, bude vždy existovat publikum ochotné ocenit (a koupit) umění vytvořené člověkem, jednoduše proto, že může být relativně vzácné.

Jinými slovy, software jako DALL-E 2 by mohl znamenat konec pro umělce, kteří se živí uměním na montážní lince, ale je nepravděpodobné, že by ztlumil vyhlídky umělců, kteří mají co říct a kteří mají jedinečnou vizuální identitu. přes které můžete mluvit.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.