DeepDream - DeepDream
| Část série na |
|
Strojové učení a dolování dat |
|---|
DeepDream je program pro počítačové vidění vytvořený inženýrem společnosti Google Alexandrem Mordvintsevem, který pomocí konvoluční neuronové sítě vyhledává a vylepšuje vzory v obrazech pomocí algoritmické pareidolia , čímž vytváří záměrně přepracovaný obraz jako psychedelický vzhled jako ve snu .
Program Google popularizoval termín (hluboký) „snění“, který odkazuje na generování obrázků, které produkují požadované aktivace v trénované hluboké síti , a tento termín nyní odkazuje na soubor souvisejících přístupů.
Dějiny
Software DeepDream, který vznikl v hluboké konvoluční síti s kódovým označením „Inception“ podle stejnojmenného filmu , byl vyvinut pro ImageNet Large-Scale Visual Recognition Challenge (ILSVRC) v roce 2014 a vydán v červenci 2015.
Myšlenka na snění a jméno se staly populární na internetu v roce 2015 díky programu Google DeepDream. Tato myšlenka pochází z rané historie neuronových sítí a k syntéze vizuálních textur byly použity podobné metody. Související nápady vizualizace byly vyvinuty (před prací společnosti Google) několika výzkumnými skupinami.
Poté, co Google zveřejnil jejich techniky a vytvořil svůj kód jako open-source , objevila se na trhu řada nástrojů v podobě webových služeb, mobilních aplikací a desktopového softwaru, které uživatelům umožňují transformovat vlastní fotografie.
Proces
Tento software je navržen tak, aby detekoval tváře a jiné vzory v obrazech, s cílem automaticky klasifikovat obrázky. Jakmile je však síť vycvičena, lze ji provozovat i obráceně a je třeba ji mírně upravit tak, aby daný výstupní neuron (např. Ten pro tváře nebo určitá zvířata) poskytoval vyšší skóre spolehlivosti. Toho lze využít pro vizualizace k lepšímu porozumění vznikající struktuře neuronové sítě a je to základ konceptu DeepDream. Tento postup obrácení není nikdy dokonale jasný a jednoznačný, protože využívá proces mapování jedna k mnoha . Po dostatečných opakováních však budou i snímky původně postrádající hledané vlastnosti dostatečně upraveny, aby byla výsledkem forma pareidolie , pomocí které se algoritmicky generují psychedelické a surrealistické obrazy. Optimalizace se podobá zpětnému šíření , ale místo úpravy síťových hmotností jsou váhy drženy pevně a je upravován vstup.
Například stávající obrázek lze změnit tak, aby byl „více kočičí“, a výsledný vylepšený obrázek lze znovu zadat do postupu. Toto použití připomíná aktivitu hledání zvířat nebo jiných vzorů v oblacích.
Aplikování gradientového sestupu nezávisle na každý pixel vstupu vytváří obrazy, ve kterých sousední pixely mají malý vztah, a proto má obraz příliš mnoho vysokofrekvenčních informací. Vygenerované obrázky lze výrazně zlepšit zahrnutím předchozího nebo regulačního nástroje, který upřednostňuje vstupy, které mají přirozenou statistiku obrazu (bez upřednostňování jakéhokoli konkrétního obrázku) nebo jsou jednoduše plynulé. Například Mahendran et al. použil regulátor celkové variace, který upřednostňuje obrazy, které jsou po částech konstantní. Různé regulátory jsou diskutovány dále v. Nedávno byl publikován hloubkový vizuální průzkum technik vizualizace a regularizace funkcí.
Uvedená podobnost snímků s halucinacemi indukovanými LSD - a psilocybinem naznačuje funkční podobnost mezi umělými neurálními sítěmi a konkrétními vrstvami zrakové kůry.
Computerphile, přehlídka počítačových věd , podrobně popisuje procesy strojového učení používané ve službě Google Dream.
Používání
Snovou myšlenku lze použít na skryté (interní) neurony jiné než ty, které jsou ve výstupu, což umožňuje zkoumání rolí a reprezentací různých částí sítě. Je také možné optimalizovat vstup tak, aby uspokojil buď jeden neuron (toto použití se někdy nazývá Maximalizace aktivity), nebo celou vrstvu neuronů.
Zatímco snění se nejčastěji používá k vizualizaci sítí nebo k produkci počítačového umění, nedávno bylo navrženo, že přidání „vysněných“ vstupů do sady školení může zlepšit časy školení pro abstrakce v informatice.
Bylo také prokázáno, že model DeepDream má uplatnění v oblasti dějin umění .
DeepDream byl použit pro videoklip Foster the People k písni „Doing It for the Money“.
V roce 2017 vytvořila výzkumná skupina z University of Sussex stroj na halucinace , který aplikuje algoritmus DeepDream na předem zaznamenané panoramatické video, což uživatelům umožňuje prozkoumávat prostředí virtuální reality a napodobovat tak zážitek z psychoaktivních látek a/nebo psychopatologických stavů. Byli schopni prokázat, že subjektivní zážitky vyvolané halucinačním strojem se významně lišily od kontrolních (nehallucinogenních) videí, přičemž vykazovaly fenomenologické podobnosti s psychedelickým stavem (po podání psilocybinu).
Viz také
Reference
externí odkazy
- Deep Dream, pythonový notebook na GitHubu
- Mordvintsev, Alexander; Olah, Christopher; Tyka, Mike (17. června 2015). „Inceptionism: Going Deeper into Neural Networks“ . Archivováno od originálu dne 2015-07-03.