LABELS a hluboké neuronové sítě

V rámci vizuálních experimentů laboratoř LABELS využívá již několik let tzv. hluboké neuronové sítě, které mají při provádění experimentů napomoci rozpoznávání a třídění vizuálních podnětů. Biologickými (lidskými) neuronovými sítěmi volně inspirované umělé neuronové sítě jsou navrženy tak, aby dokázaly relativně samostatně provádět nespecifické úkoly a na základě určité člověkem zadané klasifikace spojují vstupy s výstupy – jinými slovy se sítě postupně učí. Dobrým příkladem jsou právě obrázky, které lze díky síti vyhledávat a třídit stejně jako rozpoznávat nové – síť se ze své podstaty při každém experimentu poučí a výběr zdokonalí. Co činí umělé neuronové sítě zajímavými je fakt, že svým vyhodnocováním a řešením problémů se vzdáleně podobá lidské mysli – síť není omezena specifickými postupy a úkony, lidský zásah je omezen na základní instrukce.

Schéma hluboké neuronové sítě

Hluboké neuronové sítě jsou však pro laboratoř zajímavé zejména tím, že mohou být využívány k predikci. Právě na predikci se soustředí nový výzkum Jiřího a Filipa, který právě v LABELS probíhá – pilotní projekt tak prozkoumává možnosti neuronových sítí předpovídat výkon participantů při úloze change blindness (slepota ke změně). Obecně se však nejedná o první příklad využití neuronových sítí obou autorů v LABELS: Ve své studii Jiří L. a Filip D. z roku 2017 využili funkce hlubokých neuronových sítí pro to, aby určili kritérium uniformity a jedinečnosti vizuálních podnětů (Více zde: https://rd.springer.com/article/10.3758/s13414-017-1375-9).

Co činí hluboké neuronové sítě hlubokými

Jednoduché neuronové sítě od těch hlubokých rozlišuje poněkud obligátně jejich hloubka (kromě jiného). Jinými slovy počet vrstev skrz které data v rámci rozpoznávání prochází. To si lze představit právě na vizuálních podnětech: představme si, že naše neuronová síť umí v datech rozeznat obličeje a následně třídit data s usměvavými a naštvanými obličeji. Hluboká neuronová síť musí data třídit alespoň na dvou úrovních – (1) jedná se o obličej? a (2) usmívá se obličej anebo se mračí? Ve skutečnosti však síť zpracovává bezpočet hierarchicky seřazených úrovní od nejzákladnějších vlastností, které by donedávna bylo nutné třídit postupně na základě jedné (následně další a další). Hluboká neuronová síť je tak velmi efektivním „třídičem“ dat, kterou lze použít na různorodé podněty.

Hluboké neuronové sítě jako nástroj poznání podstaty humoru

Zatímco v LABELS jsou neuronové sítě využívány pro vizuální podněty, jiní autoři využívají sítě pro různé bohulibé účely – kupř. Poria a kol. autorů (2016) se pokusili neuronové sítě naučit rozpoznávat sarkasmus v tweetech na základě určení rozporu mezi domnělou pozitivitou sděleného a objektivní skutečností. Příkladem může být i věta vedoucího komentující podruhé přepracovávanou diplomovou práci: „Kolegovi se ta práce zase moc povedla.“ Jinými slovy doslovný sentiment ve větě je pozitivní, nicméně objektivní fakt je s tímto sentimentem v rozporu. Autoři na základě těchto poznatků vytvářejí model neuronových sítí založený na zmíněném (1) sentimentu, (2) emocích a (3) osobnosti daného člověka. Neuronové síti dali k dispozici korpus několika datasetů tweetů přerozdělených kupř. na zákadě hashtagu #sarcasm. Na různých datasetech tak neuronové sítě dokázaly rozpoznat sarkasmus až u cca 90 % tweetů. I přesto, že rozpoznatelnost s různou velikostí datasetů a jejich komplexností kolísá, není rozeznávání sarkasmu u lidí neuronovými sítěmi ani zdaleka neúspěšné. Výzkum zároveň poukazuje na základní předpoklad fungování všech hlubokých neuronových sítí – a tím je jasná instrukce / model fungování.

Hluboké neuronové sítě jako nástroj zkázy

To je ostatně i odpověď na některé apokalyptické scénáře využívání neuronových sítí – kdo by měl obavy, že nás neuronové sítě brzy předčí snad i v humoru, tam lze jednoduše odpovědět, že tak tomu nebude moci být, dokud sami docela neporozumíme danému problému v celé své komplexnosti a neuronové síti „nesdělíme“ jasné instrukce. To se zdá, že zatím nejlépe umíme v případě obrázků či hlasu. A to je ostatně hlavní záměr výzkumníků v LABELS.

3/6/2018 (mp)

Poznámky

Na výzkumu sarkasmu se významně podílí i čeští vědci v čele s Tomášem Ptáčkem ze Západočeské Univerzity v Plzni.

Principy neuronových sítí jsou jednoduše ozřejmené kupř. zde: https://www.youtube.com/watch?v=V1eYniJ0Rnk

Zdroje

TechTalks (ilustrace).

Deeplearning4j: https://deeplearning4j.org

Extremetech: https://www.extremetech.com/extreme/215170-artificial-neural-networks-are-changing-the-world-what-are-they

Lukavský, J., & Děchtěrenko, F. (2017). Visual properties and memorising scenes: Effects of image-space sparseness and uniformity. Attention, Perception, & Psychophysics, 79(7), 2044-2054.

Poria, S., Cambria, E., Hazarika, D., & Vij, P. (2016). A deeper look into sarcastic tweets using deep convolutional neural networks. arXiv preprint arXiv:1610.08815.

Ptáček, T., Habernal, I., & Hong, J. (2014). Sarcasm detection on czech and english twitter. In Proceedings of COLING 2014, the 25th International Conference on Computational Linguistics: Technical Papers (pp. 213-223).