Neuronales Netz erkennt Emotionen in Fotos
London/Seoul (pte002/28.01.2021/06:05) – Forscher von Samsung AI http://bit.ly/3pn6M3p und dem Imperial College London http://imperial.ac.uk haben ein System zur Erkennung des emotionalen Status eines menschlichen Gesichts auf einem Foto entwickelt. Ein selbstlernendes neuronales Netzwerk erkennt auch subtile Charakteristiken von positiven und negativen Emotionen in Echtzeit. Erste Tests ergaben eine „bislang ungeahnte Genauigkeit“, die auch Menschen nicht übertreffen.
Valenz und Erregung
„Wir arbeiten nun schon sehr lange an dem Problem der Erkennung von Gemütszuständen. Dabei ist uns klar geworden, dass es grundsätzlich nicht ausreicht, nur einige wenige Emotionen zu definieren, um die ganze Brandbreite an Affekten einzufangen, die der Mensch tagtäglich mit seinem Gesicht ausdrückt“, zitiert „TechXplore“ die Wissenschaftler, die ihren Ansatz in der aktuellen Ausgabe von „Nature Machine Intelligence“ präsentieren. Deshalb habe man sich auf zwei Dimensionen konzentriert: Valenz und Erregung.
Valenz ist ein Begriff aus der Psychologie und bestimmt allgemein, ob jemand gerade eine positive oder negative Gemütsregung durchlebt. Die Erregung gibt an, wie ruhig oder aufgeregt eine Person ist. „Unser Ziel ist es, rein aufgrund eines Fotos des Gesichts eines Menschen automatisch verlässliche Aussagen über seine Valenz- und Erregungswerte zu treffen“, erklären die Experten.
Deep-Learning-Technologie
Um diese Vorgabe zu erreichen, haben die Forscher nach der Deep-Learning-Methode ein künstliches neuronales Netzwerk entwickelt und dieses ein intensives Training mit einem riesigen Datensatz von Personenfotos absolvieren lassen. Bei diesen achteten sie besonders darauf, dass die Bilder aus dem normale Alltag der Menschen stammen. „Es hat sich gezeigt, dass es besser ist, Fotos zu verwenden, die einfach im Alltag gemacht wurden und nicht in einem Studio, wenn man eine Technik haben will, die auch im Alltag gut funktioniert“, stellen die Forscher klar.
Bei ersten Testläufen gelang es der Deep-Learning-Technologie, sowohl die Valenz als auch die Erregung auf Fotos mit Gesichtern mit „bislang ungeahnter Genauigkeit“ festzustellen, heißt es. Die Qualität der Analyseergebnisse sei in etwa gleich einzuschätzen wie bei einem menschlichen Experten, der versucht, die Emotionen der abgebildeten Personen richtig zu deuten. „Als nächstes wollen wir unser System weiterentwickeln, damit es nicht nur bei statischen Bildern, sondern auch bei Videos funktioniert“, verraten seine Erfinder.