Sentiment analyse op transcripties van interviews met ouderen

Onderzoeker Deniece Nazareth van de Universiteit Twente interviewde voor haar promotieonderzoek een groep ouderen over speciale en emotionele momenten in hun leven. Van deze interviews werd een dataset gemaakt met video, audio en interview-transcripten in het Nederlands. Ze vroeg zich af of er een patroon zat in de emotionele inhoud van de verhalen van haar onderzoeksdeelnemers.

Samen met Deniece en Lorenzo Gatti heb ik een verzameling tools voor sentiment analysis (natural language processing voor het analyseren van positieve en negatieve emoties en meningen) getest en vergeleken om te zien of we automatisch positieve en negatieve emoties in de interview-transcripties konden detecteren.

Uiteindelijk concludeerden we dat bestaande open-source sentimentanalysetools voor het Nederlands nog niet geavanceerd genoeg zijn om emoties te detecteren, dus zijn we mogelijke verbeteringen gaan onderzoeken voor Pattern, een van de open source tools die ook de Nederlandse taal ondersteunt. Onze experimenten leidden uiteindelijk tot een publicatie in het tijdschrift Computational Linguistics in the Netherlands. Dr. Gatti en ik schreven ook een proof-of-concept-tool voor sentimentanalyse op tekstdatasets. Deze tool is gebaseerd op VADER/nltk en Pattern, en kan worden gebruikt als een alternatief voor LiWC, de standaard voor tekstanalyse in psychologisch onderzoek. We hebben gekozen voor een aanpak met sentiment lexicons omdat dit een 100% transparante analyse oplevert, wat heel belangrijk is voor het onderzoek. Deniece gebruikt momenteel de tool voor het analyseren van valence (positieve en negatieve emotie) in haar promotieonderzoek. De tool is ook gedeeld binnen de afdeling Psychologie van de Faculty of Behavioural, Management and Social sciences (BMS) aan de Universiteit Twente, zodat andere onderzoekers en studenten er gebruik van kunnen maken.

Foto door Tiago Muraro via Unsplash

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *