Sociale vaardigheden voor digitale mensen
Als de Covid-pandemie ons iets geleerd heeft, dan is het dat interacties in het echte leven niet kunnen worden vervangen door digitale varianten. Maar dit is niet de enige reden waarom Dr. Chirag Raman, universitair docent in de groep Patroonherkenning en Bio-informatica, onderzoekt hoe digitale agenten of avatars op een meer naadloze en levensechte manier met mensen kunnen communiceren. Met behulp van kunstmatige intelligentie en kennis over menselijk gedrag leert hij machines mensachtige sociale intelligentie te begrijpen en te vertonen – verbaal, vocaal en visueel. Aan de horizon lonken technologieën voor een breed scala aan toepassingen, van afstandsonderwijs en e-gezondheidszorg tot immersieve games.
Waarom is een computerwetenschapper geïnteresseerd in non-verbale communicatie?
Dit gesprek via Zoom is in zekere zin een belichaamde interactie, omdat je een tweedimensionaal beeld bent op mijn scherm. Terwijl we praten, lees ik ook de non-verbale signalen die je geeft. Dus als je knikt, neem ik aan dat ik iets zeg dat hout snijdt. Of als je fronst, neem ik aan dat ik iets raars heb gezegd. Stel je nu voor dat we elkaar niet via Zoom ontmoeten, maar in een virtual of augmented reality-situatie. Kunnen we die sociale signalen vertalen naar jouw digitale avatar? En kunnen we kunstmatige intelligentie leren om hetzelfde te doen?
Eigenlijk is realisme niet altijd het ultieme doel. Er zijn therapiesettings waarin patiënten zelfs de voorkeur geven aan een onrealistische digitale avatar boven een meer realistische therapeut. Maar inzicht in sociale signalen bij het genereren van gedrag voor deze avatars is altijd nuttig. Als je bijvoorbeeld een patiënt bent die in therapie is, wil je misschien het gevoel hebben dat je een goede verstandhouding hebt met de therapeut, dat die je begrijpt. Dan worden non-verbale uitdrukkingen relevant. Er is literatuur waaruit blijkt dat als je de persoon met wie je praat, nabootst, hij of zij het gevoel zal hebben een betere klik met jou te hebben. Dan is het erg belangrijk om de digitale agent op het juiste moment te laten glimlachen en knikken.
Wordt dat niet een beetje... griezelig?
Als het visueel realisme en het gedragsrealisme niet met elkaar kloppen, wordt het heel snel heel griezelig. Tien jaar geleden waren videogames veel minder realistisch. Dat was geen probleem, omdat de waarheidsgetrouwheid van hoe de avatars zich gedroegen overeenkwam met hoe onrealistisch ze eruitzagen. Maar met de geweldige graphics van nu, een prachtige avatar die naar je blijft staren zonder te knipperen of zonder de subtiele bewegingen die mensen maken … dat is eng, toch?
Een avatar leren knipperen met de ogen kan niet zo moeilijk zijn
Knipperen is slechts een van vele sociale signalen. En het interpreteren van de nuances van deze signalen is zeer subjectief. Er is bijvoorbeeld veel discussie over wat glimlachen nou precies inhoudt. Welke spieren worden aangespannen en hoe? Zonder kraaienpootjes rond de ogen kan een glimlach ook een grimas zijn. En het wordt nog veel complexer als je er een sociale betekenis aan probeert toe te kennen, omdat dezelfde uitdrukking door verschillende mensen in verschillende delen van de wereld verschillend kan worden geïnterpreteerd. Dit maakt het ook erg moeilijk om de prestaties van de avatar objectief te evalueren.
Om modellen menselijker te maken, moet je eerst menselijk gedrag begrijpen
Ik ben erg geïnteresseerd in het identificeren van causale relaties tussen gedragspatronen. Wanneer we met elkaar praten, is er een feedbackloop van waarneming en reactie. Een digitale agent zal naturalistischer reageren als hij deze causale patronen in non-verbaal gedrag begrijpt. Momenteel werk ik aan het koppelen van causaal redeneren aan gedragssynthese. Kunnen we bijvoorbeeld kunstmatige intelligentie iemands gedrag laten voorspellen door een deel van diens interacties met anderen te observeren? Zelfs het voorspellen van eenvoudig gedrag is voor AI technisch gezien heel moeilijk, omdat er veel mogelijke toekomsten zijn voor dezelfde soort input. Onderzoek naar causale patronen is nog altijd technisch van aard, omdat bestaande sociale theorieën eerst wiskundig uitgedrukt moeten worden om machinemodellen sociaal bewuster kunnen te maken. Maar als het ons lukt, kunnen we nieuwe inzichten teruggeven aan de sociale wetenschappen.
Via het Cytosplore platform kunnen onderzoekers de gegevens bij elke stap van de analyse bekijken. Als er sprake is van een groepering van cellen - dus een groep gelijksoortige cellen - kunnen onderzoekers direct de uitkomst zien. Wanneer onderzoekers naar deze dataset kijken, is de groepering echt logisch. "Deze interactiviteit en het daadwerkelijk tonen van de gegevens bij elke stap in het analyseproces is volgens mij wat het anders maakt dan andere methoden op dit gebied", zegt Thomas.
Ik wil een brug vormen tussen de informatica en de sociale wetenschappen.
Welke rol spelen de sociale wetenschappers in uw onderzoek?
Ik probeer mensen binnen te halen die mijn vaardigheden als computerwetenschapper kunnen aanvullen. Uiteindelijk maakt het minder uit wat onze vakgebieden zijn; waar het om gaat, is het stellen van de juiste vragen. Het lijkt wel alsof er vaak wordt aangenomen dat er aan een technische universiteit niet veel samenwerking is tussen mensen met verschillende achtergronden. Dat is niet waar! Ik wil een brug vormen tussen de informatica en de sociale wetenschappen. Een brug moet aan beide kanten verankerd zijn, maar je hebt ook mensen nodig die jou ook zien als brug. Die moeten proberen de kloof te overbruggen.
Je werkt ook samen met partners uit de industrie
Ja, ik heb het geluk gehad om samen te werken met mensen bij bedrijven als Google en Microsoft die, diep vanbinnen, eigenlijk academici zijn. Het idee is om onderzoek te doen dat het bedrijf niet per sé ten goede moet komen. Mijn Google-subsidie is bijvoorbeeld een onvoorwaardelijke donatie, ongeacht de uitkomsten. De échte vraag rondom de dichotomie van industrie versus academische wereld is: hoe kunnen we onze wetenschap toegankelijker en opener maken?
Als ik zie hoe het AI-veld zich de afgelopen zes maanden heeft uitgebreid, durf ik niet te voorspellen hoe het er over tien jaar uit zal zien!
Het zijn spannende tijden voor AI
Ja, er heeft een explosie plaatsgevonden in zowel de technische mogelijkheden van machinaal leren als de aandacht die het heeft gekregen bij het brede publiek en de media. Mensen kunnen nu spelen met AI-technieken zonder deze helemaal opnieuw te hoeven implementeren. Dat betekent ook dat er minder inzicht is in wat deze gereedschappen wel en niet doen, onder de motorkap. Het risico bestaat dat mensen onrealistische verwachtingen krijgen als ze de beperkingen van de technologie niet langer begrijpen. Ook het onderzoek explodeert: vorig jaar werden maar liefst tienduizend papers ingediend bij de Conference on Neural Information Processing Systems. Gelukkig werd die van ons geaccepteerd. Om eerlijk te zijn… als ik zie hoe het AI-veld zich de afgelopen zes maanden heeft uitgebreid, durf ik niet te voorspellen hoe het er over tien jaar uit zal zien!