Figurative language allows us to express ideas implicitly. Among its different forms, irony stands out due to the sharp contrast it often presents between what is literally said and what is actually meant. Unlike metaphors, which rely on comparisons, irony derives its effect from contradiction to the literal meaning, which makes it a powerful tool for creative expression and humour.However, because of its implicitness, irony can also be weaponized for ridicule, offence and insult, while keeping plausible deniability.As communication increasingly occurs at scale on digital platforms, much of it is now automatically generated or analysed by language models and moderation systems.
In turn, their ability to comprehend implicit language, including figurative language and irony, is taking on greater societal importance.
This dissertation examines the capacity of automatic systems, particularly language models, to identify irony in English and Dutch social media data.Besides knowing how well these models perform, it is key to understand the mechanisms by which these models interpret irony and arrive at their predictions.To this end, the thesis examines how language models process and explain ironic language, comparing their explanations to human interpretations. Finally, this study explores the role of background knowledge in ironic communication and assesses the extent to which computational models incorporate and utilize such knowledge.
The results show that language models can accurately predict whether a text is ironic in about three out of four cases, in both English and Dutch. To identify irony, these systems often rely on detecting strong positive sentiments, focusing on hyperbolic expressions that are strongly correlated with irony. While this strategy aligns with human interpretation, irony typically involves more than mere exaggeration; as identifying ironic contrast often requires background or world knowledge. Although automatic systems for irony detection exhibit some sensitivity to topical knowledge, the extent to which they access and apply this knowledge remains uncertain. Building on this, we investigate whether language models can connect topics to relevant world knowledge in the context of irony. Our findings indicate that generative models are well capable of producing meaningful explanations for irony in English, and can ground their interpretations in relevant world knowledge, even when this information is not explicitly present in the text. However, despite comparable detection performance for Dutch, these models struggle more to produce coherent explanations for irony in Dutch tweets.
Figuurlijk taalgebruik laat ons toe een boodschap op een subtiele en impliciete manier over te brengen. Ironie is daarbij een bijzondere vorm die vaak gebaseerd is op een contrast tussen wat er letterlijk gezegd en eigenlijk bedoeld wordt. In tegenstelling tot metaforen, een vorm van figuurlijk taalgebruik die gebaseerd is op gelijkenissen of gedeelde kenmerken, ontstaat ironie door een duidelijke tegenstelling tussen de letterlijke en de werkelijke boodschap. Dat maakt ironie niet alleen bijzonder geschikt voor humor en creativiteit, maar ook voor scherpe of spottende opmerkingen, vaak op een manier waarbij de spreker achteraf kan beweren dat het niet zo bedoeld was.
Automatische systemen en taalmodellen spelen een steeds grotere rol in hoe we (online) communiceren: ze schrijven en corrigeren teksten, analyseren ze en filteren of modereren gesprekken. Om dat op een zinvolle manier te doen, moeten ze ook leren omgaan met complex taalgebruik zoals ironie.
Dit doctoraatsonderzoek bestudeert in hoeverre automatische systemen, en specifiek taalmodellen, in staat zijn om ironie te herkennen in Engelse en Nederlandse tweets. De focus ligt niet alleen op het verbeteren van hun prestaties, maar vooral op het begrijpen hoe die systemen ironie detecteren. Daarom onderzoekt deze thesis hoe taalmodellen ironie verwerken en verklaren en hoe die aanpak verschilt van hoe mensen ironie interpreteren. Daarnaast wordt er gekeken welke rol wereldkennis speelt bij het begrijpen van ironie: Hoe gebruiken mensen die kennis? En in welke mate kunnen automatische systemen daar ook mee aan de slag?
Uit de resultaten blijkt dat taalmodellen in ongeveer driekwart van de gevallen correct voorspellen of een tekst ironisch is. Daarbij letten ze vaak op sterke, overdreven uitingen van positief sentiment.
Ook mensen gebruiken die strategie vaak om ironie uit te drukken, maar ironie herkennen gaat wel verder dan dat: ze letten vooral op tegenstrijdigheden en beroepen zich daarop vaak op de wereldkennis die ze bezitten. Automatische systemen lijken in zekere mate ook rekening te houden met het onderwerp of thema van een tekst, maar of ze daarbij echt wereldkennis inzetten, is niet zeker. Om dat verder te onderzoeken, werd gekeken of taalmodellen thema's kunnen koppelen aan relevante wereldkennis in ironische contexten. Dit onderzoek toont aan dat generatieve taalmodellen voor het Engels in staat zijn om ironie te herkennen en op een betekenisvolle manier uit te leggen. Ze lijken daarbij ook gebruik te maken van wereldkennis, zelfs als die niet letterlijk in de tekst staat. Voor het Nederlands presteren deze systemen ook goed bij het herkennen van ironie, maar ze slagen er minder goed in om ironie op een coherente manier uit te leggen.