MUStARD: Multimodal Sarcasm Detection Dataset

Castro, Santiago; Hazarika, Devamanyu; Pérez-Rosas, Verónica; Zimmermann, Roger; Mihalcea, Rada; Poria, Soujanya

Published 2019 | Version v2

Open dataset Metadata-only

MUStARD: Multimodal Sarcasm Detection Dataset

Description

We release the MUStARD dataset which is a multimodal video corpus for research in automated sarcasm discovery. The dataset is compiled from popular TV shows including Friends, The Golden Girls, The Big Bang Theory, and Sarcasmaholics Anonymous. MUStARD consists of audiovisual utterances annotated with sarcasm labels. Each utterance is accompanied by its context, which provides additional information on the scenario where the utterance occurs.

Name	Description
utterance	The text of the target utterance to classify.
speaker	Speaker of the target utterance.
context	List of utterances (in chronological order) preceding the target utterance.
context_speakers	Respective speakers of the context utterances.
sarcasm	Binary label for sarcasm tag.

Resource type	Open dataset
Title	MUStARD: Multimodal Sarcasm Detection Dataset
Creators	Castro, Santiago Hazarika, Devamanyu Pérez-Rosas, Verónica Zimmermann, Roger Mihalcea, Rada Poria, Soujanya
Formats	JSON format (.json)
License(s)	no license information available
External Resource	https://github.com/soujanyaporia/MUStARD#mustard-multimodal-sarcasm-detection-dataset

	All versions	This version
Views	186	52
Downloads	42	0
Data volume	399.0 kB	0 Bytes

MUStARD: Multimodal Sarcasm Detection Dataset

Description

Variables

Details

MUStARD: Multimodal Sarcasm Detection Dataset

Creators

Description

Description

Variables

Details

Related Resources