Unleashing the Power of Neural Discourse Parsers -- A Context and Structure Aware Approach Using Large Scale Pretraining

Grigorii Guz, Patrick Huber, Giuseppe Carenini

2020-11-06Machine Translation Opinion Mining Discourse Parsing Translation

Abstract

RST-based discourse parsing is an important NLP task with numerous downstream applications, such as summarization, machine translation and opinion mining. In this paper, we demonstrate a simple, yet highly accurate discourse parser, incorporating recent contextual language models. Our parser establishes the new state-of-the-art (SOTA) performance for predicting structure and nuclearity on two key RST datasets, RST-DT and Instr-DT. We further demonstrate that pretraining our parser on the recently available large-scale "silver-standard" discourse treebank MEGA-DT provides even larger performance benefits, suggesting a novel and promising research direction in the field of discourse analysis.

Results

Task	Dataset	Metric	Value	Model
Discourse Parsing	RST-DT	Standard Parseval (Nuclearity)	61.86	Guz et al. (2020) (pretrained)
Discourse Parsing	RST-DT	Standard Parseval (Span)	72.94	Guz et al. (2020) (pretrained)
Discourse Parsing	RST-DT	Standard Parseval (Nuclearity)	61.38	Guz et al. (2020)
Discourse Parsing	Instructional-DT (Instr-DT)	Standard Parseval (Nuclearity)	46.59	Guz et al. (2020) (pretrained)
Discourse Parsing	Instructional-DT (Instr-DT)	Standard Parseval (Span)	65.41	Guz et al. (2020) (pretrained)
Discourse Parsing	Instructional-DT (Instr-DT)	Standard Parseval (Nuclearity)	44.41	Guz et al. (2020)
Discourse Parsing	Instructional-DT (Instr-DT)	Standard Parseval (Span)	64.55	Guz et al. (2020)

Related Papers

A Translation of Probabilistic Event Calculus into Markov Decision Processes2025-07-17 Function-to-Style Guidance of LLMs for Code Translation2025-07-15 Speak2Sign3D: A Multi-modal Pipeline for English Speech to American Sign Language Animation2025-07-09 Pun Intended: Multi-Agent Translation of Wordplay with Contrastive Learning and Phonetic-Semantic Embeddings2025-07-09 Unconditional Diffusion for Generative Sequential Recommendation2025-07-08 GRAFT: A Graph-based Flow-aware Agentic Framework for Document-level Machine Translation2025-07-04 TransLaw: Benchmarking Large Language Models in Multi-Agent Simulation of the Collaborative Translation2025-07-01 CycleVAR: Repurposing Autoregressive Model for Unsupervised One-Step Image Translation2025-06-29