Text-to-Text Pre-Training for Data-to-Text Tasks

Mihir Kale, Abhinav Rastogi

2020-05-21INLG (ACL) 2020 12Data-to-Text Generation Text Generation Transfer Learning Language Modelling

Abstract

We study the pre-train + fine-tune strategy for data-to-text tasks. Our experiments indicate that text-to-text pre-training in the form of T5, enables simple, end-to-end transformer based models to outperform pipelined neural architectures tailored for data-to-text generation, as well as alternative language model based pre-training techniques such as BERT and GPT-2. Importantly, T5 pre-training leads to better generalization, as evidenced by large improvements on out-of-domain test sets. We hope our work serves as a useful baseline for future research, as transfer learning becomes ever more prevalent for data-to-text tasks.

Results

Task	Dataset	Metric	Value	Model
Text Generation	WebNLG	BLEU	64.7	T5-Base
Text Generation	MULTIWOZ 2.1	BLEU	35.1	T5-Base
Text Generation	WebNLG Full	BLEU	57.1	T5-Large
Text Generation	ToTTo	BLEU	49.5	T5-3B
Text Generation	ToTTo	PARENT	58.4	T5-3B
Data-to-Text Generation	WebNLG	BLEU	64.7	T5-Base
Data-to-Text Generation	MULTIWOZ 2.1	BLEU	35.1	T5-Base
Data-to-Text Generation	WebNLG Full	BLEU	57.1	T5-Large
Data-to-Text Generation	ToTTo	BLEU	49.5	T5-3B
Data-to-Text Generation	ToTTo	PARENT	58.4	T5-3B

Related Papers

Visual-Language Model Knowledge Distillation Method for Image Quality Assessment2025-07-21 RaMen: Multi-Strategy Multi-Modal Learning for Bundle Construction2025-07-18 Making Language Model a Hierarchical Classifier and Generator2025-07-17 Disentangling coincident cell events using deep transfer learning and compressive sensing2025-07-17 VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning2025-07-17 The Generative Energy Arena (GEA): Incorporating Energy Awareness in Large Language Model (LLM) Human Evaluations2025-07-17 Inverse Reinforcement Learning Meets Large Language Model Post-Training: Basics, Advances, and Opportunities2025-07-17 Mitigating Object Hallucinations via Sentence-Level Early Intervention2025-07-16