RLAIF

Reinforcement Learning from AI Feedback

Reinforcement LearningIntroduced 200019 papers

Papers Using This Method

Toward Evaluative Thinking: Meta Policy Optimization with Evolving Reward Models2025-04-28 R2Vul: Learning to Reason about Software Vulnerabilities with Reinforcement Learning and Structured Reasoning Distillation2025-04-07 Synthetic Data Generation & Multi-Step RL for Reasoning & Tool Use2025-04-07 Training Dialogue Systems by AI Feedback for Improving Overall Dialogue Impression2025-01-22 PopAlign: Diversifying Contrasting Patterns for a More Comprehensive Alignment2024-10-17 Exploring LLM-based Data Annotation Strategies for Medical Dialogue Preference Alignment2024-10-05 Generative Reward Models2024-10-02 MaFeRw: Query Rewriting with Multi-Aspect Feedbacks for Retrieval-Augmented Large Language Models2024-08-30 Applying RLAIF for Code Generation with API-usage in Lightweight LLMs2024-06-28 Diminishing Stereotype Bias in Image Generation Model using Reinforcemenlent Learning Feedback2024-06-27 Multi-objective Reinforcement learning from AI Feedback2024-06-11 Are You Sure? Rank Them Again: Repeated Ranking For Better Preference Datasets2024-05-29 Optimization-based Prompt Injection Attack to LLM-as-a-Judge2024-03-26 CodeUltraFeedback: An LLM-as-a-Judge Dataset for Aligning Large Language Models to Coding Preferences2024-03-14 HRLAIF: Improvements in Helpfulness and Harmlessness in Open-domain Reinforcement Learning From AI Feedback2024-03-13 A Critical Evaluation of AI Feedback for Aligning Large Language Models2024-02-19 Direct Large Language Model Alignment Through Self-Rewarding Contrastive Prompt Distillation2024-02-19 FinTral: A Family of GPT-4 Level Multimodal Financial Large Language Models2024-02-16 Tuning Large Multimodal Models for Videos using Reinforcement Learning from AI Feedback2024-02-06