Tasks SotA Datasets Papers Methods Submit About

Papers With Code 2

A community resource for machine learning research: papers, code, benchmarks, and state-of-the-art results.

Explore

Notable Benchmarks All SotA Datasets Papers Methods

Community

Submit Results About

Data sourced from the PWC Archive (CC-BY-SA 4.0). Built by the community, for the community.

Sarsa

Reinforcement LearningIntroduced 199456 papers

Description

Sarsa is an on-policy TD control algorithm:

$Q\left(S\_{t}, A\_{t}\right) \leftarrow Q\left(S\_{t}, A\_{t}\right) + \alpha\left[R_{t+1} + \gamma{Q}\left(S\_{t+1}, A\_{t+1}\right) - Q\left(S\_{t}, A\_{t}\right)\right]$

This update is done after every transition from a nonterminal state $S\_{t}$ . if $S\_{t+1}$ is terminal, then $Q\left(S\_{t+1}, A\_{t+1}\right)$ is defined as zero.

To design an on-policy control algorithm using Sarsa, we estimate $q\_{\pi}$ for a behaviour policy $\pi$ and then change $\pi$ towards greediness with respect to $q\_{\pi}$ .

Source: Sutton and Barto, Reinforcement Learning, 2nd Edition

Papers Using This Method

A Unified Anti-Jamming Design in Complex Environments Based on Cross-Modal Fusion and Intelligent Decision-Making2025-06-09 Reinforcement Learning for Hanabi2025-05-31 Convergent NMPC-based Reinforcement Learning Using Deep Expected Sarsa and Nonlinear Temporal Difference Learning2025-02-07 Segmenting Action-Value Functions Over Time-Scales in SARSA via TD($Δ$)2024-11-22 A novel agent with formal goal-reaching guarantees: an experimental study with a mobile robot2024-09-23 Reinforcement Learning for Rate Maximization in IRS-aided OWC Networks2024-09-07 Optimally Solving Simultaneous-Move Dec-POMDPs: The Sequential Central Planning Approach2024-08-23 The State-Action-Reward-State-Action Algorithm in Spatial Prisoner's Dilemma Game2024-06-25 SwiftRL: Towards Efficient Reinforcement Learning on Real Processing-In-Memory Systems2024-05-07 Research on Robot Path Planning Based on Reinforcement Learning2024-04-22 State-Separated SARSA: A Practical Sequential Decision-Making Algorithm with Recovering Rewards2024-03-18 Enhancing Classification Performance via Reinforcement Learning for Feature Selection2024-03-09 An Index Policy Based on Sarsa and Q-learning for Heterogeneous Smart Target Tracking2024-02-19 Using Reinforcement Learning to Optimize Responses in Care Processes: A Case Study on Aggression Incidents2023-10-02 Career Path Recommendations for Long-term Income Maximization: A Reinforcement Learning Approach2023-09-11 Exploring reinforcement learning techniques for discrete and continuous control tasks in the MuJoCo environment2023-07-20 PCG-based Static Underground Garage Scenario Generation2023-07-08 Convergence of SARSA with linear function approximation: The random horizon case2023-06-07 On Modeling Network Slicing Communication Resources with SARSA Optimization2023-01-11 Analysis of Reinforcement Learning Schemes for Trajectory Optimization of an Aerial Radio Unit2022-11-18