CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Aravind Srinivas, Michael Laskin, Pieter Abbeel

2020-04-08Atari Games 100k Reinforcement Learning Atari Games Continuous Control Contrastive Learning reinforcement-learning

Paper PDF Code(official)Code Code Code Code Code Code

Abstract

We present CURL: Contrastive Unsupervised Representations for Reinforcement Learning. CURL extracts high-level features from raw pixels using contrastive learning and performs off-policy control on top of the extracted features. CURL outperforms prior pixel-based methods, both model-based and model-free, on complex tasks in the DeepMind Control Suite and Atari Games showing 1.9x and 1.2x performance gains at the 100K environment and interaction steps benchmarks respectively. On the DeepMind Control Suite, CURL is the first image-based algorithm to nearly match the sample-efficiency of methods that use state-based features. Our code is open-sourced and available at https://github.com/MishaLaskin/curl.

Results

Task	Dataset	Metric	Value	Model
Continuous Control	Walker, walk (DMControl100k)	Score	403	CURL
Continuous Control	Cartpole, swingup (DMControl100k)	Score	582	CURL
Continuous Control	Cheetah, run (DMControl500k)	Score	518	CURL
Continuous Control	Reacher, easy (DMControl500k)	Score	929	CURL
Continuous Control	Finger, spin (DMControl100k)	Score	767	CURL
Continuous Control	Cheetah, run (DMControl100k)	Score	299	CURL
Continuous Control	Finger, spin (DMControl500k)	Score	926	CURL
Continuous Control	Ball in cup, catch (DMControl500k)	Score	959	CURL
Continuous Control	Reacher, easy (DMControl100k)	Score	538	CURL
Continuous Control	Walker, walk (DMControl500k)	Score	902	CURL
Continuous Control	Cartpole, swingup (DMControl500k)	Score	841	CURL
Continuous Control	Ball in cup, catch (DMControl100k)	Score	769	CURL
Atari Games	Atari 2600 Boxing	Score	4.8	CURL
Atari Games	Atari 2600 Ms. Pacman	Score	1492.8	CURL
Atari Games	Atari 2600 Freeway	Score	27.9	CURL
Atari Games	Atari 2600 Pong	Score	2.1	CURL
Atari Games	Atari 2600 Krull	Score	3833.6	CURL
Atari Games	Atari 2600 Breakout	Score	18.2	CURL
Atari Games	Atari 2600 Frostbite	Score	924	CURL
Atari Games	Atari 2600 Gopher	Score	801.4	CURL
Atari Games	Atari 2600 James Bond	Medium Human-Normalized Score	400.1	CURL
Atari Games	Atari 2600 Amidar	Score	232.3	CURL
Atari Games	Atari 2600 Crazy Climber	Score	27805.6	CURL
Atari Games	Atari 2600 Demon Attack	Score	834	CURL
Atari Games	Atari 2600 Battle Zone	Score	11208	CURL
Atari Games	Atari 2600 Asterix	Score	524.3	CURL
Atari Games	Atari 2600 Kung-Fu Master	Score	14280	CURL
Atari Games	Atari 2600 Kangaroo	Score	345.3	CURL
Atari Games	Atari 2600 Assault	Score	543.7	CURL
Atari Games	Atari 2600 Alien	Score	1148.2	CURL
Atari Games	Atari 2600 Seaquest	Score	408	CURL
Atari Games	Atari 2600 Chopper Command	Score	1198	CURL
Atari Games	Atari 2600 HERO	Score	6235.1	CURL
Atari Games	Atari 2600 Bank Heist	Score	193.7	CURL
Atari Games	Atari 2600 Private Eye	Score	105.2	CURL
Atari Games	Atari 2600 Q*Bert	Score	1225.6	CURL
Atari Games	Atari 2600 Road Runner	Score	6786.7	CURL
Atari Games	Atari 2600 Up and Down	Score	2735.2	CURL
Video Games	Atari 2600 Boxing	Score	4.8	CURL
Video Games	Atari 2600 Ms. Pacman	Score	1492.8	CURL
Video Games	Atari 2600 Freeway	Score	27.9	CURL
Video Games	Atari 2600 Pong	Score	2.1	CURL
Video Games	Atari 2600 Krull	Score	3833.6	CURL
Video Games	Atari 2600 Breakout	Score	18.2	CURL
Video Games	Atari 2600 Frostbite	Score	924	CURL
Video Games	Atari 2600 Gopher	Score	801.4	CURL
Video Games	Atari 2600 James Bond	Medium Human-Normalized Score	400.1	CURL
Video Games	Atari 2600 Amidar	Score	232.3	CURL
Video Games	Atari 2600 Crazy Climber	Score	27805.6	CURL
Video Games	Atari 2600 Demon Attack	Score	834	CURL
Video Games	Atari 2600 Battle Zone	Score	11208	CURL
Video Games	Atari 2600 Asterix	Score	524.3	CURL
Video Games	Atari 2600 Kung-Fu Master	Score	14280	CURL
Video Games	Atari 2600 Kangaroo	Score	345.3	CURL
Video Games	Atari 2600 Assault	Score	543.7	CURL
Video Games	Atari 2600 Alien	Score	1148.2	CURL
Video Games	Atari 2600 Seaquest	Score	408	CURL
Video Games	Atari 2600 Chopper Command	Score	1198	CURL
Video Games	Atari 2600 HERO	Score	6235.1	CURL
Video Games	Atari 2600 Bank Heist	Score	193.7	CURL
Video Games	Atari 2600 Private Eye	Score	105.2	CURL
Video Games	Atari 2600 Q*Bert	Score	1225.6	CURL
Video Games	Atari 2600 Road Runner	Score	6786.7	CURL
Video Games	Atari 2600 Up and Down	Score	2735.2	CURL
3D	Walker, walk (DMControl100k)	Score	403	CURL
3D	Cartpole, swingup (DMControl100k)	Score	582	CURL
3D	Cheetah, run (DMControl500k)	Score	518	CURL
3D	Reacher, easy (DMControl500k)	Score	929	CURL
3D	Finger, spin (DMControl100k)	Score	767	CURL
3D	Cheetah, run (DMControl100k)	Score	299	CURL
3D	Finger, spin (DMControl500k)	Score	926	CURL
3D	Ball in cup, catch (DMControl500k)	Score	959	CURL
3D	Reacher, easy (DMControl100k)	Score	538	CURL
3D	Walker, walk (DMControl500k)	Score	902	CURL
3D	Cartpole, swingup (DMControl500k)	Score	841	CURL
3D	Ball in cup, catch (DMControl100k)	Score	769	CURL
3D Face Modelling	Walker, walk (DMControl100k)	Score	403	CURL
3D Face Modelling	Cartpole, swingup (DMControl100k)	Score	582	CURL
3D Face Modelling	Cheetah, run (DMControl500k)	Score	518	CURL
3D Face Modelling	Reacher, easy (DMControl500k)	Score	929	CURL
3D Face Modelling	Finger, spin (DMControl100k)	Score	767	CURL
3D Face Modelling	Cheetah, run (DMControl100k)	Score	299	CURL
3D Face Modelling	Finger, spin (DMControl500k)	Score	926	CURL
3D Face Modelling	Ball in cup, catch (DMControl500k)	Score	959	CURL
3D Face Modelling	Reacher, easy (DMControl100k)	Score	538	CURL
3D Face Modelling	Walker, walk (DMControl500k)	Score	902	CURL
3D Face Modelling	Cartpole, swingup (DMControl500k)	Score	841	CURL
3D Face Modelling	Ball in cup, catch (DMControl100k)	Score	769	CURL

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Abstract

Results

Related Papers

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Abstract

Results

Related Papers