SeRO: Self-Supervised Reinforcement Learning for Recovery from Out-of-Distribution Situations

Pytorch code for the submission:

SeRO: Self-Supervised Reinforcement Learning for Recovery from Out-of-Distribution Situations, IJCAI 2023

Supplementary material

Supplementary material

Requirements

mujoco200 (https://www.roboti.us/)

Generating and activating conda environment

$ conda env create -f env.yml
$ conda activate sero

Training phase

HalfCheetahNormal-v2

$ cd ~/directory/to/repository/
$ . scripts/train_{algo}_half_cheetah_normal.sh

HopperNormal-v2

$ cd ~/directory/to/repository/
$ . scripts/train_{algo}_hopper_normal.sh

Walker2DNormal-v2

$ cd ~/directory/to/repository/
$ . scripts/train_{algo}_walker2d_normal.sh

AntNormal-v2

$ cd ~/directory/to/repository/
$ . scripts/train_{algo}_ant_normal.sh

Retraining phase (should be executed after the training phase)

HalfCheetahOOD-v2

$ cd ~/directory/to/repository/
$ . scripts/train_{algo}_half_cheetah_ood.sh

HopperOOD-v2

$ cd ~/directory/to/repository/
$ . scripts/train_{algo}_hopper_ood.sh

Walker2DOOD-v2

$ cd ~/directory/to/repository/
$ . scripts/train_{algo}_walker2d_ood.sh

AntOOD-v2

$ cd ~/directory/to/repository/
$ . scripts/train_{algo}_ant_ood.sh

Visualize learning curves

$ cd ~/directory/to/repository/log/
$ tensorboard --logdir={env_name}

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
envs		envs
scripts		scripts
utils		utils
.gitignore		.gitignore
README.md		README.md
SeRO_IJCAI23_supp.pdf		SeRO_IJCAI23_supp.pdf
config.py		config.py
env.yml		env.yml
evaluation.py		evaluation.py
model.py		model.py
retraining.py		retraining.py
retraining_with_env_reward.py		retraining_with_env_reward.py
retraining_with_own_criteria.py		retraining_with_own_criteria.py
sero.py		sero.py
training.py		training.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

SeRO: Self-Supervised Reinforcement Learning for Recovery from Out-of-Distribution Situations

Supplementary material

Requirements

Generating and activating conda environment

Training phase

HalfCheetahNormal-v2

HopperNormal-v2

Walker2DNormal-v2

AntNormal-v2

Retraining phase (should be executed after the training phase)

HalfCheetahOOD-v2

HopperOOD-v2

Walker2DOOD-v2

AntOOD-v2

Visualize learning curves

About

Uh oh!

Releases

Packages

Languages

SNUChanKim/SeRO

Folders and files

Latest commit

History

Repository files navigation

SeRO: Self-Supervised Reinforcement Learning for Recovery from Out-of-Distribution Situations

Supplementary material

Requirements

Generating and activating conda environment

Training phase

HalfCheetahNormal-v2

HopperNormal-v2

Walker2DNormal-v2

AntNormal-v2

Retraining phase (should be executed after the training phase)

HalfCheetahOOD-v2

HopperOOD-v2

Walker2DOOD-v2

AntOOD-v2

Visualize learning curves

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages