Scripts/generate_mujoco_config.py

#!/usr/bin/env python
# Created at 2020/5/14
import multiprocessing

import click
import yaml

COMMON_TEMPLATE = "rl && "
GAIL_TEMPLATE = "python -m Algorithms.{0}.{1}.main --env_id {2} --save_model_path {3} " \
                "--num_process {4} --render {5} --config_path {6} --expert_data_path {7} --log_path {8}"

PPO_TEMPLATE = "python -m Algorithms.{0}.{1}.main --env_id {2} --max_iter 500 --model_path {3} --num_process {4} " \
               "--render {5} --seed 2020 --log_path {6}"

PPO_EXPERT_TEMPLATE = "python -m Algorithms.{0}.GAIL.expert_trajectory_collector --env_id {1} " \
                      "--n_trajs 1000 --model_path {2} --data_path {3}"


@click.command()
@click.option("--version", type=click.Choice(['pytorch', 'tf2']), default="pytorch", help="Version of implementation")
@click.option("--algo", type=click.Choice(['PPO', 'GAIL', 'PPO_EXPERT']), default="GAIL",
              help="Version of implementation")
@click.option("--envs", type=str, default="HalfCheetah-v3,Hopper-v3,Walker2d-v3,Ant-v3",
              help="Environment ids")
def generate(version, algo, envs):
    click.echo(f"Version: {version}, Algorithm: {algo}, Envs: {envs}")

    envs_list = envs.split(",")
    config_dict = {
        "session_name": f"run-all-{algo}",
        "start_directory": f"~/PycharmProjects/DeepRL_Algorithms",
        "windows": []
    }

    panes_list = []
    tensor_board_command = f"tensorboard --logdir=./Algorithms/{version}/log"  # run tensorboard for visualization
    for env in envs_list:
        print(f"Generate config for env : {env}")

        run_command = None
        if algo == "GAIL":
            run_command = COMMON_TEMPLATE + GAIL_TEMPLATE.format(version,
                                                                 algo,
                                                                 env,
                                                                 f"./Algorithms/{version}/{algo}/trained_models",
                                                                 int(multiprocessing.cpu_count() / 2),
                                                                 False,
                                                                 f"./Algorithms/{version}/{algo}/config/config.yml",
                                                                 f"./Algorithms/{version}/{algo}/data/{env}.npz",
                                                                 f"./Algorithms/{version}/{algo}/log")
            tensor_board_command = f"tensorboard --logdir=./Algorithms/{version}/{algo}/log"  # run tensorboard for visualization

        elif algo == "PPO":
            run_command = COMMON_TEMPLATE + PPO_TEMPLATE.format(version,
                                                                algo,
                                                                env,
                                                                f"./Algorithms/{version}/{algo}/trained_models",
                                                                int(multiprocessing.cpu_count() / 2),
                                                                False,
                                                                f"./Algorithms/{version}/{algo}/log")
        elif algo == "PPO_EXPERT":
            run_command = COMMON_TEMPLATE + PPO_EXPERT_TEMPLATE.format(version,
                                                                       env,
                                                                       f"./Algorithms/{version}/PPO/trained_models/{env}_ppo.p",
                                                                       f"./Algorithms/{version}/GAIL/data")

        panes_list.append(run_command)

    panes_list.append(COMMON_TEMPLATE + tensor_board_command)

    config_dict["windows"].append({
        "window_name": f"{algo}",
        "panes": panes_list,
        "layout": "tiled"
    })

    yaml.dump(config_dict, open(f"run_all_{algo}.yaml", "w"), default_flow_style=False)


if __name__ == '__main__':
    generate()