PANDROIDE/arguments.py at main · DamienLegros/PANDROIDE · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
import argparse

# the following functions are used to build file names for saving data and displaying results


def make_study_string(params):
    return params.env_name + '_' + params.study_name + '_' + params.critic_update_method \
           + '_' + params.critic_estim_method + '_eval_' + str(params.deterministic_eval)


def make_study_params_string(params):
    return 'cycles_' + str(params.nb_cycles) + '_trajs_' + str(params.nb_trajs) + '_batches_' + str(params.nb_batches)


def make_learning_params_string(params):
    return 'gamma_' + str(params.gamma) + '_nstep_' + str(params.nstep) + '_lr_act_' \
           + str(params.lr_actor) + '_lr_critic_' + str(params.lr_critic)


def make_full_string(params):
    return make_study_string(params) + '_' + make_study_params_string(params) + '_' \
           + make_learning_params_string(params)


def get_args():
    """
    Standard function to specify the default value of the hyper-parameters of all policy gradient algorithms
    and experimental setups
    :return: the complete list of arguments
    """
    parser = argparse.ArgumentParser()
    # multi-threading setting ##UNSTABLE
    parser.add_argument('--multi_threading', type=bool, default=False,
                        help='multi-threading for high number of evaluations')
    # environment setting
    parser.add_argument('--env_name', type=str, default='Pendulum-v0', help='the environment name')
    parser.add_argument('--env_obs_space_name', type=str, default=["pos", "angle"])  # ["pos", "angle", "vx", "v angle"]
    parser.add_argument('--render', type=bool, default=False,
                        help='visualize the run or not')  # Only False when not used
    # study settings
    parser.add_argument('--study_name', type=str, default='pg', help='study name: pg, regress, nstep, cem, evo_pg')
    parser.add_argument('--critic_update_method', type=str, default="dataset",
                        help='critic update method: batch or dataset')
    parser.add_argument('--policy_type', type=str, default="normal",
                        help='policy type: bernoulli, normal, squashedGaussian, discrete, beta')
    parser.add_argument('--team_name', type=str, default='default_team', help='team name')
    parser.add_argument('--deterministic_eval', type=bool, default=True,
                        help='deterministic policy evaluation?')  # Only True when not used
    # study parameters
    parser.add_argument('--nb_repet', type=int, default=1, help='number of repetitions to get statistics')
    parser.add_argument('--nb_cycles', type=int, default=40, help='number of training cycles')
    parser.add_argument('--nb_trajs', type=int, default=20, help='number of trajectories in a MC batch')
    parser.add_argument('--nb_trajs_cem', type=int, default=None, help='number of trajectories in a MC batch for cem')
    parser.add_argument('--nb_trajs_pg', type=int, default=None, help='number of trajectories in a MC batch for pg')
    parser.add_argument('--nb_batches', type=int, default=20, help='number of updates of the network using datasets')
    # algo settings
    parser.add_argument('--gradients', type=str, nargs='+', default=['sum'], help='other: baseline, beta')
    parser.add_argument('--critic_estim_method', type=str, default="td",
                        help='critic estimation method: mc, td or nstep')
    parser.add_argument('--fix_layers', type=str, default=False, help='only for normal')
    # learning parameters
    parser.add_argument('--start_from_policy', type=bool, default=False, help='only for normal')
    parser.add_argument('--start_from_same_policy', type=bool, default=False, help='only for normal')

    parser.add_argument('--gamma', type=float, default=1, help='discount factor')
    parser.add_argument('--lr_actor', type=float, default=0.0001, help='learning rate of the actor')
    parser.add_argument('--lr_critic', type=float, default=0.01, help='learning rate of the critic')
    parser.add_argument('--beta', type=float, default=0.1, help='temperature in AWR-like learning')
    parser.add_argument('--nstep', type=int, default=5, help='n in n-step return')
    parser.add_argument('--batch_size', type=int, default=64, help='size of a minibatch')
    parser.add_argument('--nb_workers', type=int, default=2, help='number of cpus to collect samples')
    parser.add_argument('--shuffle', type=bool, default=True,
                        help='shuffle replay samples or not')  # Only False when not used
    parser.add_argument('--max_episode_steps', type=int, default=200, help='duration of an episode (step limit)')
    parser.add_argument('--sigma', type=float, default=1.0, help='noise')
    parser.add_argument('--elites_frac', type=float, default=0.2,
                        help='proportion of the population to keep at each iter')
    parser.add_argument('--bests_frac', type=float, default=1, help='proportion of the population to keep at each iter')
    parser.add_argument('--population', type=int, default=15, help='population size')

    # evaluation settings
    parser.add_argument('--eval_freq', default=1, type=int)  # frequency for evaluation.
    parser.add_argument('--save_freq', default=1, type=int)  # frequency for saving evaluation.

    # plots settings
    parser.add_argument('--night_mode', type=bool, default=False, help='do not show the plots')
    parser.add_argument('--plot_mode', type=str, default="all", help='to launch several studies at the same time')
    parser.add_argument('--nb_intervals', type=int, default=50, help='number of intervals for segment plotting')
    # vignettes
    parser.add_argument('--title', default="Landscape", type=str)  # Title of the vignette
    parser.add_argument('--nb_lines', default=5,
                        type=int)  # number of directions generated,good value : precise 100, fast 60, ultrafast 50
    parser.add_argument('--minalpha', default=0.0, type=float)  # start value for alpha, good value : 0.0
    parser.add_argument('--nb_evals', default=5,
                        type=int)  # number of steps for the evaluation. Depends on environment.
    parser.add_argument('--maxalpha', default=0.01,
                        type=float)  # end value for alpha, good value : large 100, around model 10
    parser.add_argument('--stepalpha', default=0.0001,
                        type=float)  # step for alpha in the loop, good value : precise 0.5 or 1, less precise 2 or 3
    # 2D plot parameters
    parser.add_argument('--pixelWidth', default=10, type=int)  # width of each pixel in 2D Vignette
    parser.add_argument('--pixelHeight', default=10, type=int)  # height of each pixel in 2D Vignette
    # 3D plot parameters
    parser.add_argument('--x_diff', default=2., type=float)  # the space between each point along the x-axis
    parser.add_argument('--y_diff', default=2., type=float)  # the space between each point along the y-axis

    # File management
    # Input parameters
    parser.add_argument('--inputDir', default="Models", type=str)  # name of the directory containing the models to load
    parser.add_argument('--basename', default="rl_model_", type=str)  # file prefix for the loaded model
    parser.add_argument('--min_iter', default=1, type=int)  # iteration (file suffix) of the first model
    parser.add_argument('--max_iter', default=10, type=int)  # iteration (file suffix) of the last model
    parser.add_argument('--step_iter', default=1, type=int)  # iteration step between two consecutive models
    # Input policies parameters
    parser.add_argument('--policiesPath', default='None',
                        type=str)  # path to a list of policies to be included in Vignette
    # Output parameters
    parser.add_argument('--saveInFile', default=True, type=bool)  # true if want to save the savedVignette
    parser.add_argument('--save2D', default=True, type=bool)  # true if want to save the 2D Vignette
    parser.add_argument('--save3D', default=True, type=bool)  # true if want to save the 3D Vignette
    parser.add_argument('--directoryFile', default="SavedVignette",
                        type=str)  # name of the directory that will contain the vignettes
    parser.add_argument('--filename', default="saved", type=str)  # name of the file to load/save the vignette
    parser.add_argument('--directory2D', default="Vignette_output",
                        type=str)  # name of the directory that will contain the 2D vignette
    parser.add_argument('--directory3D', default="Vignette_output",
                        type=str)  # name of the directory that will contain the 3D vignette
    # Tools parameters	#	Drawing parameters
    parser.add_argument('--maxValue', default=360,
                        type=int)  # max score value for colormap used (dependent of benchmark used)
    parser.add_argument('--line_height', default=3, type=int)  # The height in number of pixel for each result
    # Dot product parameters
    parser.add_argument('--dotWidth', default=150, type=int)  # max width of the dot product (added on the side)
    parser.add_argument('--dotText', default=True, type=str)  # true if want to show value of the dot product
    parser.add_argument('--xMargin', default=10, type=int)  # xMargin for the side panel

    # File management
    # Output parameters
    parser.add_argument('--saveFile', default=True, type=bool)  # True if want to save the Gradient as SavedGradient
    parser.add_argument('--saveImage', default=True, type=bool)  # True if want to save the Image of the Gradient
    parser.add_argument('--directoryFileGrad', default="SavedGradient",
                        type=str)  # name of the directory where SavedGradient is saved
    parser.add_argument('--directoryImage', default="Gradient_output",
                        type=str)  # name of the output directory that will contain the image

    args = parser.parse_args()
    return args