-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy pathHomework
More file actions
106 lines (91 loc) · 5.34 KB
/
Homework
File metadata and controls
106 lines (91 loc) · 5.34 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
a rendre
1. Dérivation mathématique
2. pseudo-code
3. Courbes d'apprentissage
métriques souhaités -> cumulative_steps, average cumulative_steps
récompense moyenne (a minima), moyenne des récompense moyennes
listes actions :
rester sur place
nettoyer
charger
gauche
droite
haut
bas
politiques:
si case sale nettoyer
si sur base et battery pas pleine charge
reward:
tout propre sur base +100
déplacement -5
nettoyer +10
battery = 0 -500
simulateur:
etat, action --> (probas, état, reward), (probas1, état1, reward1), ...
case sale, nettoyer --> (0.9, case propre, +10), (0,1, case sale, +10)
base_pos = robot_pos && battery < 2, charger --> (0.9, battery +=1, +1), (0.1, battery=battery, +1)
si reste sale && battery > 0 &&
pos=0|1|2, haut --> (1, same, -5)
pos=3|4|5, haut --> (0.9, en haut, -5), (0.1, same, -5)
pos=0|1|2, bas --> (0.9, en bas, -5), (0.1, same, -5)
pos=3|4|5, bas --> (1, same, -5)
pos=2|5, droite --> (1, same, -5)
pos=0|1|3|4, droite --> (0.9, a droite, -5), (0.1, same, -5)
pos=0|3, gauche --> (1, same, -5)
pos=1|2|4|5, gauche --> (0.9, a gauche, -5), (0.1, same, -5)
si tout propre && base_pos=0 && battery > 0 &&
pos=1|2, haut --> (1, same, -5)
pos=3|4|5, haut --> (0.9, en haut, -5), (0.1, same, -5)
pos=1|2, bas --> (0.9, en bas, -5), (0.1, same, -5)
pos=3|4|5, bas --> (1, same, -5)
pos=2|5, droite --> (1, same, -5)
pos=1|3|4, droite --> (0.9, a droite, -5), (0.1, same, -5)
pos=3, gauche --> (1, same, -5)
pos=1|2|4|5, gauche --> (0.9, a gauche, -5), (0.1, same, -5)
si tout propre && base_pos=1 && battery > 0 &&
pos=0|2, haut --> (1, same, -5)
pos=3|4|5, haut --> (0.9, en haut, -5), (0.1, same, -5)
pos=0|2, bas --> (0.9, en bas, -5), (0.1, same, -5)
pos=3|4|5, bas --> (1, same, -5)
pos=2|5, droite --> (1, same, -5)
pos=0|3|4, droite --> (0.9, a droite, -5), (0.1, same, -5)
pos=0|3, gauche --> (1, same, -5)
pos=2|4|5, gauche --> (0.9, a gauche, -5), (0.1, same, -5)
si tout propre && base_pos=2 && battery > 0 &&
pos=0|1, haut --> (1, same, -5)
pos=3|4|5, haut --> (0.9, en haut, -5), (0.1, same, -5)
pos=0|1, bas --> (0.9, en bas, -5), (0.1, same, -5)
pos=3|4|5, bas --> (1, same, -5)
pos=5, droite --> (1, same, -5)
pos=0|1|3|4, droite --> (0.9, a droite, -5), (0.1, same, -5)
pos=0|3, gauche --> (1, same, -5)
pos=1|4|5, gauche --> (0.9, a gauche, -5), (0.1, same, -5)
si tout propre && base_pos=3 && battery > 0 &&
pos=0|1|2, haut --> (1, same, -5)
pos=4|5, haut --> (0.9, en haut, -5), (0.1, same, -5)
pos=0|1|2, bas --> (0.9, en bas, -5), (0.1, same, -5)
pos=4|5, bas --> (1, same, -5)
pos=2|5, droite --> (1, same, -5)
pos=0|1|4, droite --> (0.9, a droite, -5), (0.1, same, -5)
pos=0, gauche --> (1, same, -5)
pos=1|2|4|5, gauche --> (0.9, a gauche, -5), (0.1, same, -5)
si tout propre && base_pos=4 && battery > 0 &&
pos=0|1|2, haut --> (1, same, -5)
pos=3|5, haut --> (0.9, en haut, -5), (0.1, same, -5)
pos=0|1|2, bas --> (0.9, en bas, -5), (0.1, same, -5)
pos=3|5, bas --> (1, same, -5)
pos=2|5, droite --> (1, same, -5)
pos=0|1|3, droite --> (0.9, a droite, -5), (0.1, same, -5)
pos=0|3, gauche --> (1, same, -5)
pos=1|2|5, gauche --> (0.9, a gauche, -5), (0.1, same, -5)
si tout propre && base_pos=5 && battery > 0 &&
pos=0|1|2, haut --> (1, same, -5)
pos=3|4, haut --> (0.9, en haut, -5), (0.1, same, -5)
pos=0|1|2, bas --> (0.9, en bas, -5), (0.1, same, -5)
pos=3|4, bas --> (1, same, -5)
pos=2, droite --> (1, same, -5)
pos=0|1|3|4, droite --> (0.9, a droite, -5), (0.1, same, -5)
pos=0|3, gauche --> (1, same, -5)
pos=1|2|4, gauche --> (0.9, a gauche, -5), (0.1, same, -5)
si tout propre && robot_pos = base_pos, stay --> (1, same, 100)
si battery = 0, dead --> (1, same, -500)