Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

feat(ai): q-learning agent #1

Open
wants to merge 10 commits into
base: master
Choose a base branch
from

Conversation

Flecart
Copy link

@Flecart Flecart commented Jul 29, 2022

Questa è una versione presentabile dell'AI a cui ho lavorato in questa settimana.

Come allenare l'ai

questa è la directory con tutti i file utilizzati per allenare l'ai.
per allenarlo basta runnare bash start.sh, oppure eseguire direttamente il comando per far partire l'allenamento.

Per sapere i comandi runnare python3 controller.py -h

La versione in orso_ai

esiste una versione che è uscita dopo ore di allenamento (quindi qualche milioncino di partite) che sembra giocare molto bene, è il bear_v2.policy.

Note

Quella versione è stata prodotta con codice differente rispetto a questa versione che di cui sto facendo PR, ma ritengo quel codice non molto comprensibile (scritta velocemente, come veniva veniva), per questo motivo preferisco mostrare questo codice in quanto fatto per essere letto e mantenuto.

In ogni modo se curiosi della versione originale, è presente nella branch master nel mio fork

Sulla prima versione in assoluto

Come primo tentativo in assoluto a questo problema di costruzione AI, ho provato a implementare un Algoritmo di MINIMAX con AB pruning. Ma non funzionava abbastanza bene dato che lo spazio di ricerca era troppo vasto. Si può ancora ritrovare quella implementazione nella mia fork

TODOS

Ho scritto abbastanza male la versione orso_ai.py, dato che ci ho messo bene male le cose che mi servivano, senza stare a pensare altro. Ci sarebbe anche da mettere una scelta nella UI di poter scegliere se giocare contro un altro giocatore o AI.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

1 participant