SMARTBOTJS

Smart crawler using reinforcement learning to avoid detection.

Actions :

Actions classiques. L'action permettant de faker la réactivité à un Iframe sera peut être ajoutée.

Sérialisation

Les éléments à sérialiser sont les Q-values, les paramètres de l'algorithme, les sites webs et leurs attributs, les états, les actions, l'épisode auxquel nous nous somme arrêtés. Nous pouvons stocker tout ceci dans une fichier json. Les interruptions de programmes dûs aux signaux SIGINT ou SIGQUIT meneront à l'enregistrement de l'état du programme.

Fonctions d'approximations dans notre cas

Pour le moment, nos valeurs sont représentés par des tables de lookup. Cela cause des problèmes aux niveaux de larges MDPs, comme nous l'avons vu dans notre cas dès que nous ajoutons quelques attributs de plus, le nombre d'états explose, et s'ensuit une explosion du nombre de Q-values.

La solution est donc d'approximer ces derniers par une fonction, qui va être paramétrée par des poids.

Types possibles :

Lineaires
Réseaux de neurones
Arbre de décision
Nearest Neighbour
Fourrier/Ondelettes

Les FA vont nous permettre d'avoir une définition plus vague d'un état et ainsi de pouvoir s'adapter à de nouveaux états.

On doit pouvoir implémenter un algorithme utilisant une fonction d'approximation après une documentation plus complète.

Update 19/12 : Réglé un soucis d'actions, ecriture q-learning, reglage de soucis de puppeteer mise a jour de la liste des proxies, debut de la reflection sur le multi bot

Name	Name	Last commit message	Last commit date
Latest commit naifmeh Merge pull request #1 from naifmeh/add-license-1 Apr 13, 2021 a993cdf · Apr 13, 2021 History 79 Commits
algorithm	algorithm	Manually computing grads for alternative model - Pb with memory alloc…	Feb 24, 2019
crawler	crawler	Reformated + fixed plot path error in a3c agent	Feb 23, 2019
documents	documents	A3C, computing loss is hard	Feb 12, 2019
logs	logs	Reformated + fixed plot path error in a3c agent	Feb 23, 2019
preprocessing	preprocessing	completed sarsa, plotting, and crawler	Dec 12, 2018
test	test	websites preprocessing done	Nov 25, 2018
utils	utils	A3C, computing loss is hard	Feb 12, 2019
.gitignore	.gitignore	Completed actor_critic	Jan 31, 2019
LICENSE	LICENSE	Create LICENSE	Apr 13, 2021
README.md	README.md	Fixing bugs + qlearning	Dec 19, 2018
package-lock.json	package-lock.json	Browser error handling fixed	Feb 22, 2019
package.json	package.json	Browser error handling fixed	Feb 22, 2019

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SMARTBOTJS

About

Releases

Packages

Contributors 2

Languages

License

naifmeh/smartbotjs

Folders and files

Latest commit

History

Repository files navigation

SMARTBOTJS

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages