Application de l'apprentissage par renforcement au poker
Introduction
Qu'est-ce que le Deep Reinforcement Learning ? Comment l'implémenter ? L'ordinateur peut-il battre les humains à des jeux comme le poker ?
- Intervenant : Oscar Blazejewski
- Durée : 1h15
- Format : démonstration
Présentation
En 2013, Deepmind a impressioné tout le monde en étant capable d’atteindre des capacités surhumaines sur plusieurs jeux Atari avec un seul algorithme. Quelques années plus tard, AlphaGo a battu les meilleurs joueurs du monde au jeu de Go. Ces algorithmes n'ont jamais connu les règles du jeu. Tout cela a été rendu possible grâce au Deep Reinforcement Learning, qui a permis à l’ordinateur de jouer contre lui de nombreuses fois afin de trouver la meilleure stratégie.
Dans cette présentation, nous allons en apprendre davantage sur la théorie du Reinforcement Learning. Nous tenterons ensuite de transposer et d’appliquer cela au jeu de poker. Cela comprendra un feature engineering cohérent, la formation d'un mod èle de Q Learning en tenant compte des limitations de l'ordinateur, et la comparaison des résultats obtenus à une stratégie connue comme "bonne".
Auteur
Oscar Blazejewski est un Data Engineer travaillant chez Adaltas. Il est actuellement en mission dans le groupe Renault et effectue des migrations de projets vers leur nouvelle plate-forme HDP 2.6. Il s'intéresse à tout ce qui est lié à la technologie, du Big Data à la sécurité informatique, et adore apprendre de nouvelles choses.