Ghouti L
L'intégration de l'apprentissage par renforcement (RL) et de la robotique a été appliquée avec succès dans divers contextes industriels. L'un de ces contextes implique le déploiement de capteurs sismiques sur de vastes champs de pétrole et de gaz. Le problème de déploiement des capteurs peut être formulé comme un problème d'optimisation difficile où les processus de décision de Markov (MDP) peuvent être utilisés efficacement. Notre robot basé sur l'apprentissage par renforcement peut déployer des capteurs sismiques sur des zones molles et rugueuses couvrant de vastes champs de pétrole/gaz. Notre prototype de robot est le résultat d'un travail d'innovation actuellement protégé par deux brevets américains publiés [1, 2]. Une démonstration des capacités du robot peut être trouvée dans [3, 4].