Mathématiques | informatique

 

Felix El-Hoiydi, 2004 | Neuchâtel, NE

 

Ce travail étudie et présente une application de l’algorithme des réseaux neuronaux au problème de pilotage de voitures sur un circuit virtuel. Le but de la recherche est de trouver une configuration optimale pour le réseau neuronal et le nombre de capteurs, ainsi que de comparer différentes méthodes d’apprentissage : Apprentissage supervisé seul, apprentissage par algorithme génétique seul et apprentissage par algorithme génétique aidé d’un préapprentissage supervisé. Les expériences ont montré que dans notre contexte, l’apprentissage supervisé seul ne fonctionnait pas. J’ai constaté que la combinaison de l’algorithme génétique avec un préentrainement permet un apprentissage beaucoup plus rapide et donne de meilleurs résultats finaux qu’avec l’algorithme génétique seul. Avec une configuration optimale, le réseau neuronal pilote les voitures nettement mieux que l’humain. Le réseau neuronal optimum termine le parcours en 19.5 secondes contre 24 secondes pour l’humain.

Problématique

Ce travail étudie et présente une application de l’algorithme des réseaux neuronaux au problème de pilotage de voitures sur un circuit virtuel. Les voitures sont dotées de capteurs qui mesurent la distance vers les murs dans différentes directions. Ces données sont fournies au réseau neuronal pour décider si la voiture doit accélérer, décélérer, tourner à droite ou à gauche. Les buts de la recherche sont (I) de trouver une configuration optimale pour le réseau neuronal et le nombre de capteurs et (II) de comparer différentes méthodes d’apprentissage.

Méthodologie

La méthode d’investigation se base sur des simulations. On mesure le temps de parcours de la meilleure voiture à la fin de l’entrainement avec différentes configurations. On fait varier le nombre de couches cachées, le nombre de neurones par couche cachée, le nombre de rayons de vision, ainsi que la méthode d’entrainement. L’intelligence d’une voiture est déterminée par les poids synaptiques qui connectent les neurones de leur cerveau. Le but de l’apprentissage est de paramétrer ces poids synaptiques de manière optimale. L’entrainement par algorithme génétique est inspiré de la sélection naturelle. On fait 250 courses entre 500 voitures. À chaque course, les 10 meilleures voitures sont sélectionnées pour être les géniteurs des voitures lors de la course suivante. Ces voitures donnent leurs poids synaptiques aux nouvelles voitures avec de petites mutations aléatoires. Lorsque l’algorithme génétique est combiné au préapprentissage, les voitures sont d’abord entrainées avec un exemple de pilotage humain en utilisant la rétropropagation du gradient.

Résultats

Les résultats montrent premièrement que la configuration optimale du réseau neuronal est avec 7 entrées pour 7 capteurs de distance, 1 couche cachée et 12 neurones dans cette couche pour 4 neurones de sorties. Les expériences ont montré que dans notre contexte, l’apprentissage supervisé seul ne fonctionnait pas. J’ai constaté que la combinaison de l’algorithme génétique avec un préentrainement permet un apprentissage beaucoup plus rapide et donne de meilleurs résultats finaux qu’avec l’algorithme génétique seul. Avec une configuration optimale, le réseau neuronal pilote les voitures nettement mieux que l’humain. Le réseau neuronal optimum termine le parcours en 19.5 secondes contre 24 secondes pour l’humain.

Discussion

Mon intuition était qu’il aurait été plus performant d’avoir plus qu’une couche cachée. Les simulations ont montré le contraire. Une seule couche cachée est optimale en performance et en complexité de calcul. J’ai été surpris de voir que l’apprentissage supervisé seul ne fonctionnait pas.

Conclusions

Pour notre problème, l’algorithme génétique s’est montré performant pour l’entrainement au pilotage, surtout s’il est aidé par un préapprentissage par rétropropagation du gradient. Avec une configuration optimale, le réseau neuronal pilote les voitures nettement mieux que l’humain. La machine a dépassé l’homme. Pour améliorer encore les performances, on peut imaginer ajouter la vitesse et le temps de parcours comme entrées au réseau neuronal. Il serait aussi intéressant de faire des simulations avec un très grand nombre de générations pour observer si la différence entre algorithme génétique seule et algorithme génétique avec un préapprentissage s’atténue.

 

 

Appréciation de l’expert

Mathieu Guillame-Bert

Les véhicules autonomes promettent d’améliorer l’accessibilité, l’efficacité et la sécurité des transports dans nos sociétés de demain, notamment grâce aux avancées de l’intelligence artificielle.

Dans ce travail, Félix évalue de manière ludique et rigoureuse l’utilisation de techniques diamétralement opposées que sont les réseaux de neurones artificiels et les algorithmes d’apprentissage génétiques pour la conduite de véhicules virtuels. Par ailleurs, Félix a fait le choix audacieux de mettre en oeuvre ces techniques entièrement lui-même et sans recourir à des implémentations existantes.

Mention:

bien

 

 

 

Lycée Denis de Rougemont, Neuchâtel
Enseignant: Patrick Rickli