Jonas Wild, Bachelorstudent im Fachbereich Informatik, hat in seiner Bachelorarbeit eine eigene Umgebung zum intuitiven Verständnis von Reinforcement Learning (RI) implementiert.
Rl ist ein Methodenkollektiv, mit dem künstliche neuronale Netze trainiert werden können. Beispielsweise konnten Programme professionelle Spieler in dem Echtzeitstrategiespiel Starcraft 2 besiegen, in dem sich die künstliche Intelligenz zu jedem Zeitpunkt zwischen Möglichkeiten entscheiden muss. Die Methoden basieren auf dem Grundprinzip gute Aktionen auf- und schlechte abzuwerten. Dies auf neuronale Netzwerke übertragen, bedeutet, die Parameter in eine Richtung zu verändern, sodass eine Aktion in einem bestimmten Zustand öfter gewählt wird.
Um einen möglichst grundlegenden Einblick in die Mechanismen im RI geben zu können, hat Herr Wild die notwendigen Funktionalitäten zu neuronalen Netzten, wie dem Backpropagation-Algorithmus das stochastische Gradienten-Verfahren, und Verfahren des RI, wie Deep Q-Learning nachimplementiert. Mit Hilfe der Unity Entwicklungsplattform wurde dies in eine graphische Umgebung integriert. So lässt sich das RI basiert Trainieren der (Computerspiele) Pong, Tic-Tac-Toe sowie Snake in unterschiedlichen Netz- und Trainingskonfigurationen beobachten und analysieren.
Weitere Informationen zum Projekt
Bitte beachten Sie: Sobald Sie sich das Video ansehen, werden Informationen darüber an Youtube/Google übermittelt. Weitere Informationen dazu finden Sie unter Google Privacy.
Bachelorarbeit von Jonas Wild
Betreuer: Prof. Dr. Hans-Peter Beise
Sie verlassen die offizielle Website der Hochschule Trier