Im Rahmen meiner aktuellen Semesterarbeit beschäftige ich mich mit dem Thema "Einsatz küsntlich neuronaler Netze zur Folgeregelung eines Regalbediengerätes für Hochregallager". Die Problematik bei solchen Systemen besteht darin, dass die Regalbediengeräte (RBG) beim Anfahren einer bestimmten Position in Schwingungen geraten. Deshalb muss man in der Praxis Geräteberuhigungszeiten einhalten um Güter problemlos einzualgern, was natürlich auf Kosten des Durchsatzes geht.
Es gibt einige Regelungsansätze die eine aktive Schwingungsdämpfung verfolgen. Als Folgeregler können dabei klassische Regler (z.B. PD-Regler) oder auch Regler höherer Ordnung (Zustandsrückführer, Beobachter) eingesetzt werden. Diese Regelung ist allerdings auf einen festen Systemzustand abgestimmt und ineffizient gegenüber Veränderungen (Laständerung, unterschiedliche Höhe der Last am RBG, Verschleiß, Reibung etc.). Abhilfe soll deswegen eine adaptive Regelung schaffen die unter Berücksichtigung des aktuellen Beladungszustandes optimierte Trajektorien generiert. Das ganze soll salop gesagt so funktionieren, dass das Regalbediengerät eine optimale Solltrajektorie verfährt und dadurch erst gar keine Schwingungen auftreten, Und da sollten jetzt die neuronalen Netze ins Spiel kommen

Mein Ansatz war zunächst folgender: Ich hatte daran gedacht verschiedene Feedforward Netze zu testen und mit Backpropagation zu trainieren. Sollte das Ergebnis nicht zufriedenstellend sein dachte ich daran, die Netze anschließend mit genetischen Algorithmen zu optimieren. Ich habe allerdings nicht bedacht, dass ich bei BP bei jedem Trainingsbeispiel für mein Netz die optimale Solltrajektorie als teaching input benötige, was unter Umständen problematisch werden könnte, da ich bis jetzt nicht weiß, wie ich an diese Solltrajektorien komme.
Deswegen dachte ich dann eventuell an eine Reinforcement Learning Strategie, da ich mir hierbei die Solltrajektoriengenerierung sparen würde. Die Theorie hinter RL verstehe ich, aber ich weiß nicht wie ich das ganze implementieren soll bzw. welche Software dafür am besten geeignet ist.
Soweit meine Problemstellung. Für Anregungen und Hilfestellungen jeder Art wäre ich sehr dankbar

Grüße, Florian