Hallo Thomas,
sorry, dass ich mich etwas länger nicht gemeldet habe, aber es war einiges los und es gab vieles mit meinem Semesterarbeitsbetreuer zu besprechen und zu entscheiden

Wie du bereits gesagt hast, ist das Themengebiet RL mit NN noch ein eher unerforschtes Gebiet...deswegen möchte mein Betreuer vielleicht auch ein Forschungsprojekt daraus machen. Da das ganze aber einen enorm großen Aufwand bedeutet und den Rahmen einer nornmalen Semesterarbeit bei weitem sprengt, habe ich mich mit meinem Betreuer darauf verständigt, dass ich in die RL-Richtung nicht weiter machen sollte...ist jetzt zwar eine ernüchternde Erkenntnis, weil ich (und vor allem du) schon einiges an Arbeit investiert haben, aber dass das so aufwändig werden würde, konnte ich im vorhinein nicht abschätzen.
Alternativ soll ich jetzt wieder meinen ursprünglichen Ansatz mit überwachtem Lernen verwenden. Ziel soll sein, dass das NN den optimalen Verlauf der Krafttrajektorie ausgibt. Dazu kurz zu meinem Vorgehen:
Zuerst soll ich mich nur auf sog. Horizontalfahrten des RGB beschränken, d.h. das Lastaufnahmemittel verbleibt während der Horizontalfahrt des RGB auf der gleichen Höhe (später soll das ganze auf Diagonalfahren erweitert werden, also gleichzeitige Horizontal- und Vertikalfahrt). Für das Training stehen mir momentan ca. 120 Solltrajektorien zu unterschiedlichen Parametersätzen zur Verfügung (die an einem anderen Lehrstuhl mit einem anderen Regelungskonzept generiert wurden). Ich dachte daran ca 2/3 für das Training zu vernweden und 1/3 zum testen.
Die Inputparameter sind skalare Werte, also ergibt sich pro Parameter eine Inputneuron. Insgesamt habe ich 10 Inputparameter. Eine
Frage hierzu: Bei der Generierung der 120 Trainingstrajektorien wurden bis jetzt nur zwei Parameter, nämlich die Einlagermasse und der zurückzulegende Weg variiert. Bei den restlichen Parametern handelt es sich um Parameter des RGBs und die wurden jetzt noch nicht verändert (können aber natürlich veränderlich sein, zB wenn ich verschiedene RBGs einsetze). Sind meine Trainingsbeispiele dann überhaupt noch repräsentativ? Oder bräuchte ich noch Trainingsdatensätze, bei denen alle Inputparameter variiert werden? Ich fürchte fast ja
Die Trajektorien will ich folgendermaßen über die Ausgangsneuronen repräsentieren: Jede Trajektorie stellt einen Funktionsverlauf dar. Die Einzelnen Funktionsverläufe haben alle eine charakteristische Form, d.h. sind sich von der Form her sehr ähnlich. Ich habe jetzt in Matlab zwei Varianten geschrieben, um die Trajektorienverläufe zu approximieren. Variante 1 verwendet einen Polynomansatz um die Trajektorienverläufe anzunähern. Ich habe ein Polynom vom Grad 20 verwendet und Matlab berechnet mir die Koeffizienten des approximierten Polynoms.
Variante 2 verwendet einen Ansatz, bei dem 8 sin-Verläufe in der Form a*sin(b*x+c) überlagert werden. Matlab gibt mir hier auch die entsprechenden Koeefizienten a, b, c aus.
Welche Variante ich verwende, muss ich noch herausfinden. Dazu werd ich mir noch eine Simulationsschleife schreiben die alle Trajektorien mit beiden VArianten approximiert und mir dann den Gesamtfehler pro Variante für alle 120 Trajektorien ausgibt. Sollte ich aber in der Woche noch hinkriegen.
Jeder Koeffizient stellt dann ein Outputneuron dar. Auf diese Weise kann ich die Trajektorien eindeutig mit Neuronen repräsentieren.
Ein weiterer wichtiger Output, der nicht vergessen werden darf, ist die Zeit, die für den Positioniervorgang benötigt wird. Wenn mir mein Netz nämlich im "Betrieb" nur die Koeffizienten ausgibt, dann wäre mein daraus resultierender Trajektorienverlauf ja beliebig lang. Mit der Zeit kann ich ihn aber genau begrenzen.
Zu den Trainingsdaten habe ich noch eine Frage: Welches Datenformat ist denn dafür am besten geeignet? Kann ich die Trainingsdaten alle in einer Datei sammeln oder muss ich sie einzeln übergeben?
Und bevor ichs vergess:
Admin wrote:
Du sagst, es gibt bereits eine Simulation. in welcher Form liegt diese vor und wie könnte man softwaretechnisch an diese anbinden?
Von dem ganzen System liegt ein Modell in Matlab bzw. Simulink vor, das das reale Gerät relativ gut nachbildet. Die Ergebnisse meiner Arbeit kann ich mit dem Modell auch validieren, da die Möglichkeit besteht, die Schwingung für eine Positioniermanöver mit einer vorgegebenen Trajektorie zu simulieren.
Soweit der Stand der Dinge!
Ich hoffe, ich kann dann sobald wie möglich mit dem Traing des NN beginnen

Grüße,
Florian