Hallo zusammen,
im Rahmen meines Projektes habe ich ein kleines Script erstellt, dass ein RAW-Lesson-Datafile (*.csv) einließt und mit Hilfe von Membrain in eine Trainingslesson (*.mbl) und eine Testlesson (*.mbl) splittet.
Die Aufteilung in Training- und Testdaten erfolgt per random, das Verhältnis kann im Script über die Variable "splitratio" eingestellt werden. Per default wird im Verhältnis 80% Trainingsdata, 20% Testdata gesplittet.
Damit das Script funktioniert, muss ein zu-den-Daten-passendes-Netz vorhanden sein, daher findet Ihr im Zip auch ein Beispielnetz, und die dazugehörige RawLesson.
Das Skript basiert auf dem Beispielscript von Herrn Jetter.
Viele Grüße,
Frank
Script: Splittung eines Datasets in Lern- und Testdaten
Script: Splittung eines Datasets in Lern- und Testdaten
- Attachments
-
- SplitData.zip
- (1.72 KiB) Downloaded 1124 times