Script: Splittung eines Datasets in Lern- und Testdaten
Posted: Fri 28. Jun 2013, 14:21
Hallo zusammen,
im Rahmen meines Projektes habe ich ein kleines Script erstellt, dass ein RAW-Lesson-Datafile (*.csv) einließt und mit Hilfe von Membrain in eine Trainingslesson (*.mbl) und eine Testlesson (*.mbl) splittet.
Die Aufteilung in Training- und Testdaten erfolgt per random, das Verhältnis kann im Script über die Variable "splitratio" eingestellt werden. Per default wird im Verhältnis 80% Trainingsdata, 20% Testdata gesplittet.
Damit das Script funktioniert, muss ein zu-den-Daten-passendes-Netz vorhanden sein, daher findet Ihr im Zip auch ein Beispielnetz, und die dazugehörige RawLesson.
Das Skript basiert auf dem Beispielscript von Herrn Jetter.
Viele Grüße,
Frank
im Rahmen meines Projektes habe ich ein kleines Script erstellt, dass ein RAW-Lesson-Datafile (*.csv) einließt und mit Hilfe von Membrain in eine Trainingslesson (*.mbl) und eine Testlesson (*.mbl) splittet.
Die Aufteilung in Training- und Testdaten erfolgt per random, das Verhältnis kann im Script über die Variable "splitratio" eingestellt werden. Per default wird im Verhältnis 80% Trainingsdata, 20% Testdata gesplittet.
Damit das Script funktioniert, muss ein zu-den-Daten-passendes-Netz vorhanden sein, daher findet Ihr im Zip auch ein Beispielnetz, und die dazugehörige RawLesson.
Das Skript basiert auf dem Beispielscript von Herrn Jetter.
Viele Grüße,
Frank