Page 1 of 1

Script: Splittung eines Datasets in Lern- und Testdaten

Posted: Fri 28. Jun 2013, 14:21
by franky
Hallo zusammen,

im Rahmen meines Projektes habe ich ein kleines Script erstellt, dass ein RAW-Lesson-Datafile (*.csv) einließt und mit Hilfe von Membrain in eine Trainingslesson (*.mbl) und eine Testlesson (*.mbl) splittet.
Die Aufteilung in Training- und Testdaten erfolgt per random, das Verhältnis kann im Script über die Variable "splitratio" eingestellt werden. Per default wird im Verhältnis 80% Trainingsdata, 20% Testdata gesplittet.
Damit das Script funktioniert, muss ein zu-den-Daten-passendes-Netz vorhanden sein, daher findet Ihr im Zip auch ein Beispielnetz, und die dazugehörige RawLesson.
Das Skript basiert auf dem Beispielscript von Herrn Jetter.

Viele Grüße,
Frank