Script: Splittung eines Datasets in Lern- und Testdaten

Dieses Forum beschäftigt sich mit allen Fragen, Kommentaren und Anregungen zu MemBrain Skripten. Auch der Austausch von Skripten zwischen MemBrain Benutzern soll hiermit gefördert werden.
Wenn Sie ein interessantes Skript haben, das Sie anderen MemBrain Benutzern zur Verfügung stellen wollen, dann Erstellen Sie dafür jeweils bitte ein neues Thema in diesem Forum. Der Titel des Themas sollte es anderen Benutzern erlauben möglichst schnell zu erfassen, wozu Ihr Skript dient.
Post Reply
franky
Posts: 5
Joined: Wed 13. Feb 2013, 12:30

Script: Splittung eines Datasets in Lern- und Testdaten

Post by franky » Fri 28. Jun 2013, 14:21

Hallo zusammen,

im Rahmen meines Projektes habe ich ein kleines Script erstellt, dass ein RAW-Lesson-Datafile (*.csv) einließt und mit Hilfe von Membrain in eine Trainingslesson (*.mbl) und eine Testlesson (*.mbl) splittet.
Die Aufteilung in Training- und Testdaten erfolgt per random, das Verhältnis kann im Script über die Variable "splitratio" eingestellt werden. Per default wird im Verhältnis 80% Trainingsdata, 20% Testdata gesplittet.
Damit das Script funktioniert, muss ein zu-den-Daten-passendes-Netz vorhanden sein, daher findet Ihr im Zip auch ein Beispielnetz, und die dazugehörige RawLesson.
Das Skript basiert auf dem Beispielscript von Herrn Jetter.

Viele Grüße,
Frank
Attachments
SplitData.zip
(1.72 KiB) Downloaded 349 times

Post Reply