Kreditprüfung HILFE!

Sie haben ein bestimmtes Projekt zu bearbeiten und wissen nicht, wie Sie an die Aufgabe heran gehen sollen? Sie sind sich nicht sicher, ob Ihr Netzentwurf zu Ihrem Problem passt oder ob es da Optimierungsmöglichkeiten gibt? Ist es überhaupt sinnvoll an Ihre Daten mit einem NN basierten Ansatz heranzugehen? Ist MemBrain das richtige Werkzeug für Ihr Problem und Ihre Infrastruktur?

Hier ist der richtige Platz für diese Art von Fragen.
Post Reply
xroot
Posts: 1
Joined: Wed 17. Jun 2009, 21:05

Kreditprüfung HILFE!

Post by xroot »

Hallo zusammen,

ich habe morgen eine Präsentation über Neuornale Netzte und bin leider erst jetzt auf MemBrain gestossen und möchte nun ein kleines Netz morgen anhand von einpaar Bsp Daten vorfühen. Vielleicht kann mir ja einer kurzfristig helfen!!!!

Konkret geht es um eine Kreditprüfung mit etwa 12 Inputfaktoren wie z.B. Kredithistorie, Alter etc...

Es sind um die 1000 Datenreihen vorhanden und ich habe alle Datensätze auch normalisiert.
Als Output muss entweder eine 1 oder eine 2 rauskommen. DAher guter Kunde oder schlechter Kunde.Output ist auch normalisiert.

NUn habe ich aber das Problem bei dem Netzaufbau selbst, da egal wieviele Schichten ich in den Hiddenlayer reinsetze ich einen NetError über 240 habe. Als bestes Ergebnis ist bisher 12x2x1 rausgekommen. Ich möcte aber auch keine Inputfaktoren streichen.

Kann mir jemand kurzfristig einen Vorschlag zu der Netztopologie/ARchitektur geben??? BZw. verwende ich mit Backpropagation mit Momentum auch die falsche Lernmethode.


Vielen Dank Leute. Wäre cool wenn mir jemand schnell eine ANtwort geben könnte.
VG,

siegfried
User avatar
Admin
Site Admin
Posts: 438
Joined: Sun 16. Nov 2008, 18:21

Re: Kreditprüfung HILFE!

Post by Admin »

Hallo Siegfried,

sorry, hab Deinen Post gerade erst gelesen. Wenn Du schnell reagierst, kann ich vielleicht heute noch kurz danach schauen...

Du musst mir allerdings die Daten zukommen lassen, sonst wird das auf keinen Fall was. Ohne Daten eine Ferndiagnose in einer halben Stunde oder so ist nicht möglich.
Du kannst mir die Daten gerne auch per E-Mail schicken, wenn Du sie hier nicht der Öffentlichleit zugänglich machen willst. Bitte zippen oder als rar-Archiv.

Bis denn, ich hoffe, noch von Dir zu hören ;)

Wann hast Du denn Deinen Vortrag morgen?

Viele Grüße und auf jeden Fall viel Erfolg!
Thomas Jetter
User avatar
Admin
Site Admin
Posts: 438
Joined: Sun 16. Nov 2008, 18:21

Re: Kreditprüfung HILFE!

Post by Admin »

Hallo Sergej,

danke für die Daten, keine allzu guten Neuigkeiten leider:
Deine Daten sind unzulänglich bzw. widersprüchlich für das Netz. Ich habe ein wenig herumgespielt, komme auf minimal ca. 140 Net Error für die volle Lesson.

Habe dann auch die Lesson mal aufgespaltet in 90% Trainingslesson und 10% Validierungslesson. Wenn ich damit trainiere (und mir beim Training den Fehler bzgl. der Validierungslesson anzeigen lasse, dann komme ich bzgl. der 100 Pattern umfassenden Validierungslesson auf einen Fehler von ca 13-15.
Wenn man bedenkt, dass der Net Error die Summe der QAUQDRIERTEN Abweichungen über alle Pattern der Lesson ist, ist das sehr viel Restfehler. Wenn man sich dementsprechend den Output im Vergleich zum Soll im 'Pattern-Error-Viewer ' anschaut, sieht man auch, dass das Netz nicht besonders gut rät.

Ich habe mir dann die Daten einmal näher angeschaut und stelle folgendes fest:
Die Pattern (Datenzeilen) unterscheiden sich in vielen Spalten so gut wie gar nicht. Ist da vielleicht beim Editieren des csv Files was schief gegangen? Vielleicht in Excel importiert und deutsche Einstellungen für 1000er-Trennzeichen und Spaltentrennzeichen genommen, es hat sich aber vielleicht um eine englisch formatierte Original-Datei gehandelt, in der die Trennzeichen anders sind?

Woher hast Du denn die Originaldaten?

Du must Dir das so vorstellen:
Dem Netz bietest Du viele verschiedene Datensätze (Pattern), in denen sich die Inputs über verschiedene Pattern sehr ähneln, der Output aber wechselt. Ich habe das letztens mal im Forum versucht mit einer Analogie zu beschreiben:

"Das ist so ungefähr, wie wenn Du einem Schüler heute beibringen willst, dass 2 + 3 = 5 ist, morgen behauptest Du aber 2 + 3 sei 7. Der Schüler hat keine Möglichkeit, etwas zu lernen, da er aus diesen Daten keine Regeln ableiten kann. Erst wenn er merkt, dass Du Montags immer '5' sagst, an allen anderen Wochentagen aber '7' kann er das erlernen. Dazu braucht er weiteren Input. Nämlich den Wochentag."

Deinem Netz fehlen also weitere Inputs, an deren Daten es die Entscheidung ob 1 oder 2 auszugeben ist, festmachen kann. Dass diese Daten fehlen, kann 3 Gründe haben:
- Du hast beim csv umformatieren Fehler gemacht (z.B. falsche Trennzeichen englisch/deutsch)
- Die Daten wurden nie erfasst
- Es gibt die Daten nicht

Letzteres bedeutet, dass der Vorgang aus menschlicher Sicht chaotisch einzustufen ist und mit keinem Tool abgebildet werden kann. Das wäre also 'Wahrsagerei'.

Ein weiteres Problem könnte übrigens die Codierung mancher Spalten sein, z.B. 'Credit history' oder 'Purpose': Diese scheinen mir Codes zu sein, viel mehr als Werte, die sich auf einer Werteskala einordnen ließen.
Du musst bei einem Neuronalen Netz darauf achten, dass ein Eingabeparameter nur dann durch ein einzelnes Neuron repräsentiert werden sollte, wenn der Parameter einen Wert aufweist, der auf einer Skala eine Bedeutung hat. Er sollte also entweder binär (1 oder 0) sein, oder sein Wert sollte einer logischen Richtungszuordnung im Sinne von 'größer' oder 'kleiner' folgen.
Wenn es sich um abstrakte Codes handelt, kann das Netz daraus keine Regeln ableiten, weil es versucht, mit den Werten zu rechnen. Das macht bei Codes, denen keine Bedeutung wie 'größere Zahl bedeutet mehr' zugrundeliegt, keinen Sinn. Hier muss man z.B. über alternative Codierungen durch mehrere binäre Neuronen nachdenken.

Hilft das? Ich weiß, es sind erst mal keine guten Neuigkeiten, aber es ist auch ein Ergebnis: Mit diesen Daten geht's nicht!
Kannst Du nochmal die Originaldaten untersuchen, und schauen, ob das die selben sind, wie im csv?

Viele Grüße,
Thomas
Thomas Jetter
User avatar
Admin
Site Admin
Posts: 438
Joined: Sun 16. Nov 2008, 18:21

Re: Kreditprüfung HILFE!

Post by Admin »

Kleiner Nachtrag noch:

Nimm 'RPROP' mit den MemBrain Default-Einstellungen als Teacher. Das schlägt normales Backpropagation in Punkto Geschwindigkeit meist um Längen und Du musst nicht erst mühsam eine optimale 'Learnrate' suchen, da sie bei RPROP dynamisch automatisch angepasst wird.

Viele Grüße und viel Erfolg morgen!
Thomas Jetter
Post Reply