KNN zur Produkterkennung anhand einer Beschreibung

Sie haben ein bestimmtes Projekt zu bearbeiten und wissen nicht, wie Sie an die Aufgabe heran gehen sollen? Sie sind sich nicht sicher, ob Ihr Netzentwurf zu Ihrem Problem passt oder ob es da Optimierungsmöglichkeiten gibt? Ist es überhaupt sinnvoll an Ihre Daten mit einem NN basierten Ansatz heranzugehen? Ist MemBrain das richtige Werkzeug für Ihr Problem und Ihre Infrastruktur?

Hier ist der richtige Platz für diese Art von Fragen.
Post Reply
mop
Posts: 2
Joined: Fri 17. Jun 2011, 17:28

KNN zur Produkterkennung anhand einer Beschreibung

Post by mop »

Hallo,

ich habe leider nicht viel Ahnung vom Aufbaue von Netztopologien, also hoffe ich, dass mir hier jemand helfen kann... Ich habe schon Mal Netze zur Erkennung von UND und ODER Verknüpfungen gebaut, aber das ist kein Vergleich zu dem, was jetzt jetzt testen möchte:

Ich hätte gerne den folgenden Test gebaut:
Wenn ich z.B. für einen Onlineshop Produkte erfasse und Beschreibungen hinterlege, wie z.B.:
Produktnummer: 123456789
Beschreibung: Digitalkamera 50mm Objektiv mit Stativ
Und ein Kunde irgendwo sowas wie eine "Kleinanzeige" platziert:
Text: Kamera 0,5m mit Ständer

(Das Beispiel ist jetzt frei erfunden und vielleicht sinnlos, was sinnvolles fällt mir so spontan nicht ein)

Ich würde gerne ein Netz aufbauen, das ich darauf trainieren kann, aus einem solchen Suchtext eine Entsprechung in der Produktbeschreibung und somit eine Produktnummer zu bekommen.
Ich habe aber keine Idee, wie so ein Netz aussehen sollte. Wieviele Inputs sollte das haben, wie viele Outputs? Wieviele hidden layer mit wievielen Zellen? Reicht ein forward only oder sollte es da rückkopplungen geben?
Also Outputs=Anzahl Produkte ist wahrscheinlich eher sinnlos, wenn ich mir vorstelle, dass ich z.B. 1.000.000 Produkte in einem Shop habe. Was sollte also an den Outputs ankommen?
Und was sollte rein gehen? Der komplette Suchtext? Einzelne Wörter? Der Text irgendwie aufbereitet?

Oder meint Ihr, Nueronale Netze sind für eine solche Anwendung nicht das richtige?

Würde mich sehr über Denkanstöße freuen.
Danke
Mop
User avatar
Admin
Site Admin
Posts: 438
Joined: Sun 16. Nov 2008, 18:21

Re: KNN zur Produkterkennung anhand einer Beschreibung

Post by Admin »

Hallo,

für das beschriebene Problem sind neuronale Netze ohne aufwändige Datenvorbereitung ungeeignet. Das zeigt sich schon an Deiner Frage:
mop wrote:Und was sollte rein gehen? Der komplette Suchtext? Einzelne Wörter? Der Text irgendwie aufbereitet?
Unsere Sprache beinhaltet eine ungeheure Vielfalt an Kombinationsmöglichkeiten von Buchstaben. Dazu kommt, dass nicht nur die Buchstaben eines Wortes zu seiner Bedeutung gehören, sondern ganz wesentlich auch deren Reihenfolge. Weiterer Punkt ist natürlich, dass verschiedene Wörter unterschiedliche Längen haben.
Das Selbe Problem setzt sich auf der Ebene der Sätze fort, nur dass die Bestandteile hier ganze Wörter anstatt Buchstaben sind.

Generell ist zur Erkennung von digitalem Text ein klassischer Wörterbuchanhsatz zunächst sinnvoller.

Hat man ein Wort erkannt, so findet man wohl am besten auf der Basis von Thesauren mögliche Synonyme und ähnliche Wörter und geht damit in eine (Datenbank)-Suche des Online Shops.

Diese klassischen Methoden sind in diesem Bereich viel leistungsfähiger als neuronale Netze. Allein die Herstellung der Trainingsdatenmenge für das beschriebene Problem würde wahrscheinlich ins Unermessliche gehen. Eine entsprechende Codierung von Wörtern in skalare Eingangswerte eines Netzes zu finden, wäre die nächste große Herausforderung, meiner Meinung nach zum Scheitern verurteilt.

Viele Grüße und trotzdem viel Erfolg bei der Aufgabe!
Thomas Jetter
mop
Posts: 2
Joined: Fri 17. Jun 2011, 17:28

Re: KNN zur Produkterkennung anhand einer Beschreibung

Post by mop »

Hi,

danke für die Antwort. Ich gebe trotzdem nicht auf :) Ich versuche mal ein Paar Testdaten zu generieren und diese dann aufzubereiten. Wenn da etwas vernünftiges rauskommt, poste ich das hier mal...
Post Reply