Bitmap von Störstreifen befreien
Posted: Tue 4. Sep 2012, 09:10
Hallo Moin,
Ich bin absolut neu zum Thema KNN und möchte gerne abschätzen ob es sinnvoll ist, für die Lösung meines Problems ein NN zu benutzen.
Die Aufgabenstellung:
Eine Captcha Bitmap steht als 8bpp indexed Gray in einem Array(x,y) bereit. Das Ziel ist eine Bitmap mit 2 Farben (B/W). Die Erkennung der Ziffern ist ein späterer Schritt.
Die Farben der Ziffern ist immer 234,
Die Farben vom Hintergrund sind Noise: können alle Werte von 0-255 haben, nur nicht 234
Durch das Bild laufen mehrere Störstreifen deren Grundwert 254 ist. Diese Störstreifen wurden aber mit GDI+ in die Bitmap eingezeichnet. Dadurch entstehen an den Rändern der Streifen, an den Übergängen, Zwischenfarben (Dithering). Diese Pixel können wieder alle Werte von 0-255 haben. Diese Störstreifen überschreiben z.T wichtige Strukturen der Ziffern, so das eine Rekonstruktion herkömmlich schwierig ist.
Ich könnte mir vorstellen das ein NN in der Lage ist zu Lernen, welche Farbe (S/W) ein Pixel wirklich hat. Das Array hat eine Grösse von 330*80 Pixel.
1.) Ist es (Rechen) zeitlich gesehen besser das gesamte array den IN Neuronen zu übergeben oder sollte man jeden Pixel durchlaufen und in einem kleineren Feld (z.B. 15*15) bewerten lassen.
2.) Mit welchem Netz könnte man dann die besten Erfolge erzielen
Vielen Dank. Frank
Ich bin absolut neu zum Thema KNN und möchte gerne abschätzen ob es sinnvoll ist, für die Lösung meines Problems ein NN zu benutzen.
Die Aufgabenstellung:
Eine Captcha Bitmap steht als 8bpp indexed Gray in einem Array(x,y) bereit. Das Ziel ist eine Bitmap mit 2 Farben (B/W). Die Erkennung der Ziffern ist ein späterer Schritt.
Die Farben der Ziffern ist immer 234,
Die Farben vom Hintergrund sind Noise: können alle Werte von 0-255 haben, nur nicht 234
Durch das Bild laufen mehrere Störstreifen deren Grundwert 254 ist. Diese Störstreifen wurden aber mit GDI+ in die Bitmap eingezeichnet. Dadurch entstehen an den Rändern der Streifen, an den Übergängen, Zwischenfarben (Dithering). Diese Pixel können wieder alle Werte von 0-255 haben. Diese Störstreifen überschreiben z.T wichtige Strukturen der Ziffern, so das eine Rekonstruktion herkömmlich schwierig ist.
Ich könnte mir vorstellen das ein NN in der Lage ist zu Lernen, welche Farbe (S/W) ein Pixel wirklich hat. Das Array hat eine Grösse von 330*80 Pixel.
1.) Ist es (Rechen) zeitlich gesehen besser das gesamte array den IN Neuronen zu übergeben oder sollte man jeden Pixel durchlaufen und in einem kleineren Feld (z.B. 15*15) bewerten lassen.
2.) Mit welchem Netz könnte man dann die besten Erfolge erzielen
Vielen Dank. Frank