16 Juni 2008

cellwriter

...ich bin begeistert. Vor ein paar Tagen habe ich die Software cellwriter entdeckt, die einzelne, in ein Kammfeld geschriebene Buchstaben (ich vermeide den Begriff Glyphe, da z.B. keine Ligaturen aufgelöst werden) den entsprechenden Charactern (Graphemen) im angegebenen und trainierten Zeichensatz zuordnen. Es geht also um Schriftzeichenerkennung. Die Software benutzt ein paar Algorithmen, die in einem beiliegenden Text erklärt werden und ist natürlich hauptsächlich zur Verwendung auf PDAs gedacht. Als freie Software auf diesem Gebiet kannte ich bislang nur STIHRS und die Bibliothek LipiTk, hatte beide jedoch noch nicht wirklich getestet.
Natürlich hoffe ich weiter auf eine (freie) Software zur Handschriftenerkennung - dieser im Weg stehen natürlich Segmentierungsprobleme (wie so oft).
Will man sich auf dem Gebiet weiter informieren, empfehle ich den Forschungsüberblick von Bianca Feldmann (PDF, auf dem Dokumentenserver der Uni Göttingen) und z.B. die Artikel und Vorträge, die rund um die ICDAR entstanden sind. Zur Handschriftenerkennung per HMM gab es dort einen wohl sehr interessanten Vortrag von G. Fink und T. Plotz (Uni Dortmund). Mit Handschriftenerkennung mittelalterlicher Texte und der Schreiberidentifikation anhand der Handschrift beschäftigt sich Marius Balacu (Uni Groningen).
Mit der Rechenleistung heutiger Rechner wird so einiges möglich, wovon ich damals, als ich den ersten Handheld-Scanner an einen 386er anschloß, nur träumen konnte und was demnächst die Textdigitalisierung und den täglichen Gebrauch des Rechners als Textverarbeitungsmaschine erleichtern wird - da freu ich mich jetzt schon drauf.

Labels: , , ,