21 Dezember 2007

mehr Software

...auch eine schöne Software ist der Stuttgarter Finite State Transducer, mit dem man sich beispielsweise lustige kleine Automaten zur morphologischen Analyse recht komfortabel selbst bauen kann. Besonders leicht, wenn man bei einer agglutinierenden Sprache einfach nur Affixe an den Wortstamm kleben muß (hier im Bild z.B. Suaheli "alinichukulia" ("er trug für mich") und "ninasoma" ("ich lese"), die der Transducer gleich in eine Kette von 'Tags' <3pers_sg>... verwandelt, aus denen man sich leicht die deutsche Übersetzung bauen könnte), schwieriger wird es (und ich stehe mit regulären Ausdrücken ja ab und an schon auf dem Kriegsfuß), wenn es um (String-)Ersetzungen geht: Bei Sätze wie "each substring s of the input string which is in the analysis/deep language of the transducer c and whose left context is matched by the expression .*l and whose right context is matched by r.* is mapped to the respective surface strings defined by transducer c" (aus dem SFST-Manual) wirft meine Stirn ganz automatisch Falten...

Labels: ,