13 Februar 2010

Stanford-postagger und Ruby Teil2

Sobald die Klasse PosTagger nun übersetzt ist, kann sie von Ruby aus angesprochen werden.

Hierzu brauchen wir die Ruby-Java-Bridge (Zeile 4), setzen den Classpath auf den POS-Tagger (Zeile 9) und importieren dann unsere Klasse PosTagger (Zeile 10). Danach kann man die Methode tag aus der Java-Klasse benutzen, die uns einen getagten String zurückgibt. Die private Ruby-Methode get_token dient hier dazu, diesen String zu zerlegen um als Resultat ein Array aus Wortformen und Wortarten (bzw. Penn Treebank tags) zu erhalten.
Die hier gezeigten Scriptschnipsel sind nicht schön und auch noch nicht wirklich fertig, aber vielleicht helfen sie ja der ein oder dem anderen.

Labels: , ,