28 Oktober 2007

Irgendwann zwischen 2A und 2B

...aus dem Bundesgesetzblatt, Jahrgang 2001, Teil I Nr. 35:
§ 2 (2) Die mitteleuropäische Sommerzeit endet jeweils am letzten Sonntag im Oktober um 3 Uhr mitteleuropäischer Sommerzeit. Im Zeitpunkt des Endes der Sommerzeit wird die Stundenzählung um eine Stunde von 3 Uhr auf 2 Uhr zurückgestellt. Die Stunde von 2 Uhr bis 3 Uhr erscheint dabei zweimal.
Die erste Stunde (von 2 Uhr bis 3 Uhr mitteleuropäischer Sommerzeit) wird mit 2 A und die zweite Stunde (von 2 Uhr bis 3 Uhr mitteleuropäischer Zeit) mit 2 B bezeichnet.

Labels: , ,

26 Oktober 2007

Google Übersetzer

...und schon wieder gibt es Neuigkeiten zum Thema Maschinelle Übersetzung: Google stellt mit translate.google.com einen eigenen Übersetzungsmechanismus vor, der - wie sollte es bei dem Konzen mit dem großen 'G' anders sein - auf der Auswertung von riesigen Datenmengen beruht. Die Wort-zu-Wort-Übersetzung von 'Share' (Imperativ, Satzanfang) zu 'Aktie' statt zu 'Teile' o.ä. (siehe Bild) verwundert ('Internet' als zugrund liegendes Korpus) nicht sonderlich. (Mehr bei pixelfolk).

Labels: , , ,

16 Oktober 2007

Verkehrsinfrastruktur

...pünklich zum Semester wurde die neue Verbindung zwischen Campus und Hospital (Campus II) fertiggestellt. Der beleuchtete(!) und asphaltierte(!) Weg ist eine Art Fahrradschnellstraße, die insbesondere in Richtung Mensa zum Rasen animiert. Wie üblich verbindet der Weg jedoch nicht auf möglichst kurzem Weg die beiden Campi, sondern schlängelt sich in gefälligen Kurven durchs Gelände. Deshalb nehme ich stark an, daß auch in Zukunft der alte Trampelpfad nicht ungenutzt bleibt (vgl. Bild links). Als Hindernisse für den Fahrradverkehr bleiben die Fußgänger aus Richtung Kohlenstraße - wahrscheinlich nur Anwohner aus dem dortigen Wohnheim, denn auch für die Studenten, die mit dem Bus aus er Stadt kommen, stellt m.E. die neue Asphaltpiste einen Umweg dar.
(Fotos: Die Verbindungswege zwischen Campus I und II. Links der alte Trampelpfad über die zeitweise als Schafweide genutzte Wiese, rechts die neue 'Asphaltautobahn' - länger, aber mit geringerem Gefälle und fahrradtauglich.)

Labels: , , ,

10 Oktober 2007

line segmentation mal wieder

...vor fast zwei Jahren habe ich mich ein wenig mit der Zeilensegmentierung handschriftlicher Texte beschäftigt - hauptsächlich spielte ich mit Filtern, also Pixel- und Kantenorientierten Verfahren rum. Irgendwann möchte ich mal Handschriften deren Transkription zeilenweise gegenüberstellen.
Neulich fiel mir die OCR-Software GOCR in die Hände, die ich natürlich gleich gegen ihren ursprünglichen Verwendungszweck auf eine Handschrift loslassen musste. Das Schöne an GOCR ist, daß man sich die Koordinaten der gefundenen Zeilen und Zeichen als XML ausgeben lassen kann. Den Ausschnitt (ein paar Zeilen) der Handschrift (als jpeg) schicken wir zuerst durch djpeg, um ihn in ein graustufiges pbm umzuwandeln, danach lassen wir gocr darauf los und lassen uns das Ergebnis als xml ausgeben:
djpeg -pnm -gray hs30.jpg | gocr -o hs30.xml -f XML -v 48 -m 256
Mit dem Parameter -v >=32 gibt uns GOCR das Ergebnis zudem noch als png aus. Für das XML kann man sich nun recht einfach ein XSL schreiben, um aus den Koordinaten der gefundenen Zeichen eine Imagemap zu erstellen. Die Links in der Imagemap sollten dann auf die entsprechende Zeile in der Transkription verweisen. So viel zur Idee...
Hier kann man sich das Resultat ansehen (oder hier als statisches html - mit xsltproc gebaut). Die Auszeichnungen von GOCR: Blaue Linien für die Zeilen, rote Rechtecke für die Zeichen. Die Koordinaten der Zeichen und die jeweilige Zeilennummer sind in den area-Tags im title-Attribut hinterlegt. Das XSL sieht so aus.
Gut, die Zeilensegmentierung ist alles andere als optimal - GOCR ist dafür nicht gedacht und funktioniert bei gedruckten Zeilen auch super. Vorgefilterte Bilder (Sobel-Filter etc.?) habe ich auf die Segmentierung von GOCR noch nicht losgelassen.
Gespannt sein darf man aber auch auf OCRopus des DFKI - ausprobiert habe ich es noch nicht, da ich keine Doku gefunden habe und es wohl (noch) kein fertiges Paket gibt.
Vielleicht kann ich ja über die nächsten kleinen Ergebnisse noch vor September 2009 berichten. :)

Labels: , ,

04 Oktober 2007

Free Burma!


Free Burma!
Solidarität mit den friedlichen Protesten in Birma/Myanmar.

Hintergrundinformationen zu den aktuellen Entwicklungen gibt es u.a. bei der Heinrich Böll Stiftung und bei der AG Friedensforschung der Uni Kassel.

(Grafik: Steffi Nitzpon (blogwiese.de), CC-Lizenz)

Labels:

03 Oktober 2007

Einheitstag

...Dinge, die man am Feiertag machen könnte, sollte einem langweilig werden: Ahoi Polloi lesen und einen Buchscanner aus Lego bauen.

Labels: ,