30 April 2008

OCRopus

...letzten Oktober hatte ich mich ja nochmal an einer line segmentation handschriftlicher Texte versucht und wollte mir hierzu auch noch OCRopus ansehen, wenn es dann fertig ist (bzw. ich es auf meinem Rechner zum laufen bekomme). Heute war es dann soweit: Nachdem sich OCRopus hier vorgestern noch nicht bauen ließ, wurde praktisch über Nacht der Bug gefixt und die derzeitige Revision 800 (http://ocropus.googlecode.com/svn/trunk/) funktioniert bestens mit Tesseract in der Revision 169 ( http://tesseract-ocr.googlecode.com/svn/trunk/). Nur kurz, wie man beides (z.B.) zieht und installiert, erst Tesseract:
svn co http://tesseract-ocr.googlecode.com/svn/trunk/ tesseract-ocr
Und in tesseract-ocr dann
./configure
make
make install

Prüfen, ob Tesseract funktioniert:
tesseract eurotext.tif test
test sollte nun den Text enthalten, den man in dem Bild eurotext.tif sieht. Nun noch OCRopus ziehen und bauen:
svn co http://ocropus.googlecode.com/svn/trunk/ ocropus
Und in ocropus dann
./configure
jam

Wenn alles ordentlich durchlief dann z.B. mit
ocrocmd/ocrocmd data/pages/alice_1.png
testen, ob die Zeichenerkennung auf dem Testbild (Alice im Wunderland) funktioniert.
Bestenfalls erhält man html mit der segmentation des Bildes und dem Text. Ich habe das Ganze mal so, wie es ist, auf ein Stück aus der Trierer HS30 losgelassen. Das Ergebnis sieht man auf dem Bild (die unterschiedlichen Farben haben keine Bedeutung). Mal sehen, was man noch alles mit dem netten Programm anfangen kann.

Labels: , ,

29 April 2008

Herr Pilipenko und sein U-Boot

Herr Pilipenko und sein U-Boot (NDR):
"NDR - Herr Pilipenko und sein U-Boot
28.04.2008 23:45-01:15
Am liebsten ist Wladimir Pilipenko in seiner Werkstatt. Hier hat er in den letzten 30 Jahren Tage und Nächte verbracht und sich ein U-Boot gebaut, aus Schrottteilen. Mitten in der ukrainischen Steppe."

Spitzendoku grad' auf N3:
Herr Pilipenko taucht, und das ganze Dorf steht dabei und bangt - und auch ich hatte berechtigte Angst, daß Herr Pilipenko in seinem Schrott-U-boot ersäuft - aber (Achtung Spoiler!) Herr Pilipenko taucht wieder auf, das U-Boot wird mit einem Lada Niva aus dem Wasser gezogen und am Abend gibt es zur Feier Schaschlik und Wodka. Testlauf bestanden.
Da der nächste Tauchgang im offenen Meer stattfinden soll, läd Herr Pilipenko das U-Boot auf einen Laster und macht sich mit einem Freund, einer Decke, einem Handtuch (Don't Panic!) und Socken auf den Weg. Unterwegs philosophieren die beiden über Fische: "Fische sind das Problem des Jahrhunderts" (Problem sie zu fangen, Problem auf sie aufzupassen, Problem sie zu verkaufen...) und trinken reichlich Wodka auf ex (und essen danach natürlich eine Tomate - das gehört wohl so).
Am Meer angekommen macht sich Herr Pilipenko trotz 30jähriger Bauzeit nicht wirklich Gedanken, wie er sein U-Boot wieder aus dem Wasser ziehen will. "Ich hab's satt", sagt Herr Pilipenko, "wenn es nicht klappt, versenken wir es und fahr'n nach Hause"...

Labels: ,

26 April 2008

things to do

...eigentlich wollte ich mir ja auch noch das js-Framework mootools ansehen - das ein oder andere daraus kann man sicher hier oder da noch gut gebrauchen - und wo wir schon bei JavaScript sind: Drüben bei Kevin van Zonneveld werden momentan einige viele PHP-Funktionen in js gestrickt (php.js) - sollte ich mal gezwungen sein, irgendwas clientseitiges verbrechen zu müssen, werde ich bestimmt noch darauf zurückkommen. Momentan gilt jedoch: Keine Zeit, keine Zeit - zwischendurch wollte ja auch noch der Ubuntu-Rechner auf 8.04 geupgradet (schlimmes Wort) sein...
"Oh dear! Oh dear! I shall be too late!"

Labels: , , ,

23 April 2008

SPAM

...da sich die deutsche Bloggeria momentan mal wieder für jeden Werbemüll einspannen läßt, der ihr vor die Füße geworfen wird, hab ich natürlich nichts besseres zu tun, als da fröhlich mitzumischen. Zwar habe ich kein Päckchen bekommen, aber eine ganz putzige Spammail, bestehend aus einem bunten Strauß kruder Formulierungen und Übersetztungsfehlern, die mich sehr haben schmunzeln lassen. Neben der wohl rhetorisch gemeinten Frage "Ist es möglich, zu kaufen zum niedrigsten Preis?" brachte mich der Hinweis "Möglicherweise haben Sie bemerkt, auch der Unterschied in den Kosten für die Fahrkarte aus seiner Nachbarn während eines Fluges" dann doch zum Grübeln. Gewöhnlich fliege ich zwar nicht, von dem seltsamen Preissystem für die Tickets habe ich jedoch durchaus gehört. Gut, daß die Mail auch gleich eine vernünftige Erklärung liefern konnte: "Der Preis der Karten wird von mehr Wert auf einen kleineren, und umgekehrt". Aus dieser Perspektive hatte ich das noch gar nicht betrachtet. Jetzt wurde mir einiges klar! Aber damit nicht genug - so hieß es weiter: "Es ist die Berechnung: literate Reiseveranstalter wissen, für wie viele Personen sie zu zählen". Eine Unverschämtheit! Das grenzt ja an Betrug! Gott sei Dank wusste die Infomail um Abhilfe: "außergewöhnliche Zeit, die Sie kaufen können Eintrittskarten zu einem beliebigen Punkt in Europa, zum Beispiel für 55 Euro". Na, das klingt doch schon eher nach einem fairen Preis. Zugreifen!

(Bild von Grumbler auf flickr.com unter dieser CC-Lizenz)

Labels: , , ,

22 April 2008

Dragnet

...manchmal hab' ich ja Assoziationen, bei denen ich nicht genau nachvollziehen kann, wie diese zustande kamen. Als ich jedoch eben auf hunderttausend.de das Interview mit Tim Jürgens gelesen hatte und dann über den Veranstaltungskalender (siehe Screenshotausschnitt) stolperte, wusste ich genau, warum ich plötzlich an den Film Dragnet denken musste und fast vor Lachen vom Stuhl fiel.

Labels: , ,

21 April 2008

Reanimation

...das gestern anstehende 'Backup' gestaltete sich dann doch einfacher, als zuerst gedacht. Die Aufgabe bestand darin, an den Inhalt von ein paar Textdateien zu gelangen, die schön säuberlich über mehrere 5 1/4"-Disketten verteilt schon seit einigen Jahren hier im Regal standen. Gut, daß ich auf der Diskettenbox vermerkt hatte, mit welchem Programm diese Textdateien erstellt wurden: GeoWriter aus dem Geoworks Ensemble. Zur Konvertierung reaktivierte ich also den alten 80MHz schnellen 468DX2. Und obwohl dieser Rechner in seiner aktiven Zeit nie Macken hatte und immer der Robusteste unter all den Rechnern war, die ich je zusammengeschraubt habe, hielt ich meine Befürchtungen, den Rechenzwerg nach Jahren des Stillstandes wieder in Betrieb zu nehmen, für berechtigt: Was, wenn das Netzteil gleich beim ersten Einschalten den Geist aufgibt, oder noch schlimmer, sich die Festplatte ins Nirvana kratzt? Aber auch nach Jahren der Inaktivität sprang der Kleine ohne zu meckern an, zählte brav seinen Speicher durch und begrüßte mich dann zum 20. April 2097 - und ein wenig fühlte ich mich an 2010 erinnert, obwohl ich natürlich weder ein Raumschiff bergen, noch einen Monolithen untersuchen wollte.
("I'm completely operational and all my circuits are functioning perfectly.")
Mein Rechner explodierte hinterher auch nicht sondern nahm den Einbau des 5 1/4 Zoll Laufwerks und die Konvertierung der Dateien (weder hatten sich inzwischen die Disketten zersetzt noch verweigerte GeoWriter den Dienst) sehr gelassen hin.
Natürlich konnte ich nach getaner Arbeit nicht die Finger von dem Rechner lassen und ermöglichte ihm noch einen Blick in die heutigen Datennetze, indem ich eine 3Com EtherlinkIII (ISA) nachrüstete.
("Good morning, Dr. Chandra. This is HAL. I'm ready for my first lesson.")
Surfen mit dem Netscape Navigator 3 und einer Bildschirmauflösung von 640x480 ist nicht wirklich eine Freude, weshalb ich wohl für den täglichen Einsatz nicht wieder auf den 486er zurückgreifen werde - er soll aber trotzdem seinen Platz in meiner kleinen Rechnersammlung behalten.
("Dr. Chandra?" - "Yes?" - "Will I dream?")

(Bild von Mess of Pottage auf flickr.com unter dieser CC-Lizenz)

Labels: , , ,

19 April 2008

Pokal

21:53: ...Junge, Junge, da gehse doch bekloppt!
22:08: ja isset denn? ja ne, is klaa...
22:15: Jakub, Jakub, Jakub... ne, ne, ne, ne, ne...
22:28: ja leck mich doch anne Socken! War ja mal wieder klar.

Labels: , ,

18 April 2008

Sylt

...ok, wenn man zu doof ist sich das neue Kettcar-Album im Internet vorzubestellen und es dann am Veröffentlichungstag doch in den Fingern und Ohren juckt, muß man halt zum fiesen Elektronikmarkt um die Ecke laufen, um dort sein Geld loszuwerden. Eigentlich mit der Befürchtung im Gepäck, daß die Damen und Herren Plattenverkäufer es mal wieder nicht auf die Reihe kriegen, ihr Sortiment pünklich zu erweitern, wird man dann doch positiv überrascht (und man denkt 'achso, ja, Studentenstadt - und schließlich Kettcar, nicht irgendeine unbekannte Band aus Castrop-Rauxel oder Datteln') - das Ding lächelt einen schon an, als man noch auf der Rolltreppe steht. Zwar gibt's nur die 'limitierte Deluxe Edition' und man fragt sich 'wozu', greift dann aber doch beherzt zu. Schrecklich, diese Fan-Allüren - ganz schlimm. Also schenkt man, wo man schon hier rumsteht, dem Vinylregal Beachtung. 'Tales of mystery and imagination'... dann die zwei ganzkörpertätowierten Zimmermänner: "Oh, es gibt ja wieder Platten." - "Das ist ja wieder in." - "Ich hab auch nen Plattenspieler." - "Ich auch, von Oma der, ein Sony." - "Hast Du mal versucht, ne neue Nadel zu bekommen? Das geht garnicht." - "Ne, bekommt man nicht". Allein für diesen Dialog hat sich der Gang in diese sonst so kalte, unpersönlich gesichtslose Plattenabteilung schon gelohnt. Wahrscheinlich aber auch für den Neuerwerb, dessen Plastikhülle man gleich im Fahrstuhl aufreißt. Postergutschein gratis dazu , den man auf den Konzerten am Merchandisestand eintauschen kann. Sollte kein Problem sein. Und man sieht sich schon in der S-Bahn sitzen, nach dem Konzert, mit einem Poster in der Hand und man hat jetzt schon keine Lust auf die Party-Küchengespräche, in denen die Platten gegeneinander abgewogen werden: "Die DuundwievielevonDeinenFreunden ist viel besser, weil ... und außerdem ..." - und außerdem wollte man noch seinen Nachnamen googeln und eine Platte hören.

Labels: , ,

Präsi

...also ich sag mal so: "wenn ich der Bundespräsident wär..." - aber egal

Labels: ,

16 April 2008

Baumarkt

...na die Woche fing ja gut an! Erst im strömenden Eisregen zum Baumarkt geradelt für ein handwerkliches Resultat, das im Endeffekt niemandem und dann noch von einem Marktforschungsinstitut angerufen worden: Es ging um Baumärkte. Da ich dachte, mit frischer Erfahrung ins Rennen zu gehen und, da ich für lau bekanntlich am liebsten arbeite, dachte ich: 'na dann mal los'. Leider konnte ich keinen der mir vorgelesenen Werbesprüche dem jeweils richtigen Baumarkt zuordnen, außerdem verwechselte ich ständig Hornbach mit Hagebau, Hagebau mit Bauhaus und sicher auch Bauhaus mit Hornbach. Die Befragung war eh sehr schnell zuende, da ich die Fragen der stark sächselnden Interviewerin genau so wenig verstand, wie sie meine gelangweilt in das rauschende Telefon gebrummten Antworten. Für alle die diese Woche noch was von mir wollen: Das blinkende 'macht Euren Scheiß besser alleine'-Schild auf meiner Stirn ist nicht böse, sondern ganz ehrlich gemeint.

Labels: ,

09 April 2008

Verwaltungsakt

...natürlich kann es, bietet man Telemedien an, auch mal passieren, daß die Technik streikt und z.B. ein Server nicht mehr das tut, was er soll. Kommt vor. Kommt offensichtlich auch bei staatlichen Anbietern vor, wie dieser Screenshotausschnitt zeigt, dem man leicht entnehmen kann, daß die Bundesnetzagentur auf PHP in Verbindung mit MySql (auf einem Server mit M$-Betriebssystem) setzt. Wie gesagt: Ein Fehler - sowas kommt vor. Es soll aber auch nicht unerwähnt bleiben, daß man in diesem Fall die PHP-Fehlermeldungen auch abfangen und dem Nutzer des Telemediendienstes eine benutzerfreundlichere und weniger aussagekräftige Fehlermeldung hätte anzeigen können. In diesem Fall hat man sich jedoch dafür entschieden, ein knappes Wochenende lang die blanke PHP-Fehlermeldung auszuliefern - bis sich dann am Montag endlich jemand für das Problems zuständig fühlte.

Labels: , ,

Versteckspiel

...und noch eine Sache, die mir bei einigen Seiten im Netz aufgefallen ist: Ich mache kein Geheimnis daraus, daß eingebettete Multimediainhalte ('Filmchen') oftmals für mich ein rotes Tuch sind. Oft nur überflüssig, manchmal aber auch sehr störend - u.a. dann, wenn sie, wie hier im Screenshotausschnitt festgehalten, Steuerelemente der Seite verdecken. Mag ich nicht, sowas - ließe sich aber evtl. leicht durch ein paar Änderungen im Stylesheet korrigieren.

Labels: , ,

CSS naked day

...heute ist mal wieder CSS naked day, weshalb ich hier für heute die Stylesheets ausgeschaltet habe. Nicht wundern. Ich finde, die Seite ist auch so recht gut lesbar* - für Hinweise und Verbesserungsvorschläge bin ich immer ansprechbar. (Ja, und ich weiß, das Blog hier 'beim bösen G' zu hosten ist ganz schlecht, geradezu verdorben muß man sein...)

(*autsch - teilweise >40 Fehler auf einer simplen Seite (fehlendes alt-Attribut, fehlende Summary), das muß auch besser gehen!)

Labels: ,

07 April 2008

Zweifel

...diese Woche soll es mal um Internetseiten gehen, bei deren Ansicht ein großes Fragezeichen über meinem Kopf erschien: Ob statt der Seite nur (PHP-)Fehlermeldungen angezeigt werden, die Benutzbarkeit durch unschönes CSS eingeschränkt wird oder ob es den Inhalten an Korrektheit mangelt - in loser Folge werde ich hier ein paar Seiten zeigen, die mich stark daran zweifeln ließen, ob sie vom Ersteller nochmal getestet und/oder geprüft wurden.
Es geht los mit dem Angebot eines Serververmieters, der bei seinen Servern die Ausstattung mit AMD-Professoren anpreist. Klar, so ein AMD-Professor doziert wahrscheinlich nur Di-Do, also kann er in der restlichen Zeit Dienst in einem dunklen Serverraum tun. Für die Studierenden wirft das die interessante Frage auf, ob man besser Seminare bei einem Intel-Professor belegt und ob dieser dann auf die Bitte nach Verlängerung der Abgabefrist für die Hausarbeit schneller oder einfach cooler reagiert.
(P.S.: Natürlich schreib' ich auch nur eine Menge Müll, aber - hey, das ist das Netz, also kein Grund, sich nicht über die Fehler anderer zu beschweren...)

Labels: , ,

03 April 2008

Kritik

...(und weiter geht's mit krakeligen Bildchen) ...interessant wird sicherlich auch, in welcher Form die Olympioniken Kritik an dem Gastgeber der Spiele äußern werden und, ob sie dann noch ihre Medaillen mit nach Hause nehmen dürfen.
(lies auch hier und so...)

Labels:

02 April 2008

China

...heute aus der Reihe 'gute Fotos - schlecht nachgezeichnet': China und die Olympischen Spiele.

Labels:

TV-Browser down?

Aprilscherze fand ich selten mal lustig. Das mag auch daran liegen, daß ich gerne mal auf welche reinfalle - wie z.B. auf diesen hier. Ganz besonders ärgerlich wäre ein Ende des TV-Browsers gewesen, da mir OnTV, welches von nxtvepg gefüttert wird, nur ganz selten mal vollständige Daten anzeigt - und auch nicht im gegensatz zum TV-Browser automatisch TVTime startet, wenn House oder Monk anfängt. Schlechter Scherz! Grrrr!