Zum Inhalt springen

Benutzer:Andreas W. Hauser

aus Wikisource, der freien Quellensammlung

Hoi,

ich studiere Computerlinguistik an der LMU München und habe meine Magisterarbeit über | "OCR -Nachkorrektur von historischen Texten" geschrieben. Eventuell kann man dabei entstandene Techniken auch für Wikisource benutzen.

Ein erster Schritt wäre, die Fuzzy Mathching Regeln, die für älteres Neuhochdeutsch und Frühneuhochdeutsch entwickelt worden sind, um ältere Schreibweisen, wie "frawen", mit den heutigen ("frauen") matchen zu können, für die Volltextsuche einzusetzen.

Bei den Regeln handelt es sich um Substring zu Substring Operationen mit Gewichten. Also z.B.

0.1 aw -> au

mit Gewicht und dann alter Substring "->" neuer Substring.


Ausserdem bin ich verheiratet und habe einen Sohn :-)

Im IRC ist mein Nick buggs.

--

Andy

Babel:
Dieser Benutzer spricht Deutsch als Muttersprache.
en-3
This user is able to contribute with an advanced level of English.
fr-1
Cette personne sait contribuer avec un niveau élémentaire de français.
Benutzer nach Sprache