Benutzer:Andreas W. Hauser
Erscheinungsbild
Hoi,
ich studiere Computerlinguistik an der LMU München und habe meine Magisterarbeit über | "OCR -Nachkorrektur von historischen Texten" geschrieben. Eventuell kann man dabei entstandene Techniken auch für Wikisource benutzen.
Ein erster Schritt wäre, die Fuzzy Mathching Regeln, die für älteres Neuhochdeutsch und Frühneuhochdeutsch entwickelt worden sind, um ältere Schreibweisen, wie "frawen", mit den heutigen ("frauen") matchen zu können, für die Volltextsuche einzusetzen.
Bei den Regeln handelt es sich um Substring zu Substring Operationen mit Gewichten. Also z.B.
0.1 aw -> au
mit Gewicht und dann alter Substring "->" neuer Substring.
Ausserdem bin ich verheiratet und habe einen Sohn :-)
Im IRC ist mein Nick buggs.
--
Andy
Babel: | ||
---|---|---|
| ||
| ||
Benutzer nach Sprache |