Wikisource:OCR/Abbyy/Archiv
Diese Seite ist ein Archiv abgeschlossener Diskussionen. Ihr Inhalt sollte daher nicht mehr verändert werden. Benutze bitte die aktuelle Diskussionsseite.
Um einen Abschnitt dieser Seite zu verlinken, klicke im Inhaltsverzeichnis auf den Abschnitt und kopiere dann Seitenname und Abschnittsüberschrift aus der URL-Zeile deines Browsers (Beispiel: |
RE II,1, 961–970
Als Test ocr von Arnd blitzschnell dankend erhalten. Die Seiten RE:Aristonikos 2–17, Aristonis, Aristonophos, Aristonus 4–5, Aristonymidas, Aristonymos 1–6, Aristopamon, Aristophanes 2–9 habe ich mit Vermerk „ocr ABBYY Finereader Online“ eingestellt (Übersicht). Scans: 300dpi jpegs vom Originaldruck (nicht Nachdruck). Ergebnis: Spaltenerkennung fehlerfrei; deutscher Text sehr gut bis fehlerfrei mit sehr wenig falschen Griechischem (mal δ statt 5); Griechisch nicht so schlecht wie erwartet, aber nur monotonisch, daher Buchstaben mit polytonischen Akzent falsch; Distinktionsfehler zwischen lat. und gr. Alphabet scheinen mir also nicht störend. Dazu Pfaerrich als Korrektor viellecht mehr. Frage an Arnd: wieviel Handarbeit steckt da drin oder kann das vollautomatisch erreicht werden? Nochmals viel Dank, --S8w4 (Diskussion) 04:08, 17. Mai 2015 (CEST)
- Eine vollautomatische Lösung ist nur per Abbyy Cloud OCR SDK möglich. Allerdings sind die Preise für die Erkennung wesentlich höher, weshalb ich nur ein Paket für Abbyy Finereader Online beantragt habe. Sollte eine hohe Nachfrage bestehen, können wir darüber nochmal nachdenken. Zur Zeit muss ich folgendes tun: (1) PDF in Seiten zerlegen (wenn man die Texte der Einzelseiten braucht), (2) die Einzelseiten in Hunderterparekten über die Abbyy Webseite hochladen und erkennen lassen. (3) Die Ergebnisse aus meinem Google Webspace downloaden. (4) Ergebnisse per Bot einspielen, wenn gewünscht. An (2) und (4) arbeite ich noch. --Arnd 09:13, 17. Mai 2015 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 06:27, 11. Aug. 2015 (CEST)
Fliegende Blätter
Hallo! Ich bin so frei und melde einen Wunsch an: Beim ersten Band der Fliegenden Blätter hätte ich gerne zunächst einmal die OCRs für die Hefte 2 bis 4. Das sind gemäß der Index-Seite: Index:Fliegende Blätter 1.djvu die Seiten 9 (bzw. ...djvu/13) bis 32 (bzw. ...djvu/36). Ausgenommen werden können die Seiten 30 (bzw. ...djvu/34) und 31 (bzw. ...djvu/35), da sie sowieso kaum Text enthalten. Wenn es ginge, dann die Seiten gleich anzulegen, wäre das ganz prima! Und wenn ich gut vorankomme und Gefallen daran finde, könnte es auch einen Folgeauftrag geben ... Zunächst einmal aber vielen Dank! Viele Grüße, --Unendlicheweiten (Diskussion) 21:01, 18. Mai 2015 (CEST)
- Unendlicheweiten, habe die OCRs erstellt und (diesmal noch händisch) eingestellt. Schau dir mal die Quali an. Für Folgeaufträge ist es generell sinnvoll, gleiche alle Seiten erkennen zu lassen, statt es nochmal in Unteraufträge zu zerlegen. Gruß, --Arnd 23:19, 18. Mai 2015 (CEST)
- Ganz herzlichen Dank, Arnd, das ging ja wirklich blitzschnell !!! Habe mir gleich mal ein paar Seiten angesehen - das hilft wirklich weiter! Zum Teil ist die Qualität richtig gut, an anderen Stellen nicht ganz so, was aber sicher mit der Qualität der Vorlage zu tun hat. Sicher ist es generell einfacher, gleich alles in einem Rutsch durchlaufen zu lassen - aber bevor ich Dein Seitenkontingent damit belaste, muss ich erst mal sehen, wie ich mit den ersten Seiten klar komme und ob es dann tatsächlich hier auch weiter geht! Nochmals herzlichen Dank! Viele Grüße, --Unendlicheweiten (Diskussion) 23:30, 18. Mai 2015 (CEST)
- Nachdem ich mir inzwischen einige Seiten genauer angesehen habe, nochmals ein Feedback: die OCRs sind eine große Hilfe! Da, wo die Scan-Qualität gut ist, sind auch die Ergebnisse gut. Wo die Vorlage Mängel aufweist, kommt es logischerweise im Ergebnistext auch zu Fehlern. Da der Text zuweilen durch Grafiken unterbrochen wird und es zwei Spalten gibt, sind manchmal Textteile verschoben - was aber kein Problem ist. Das bekommt man schon ganz gut wieder hin! Fazit: die OCRs sind klasse und helfen (mir jedenfalls!) enorm weiter! Viele Grüße, --Unendlicheweiten (Diskussion) 23:57, 27. Mai 2015 (CEST)
- Ganz herzlichen Dank, Arnd, das ging ja wirklich blitzschnell !!! Habe mir gleich mal ein paar Seiten angesehen - das hilft wirklich weiter! Zum Teil ist die Qualität richtig gut, an anderen Stellen nicht ganz so, was aber sicher mit der Qualität der Vorlage zu tun hat. Sicher ist es generell einfacher, gleich alles in einem Rutsch durchlaufen zu lassen - aber bevor ich Dein Seitenkontingent damit belaste, muss ich erst mal sehen, wie ich mit den ersten Seiten klar komme und ob es dann tatsächlich hier auch weiter geht! Nochmals herzlichen Dank! Viele Grüße, --Unendlicheweiten (Diskussion) 23:30, 18. Mai 2015 (CEST)
Hallo, Arnd, nachdem die ersten Erfahrungen mit den OCRs für mich sehr positiv ausgefallen sind und ich davon ausgehe, dass ich hier kontinuierlich weiterarbeiten werde, bitte ich Dich freundlich darum, auch noch die restlichen Seiten umzuwandeln und einzustellen. Die zwei bisher ausgelassenen Seiten kannst Du weiterhin weglassen und im weiteren Verlauf die beiden bereits fertigen natürlich auch. Ganz herzlichen Dank für die Mühe!! Es stellt für mich aber eine große Hilfe dar! Viele Grüße, --Unendlicheweiten (Diskussion) 19:47, 28. Mai 2015 (CEST)
- Unendlicheweiten, erledigt. Viel Spaß noch, --Arnd 16:11, 30. Mai 2015 (CEST)
- Großartig! Vielen, vielen Dank !!! --Unendlicheweiten (Diskussion) 16:19, 30. Mai 2015 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 06:27, 11. Aug. 2015 (CEST)
Hallo, bitte konvertiere alle noch fehlenden Seiten (siehe Index_Diskussion:P._Florian_Baucke,_ein_deutscher_Missionär_in_Paraguay_(1749_-_1768).pdf :-) ). Sorry, vielen Dank und viele Grüße,--BunteKartoffel (Diskussion) 19:01, 26. Mai 2015 (CEST)
- BunteKartoffel, erledigt. Übrigens wäre es nett, wenn du die unnützen Seiten an Anfang und Ende des PDFs vor dem Hochladen entfernen könntest. --Arnd 14:41, 30. Mai 2015 (CEST)
- Hi Arnd, super. Das sieht klasse aus. Vielen, vielen Dank für deine viele Mühe. Ich weiß leider nicht, wie ich die überflüssigen pdf-Seiten entfernen kann. Die haben mich auch gestört, aber ich habe leider keinen pdf-Writer. Viele Grüße--BunteKartoffel (Diskussion) 08:18, 31. Mai 2015 (CEST)
- Ich glaube es gibt diverse auch kostenlose Programme um PDFs zuzuschneiden, einfach mal im Internet suchen. Letztens habe ich auch eine Online-Variante gefunden: http://www.ilovepdf.com/. --Arnd 08:26, 31. Mai 2015 (CEST)
- Hi Arnd, danke für den link. Beim nächsten Projekt werde ich das pdf stutzen :-) . Ansonsten sind deine Konvertierung wieder einmal von beeindruckender Qualität. Unverständlich, warum tesseract bei den bräunlich eingefärbten Seiten nur leere Ergebnisse liefert. Vielen Dank nochmals, --BunteKartoffel (Diskussion) 11:31, 31. Mai 2015 (CEST)
- Ich glaube es gibt diverse auch kostenlose Programme um PDFs zuzuschneiden, einfach mal im Internet suchen. Letztens habe ich auch eine Online-Variante gefunden: http://www.ilovepdf.com/. --Arnd 08:26, 31. Mai 2015 (CEST)
- Hi Arnd, super. Das sieht klasse aus. Vielen, vielen Dank für deine viele Mühe. Ich weiß leider nicht, wie ich die überflüssigen pdf-Seiten entfernen kann. Die haben mich auch gestört, aber ich habe leider keinen pdf-Writer. Viele Grüße--BunteKartoffel (Diskussion) 08:18, 31. Mai 2015 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 06:27, 11. Aug. 2015 (CEST)
Urlaub
Hallo zusammen, ich mache ab dem Wochenende für 3 Wochen Urlaub, in dem ich keine größeren Sachen in WS machen werde. Wer also noch etwas für diese Zeit braucht, schreibe es bitte sobald wie möglich, damit ich es diese Woche noch bearbeiten kann. Gruß, --Arnd 13:53, 1. Jun. 2015 (CEST)
- Ich wünsche Dir einen schönen und erholsamen Urlaub! Er sei Dir von Herzen gegönnt! :-) --Unendlicheweiten (Diskussion) 22:49, 1. Jun. 2015 (CEST)
- Es kann weitergehen. --Arnd 13:37, 29. Jun. 2015 (CEST)
- Ich wünsche Dir einen schönen und erholsamen Urlaub! Er sei Dir von Herzen gegönnt! :-) --Unendlicheweiten (Diskussion) 22:49, 1. Jun. 2015 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 06:27, 11. Aug. 2015 (CEST)
File:Biographisches Lexikon des Kaiserthums Oesterreich Bd.03.pdf
Lieber Arnd,
ich helfe gerade Zabia ein bisschen bei der BLKÖ und ich würde gerne ausprobieren, ob nicht die Abbyy-OCR ihre Arbeit – hoffentlich – erheblich erleichtern könnte. Das Versuchsobjekt wäre das „Biographisches Lexikon des Kaiserthums Oesterreich Bd.03“ Commons, es handelt sich um 452 S. Was wäre für mich zu tun? Einen Index anlegen? Ich frage, weil ich nicht ganz überblicke, welche Schritte Du automatisieren konntest. Bis bald, viele Grüße von --Konrad Stein (Diskussion) 14:09, 20. Jun. 2015 (CEST)
- Hallo, für dich ist nichts weiter zu tun. Ich kann die OCRs aus dem PDF erstellen und die Seiten anlegen, wenn ich aus dem Urlaub zurück bin. Index usw. wäre die Aufgabe des Projektleiters. Gruß, --Arnd 16:42, 20. Jun. 2015 (CEST)
- Danke Euch beiden. Ich hab noch nie einen Index angelegt, ich fürcht, da brauch ich jedenfalls Hilfe. Gruß Zabia (Diskussion) 07:59, 21. Jun. 2015 (CEST)
- Ich hab auf Commons die Kategorie und die Urheberrechtsinfo angepasst. Zabia (Diskussion) 08:08, 21. Jun. 2015 (CEST)
- Ich hab noch mal drüber nachgedacht. Seiten anlegen ist doch nicht notwendig, oder? Der Wurzbach wird, von mir, ja artikelweise angelegt, nicht seitenweise. Ich brauch einfach nur die OCR, gern auch per Mail. Und die probier ich aus, und geb auch Feedback, wenns gewünscht wird. Schönen Urlaub Zabia (Diskussion) 11:46, 24. Jun. 2015 (CEST)
- Ich hab auf Commons die Kategorie und die Urheberrechtsinfo angepasst. Zabia (Diskussion) 08:08, 21. Jun. 2015 (CEST)
Lieber Arnd, hinter der Frage von Zabia steht die allgemeinere Frage, wie die OCR für PR-1-Projekte - die ja nicht auf Einzelseiten und Index basieren - bereitgestellt werden kann. Über den email-Versand an die Autoren hinaus wäre vielleicht noch ein Depositum bei Commons oder auch lokal hier bei WS denkbar. Viele Grüße von --Konrad Stein (Diskussion) 13:57, 24. Jun. 2015 (CEST)
- Hallo Zabia, die OCRs für die Seiten 1-99 findest du hier. Schau Sie dir bitte bei Gelegenheit an. Wenn die Qualität für dich ausreichend ist, kann ich gern die restlichen OCRs auch noch erstellen. Gruß, --Arnd 14:39, 27. Jun. 2015 (CEST)
Hallo, Arnd! Danke für die Mühe. Sehr berauschend ist das aber nicht. Kann man das noch sehr?) verbessern? Gruß, Zabia (Diskussion) 16:14, 27. Jun. 2015 (CEST)
- Sieht sehr danach aus, als käme Abbyy mit mehreren Schrifttypen gleichzeitig nicht gut zurecht. --Konrad Stein (Diskussion) 16:38, 27. Jun. 2015 (CEST)
- Jupp, liegt wohl an den Schrifttypen. Ich fürchte, dass ich da nichts machen kann. Allerdings finde ich die Ergebnisse nicht so schlecht. --Arnd 18:06, 27. Jun. 2015 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 06:27, 11. Aug. 2015 (CEST)
commons:File:Wilhelm Löhes Leben Band 1 (2. Auflage).pdf, 404 Seiten, commons:File:Wilhelm Löhes Leben Band 2.pdf, 580 Seiten, commons:File:Wilhelm Löhes Leben Band 3.pdf, 345 Seiten. Scans wurden von mir vorgenommen, 400dpi b/w, astreine Qualität. --Moros (Diskussion) 22:22, 28. Jul. 2015 (CEST)
- Hallo Moros, in welcher Form möchtest du die OCRs? Soll ich die Seiten direkt erstellen? --Arnd 07:30, 29. Jul. 2015 (CEST)
- Für Band 1: Index:Wilhelm Löhes Leben Band 1 (2. Auflage). Kann man das Ergebnis dort gleich korrigiert reinstellen? Dann könnte ich es mit meiner Korrektur fertig stellen. Band 2 und 3 folgt noch. --Moros (Diskussion) 21:13, 30. Jul. 2015 (CEST)
- Hallo Moros, Band 1 ist fertig. Viel Spaß damit. --Arnd 20:32, 31. Jul. 2015 (CEST)
- Vielen Dank für die Mühe. Für Band 2: Index:Wilhelm Löhes Leben Band 2, für Band 3: Index:Wilhelm Löhes Leben Band 3. --Moros (Diskussion) 20:55, 31. Jul. 2015 (CEST)
- Fertig. Ich denke jetzt hast du erstmal genug zu tun ;-) --Arnd 00:33, 1. Aug. 2015 (CEST)
- Sollte in rund hundert Arbeitsstunden komplett korrigiert und formatiert sein. Also, eigentlich ein Klacks. --Moros (Diskussion) 21:27, 2. Aug. 2015 (CEST)
- Stimmt. Übrigens gibt es gerade im Wikisource:Skriptorium#ArndBot etwas Knatsch wegen diesem Werk. --Arnd 21:35, 2. Aug. 2015 (CEST)
- Sollte in rund hundert Arbeitsstunden komplett korrigiert und formatiert sein. Also, eigentlich ein Klacks. --Moros (Diskussion) 21:27, 2. Aug. 2015 (CEST)
- Fertig. Ich denke jetzt hast du erstmal genug zu tun ;-) --Arnd 00:33, 1. Aug. 2015 (CEST)
- Vielen Dank für die Mühe. Für Band 2: Index:Wilhelm Löhes Leben Band 2, für Band 3: Index:Wilhelm Löhes Leben Band 3. --Moros (Diskussion) 20:55, 31. Jul. 2015 (CEST)
- Hallo Moros, Band 1 ist fertig. Viel Spaß damit. --Arnd 20:32, 31. Jul. 2015 (CEST)
- Für Band 1: Index:Wilhelm Löhes Leben Band 1 (2. Auflage). Kann man das Ergebnis dort gleich korrigiert reinstellen? Dann könnte ich es mit meiner Korrektur fertig stellen. Band 2 und 3 folgt noch. --Moros (Diskussion) 21:13, 30. Jul. 2015 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 06:27, 11. Aug. 2015 (CEST)
Die noch ausstehenden Seiten. --LuBib (Diskussion) 11:20, 29. Jul. 2015 (CEST)
- Hallo LuBib, gibt es Möglichkeit alle (fehlenden) Einzelseiten irgendwo herunterzuladen? Auch ein komplettes PDF wäre ok. Das würde die Erstellung der OCRs für mich erleichtern. --Arnd 20:29, 31. Jul. 2015 (CEST)
- Das müsste ein komplettes PDF der UB sein (s. Link auf der Indexseite). Grüße --LuBib (Diskussion) 21:37, 8. Aug. 2015 (CEST)
- @LuBib, erledigt. --Arnd 21:15, 10. Aug. 2015 (CEST)
- Herzlichen Dank. Ich hoffe, bald zu der Korrektur zu kommen :-) LuBib (Diskussion) 12:10, 11. Aug. 2015 (CEST)
- @LuBib, erledigt. --Arnd 21:15, 10. Aug. 2015 (CEST)
- Das müsste ein komplettes PDF der UB sein (s. Link auf der Indexseite). Grüße --LuBib (Diskussion) 21:37, 8. Aug. 2015 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 12:30, 11. Aug. 2015 (CEST)
RE:Iulius 132 = Kaiser Augustus
Hallo Arnd, ich bin dann mal so frei und bestelle OCR zu obigem Lemma, Band X,1 Spalte 275–381. Die Seite ist eingerichtet, sprich das Ergebnis kann dorthin abgelegt werden. Danke. --Pfaerrich (Diskussion) 21:56, 29. Jul. 2015 (CEST)
- Hallo Pfaerrich, etwas außerhalb der Ordnung aber weil es schnell geht habe ich eine Probeseite eingestellt. Bitte die Quali prüfen. Wenn es passt ergänze ich den Rest.
- also der erste Eindruck war enttäuschend. Abgetippt hätte ich weniger Zeit aufgewendet. Vor allem die Spalte 275 und 276 waren Kraut und Rüben, Spalte 276 erste Hälfte fehlte komplett. Ich habe es jetzt mit eigenen ABBYY-Bordmitteln nachgestellt, und siehe da, das Ergebnis war deutlich besser. Ich werde mal einige Folgeseiten in Eigenregie abarbeiten und komme ggf. wieder auf Dich zu. Danke trotzdem. Es hat mir gezeigt, dass vierspaltige Seiten und Griechisch Deiner ABBYY-Version nicht wirklich liegen. Gruß --Pfaerrich (Diskussion) 08:21, 1. Aug. 2015 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 06:27, 11. Aug. 2015 (CEST)
Verlagskatalog Breitkopf & Härtel
Bester Arnd,
könntest Du mir das Verzeichnis des Bücher-Verlages von Breitkopf& Härtel 1828-1898 Commons – 273 Seiten – einmal durch die Abbyy-Mühle drehen und mir die OCR irgendwo zum download bereitstellen? Ich benötige sie zur Erstellung der gleichnamigen Verlags-Themenseite. Vielen Dank und viele Grüße von --Konrad Stein (Diskussion) 14:15, 6. Aug. 2015 (CEST)
- Konrad Stein, brauchst du seperate OCRs für jeder Seite oder ein Text-File für alle Seiten? --Arnd 22:04, 6. Aug. 2015 (CEST)
Bester Arnd, ein Gesamt-Text-File wäre vollkommen ausreichend. Dank von Deinem --Konrad Stein (Diskussion) 22:06, 6. Aug. 2015 (CEST)
- Hallo Konrad Stein, hier ein ZIP mit zwei OCR-Versuchen, eines mit Fraktur und eines ohne. Ich hoffe es bringt dir was. Gruß, --Arnd 19:44, 7. Aug. 2015 (CEST)
- Bester Arnd, herzlichen Dank für die feine OCR. Du hast glücklicherweise erkannt, dass dieses Buch eine (heillose) Mischung von Fraktur und Antiqua enthält – daher kann (= muss) ich aus beiden Fassungen eine machen, was aber mit den beiden Fassungen gut machbar ist. Bis bald, viele Grüße --Konrad Stein (Diskussion) 06:21, 8. Aug. 2015 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 06:27, 11. Aug. 2015 (CEST)
Wie Gottes Wort in der gegenwärtigen Kriegszeit uns zur Treue mahnt
Digitalisat commons:File:Adolf von Stählin - Wie Gottes Wort in der gegenwärtigen Kriegszeit uns zur Treue mahnt.pdf (16 Seiten). Index:Wie Gottes Wort in der gegenwärtigen Kriegszeit uns zur Treue mahnt --Moros (Diskussion) 12:21, 5. Okt. 2015 (CEST)
- Moros, reicht dir die OCR in dieser Form? Der Aufwand der seitenweisen OCR-Erstellung sowie der Upload auf WS ist nämlich recht hoch, was gerade bei kleinen Projekten ins Gewicht fällt. Gruß, --Arnd 19:13, 7. Okt. 2015 (CEST)
- Ja, das krieg ich auch hin.--Moros (Diskussion) 11:31, 8. Okt. 2015 (CEST)
- Ok, habe das für die kleinen Projekte gemacht, siehe unten. Soll ich für Der Dienst des Pfarrers die Seiten direkt einstellen? --Arnd 12:29, 8. Okt. 2015 (CEST)
- Ja, wenn's geht, gerne. --Moros (Diskussion) 18:14, 8. Okt. 2015 (CEST)
- Ok, habe das für die kleinen Projekte gemacht, siehe unten. Soll ich für Der Dienst des Pfarrers die Seiten direkt einstellen? --Arnd 12:29, 8. Okt. 2015 (CEST)
- Ja, das krieg ich auch hin.--Moros (Diskussion) 11:31, 8. Okt. 2015 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 21:16, 8. Okt. 2015 (CEST)
Predigt gehalten zur Feier des Friedensfestes
Digitalisat commons:File:Adolf von Stählin - Predigt gehalten zur Feier des Friedensfestes.pdf (18 Seiten). Index:Predigt gehalten zur Feier des Friedensfestes --Moros (Diskussion) 12:23, 5. Okt. 2015 (CEST)
- Wikisource:OCR/Abbyy/2, --Arnd 12:28, 8. Okt. 2015 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 21:16, 8. Okt. 2015 (CEST)
Trost und Mahnung für die Kirche des Herrn
Digitalisat commons:File:Adolf von Stählin - Trost und Mahnung für die Kirche des Herrn.pdf (22 Seiten). Index:Trost und Mahnung für die Kirche des Herrn --Moros (Diskussion) 12:25, 5. Okt. 2015 (CEST)
- Wikisource:OCR/Abbyy/3, --Arnd 12:28, 8. Okt. 2015 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 21:16, 8. Okt. 2015 (CEST)
Rede zur Einweihung der Emmerans-Kirche
Digitalisat commons:File:Adolf von Stählin - Rede zur Einweihung der Emmerans-Kirche.pdf (17 Seiten). Index:Rede zur Einweihung der Emmerans-Kirche --Moros (Diskussion) 12:45, 5. Okt. 2015 (CEST)
- Wikisource:OCR/Abbyy/4, --Arnd 12:28, 8. Okt. 2015 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 21:16, 8. Okt. 2015 (CEST)
Predigt über Evang. Lucä 21, 33
Digitalisat commons:File:Adolf von Stählin - Predigt über Evang. Lucä 21,33.pdf (20 Seiten). Index:Predigt über Evang. Lucä 21, 33 --Moros (Diskussion) 12:47, 5. Okt. 2015 (CEST)
- Wikisource:OCR/Abbyy/5, --Arnd 12:28, 8. Okt. 2015 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 21:16, 8. Okt. 2015 (CEST)
Predigt über Röm. 12, 12
Digitalisat commons:File:Adolf von Stählin - Predigt über Röm. 12,12.pdf (16 Seiten). Index:Predigt über Röm. 12, 12 --Moros (Diskussion) 12:48, 5. Okt. 2015 (CEST)
- Wikisource:OCR/Abbyy/6, --Arnd 12:28, 8. Okt. 2015 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 21:16, 8. Okt. 2015 (CEST)
Der Dienst des Pfarrers
Digitalisat commons:File:Hermann von Bezzel - Der Dienst des Pfarrers.pdf (140 Seiten). Index:Der Dienst des Pfarrers --Moros (Diskussion) 11:47, 6. Okt. 2015 (CEST) Moros, fertig.
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 21:16, 8. Okt. 2015 (CEST)
Adolf von Stählin - Philipp Melanchthon
Digitalisat commons:File:Adolf von Stählin - Philipp Melanchthon.pdf (34 Seiten). Index:Adolf von Stählin - Philipp Melanchthon --Moros (Diskussion) 15:22, 7. Okt. 2015 (CEST)
- Wikisource:OCR/Abbyy/7, --Arnd 12:28, 8. Okt. 2015 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 21:16, 8. Okt. 2015 (CEST)
Friedrich Bauer - Christliche Ethik auf lutherischer Grundlage
Digitalisat commons:File:Friedrich Bauer - Christliche Ethik auf lutherischer Grundlage.pdf (387 Seiten). Index:Friedrich Bauer - Christliche Ethik auf lutherischer Grundlage --Moros (Diskussion) 16:33, 24. Okt. 2015 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 18:45, 24. Okt. 2015 (CEST)
Drei Erzählungen (Patkanjan)
Ich erbitte die OCR-isierung von commons:File:ArmenischeBibliothek01.pdf und, wenn das kein grosser Aufwand ist, Zerlegung und Befüllung der Seiten Seite:PatkanjanDreiErzählungen/1 bis Seite:PatkanjanDreiErzählungen/174. Oder muss dazu erst der Index erstellt werden? Das Projekt ist angemeldet, hat aber bisher weder Zu- noch Widerspruch erfahren. Mein "Guthabenkonto" dürfte aber noch gut gefüllt sein. --Maasikaru (Diskussion) 13:36, 30. Okt. 2015 (CET)
- Maasikaru, da es sich nicht um Fraktur handelt, würde ich zur OCRisierung nicht das "teure" Abbyy nehmen. Aber das ist meine Sache. Ich kann dir die Seiten einstellen. Index usw. müsstest du aber noch bei Gelegenheit machen. Ich kann gern mit korrigieren, wobei mir eine Erstkorrektur lieber wäre, da ich nicht so genau arbeite. Gruß, --Arnd 14:28, 30. Okt. 2015 (CET)
- Hallo Arnd. Besten Dank für diverse Angebote. Gerne überlasse ich Dir die Wahl der geeigneten Mittel. Der Scan ist nicht der allerbeste. Gerne auch die Erstkorrektur. Ich schau, am Wochenende die Grundlagen zu schaffen. freundliche Grüsse, --Maasikaru (Diskussion) 18:35, 30. Okt. 2015 (CET)
- Ich habe die Indexseite erstellt. Da die laut Anleitung gleich heissen muss wie die Commonsseite heisst sie Index:ArmenischeBibliothek01.pdf. --Maasikaru (Diskussion) 21:45, 30. Okt. 2015 (CET)
- Maasikaru, stimmt das wirklich, dass der Index wie das PDF heißen muss? Wenn ja, dann sollten wir das Commons-File besser benennen. Ok, mache auch die Zweitkorrektur - auch wenn ich wahrscheinlich das ein oder andere übersehen werde. --Arnd 10:11, 31. Okt. 2015 (CET)
- lese ich zumindest auf: Wikisource:Projektaufbau_mit_mehrseitigen_Dateien so: Im Suchfeld (oben rechts) gibt man nun den Namen des neuzuerstellenden Index in der gleichen Form wie die Commons-Datei heißt, Index:Titel.pdf ein (Aber Vorsicht: es entfällt „file:“). --Maasikaru (Diskussion) 10:15, 31. Okt. 2015 (CET)
- ok, dann sollten wir tatsächlich die Datei umbennen, oder? --Arnd 10:19, 31. Okt. 2015 (CET)
- Maasikaru, warten wir noch die letzte Umbenennung ab, dann kannst du die Index-Seite entsprechend verschieben. Ich habe die OCRs erstellt, habe allerdings heute und morgen nicht die Möglichkeit diese automatisiert hochzuladen. Wenn du schon anfangen willst: https://drive.google.com/folderview?id=0B1Y6YZi-7KKrX2tmNVEyWUZ1TlE&usp=sharing. Gruß, --Arnd 11:41, 31. Okt. 2015 (CET)
- Hallo Arnd. Ich habe Umbenennungmittlerweile vollzogen. Hochladen eilt gar nicht. Testblick geworfen. Sieht gut aus. Besten Dank soweit. --Maasikaru (Diskussion) 13:14, 31. Okt. 2015 (CET)
- Maasikaru, es ist vollbracht. --Arnd 18:23, 2. Nov. 2015 (CET)
- ok, dann sollten wir tatsächlich die Datei umbennen, oder? --Arnd 10:19, 31. Okt. 2015 (CET)
- lese ich zumindest auf: Wikisource:Projektaufbau_mit_mehrseitigen_Dateien so: Im Suchfeld (oben rechts) gibt man nun den Namen des neuzuerstellenden Index in der gleichen Form wie die Commons-Datei heißt, Index:Titel.pdf ein (Aber Vorsicht: es entfällt „file:“). --Maasikaru (Diskussion) 10:15, 31. Okt. 2015 (CET)
- Maasikaru, stimmt das wirklich, dass der Index wie das PDF heißen muss? Wenn ja, dann sollten wir das Commons-File besser benennen. Ok, mache auch die Zweitkorrektur - auch wenn ich wahrscheinlich das ein oder andere übersehen werde. --Arnd 10:11, 31. Okt. 2015 (CET)
- Ich habe die Indexseite erstellt. Da die laut Anleitung gleich heissen muss wie die Commonsseite heisst sie Index:ArmenischeBibliothek01.pdf. --Maasikaru (Diskussion) 21:45, 30. Okt. 2015 (CET)
- Hallo Arnd. Besten Dank für diverse Angebote. Gerne überlasse ich Dir die Wahl der geeigneten Mittel. Der Scan ist nicht der allerbeste. Gerne auch die Erstkorrektur. Ich schau, am Wochenende die Grundlagen zu schaffen. freundliche Grüsse, --Maasikaru (Diskussion) 18:35, 30. Okt. 2015 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 18:23, 2. Nov. 2015 (CET)
Hermann von Bezzel - Die zehn Gebote
Digitalisat commons:File:Hermann von Bezzel - Die zehn Gebote.pdf (296 Seiten). Index:Die zehn Gebote (Hermann von Bezzel) --Moros (Diskussion) 12:17, 3. Nov. 2015 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 15:59, 8. Nov. 2015 (CET)
Hermann von Bezzel - Der 1. Glaubensartikel
Digitalisat: commons:File:Hermann von Bezzel - Der 1. Glaubensartikel.pdf (120 Seiten). Index:Der 1. Glaubensartikel --Moros (Diskussion) 12:25, 30. Nov. 2015 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 12:38, 4. Dez. 2015 (CET)
Hermann von Bezzel - Der 2. Glaubensartikel
Digitalisat: commons:File:Hermann von Bezzel - Der 2. Glaubensartikel.pdf (175 Seiten). Index:Der 2. Glaubensartikel --Moros (Diskussion) 12:02, 4. Dez. 2015 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 17:38, 4. Dez. 2015 (CET)
Hermann von Bezzel - Der 3. Glaubensartikel
Digitalisat: commons:File:Hermann von Bezzel - Der 3. Glaubensartikel.pdf (125 Seiten). Index:Der 3. Glaubensartikel --Moros (Diskussion) 12:02, 4. Dez. 2015 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 17:37, 4. Dez. 2015 (CET)
Adolf von Stählin - Löhe, Thomasius, Harleß
Digitalisat: commons:File:Adolf von Stählin - Löhe, Thomasius, Harleß.pdf (151 Seiten). Index:Löhe, Thomasius, Harleß --Moros (Diskussion) 11:53, 16. Dez. 2015 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 21:56, 16. Dez. 2015 (CET)
Erler Robert Schumann's Leben
Bester Arnd, könntest Du „Erler Robert Schumann's Leben Band 2“ Commons einlesen lassen und mir die OCR schicken? Das wäre sehr hilfreich. Es handelt sich um 360 Seiten. Viele Grüße von --Konrad Stein (Diskussion) 23:09, 16. Dez. 2015 (CET)
- Hallo Konrad , reicht dir die OCR als einzelne Datei oder brauchst du separate Seiten? --Arnd 13:28, 17. Dez. 2015 (CET)
Eine einzige Datei wäre mir am liebsten. Dank und Gruß --Konrad Stein (Diskussion) 14:47, 17. Dez. 2015 (CET)
Sehr schön, Hab vielen Dank. Von Deinem --Konrad Stein (Diskussion) 17:22, 17. Dez. 2015 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: Konrad Stein (Diskussion) 17:22, 17. Dez. 2015 (CET)
Hermann von Bezzel - Die sieben Sendschreiben
Digitalisat: commons:File:Hermann von Bezzel - Die sieben Sendschreiben.pdf (150 Seiten). Index:Die sieben Sendschreiben --Moros (Diskussion) 12:50, 19. Dez. 2015 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 11:08, 21. Dez. 2015 (CET)
Der Beruf der evangelisch-lutherischen Kirche zum Amt der Diakonie
Digitalisat: commons:File:Hermann von Bezzel - Der Beruf der evangelisch-lutherischen Kirche zum Amt der Diakonie.pdf (132 Seiten). Index:Der Beruf der evangelisch-lutherischen Kirche zum Amt der Diakonie --Moros (Diskussion) 16:42, 23. Dez. 2015 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 00:41, 24. Dez. 2015 (CET)
Therese Stählin - Auf daß sie alle eins seien
Digitalisat: commons:File:Therese Stählin - Auf daß sie alle eins seien.pdf (290 Seiten). Index:Auf daß sie alle eins seien --Moros (Diskussion) 14:38, 28. Dez. 2015 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 23:02, 28. Dez. 2015 (CET)
Wie hier dargelegt wäre eine Abbyy-OCR für dieses Projekt sehr gut. Es sollten noch so 580 Seiten verbleiben zum einstellen. Gruß --THE IT (Diskussion) 09:33, 4. Jan. 2016 (CET)
- THE IT, guckst du bitte kurz über die OCRs (42-99) bzgl. die Quali. Wenn das so ok ist, dann stelle ich die verbleibenden auch ein. Gruß, --Arnd 10:44, 4. Jan. 2016 (CET)
- Sieht gut aus. Damit kann man arbeiten. Da sind Lücken ist das Absicht? --THE IT (Diskussion) 10:47, 4. Jan. 2016 (CET)
- Leider versagt die OCR bei diesen Seiten. "file was not processed: the recognized document contains errors". --Arnd 10:48, 4. Jan. 2016 (CET)
- Shit happens, danke für die schnelle Abarbeitung. --THE IT (Diskussion) 10:53, 4. Jan. 2016 (CET)
- THE IT, ich habe bemerkt, dass ABBYY kein Problem mit den JPGs der Örebro Uni hat (http://130.243.103.193/greenstone/collect/archives/HASH01fc.dir/my.html). Wenn mir jemand diese für die fehlenden zuarbeitet, dann kann ich sie noch durch die OCR "jagen". Gruß, --Arnd 12:47, 4. Jan. 2016 (CET)
- Shit happens, danke für die schnelle Abarbeitung. --THE IT (Diskussion) 10:53, 4. Jan. 2016 (CET)
- Leider versagt die OCR bei diesen Seiten. "file was not processed: the recognized document contains errors". --Arnd 10:48, 4. Jan. 2016 (CET)
- Sieht gut aus. Damit kann man arbeiten. Da sind Lücken ist das Absicht? --THE IT (Diskussion) 10:47, 4. Jan. 2016 (CET)
Also Arnd: Wie muß die Link oder Bilderliste aussehen und wo soll sie hin? Ich hab noch nicht so viel Ahnung, Sorry Gruß --Cosmogini (Diskussion) 14:15, 4. Jan. 2016 (CET)
- Hallo Cosmogini, ich hatte an ein ZIP-File gedacht mit den JPGs drin. Das könntest du mir dann per Dropbox o. sogar Mail schicken. --Arnd 16:20, 4. Jan. 2016 (CET)
Ok, wird erledigt. Ich hoffe, ich finde die Dropbox nachher. Gruß und frohes neues Jahr --Cosmogini (Diskussion) 16:24, 4. Jan. 2016 (CET)
Hi Arnd, ich habe Dropbox bei mir installiert. Unter https://www.dropbox.com/s/ppba5n5jw3vmfq1/Cajsa.zip?dl=0 findest Du die ZIP mit 56 Seiten. Ich hoffe die Namen sind OK. Güße --Cosmogini (Diskussion) 18:19, 4. Jan. 2016 (CET)
- Hallo Cosmogini, leider ist die Quali der JPGs nicht ausreichend. Ein bessere JPG bekommt man wenn man direkt auf die Seiten klickt wie z. B. http://130.243.103.193/greenstone/collect/archives/HASH01fc.dir/33300007.jpg. Bitte das noch einmal nacharbeiten. Ansonsten was das ZIP so völlig ausreichend. --Arnd 12:53, 6. Jan. 2016 (CET)
bist Du Dir sicher? die haben, 72x72 dpi; im ZIP 300x300 ?! --Cosmogini (Diskussion) 14:52, 6. Jan. 2016 (CET)
- Cosmogini, also ich guck immer nach den Pixeln. Die im ZIP haben ca. 650x950 das obige Bild 1300x1900, also vier Mal so viele. Außerdem sieht man beim reinzoomen, dass die ZIP-Bilder sehr "verwaschen sind". --Arnd 15:04, 6. Jan. 2016 (CET)
Ok, dann: Ich hoffe, https://www.dropbox.com/s/pqb4g9w9xr6gset/Cajsa2.zip?dl=0 hiermit geht es jetzt besser. --Cosmogini (Diskussion) 16:31, 6. Jan. 2016 (CET)
- Vielen Dank für die Zuarbeit, Cosmogini. Leider gab es bei diesem Fall OCR-Probleme, die bis dato noch nicht aufgetreten sind. Viel Spaß veim Korrekturlesenn. --Arnd 18:30, 6. Jan. 2016 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 18:30, 6. Jan. 2016 (CET)
Meine Seele erhebet den Herrn
Digitalisat: commons:File:Therese Stählin - Meine Seele erhebet den Herrn.pdf (240 Seiten). Index:Meine Seele erhebet den Herrn --Moros (Diskussion) 18:28, 4. Jan. 2016 (CET)
- Hallo Moros, ich bin mir nicht sicher, ob ich mich noch im Rahmen der Regeln von WS bewege, wenn ich Projekt um Projekt von dir mit OCRs versorge, diese aber mangels Zweitkorrekteuren nicht abgeschlossen werden können. Bitte dies erst einmal auf der Projektseite klären. Bis dahin pausiere ich die Bearbeitung. --Arnd 20:23, 5. Jan. 2016 (CET)
- Hallo, vielleicht würde es helfen, wenn Du noch einmal meine Projekte überprüfst, die angeblich alle nicht fertig gestellt worden seien. Du würdest zum Ergebnis kommen müssen, dass es sich hierbei lediglich um drei Projekte handelt, die noch keine Zweitkorrektur gefunden haben. Ansonsten bleibt es Dir natürlich freigestellt, für welche Projekte Du die OCR machen willst und für welche nicht. Wie dem auch sei, für die bisher geleistete Arbeit möchte ich mich bedanken.--Moros (Diskussion) 10:55, 6. Jan. 2016 (CET)
- Ich pflichte Moros völlig bei. Am Fertigstellungsstand seiner Projekte ist nicht auszusetzen. An den Gegenleistungen erst recht nicht. Alle Projekte wurden Ordnungsgemäß angekündigt. Damit sind alle Regeln, die wir uns hier gegeben haben, vorbildlich erfüllt. Aus meiner Sicht spricht nichts gegen eine Fortsetzung der OCR’s. Dann wird auch das Kontingent gut ausgeschöpft. --THE IT (Diskussion) 12:55, 6. Jan. 2016 (CET)
- Ok, wollte nur nicht wieder in eine "Shitstorm" geraten, wegen der "massenhaften" und möglicherweise unberechtigten Einstellung von Seiten. Werde mich wenn möglich heute abend daran machen. --Arnd 13:00, 6. Jan. 2016 (CET)
- Ich pflichte Moros völlig bei. Am Fertigstellungsstand seiner Projekte ist nicht auszusetzen. An den Gegenleistungen erst recht nicht. Alle Projekte wurden Ordnungsgemäß angekündigt. Damit sind alle Regeln, die wir uns hier gegeben haben, vorbildlich erfüllt. Aus meiner Sicht spricht nichts gegen eine Fortsetzung der OCR’s. Dann wird auch das Kontingent gut ausgeschöpft. --THE IT (Diskussion) 12:55, 6. Jan. 2016 (CET)
- Hallo, vielleicht würde es helfen, wenn Du noch einmal meine Projekte überprüfst, die angeblich alle nicht fertig gestellt worden seien. Du würdest zum Ergebnis kommen müssen, dass es sich hierbei lediglich um drei Projekte handelt, die noch keine Zweitkorrektur gefunden haben. Ansonsten bleibt es Dir natürlich freigestellt, für welche Projekte Du die OCR machen willst und für welche nicht. Wie dem auch sei, für die bisher geleistete Arbeit möchte ich mich bedanken.--Moros (Diskussion) 10:55, 6. Jan. 2016 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 19:09, 6. Jan. 2016 (CET)
Gesammelte Werke David Hilbert
Noch ca. 300 Seiten verbleibend.
MfG --THE IT (Diskussion) 22:33, 17. Jan. 2016 (CET)
- Hallo THE IT, sind die Ergebnisse wie z. B. David Hilbert Gesammelte Abhandlungen Bd 1.djvu/301 ok? Vor allem die Formeln bereiten Probleme. Gruß, --Arnd 07:21, 18. Jan. 2016 (CET)
- Die Ergebnisse sind leider nicht sehr viel besser als die Tesseract-Erkennung. Dann würde ich das hier canceln, sonst wäre es eine Verschwendung des Kontingents. --THE IT (Diskussion) 09:17, 18. Jan. 2016 (CET)
- Ok, ich glaube generell "lohnt" sich das nur bei Fraktur. --Arnd 10:02, 18. Jan. 2016 (CET)
- Die Ergebnisse sind leider nicht sehr viel besser als die Tesseract-Erkennung. Dann würde ich das hier canceln, sonst wäre es eine Verschwendung des Kontingents. --THE IT (Diskussion) 09:17, 18. Jan. 2016 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 10:02, 18. Jan. 2016 (CET)
Auf Wikisource:Verwaistenliste findet sich u.a. als PR1-Projekt auch dieser Gedichtband: Gedichte (Alxinger), der seit 2010 nicht mehr weiterbearbeitet wurde. 9 Gedichte sind hier fertig, die restlichen 34 Gedichte aber unkorrigiert. Wäre es Dir möglich, Arnd, zu den fehlenden Gedichten die OCRs zu machen und die Seiten anzulegen? Das wäre klasse, dann könnte ich nach und nach die Erstkorrekturen vornehmen. Viele Grüße, --Unendlicheweiten (Diskussion) 20:51, 2. Feb. 2016 (CET)
- Hallo Unendlicheweiten, (1) das mit dem Seiten anlegen geht wohl nicht so einfach, da der Text direkt im Artikel von einem Gedicht enthalten und nicht seitenweise hinterlegt ist. Trotzdem anbei die OCR, die ob der Quali der Scans nicht so berauschend ist; auch fehlen einige Seiten, da die OCR da komplette versagt hat. Schau mal, ob du damit etwas anfangen kannst.[1] Gruß, --Arnd 19:05, 3. Feb. 2016 (CET)
- Hallo Arnd, vielen Dank für Deine Mühe! Habe mir mal die ersten Seiten angesehen und das sieht tatsächlich nicht ganz so gut aus, wie sonst gewohnt! Hatte eigentlich nach erstem Augenschein nicht gedacht, dass die Scans so wenig hergeben. Naja, ich werde mal sehen, wie damit zu arbeiten ist. Sicher dennoch um einiges besser, als alles von Hand abzutippen! Dir jedenfalls ein ganz herzliches Dankeschön für Deine Mühe! Viele Grüße, --Unendlicheweiten (Diskussion) 21:41, 3. Feb. 2016 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 22:09, 3. Feb. 2016 (CET)
Schumanns Briefe Neue Folge
Bester Arnd, könntest Du mich mit schöner OCR versorgen von Nachstehendem? Ich benötige nur den Text, kein Anlegen von Seiten. Danke schon einmal.
Friedrich Gustav Jansen (Hg.): Robert Schumanns Briefe – Neue Folge, 2. vermehrte und verbesserte Ausgabe, 17+571 S. Breitkopf & Härtel, Leipzig 1904
Bei Commons
Viele Grüße von Deinem --Konrad Stein (Diskussion) 12:13, 4. Feb. 2016 (CET)
- Konrad Stein, wie gehabt als eine Datei und nicht die einzelnen Seiten? --Arnd 12:42, 4. Feb. 2016 (CET)
Ja, wie gehabt eine Datei. --Konrad Stein (Diskussion) 13:22, 4. Feb. 2016 (CET)
- Hallo Konrad Stein, hier findest du die OCR. --Arnd 17:20, 4. Feb. 2016 (CET)
Phantastico, ich Danke Dir. So schnell… Und sehr gute Qualität. Viele Grüße --Konrad Stein (Diskussion) 17:50, 4. Feb. 2016 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: Konrad Stein (Diskussion) 17:50, 4. Feb. 2016 (CET)
Einsegnungs-Unterricht 1909
Digitalisat: commons:File:Hermann von Bezzel - Einsegnungs-Unterricht 1909.pdf (132 Seiten). Index:Einsegnungs-Unterricht 1909 --Moros (Diskussion) 11:48, 6. Mär. 2016 (CET)
- Moros, erldigt. --Arnd 21:16, 7. Mär. 2016 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 21:10, 7. Mär. 2016 (CET)
Hermann von Bezzel - Einsegnungsunterricht 1892
Digitalisat: commons:File:Hermann von Bezzel - Einsegnungsunterricht 1892.pdf (94 Seiten). Index:Einsegnungsunterricht 1892 --Moros (Diskussion) 16:33, 12. Mär. 2016 (CET)
- Moros, erldigt. --Arnd 17:05, 13. Mär. 2016 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 17:05, 13. Mär. 2016 (CET)
Adolf von Stählin - Justin der Märtyrer
Digitalisat: commons:File:Adolf von Stählin - Justin der Märtyrer.pdf (71 Seiten). Index:Justin der Märtyrer --Moros (Diskussion) 16:01, 18. Mär. 2016 (CET)
- Moros, erldigt. --Arnd 17:36, 21. Mär. 2016 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 17:36, 21. Mär. 2016 (CET)
Adolf von Stählin - Das landesherrliche Kirchenregiment
Digitalisat: commons:File:Adolf von Stählin - Das landesherrliche Kirchenregiment.pdf (80 Seiten). Index:Das landesherrliche Kirchenregiment --Moros (Diskussion) 16:38, 26. Mär. 2016 (CET)
- Hallo Moros, die OCR ist fertig. Wo ist der Index? --Arnd 18:07, 29. Mär. 2016 (CEST)
- Benutzer:Konrad Stein hat mich darauf aufmerksam gemacht, dass zwischen Projektvorstellung und Projektbeginn mindestens zehn Tage liegen müssen. Wenn diese Frist abgelaufen ist und kein erheblicher Protest gegen mein Projekt laut geworden ist, werde ich die Indexseite wieder anlegen.--Moros (Diskussion) 16:49, 30. Mär. 2016 (CEST)
- Die Zehntagesfrist ist abgelaufen, Protest ist nicht laut geworden. Deswegen hier der Index:Das landesherrliche Kirchenregiment.--Moros (Diskussion) 16:56, 5. Apr. 2016 (CEST)
- Hallo Moros, erledigt. --Arnd 18:15, 5. Apr. 2016 (CEST)
- Benutzer:Konrad Stein hat mich darauf aufmerksam gemacht, dass zwischen Projektvorstellung und Projektbeginn mindestens zehn Tage liegen müssen. Wenn diese Frist abgelaufen ist und kein erheblicher Protest gegen mein Projekt laut geworden ist, werde ich die Indexseite wieder anlegen.--Moros (Diskussion) 16:49, 30. Mär. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 18:15, 5. Apr. 2016 (CEST)
Gesammelte Werke David Hilbert
Noch ca. 300 Seiten verbleibend.
Da das Kontingent ja demnächst abläuft würde ich jetzt doch noch die 300 Seiten nutzen. Die Tesseract-Erkennung bei Wikimedia scheint down zu sein.
Gruß --THE IT (Diskussion) 16:03, 8. Apr. 2016 (CEST)
- THE IT, werde wohl noch einmal verlängern mit einer geringeren Menge, sodass das alte Kontingent auch erhalten bleibt. Also müssen wir nicht unbedingt jetzt handeln. --Arnd 18:41, 11. Apr. 2016 (CEST)
- Ich würde das trotzdem gerne tun. Die Tesseract-Erkennung von Wikimedia lässt mich leider mit steigender Häufigkeit im Stich. --THE IT (Diskussion) 21:46, 11. Apr. 2016 (CEST)
- Hallo THE IT, fertig... leider mit etwas Verzögerung. Gruß, --Arnd 16:26, 16. Apr. 2016 (CEST)
- Ich würde das trotzdem gerne tun. Die Tesseract-Erkennung von Wikimedia lässt mich leider mit steigender Häufigkeit im Stich. --THE IT (Diskussion) 21:46, 11. Apr. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 16:26, 16. Apr. 2016 (CEST)
Werke von Philon in deutscher Übersetzung
Auf commons liegen nun:
- commons:File:PhiloCongrGermanLewy.djvu 49 S. [2]
- commons:File:PhiloEbrGermanAdler.djvu 76 S. []
- commons:File:PhiloFugGermanAdler.djvu 54 S. [3]
- commons:File:PhiloSobrGermanAdler.djvu 23 S. [4]
- commons:File:PhiloSomn1GermanAdler.djvu 62 S. [5]
- commons:File:PhiloSomn2GermanAdler.djvu 54 S. [6]
Am liebsten hätte ich das Ganze gerne als sechs odt-Dateien. Die Einstellung der Werke würde im Sommer - je nach Hilfszusagen - beginnen. --Batchheizer (Diskussion) 19:55, 2. Mai 2016 (CEST)
- Hi Batchheizer, bitte checke mal die Quali.[7] Die erste Seite hat es zerhauen, glaube ich. Bei Freigabe würde ich die restlichen erstellen. Gruß, --Arnd 20:57, 2. Mai 2016 (CEST)
- Auch wenn das Dokument in seinen Formatierungen bei mir nur ganz verhunzt ankommt (als 102 Seiten), ist das Ergebnis der Texterkennung gut bis sehr gut. Also: weiter so bzw. Freigabe! Notfalls auch als UTF-8 kodiertes Textdokument. Danke. --Batchheizer (Diskussion) 11:32, 3. Mai 2016 (CEST)
- Hi Batchheizer, es kommt darauf an, wie du das Ergebnis weiterverarbeiten willst. Ich kann auch einfach nur den reinen Text extrahieren. Bei odt und ähnlichen Formaten versucht er auch das Layout zu erkennen, was dann wie in dem Fall manchmal zu sehr unschönen Dokumenten führt. Leider kann ich mit der Online-Variante von Abbyy nur einmal angeben, welches Format ich möchte. Was ist dir lieber: odt oder einfach nur Text? Gruß, --Arnd 12:21, 3. Mai 2016 (CEST)
- Bitte kein Layout. Dann lieber nur Text in UTF-8 (dann haben wir auch griechische Buchstaben richtig drin). Danke, --Batchheizer (Diskussion) 14:43, 3. Mai 2016 (CEST)
- Hi Batchheizer, habe die Ergebnisse oben verlinkt. Leider hat eine Datei gestreikt. --Arnd 21:45, 3. Mai 2016 (CEST)
- Bitte kein Layout. Dann lieber nur Text in UTF-8 (dann haben wir auch griechische Buchstaben richtig drin). Danke, --Batchheizer (Diskussion) 14:43, 3. Mai 2016 (CEST)
- Hi Batchheizer, es kommt darauf an, wie du das Ergebnis weiterverarbeiten willst. Ich kann auch einfach nur den reinen Text extrahieren. Bei odt und ähnlichen Formaten versucht er auch das Layout zu erkennen, was dann wie in dem Fall manchmal zu sehr unschönen Dokumenten führt. Leider kann ich mit der Online-Variante von Abbyy nur einmal angeben, welches Format ich möchte. Was ist dir lieber: odt oder einfach nur Text? Gruß, --Arnd 12:21, 3. Mai 2016 (CEST)
- Auch wenn das Dokument in seinen Formatierungen bei mir nur ganz verhunzt ankommt (als 102 Seiten), ist das Ergebnis der Texterkennung gut bis sehr gut. Also: weiter so bzw. Freigabe! Notfalls auch als UTF-8 kodiertes Textdokument. Danke. --Batchheizer (Diskussion) 11:32, 3. Mai 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Arnd 21:45, 3. Mai 2016 (CEST)
Heinrich Brandt - Darlegung der Glaubenslehre der evangelisch-lutherischen Kirche
Digitalisat: commons:File:Heinrich Brandt - Darlegung der Glaubenslehre der evangelisch-lutherischen Kirche.pdf (511 Seiten). Index:Heinrich Brandt - Darlegung der Glaubenslehre der evangelisch-lutherischen Kirche.pdf --Moros (Diskussion) 11:17, 30. Apr. 2016 (CEST)
- Moros, erledigt. --Arnd 06:32, 9. Aug. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 06:32, 9. Aug. 2016 (CEST)
Zur Vervollständigung wäre OCR der folgenden Seiten hilfreich:
- Seite:Zürcher Diskußjonen (16–17) 015.jpg
- Seite:Zürcher Diskußjonen (16–17) 016.jpg
Starshollow (Diskussion) 07:16, 17. Mai 2016 (CEST)
- Starshollow, erledigt. --Arnd 06:32, 9. Aug. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 06:32, 9. Aug. 2016 (CEST)
Digitalisat: commons:File:Wilhelm Löhe - Beichtunterricht (4. Auflage).pdf (92 Seiten). Index:Einfältiger Beichtunterricht für Christen evangelisch-lutherischen Bekenntnisses (4. Auflage) --Moros (Diskussion) 12:13, 3. Jul. 2016 (CEST)
- Moros, erledigt. --Arnd 06:32, 9. Aug. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 06:32, 9. Aug. 2016 (CEST)
Digitalisat: commons:File:Friedrich Meyer - Die Kirche und die moderne Zeit.pdf (26 Seiten). Index:Die Kirche und die moderne Zeit --Moros (Diskussion) 12:13, 3. Jul. 2016 (CEST)
- Moros, erledigt. --Arnd 06:32, 9. Aug. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 06:32, 9. Aug. 2016 (CEST)
Digitalisat: commons:File:Wilhelm Löhe - Ein Conferenzvortrag in Betreff der Rosenmonate heiliger Frauen.pdf (40 Seiten). Index:Ein Conferenzvortrag in Betreff der Rosenmonate heiliger Frauen --Moros (Diskussion) 12:13, 3. Jul. 2016 (CEST)
- Moros, erledigt. --Arnd 06:32, 9. Aug. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 06:32, 9. Aug. 2016 (CEST)
Digitalisat: commons:File:Wilhelm Löhe - Was ist es mit den Geistererscheinungen.pdf (34 Seiten). Index:Was ist es mit den Geistererscheinungen --Moros (Diskussion) 15:48, 13. Jul. 2016 (CEST)
- OCR des gesamten Textes: https://drive.google.com/file/d/0B1Y6YZi-7KKrZGV0SGtYS0hCVmc/view?usp=drivesdk --Arnd 12:48, 15. Jul. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 06:32, 9. Aug. 2016 (CEST)
Digitalisat: commons:File:Wilhelm Löhe - Bedenken über weibliche Diakonie.pdf (8 Seiten). Index:Bedenken über weibliche Diakonie --Moros (Diskussion) 15:48, 13. Jul. 2016 (CEST)
Die Bearbeitung hier kann ich übernehmen; OCR nicht nötig Gruß--Cosmogini (Diskussion) 20:26, 14. Jul. 2016 (CEST)
Ist korrigiert eingestellt --Cosmogini (Diskussion) 22:22, 14. Jul. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 06:32, 9. Aug. 2016 (CEST)
Digitalisat: commons:File:Wilhelm Löhe - Zum Gedächtnis meines Pathenkindes Lorenz Wilh. Friedr. August Kündinger.pdf (24 Seiten). Index:Zum Gedächtnis meines Pathenkindes Lorenz Wilh. Friedr. August Kündinger --Moros (Diskussion) 15:48, 13. Jul. 2016 (CEST)
- Hallo Moros, der Aufwand des automatischen Einstellens der Seiten ist nicht unerheblich. Deswegen würde ich dies gern für Werke mit weniger als 50 Seiten vermeiden. Wäre es für dich in Ordnung, wenn du ein TXT-File bekommst mit der OCR für das gesamte Werk? Alternativ wäre es auch möglich, ein ZIP-File zu liefern, das die OCRs der einzelnen Seiten enthält. Was meinst du dazu? Gruß, --Arnd 17:58, 14. Jul. 2016 (CEST)
- Die Situation haben wir, glaube ich, schon einmal gehabt. Meines Wissens hast Du mir damals einen TXT-File angeboten. Ich kann natürlich das Einstellen übernehmen. Gruß,--Moros (Diskussion) 19:18, 14. Jul. 2016 (CEST)
- Moros, kann sein. Ein TXT-File oder eines pro Seite. Was ist für dich einfacher? --Arnd 20:03, 14. Jul. 2016 (CEST)
- Das war ein TXT-File für alles. Ich habe dann dort die einzelnen Seiten rausgepickt.--Moros (Diskussion) 11:03, 15. Jul. 2016 (CEST)
- Moros, kann sein. Ein TXT-File oder eines pro Seite. Was ist für dich einfacher? --Arnd 20:03, 14. Jul. 2016 (CEST)
- Die Situation haben wir, glaube ich, schon einmal gehabt. Meines Wissens hast Du mir damals einen TXT-File angeboten. Ich kann natürlich das Einstellen übernehmen. Gruß,--Moros (Diskussion) 19:18, 14. Jul. 2016 (CEST)
- OCR des gesamten Textes: https://drive.google.com/file/d/0B1Y6YZi-7KKrczB4WXUzVHJ2eUk/view?usp=drivesdk --Arnd 12:48, 15. Jul. 2016 (CEST)
- Mir fehlt das Zugriffsrecht.--Moros (Diskussion) 11:30, 16. Jul. 2016 (CEST)
- Sorry, sollte jetzt funktionieren. Ist der andere Link auch ok? --Arnd 11:50, 16. Jul. 2016 (CEST)
- Mir fehlt das Zugriffsrecht.--Moros (Diskussion) 11:30, 16. Jul. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 06:32, 9. Aug. 2016 (CEST)
Digitalisat: commons:File:Therese Stählin - So wir im Lichte wandeln.pdf (43 Seiten). Index:So wir im Lichte wandeln --Moros (Diskussion) 18:01, 4. Aug. 2016 (CEST)
- Hi Moros, hier der Link https://docs.google.com/document/d/12q6m9aBkG9fb9Qp7SEvd5kGAf5hb0XsVK8ii0kqTavc/edit?usp=sharing --Arnd 19:05, 4. Aug. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 06:32, 9. Aug. 2016 (CEST)
Digitalisat: commons:File:Ferdinand Wilhelm Weber - Wie kann der christliche Volksschullehrer an der Schuljugend Seelsorge üben.pdf (20 Seiten). Index:Wie kann der christliche Volksschullehrer an der Schuljugend Seelsorge üben --Moros (Diskussion) 18:01, 4. Aug. 2016 (CEST)
- Hi Moros, hier der Link https://docs.google.com/document/d/1L2NXz34z2ZRWnl5P94LUBb0BCltUiHPbBv5qHycTDPI/edit?usp=sharing --Arnd 19:03, 4. Aug. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 06:32, 9. Aug. 2016 (CEST)
Digitalisat: commons:File:Wilhelm Löhe - Sieben Predigten in Nürnberg zu St. Aegydien (2. Auflage).pdf (100 Seiten). Index:Sieben Predigten in Nürnberg zu St. Aegydien (2. Auflage) --Moros (Diskussion) 18:01, 4. Aug. 2016 (CEST)
- Warte noch auf die Lösung dieses Problems, um die OCRs direkt einstellen zu können. --Arnd 19:38, 4. Aug. 2016 (CEST)
- Moros, erledigt. --Arnd 06:32, 9. Aug. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 06:32, 9. Aug. 2016 (CEST)
Ich hätte gern die OCR vom Schriftstellerlexicon, gern auf eine Benutzer-Unterseite bei mir, oder als txt per Mail oder wo immer du willst. Anlegen der Seiten ist nicht nötig und danke im Voraus. – Paulis 19:52, 8. Aug. 2016 (CEST) P.S. Zum Archivieren der Beiträge braucht der Bot einen Zeitstempel, nur „Erledigt Arnd“ reicht da nicht.
- Vermutlich sind die Seiten schon verbraucht, oder es gibt eine sehr lange Warteschlange. Betrachte meine Anfrage bitte als erledigt. – Paulis 15:21, 11. Aug. 2016 (CEST)
- Tut mir leid Paulis, habe deinen Autrag tatsächlich vergessen. Du musst sagen, ob ich die OCR noch nachreichen kann; innerhalb weniger Stunden. --Arnd 15:41, 11. Aug. 2016 (CEST)
- Es geht mir nicht um sekundenschnelle, mehr um überhaupt eine Reaktion. Bis Samstag wäre nett. Kannst du eigentlich auch IA-Digitalisate bearbeiten lassen? – Paulis 06:15, 12. Aug. 2016 (CEST)
- Tut mir leid Paulis, habe deinen Autrag tatsächlich vergessen. Du musst sagen, ob ich die OCR noch nachreichen kann; innerhalb weniger Stunden. --Arnd 15:41, 11. Aug. 2016 (CEST)
- Hallo Paulis, da das Werk ziemlich viele Seiten hat, habe ich dir unter Benutzer:Paulis/Sächsisches Schriftsteller-Lexicon 344 345 eine OCR-Probe der PDF-Seite 344 und 345 abgelegt. Wie man sieht hat er mit den Latein so sein Probleme. Wenn die Quali trotzdem für dich akzeptabel ist, dann gibt mir Bescheid und ich "jage" das komplette Werk durch.
- Bzgl. IA, was meinst du mit "bearbeiten lassen"? Im Prinzip kann ich alle gängigen Bilddateiformat OCRen. Gruß, --Arnd 07:03, 12. Aug. 2016 (CEST)
- Sieht doch gut aus, damit kann ich doch was anfangen, jedenfalls Viel besser als die von HT. Bzgl. IA, ich meine, kann das Buch im IA sein, oder muss das auf commons sein? -- Paulis 09:31, 12. Aug. 2016 (CEST)
- Hallo Paulis, habe die komplette OCR auf der oben erwähnter Unterseite abgelegt. Was Seiten mit hauptsächlich Nicht-Fraktur betrifft, so kann ich diese bei Bedarf auch noch einmal gesondert durchlaufen lassen. Bücher in IA könnte ich mir runterladen. Allerdings sollten die OCR-Inhalte für Wikisource Verwendung finden, was sich mir in einem solchen Falle nicht ganz erschließt. Gruß, --Arnd 12:28, 12. Aug. 2016 (CEST)
- Erstmal vielen Dank für die OCR, Nichtfraktur schaffe ich alleine, so ist mir schon sehr geholfen.
Zum IA-Buch: Ich würde gern irgendwann mal die Geschichte der Stadt Bautzen hier haben wollen Internet Archive. Das Werk ist reichlich 900 Seiten stark und ist nicht besonders hochwertig gescannt. Letzteres ist nicht schlimm, da das Werk in meinem Regal steht und ich jederzeit Ersatz beschaffen kann. Ich bräuchte nur noch verlässliche Korrekturzusagen zur Fertigstellung in Ws. Und da ich daran aber nicht glaube, dass es für diese Kleinstadtchronik Interessenten gibt, wäre es durchaus schon eine Hilfe, wenn wenigstens die OCR, wenn auch unkorrigiert, irgendwo auf einer Unterseite bei uns zu finden wäre. Gibt sicher spannenderes oder wichtigeres, und wenn nicht - dann eben nicht ;-) – Paulis 17:41, 12. Aug. 2016 (CEST)- Da die Chronik ziemlich viele Seiten hat, würde ich ungern allein entscheiden, ob wir das Kontingent in einem solchen Fall auch verwenden können. Vielleicht kann man zur gegeben Zeit das mal im Skriptorium ansprechen. Gruß, --Arnd 13:13, 14. Aug. 2016 (CEST)
- Erstmal vielen Dank für die OCR, Nichtfraktur schaffe ich alleine, so ist mir schon sehr geholfen.
- Hallo Paulis, habe die komplette OCR auf der oben erwähnter Unterseite abgelegt. Was Seiten mit hauptsächlich Nicht-Fraktur betrifft, so kann ich diese bei Bedarf auch noch einmal gesondert durchlaufen lassen. Bücher in IA könnte ich mir runterladen. Allerdings sollten die OCR-Inhalte für Wikisource Verwendung finden, was sich mir in einem solchen Falle nicht ganz erschließt. Gruß, --Arnd 12:28, 12. Aug. 2016 (CEST)
- Sieht doch gut aus, damit kann ich doch was anfangen, jedenfalls Viel besser als die von HT. Bzgl. IA, ich meine, kann das Buch im IA sein, oder muss das auf commons sein? -- Paulis 09:31, 12. Aug. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 13:13, 14. Aug. 2016 (CEST)
Digitalisat: commons:File:Wilhelm Löhe - Zuruf aus der Heimat an die deutsch-lutherische Kirche Nordamericas.pdf (68 Seiten). Index:Zuruf aus der Heimat an die deutsch-lutherische Kirche Nordamericas --Moros (Diskussion) 11:44, 16. Aug. 2016 (CEST)
- Moros, wollte die Seiten eigentlich einspielen, aber irgendwie hat das mit den Seitenummerierung nicht so hingehauen. Deswegen hier die OCRs der Einzelseiten: https://drive.google.com/folderview?id=0B1Y6YZi-7KKrRXczaVp4N3JFZGM&usp=sharing --Arnd 20:52, 17. Aug. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 20:52, 17. Aug. 2016 (CEST)
Digitalisat: commons:File:Fünf Festreden der Gesellschaft für innere Mission.pdf (65 Seiten). Index:Fünf Festreden der Gesellschaft für innere Mission --Moros (Diskussion) 11:44, 16. Aug. 2016 (CEST)
- Moros, erledigt. --Arnd 21:09, 17. Aug. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 21:09, 17. Aug. 2016 (CEST)
Digitalisat: Commons (142 Seiten). Index:David und Salomo --Moros (Diskussion) 11:50, 3. Sep. 2016 (CEST)
- Moros, erledigt. --Arnd 18:24, 4. Sep. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 18:24, 4. Sep. 2016 (CEST)
Paul Hambruch: Landeskunde von Schleswig-Holstein
Digitalisat: commons:File:Paul_Hambruch-Landeskunde_von_Schleswig-Holstein.pdf (192 Seiten). --Ratzer (Diskussion) 12:20, 12. Sep. 2016 (CEST)
- Hallo Ratzer, wofür soll die OCR genutzt werden? Ist das Projekt schon vorgestellt worden? Warum geht der Link nicht? --Arnd 12:29, 12. Sep. 2016 (CEST)
- Der Link ist gefixt (Editierfehler). Die anderen Fragen verstehe ich nicht ganz. Es ist doch besser, wenn ein Buch nach Namen und Begriffen durchsuchbar ist, auch für die WP-Arbeit natürlich. Das ist beim vorliegenden Buch noch nicht der Fall (eine OCR ist zwar drübergelaufen, hat aber nur die paar in lateinischer Schrift gedruckten Wörter erkannt).--Ratzer (Diskussion) 14:40, 12. Sep. 2016 (CEST)
- Ratzer, wo soll die OCR denn dann hin? Der Service wird natürlich nur angeboten für die direkte (als Projekt) oder indirekte Verwendung in Wikisource (z. B. Erfassung von Inhaltsverzeichnissen o. ä.) Gruß, --Arnd 20:10, 12. Sep. 2016 (CEST)
- Ich kenne hier wohl die Arbeitsabläufe nicht. Deshalb bin ich auch nicht sicher, ob ich Deine aktuelle Frage verstehe (wo soll die OCR denn dann hin?). In Fragen zur Wikipedia erhielt ich einen Link auf diese Seite (oder auf eine andere Wikisource-Seite, die hierher verlinkt). Daraus folgerte ich, dass man hier eine ORC-Behandlung (Abbyy) von Büchern in Fraktur beantragen kann, denen noch keine entsprechende OCR zuteil wurde und die daher nicht durchsucht werden können. Nun, das o.g. Buch (zu 99 % in Fraktur) hatte ich mal auf commons hochgeladen, und es ist auch bereits in einigen Artikeln zitiert und verlinkt. Dort liegt es als PDF-Datei, noch ohne geeignete OCR. Meine Vorstellung wäre, dass das PDF-Buch mit Abbyy einer OCR-Erkennung unterzogen wird, und durch eine neue PDF, die dann durchsuchbar ist, ersetzt wird. Beantwortet das Deine Frage, wohin die OCR soll? Sie soll ins PDF-Buch rein. Ich habe inzwischen auch auf Wikisoure von Korrekturlesen etc. gelesen, aber das wäre die Kür sozusagen (irgendwann mal in der Zukunft). Bis dahin werden einige Erkennungsfehler gern hingenommen, wenn das Buch wenigstens weitgehend durchsuchbar ist. Grüße,--Ratzer (Diskussion) 20:26, 12. Sep. 2016 (CEST)
- Ahh, jetzt verstehe ich Ratzer. Generell würde ich sagen, dass ich dies auch auf Grund der Kontingentgröße ohne weitere machen könnte. Ich müsste allerdings erst einmal prüfen, wie das technisch geht. Ich melde mich, wenn ich etwas dazu sagen kann. --Arnd 21:16, 12. Sep. 2016 (CEST)
- Guten Morgen Ratzer, ich habe mal testweise die Seiten 46 und 47 aus dem PDF extrahiert und folgende OCR erhalten: Benutzer:Aschroet/1. Ich habe auch herausgefunden, wie ich ein durchsuchbares PDF generieren kann. Ich gehe mal davon aus, dass das Gesamt-PDF dann auch klappt. Wenn also die Test-OCR für dich ok ist, würde ich das PDF mit neuer OCR erstellen und auch hochladen auf Commons.
- Da diese Art der Verwendung der OCR eigentlich nicht direkt mit Wikisource zusammenhängt, würde ich die Erstellung dieser OCR erstmal als Ausnahme sehen. Wenn häufigere Anfragen in diese Richtung kommen, müsste ich mal darüber nachdenken den Service etwas anders aufzuziehen. --Arnd 08:46, 13. Sep. 2016 (CEST)
- Danke, aber das Buch ist schon auf Wikisource eingetragen, unter seinem Autor. Vielleicht kann ich mal ein richtiges Wikisourc-Projekt daraus machen, wenn ich mich mit Wikisource mehr auskenne (ich kann auch mal etwas probelesen). Die von Dir extrahierten Seiten 46 und 47 sind schon deutlich besser als ein Versuch, das Buch mit der freien Software Tesseract zu erkennen (Ergebnis für das ganze Buch hier). Damit dürfte auch das gesamte Buch ziemlich gut durchsuchbar werden. Dank und Gruß,--Ratzer (Diskussion) 09:46, 13. Sep. 2016 (CEST)
- Ratzer, das von dir verlinkte Ergebnis von Tesseract ist aber mindestens genauso gut, wenn nicht sogar besser. --Arnd 09:56, 13. Sep. 2016 (CEST)
- Wirklich? Das war nicht mein Eindruck, aber für einen systematischen Vergleich müsste man die Ergebnisse Zeile für Zeile, Wort für Wort vergleichen... Aber wenn Du Dir sicher bist, kannst Du Dir die weitere Arbeit sparen, dann werde ich den entsprechenden WP-Kollegen alexrk bitten, sein OCR in das PDF-Buch einzubetten, mit dem Hinweis, dass es Abbyy auch nicht besser kann, wie Du feststellen musstest. Und danke für Deine bisherige Arbeit in dieser Angelegenheit. Grüße,--Ratzer (Diskussion) 10:09, 13. Sep. 2016 (CEST)
- Ratzer, ich habe noch zwei andere Seiten OCRt und die Ergebnisse mit einem Difftool verglichen. Die Ergebnisse von Tesseract sind zumindest für dieses Dokument besser. Das verwundert mich selber, bringt mich dazu Tesseract mal genauer unter die Lupe zu nehmen. Vielleicht ist dies tatsächlich auch hier verwendbar. Deswegen auch dir danke für den Hinweis. Gruß, --Arnd 10:38, 13. Sep. 2016 (CEST)
- Wirklich? Das war nicht mein Eindruck, aber für einen systematischen Vergleich müsste man die Ergebnisse Zeile für Zeile, Wort für Wort vergleichen... Aber wenn Du Dir sicher bist, kannst Du Dir die weitere Arbeit sparen, dann werde ich den entsprechenden WP-Kollegen alexrk bitten, sein OCR in das PDF-Buch einzubetten, mit dem Hinweis, dass es Abbyy auch nicht besser kann, wie Du feststellen musstest. Und danke für Deine bisherige Arbeit in dieser Angelegenheit. Grüße,--Ratzer (Diskussion) 10:09, 13. Sep. 2016 (CEST)
- Ratzer, das von dir verlinkte Ergebnis von Tesseract ist aber mindestens genauso gut, wenn nicht sogar besser. --Arnd 09:56, 13. Sep. 2016 (CEST)
- Danke, aber das Buch ist schon auf Wikisource eingetragen, unter seinem Autor. Vielleicht kann ich mal ein richtiges Wikisourc-Projekt daraus machen, wenn ich mich mit Wikisource mehr auskenne (ich kann auch mal etwas probelesen). Die von Dir extrahierten Seiten 46 und 47 sind schon deutlich besser als ein Versuch, das Buch mit der freien Software Tesseract zu erkennen (Ergebnis für das ganze Buch hier). Damit dürfte auch das gesamte Buch ziemlich gut durchsuchbar werden. Dank und Gruß,--Ratzer (Diskussion) 09:46, 13. Sep. 2016 (CEST)
- Ahh, jetzt verstehe ich Ratzer. Generell würde ich sagen, dass ich dies auch auf Grund der Kontingentgröße ohne weitere machen könnte. Ich müsste allerdings erst einmal prüfen, wie das technisch geht. Ich melde mich, wenn ich etwas dazu sagen kann. --Arnd 21:16, 12. Sep. 2016 (CEST)
- Ich kenne hier wohl die Arbeitsabläufe nicht. Deshalb bin ich auch nicht sicher, ob ich Deine aktuelle Frage verstehe (wo soll die OCR denn dann hin?). In Fragen zur Wikipedia erhielt ich einen Link auf diese Seite (oder auf eine andere Wikisource-Seite, die hierher verlinkt). Daraus folgerte ich, dass man hier eine ORC-Behandlung (Abbyy) von Büchern in Fraktur beantragen kann, denen noch keine entsprechende OCR zuteil wurde und die daher nicht durchsucht werden können. Nun, das o.g. Buch (zu 99 % in Fraktur) hatte ich mal auf commons hochgeladen, und es ist auch bereits in einigen Artikeln zitiert und verlinkt. Dort liegt es als PDF-Datei, noch ohne geeignete OCR. Meine Vorstellung wäre, dass das PDF-Buch mit Abbyy einer OCR-Erkennung unterzogen wird, und durch eine neue PDF, die dann durchsuchbar ist, ersetzt wird. Beantwortet das Deine Frage, wohin die OCR soll? Sie soll ins PDF-Buch rein. Ich habe inzwischen auch auf Wikisoure von Korrekturlesen etc. gelesen, aber das wäre die Kür sozusagen (irgendwann mal in der Zukunft). Bis dahin werden einige Erkennungsfehler gern hingenommen, wenn das Buch wenigstens weitgehend durchsuchbar ist. Grüße,--Ratzer (Diskussion) 20:26, 12. Sep. 2016 (CEST)
- Ratzer, wo soll die OCR denn dann hin? Der Service wird natürlich nur angeboten für die direkte (als Projekt) oder indirekte Verwendung in Wikisource (z. B. Erfassung von Inhaltsverzeichnissen o. ä.) Gruß, --Arnd 20:10, 12. Sep. 2016 (CEST)
- Der Link ist gefixt (Editierfehler). Die anderen Fragen verstehe ich nicht ganz. Es ist doch besser, wenn ein Buch nach Namen und Begriffen durchsuchbar ist, auch für die WP-Arbeit natürlich. Das ist beim vorliegenden Buch noch nicht der Fall (eine OCR ist zwar drübergelaufen, hat aber nur die paar in lateinischer Schrift gedruckten Wörter erkannt).--Ratzer (Diskussion) 14:40, 12. Sep. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 11:06, 13. Sep. 2016 (CEST)
Digitalisat: Commons (404 Seiten). Index:Rosen-Monate heiliger Frauen --Moros (Diskussion) 16:41, 16. Sep. 2016 (CEST)
- Moros, erledigt. --Arnd 20:42, 18. Sep. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 20:42, 18. Sep. 2016 (CEST)
Digitalisat: Commons (12 Seiten). Index:Festpredigt und Rede gehalten bei der Einweihung des Maria-Martha-Stifts mit Altersheim --Moros (Diskussion) 10:19, 1. Okt. 2016 (CEST)
- https://drive.google.com/file/d/0B1Y6YZi-7KKrX04ybl9LSmQtb1U/view?usp=drivesdk --Arnd 11:30, 1. Okt. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 18:24, 2. Okt. 2016 (CEST)
Digitalisat: Commons (8 Seiten). Index:Rede bei der Beerdigung des Herrn Dr. Hermann Bechmann --Moros (Diskussion) 10:19, 1. Okt. 2016 (CEST)
- https://drive.google.com/file/d/0B1Y6YZi-7KKrVTl6T0xuRFFmNzg/view?usp=drivesdk --Arnd 11:33, 1. Okt. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 18:24, 2. Okt. 2016 (CEST)
Digitalisat: Commons (44 Seiten). Index:Der Kampf mit den Kleinheiten (2. Auflage) --Moros (Diskussion) 11:01, 4. Okt. 2016 (CEST)
- https://drive.google.com/file/d/0B1Y6YZi-7KKrWjBRa1BxTW5IZkk/view?usp=drivesdk --Arnd 18:36, 4. Okt. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 18:37, 4. Okt. 2016 (CEST)
Digitalisat: Commons (16 Seiten). Index:Passionsgedanken --Moros (Diskussion) 11:01, 4. Okt. 2016 (CEST)
- https://drive.google.com/file/d/0B1Y6YZi-7KKrMi0xaGt1TF9pRDg/view?usp=drivesdk --Arnd 18:29, 4. Okt. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 18:37, 4. Okt. 2016 (CEST)
Ich mache mal wieder einen Anlauf, weil der Brocken hammerhart ist. Erbitte OCR für Band S III Seiten 915 bis 1121. An dem Stück werde ich wohl noch bis ins neue Jahr zu knorzen haben. dks. --Pfaerrich (Diskussion) 20:56, 25. Sep. 2016 (CEST)
- Hi Pfaerrich, wie komme ich an die Scans ran? Am besten als ein PDF mit den entsprechenden Seiten. --Arnd 17:58, 12. Okt. 2016 (CEST)
- Hallo Arnd, ich habe zwischenzeitlich die Chose in Eigenregie regeln können. Es war zwar aufwändig, aber ich konnte den Artikel schon zu mehr als der Hälfte unter RE:Herakles auf korrigiert stellen. Danke und Gruß --Pfaerrich (Diskussion) 21:26, 12. Okt. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 08:10, 13. Okt. 2016 (CEST)
Digitalisat: Commons (483 Seiten). Index:Predigten für die festliche Hälfte des Kirchenjahres --Moros (Diskussion) 10:54, 20. Okt. 2016 (CEST)
- Moros, erledigt. --Arnd 19:39, 20. Okt. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 19:39, 20. Okt. 2016 (CEST)
Digitalisat: Commons (252 Seiten). Index:Raphael --Moros (Diskussion) 11:08, 4. Nov. 2016 (CET)
- Moros, erledigt. --Arnd 18:24, 10. Nov. 2016 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 18:24, 10. Nov. 2016 (CET)
Digitalisat: Commons (76 Seiten). Index:Betbüchlein für Kinder --Moros (Diskussion) 12:08, 9. Nov. 2016 (CET)
- Moros, erledigt. --Arnd 18:24, 10. Nov. 2016 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 18:24, 10. Nov. 2016 (CET)
Digitalisat: Commons (444 Seiten). Index:Kurzgefaßte Einleitung in die heiligen Schriften (11. Auflage) --Moros (Diskussion) 11:19, 1. Dez. 2016 (CET)
- Moros, erledigt. --Arnd 23:18, 4. Dez. 2016 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 23:18, 4. Dez. 2016 (CET)
Digitalisat: Commons (25 Seiten). Index:Entstehung und Entwicklung der Urpfarrei Sachsen bei Ansbach --Moros (Diskussion) 12:29, 1. Jan. 2017 (CET)
- https://docs.google.com/document/d/189RrJPrN3gKH_MGgDqQH9vO8PWX5KqrMBFiAdsQLjvI/edit?usp=sharing
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 14:49, 1. Jan. 2017 (CET)
Digitalisat: Commons (37 Seiten). Index:Grundlagen und Anfänge kirchlicher Organisation an der mittleren Rezat (Fortsetzung) --Moros (Diskussion) 12:29, 1. Jan. 2017 (CET)
- https://docs.google.com/document/d/1_FrUzbUb2-i7OeneSjSI-bgdqPJSOHbFOeGT00EXkIo/edit?usp=sharing
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 14:49, 1. Jan. 2017 (CET)
Digitalisat: Commons (12 Seiten). Index:Grundlagen und Anfänge kirchlicher Organisation an der mittleren Rezat --Moros (Diskussion) 12:08, 20. Jan. 2017 (CET)
- Moros, hier das Ergebnis: Benutzer:Aschroet/1. --Arnd 12:21, 20. Jan. 2017 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 12:21, 20. Jan. 2017 (CET)
Für die einzelne Seite wäre eine neue OCR sehr nützlich, Korrektur erfolgt dann zeitnah durch mich. --Dorades (Diskussion) 22:52, 22. Apr. 2017 (CEST)
- Dorades, erledigt. --Arnd 00:17, 23. Apr. 2017 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 00:17, 23. Apr. 2017 (CEST)
Ich könnte teils zur Verfeinerung der Korrekturgänge für Gesammelte Schriften über Musik und Musiker (Bd.2), teils zur Vorbereitung untenstehende OCR sehr gut gebrauchen.
Da das Kontingent ja nicht mehr sehr groß ist, könnten die beiden letzten Posten auch entfallen.
- Zweiter Band Commons, S. 130–286 = 156 Seiten
- Dritter Band Commons, 294 S.
- Vierter Band Commons, 304 S.
Viele Grüße von --Konrad Stein (Diskussion) 10:25, 25. Apr. 2017 (CEST)
- Hallo Konrad, reicht dir als Ergebnis jeweils eine Textdatei? --Arnd 08:00, 28. Apr. 2017 (CEST)
Bester Arnd, ja, reicht. Danke, Dein --Konrad Stein (Diskussion) 09:08, 28. Apr. 2017 (CEST)
Hallo Konrad, hier die (ungesichteten) Ergebnisse:
- https://drive.google.com/file/d/0B1Y6YZi-7KKrVEJGWjFQQ1FsSUE
- https://drive.google.com/file/d/0B1Y6YZi-7KKrX0F4MGdrOVltWlk
- https://drive.google.com/file/d/0B1Y6YZi-7KKrWk1WaGdEczg3WmM
Ich hoffe das passt so. Viel Spaß damit und schönes verlängertes WE, --Arnd 09:39, 28. Apr. 2017 (CEST)
- Prima, ich danke Dir. Bis bald, Dein --Konrad Stein (Diskussion) 09:49, 28. Apr. 2017 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Arnd 10:20, 28. Apr. 2017 (CEST)