Wikisource:Skriptorium/Archiv/2025/Februar
![]() |
Diese Seite ist ein Archiv abgeschlossener Diskussionen. Ihr Inhalt sollte daher nicht mehr verändert werden. Benutze bitte die aktuelle Diskussionsseite.
Um einen Abschnitt dieser Seite zu verlinken, klicke im Inhaltsverzeichnis auf den Abschnitt und kopiere dann Seitenname und Abschnittsüberschrift aus der URL-Zeile deines Browsers (Beispiel: |
Reminder: first part of the annual UCoC review closes soon
My apologies for writing in English. Hilf bitte mit, in deine Sprache zu übersetzen.
This is a reminder that the first phase of the annual review period for the Universal Code of Conduct and Enforcement Guidelines will be closing soon. You can make suggestions for changes through the end of day, 3 February 2025. This is the first step of several to be taken for the annual review. Read more information and find a conversation to join on the UCoC page on Meta. After review of the feedback, proposals for updated text will be published on Meta in March for another round of community review.
Please share this information with other members in your community wherever else might be appropriate.
-- In cooperation with the U4C, Keegan (WMF) (talk) 01:49, 3. Feb. 2025 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: 9xl (Diskussion) 16:32, 5. Feb. 2025 (CET)
Neuer Bot für die Liste der Autoren
Hallo liebe Freunde der gut gepflegten Autorenlisten. Benutzer @Aschroet: hat in letzter Zeit viel Arbeit investiert unsere Autoren besser mit Daten aus Wikidata zu versorgen, was eine mega Arbeit war und wahrscheinlich lange überfällig.
Dies hatte den kleinen Nachteil, dass der Bot, der des nächtens seit Juni 2016! die Liste der Autoren aktualisiert nicht mehr ordentlich funktioniert hat. Leider war das mit Abstand der älteste Bot meiner Codebase, dem entsprechend war die Qualität des Quellcodes (wer hätte gedacht, dass man besser programmieren kann nach 9 Jahren ;-) ). Ich habe daher in den letzten Tagen das Ding einmal komplett neu geschrieben und überarbeitet. Er kann jetzt mit den Änderungen von Aschroet umgehen und findet wesentlich mehr Informationen, dank Wikidata.
Momentan ist die neue List unter Liste der Autoren/New zu finden. Optisch ist sie unverändert, nur die Daten sind jetzt wieder korrekter. Schaut vielleicht mal vorbei und lasst es mich wissen, falls sich noch Fehler eingeschlichen haben. Falls ich in die Richtung nichts höre schalte ich in einer Woche den Bot auf die Hauptliste um und beerdige den Code der uns 9 Jahre treue Dienste geleistet hat.
THE IT (Diskussion) 16:13, 6. Feb. 2025 (CET)
- Hi THE IT, danke fürs aktualisieren. Ich haben drei Fälle gefunden, bei denen der Name in der Liste nicht vollständig angezeigt wird: Christian Friedrich Goldschadt, Christian Gottlob Wabst, Camillo von Althaus.
- PS: Nur interessehalber: Wie macht das der Bot eigentlich? Rendert er das Template inklusive den Wikdiata-Abfragen und extrahiert dann die Daten oder musstest du das Besorgen der Daten noch einmal nachprogrammieren? Gruß, --Arnd 🇺🇦 09:18, 7. Feb. 2025 (CET)
- nein ich muss die Daten nochmal nach organisieren. Für die Sortierung brauche ich eine akkurate Trennung von Nach- und Vornamen. Und für die Nachnamen besorge ich mir zum Beispiel auch das Englische als Backup, wenn Deutsch gerade mal nicht da ist. THE IT (Diskussion) 09:43, 7. Feb. 2025 (CET)
- THE IT, was war jetzt das Problem bei den drei genannten Personen? Wikidata hat doch die Nachnamen, welche auch in der Infobox angezeigt werden. Gruß, --Arnd 🇺🇦 09:52, 7. Feb. 2025 (CET)
- Die drei Fehler waren alle dadurch zu erklären, dass nur der Nach- oder Vorname in der Vorlage gepflegt war. Ich habe den da mal ergänzt. Ich hole mir nur die Daten aus Wikidata, wenn sowohl Vor- als auch Nachname in der Vorlage fehlen ansonsten kommt es zu anderen komischen Effekten, die bei Klabund (der Mann heißt ja eigentlich Alfred Henschke, durch die Mischung auf Wikidata und Vorlage wird sein Name zu Alfred Klabund, was weniger Sinn ergibt). Anderes Beispiel Aristoteles. THE IT (Diskussion) 10:05, 7. Feb. 2025 (CET)
- weitere Beispiele
- nein ich muss die Daten nochmal nach organisieren. Für die Sortierung brauche ich eine akkurate Trennung von Nach- und Vornamen. Und für die Nachnamen besorge ich mir zum Beispiel auch das Englische als Backup, wenn Deutsch gerade mal nicht da ist. THE IT (Diskussion) 09:43, 7. Feb. 2025 (CET)
- Die Frage ist hier, wie will man Einzelnamen (griechische und römische Autoren) und "von" Nachnamen behandeln. Die Einzelnamen behandelt der Bot glaube ich schon ganz vernünftig, indem er da Wikidata einfach ignoriert. Bei den Adelsnamen haben wir die Häufig einfach bei Vor- oder Nachnamen komplett eingetragen. Der Bot kann das vernünftig händeln (er streicht das 'von' bevor, der Sortierschlüssel erzeugt wird), aber dafür müssen die beiden Namensteile halt seperat zur verfügung gestellt werden. @Aschroet:: Ideen?
- THE IT (Diskussion) 10:26, 7. Feb. 2025 (CET)
- Dazu noch eine verwandte Frage, gehe ich recht in der Annahme, das ein "von" Teil des Nachnamens ist? THE IT (Diskussion) 10:31, 7. Feb. 2025 (CET)
- Zur Sortierung: Ich habe die Liste mal nach Geburtsdatum sortiert und habe dabei seltsame Erfahrungen gemacht. Z. B. nach „Seneca, Lucius“ kommt „Schröder, Emilie“ und einige andere, und „Gorki, Maxim“ wird gefolgt von „Plinius der Ältere“. Wie man allerdings eine Datumsangabe „vor 40 nach Chr.“ oder ein Datum mit „oder“ sinnvoll sortieren soll, kann ich auch nicht erklären. --9xl (Diskussion) 10:46, 7. Feb. 2025 (CET)
- Habe mich drum gekümmert THE IT (Diskussion) 11:39, 7. Feb. 2025 (CET)
- Das Ergebnis sieht man wohl erst morgen? --9xl (Diskussion) 16:47, 7. Feb. 2025 (CET)
- Exakt … THE IT (Diskussion) 21:06, 7. Feb. 2025 (CET)
- Das Ergebnis sieht man wohl erst morgen? --9xl (Diskussion) 16:47, 7. Feb. 2025 (CET)
- Habe mich drum gekümmert THE IT (Diskussion) 11:39, 7. Feb. 2025 (CET)
- Danke dir und Aschroet für die viele Mühe! Warum entfernst du hier aber relevante Angaben? --Dorades (Diskussion) 21:11, 7. Feb. 2025 (CET)
- Danke, das hat funktioniert. Zwischen Seneca und Plinius waren fünf „moderne“ Personen einsortiert, die sind jetzt alle wo man sie erwartet. --9xl (Diskussion) 10:39, 9. Feb. 2025 (CET)
- @Dorades:, aus dem Fragezeichen wurde ich so gar nicht schlau und es sind alles Kleinigkeiten, die die Sortierung von Daten erschweren und fehlschlagen lassen. Ich stelle es gerne wieder. THE IT (Diskussion) 09:00, 12. Feb. 2025 (CET)
- Danke! Fragezeichen bedeutet, der genaue Geburtstag ist unsicher, könnte man auch durch "eventuell" oder "vermutlich" ausdrücken, falls es die Sache einfacher macht. Ich habe das auch entsprechend im Wikidata-Item modelliert, falls man die Daten von dort verwenden will. --Dorades (Diskussion) 19:55, 12. Feb. 2025 (CET)
- @Dorades:, aus dem Fragezeichen wurde ich so gar nicht schlau und es sind alles Kleinigkeiten, die die Sortierung von Daten erschweren und fehlschlagen lassen. Ich stelle es gerne wieder. THE IT (Diskussion) 09:00, 12. Feb. 2025 (CET)
- Danke, das hat funktioniert. Zwischen Seneca und Plinius waren fünf „moderne“ Personen einsortiert, die sind jetzt alle wo man sie erwartet. --9xl (Diskussion) 10:39, 9. Feb. 2025 (CET)
Letzte Fehler wurden behoben, ab morgen wird die Liste vom renovierten Algorithmus erzeugt. THE IT (Diskussion) 09:00, 12. Feb. 2025 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: THE IT (Diskussion) 09:49, 25. Feb. 2025 (CET)
Anstehendes Treffen des Sprachkomitees (28. Februar, 14:00 UTC) und Newsletter
Hallo allerseits!

Wir freuen uns, ankündigen zu können, dass das nächste Treffen des Sprachkomitees bald stattfindet, am 28. Februar um 14:00 UTC! Wenn du teilnehmen möchtest, melde dich einfach über die Wikiseite an.
Dies ist ein von den Teilnehmenden angetriebenes Treffen, bei dem wir Neuigkeiten zu sprachbezogenen Projekten austauschen, über technische Herausforderungen in Sprach-Wikis sprechen und gemeinsam an Lösungen arbeiten. In unserem letzten Treffen haben wir Themen wie die Entwicklung von Sprachtastaturen, den Start der Mòoré-Wikipedia und Neuigkeiten aus den Veranstaltungen zur Sprachunterstützung auf der Wiki Indaba behandelt.
Du hast ein Thema, das du einbringen möchtest? Egal, ob es um technische Neuigkeiten aus deinem Projekt, eine Herausforderung, bei der du Hilfe suchst, oder eine Anfrage um Simultanübersetzung geht, wir freuen uns, von dir zu hören! Du kannst gerne auf diese Nachricht antworten oder Tagesordnungspunkte zu diesem Dokument hinzufügen.
Außerdem wollten wir darauf hinweisen, dass die sechste Ausgabe des Newsletters „Sprache und Internationalisierung“ (Januar 2025) verfügbar ist: Wikimedia Language and Product Localization/Newsletter/2025/January. Dieser Newsletter enthält Informationen aus dem Quartal Oktober-Dezember 2024 über die Entwicklung neuer Funktionen, Verbesserungen verschiedener sprachbezogener technischer Projekte und Unterstützungsmaßnahmen, Details über Communitytreffen und Ideen für das Beitragen zu Projekten. Um auf dem Laufenden zu bleiben, kannst du den Newsletter über seine Wiki-Seite abonnieren: Wikimedia Language and Product Localization/Newsletter.
Wir freuen uns auf deine Ideen und deine Teilnahme am Treffen des Sprachkomitees, bis bald!
MediaWiki message delivery 09:29, 22. Feb. 2025 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: 9xl (Diskussion) 09:47, 3. Mär. 2025 (CET)
Hi Kollegen,
ich reite mal auf der Motivationswelle noch etwas weiter und mache mich daran die Liste der Gedichte zu automatisieren. Fragen dazu:
- Ich beziehe alle Werke ein die unter der Kategorie Kategorie:Gedicht (9965) zu finden sind. Ist das der Umfang der hier angestrebt wird?
- Falls sich am Layout der bestehenden Liste etwas ändern soll bitte Bescheid sagen, dann kann ich das berücksichtigen. Allerdings dürfen nicht zuviele Informationen dazu kommen, wenn die Liste mit allen Gedichten gefüllt ist kratzt sie schon sehr an der Größenbeschränkung.
... mehr Fragen eventuell später.
THE IT (Diskussion) 22:00, 12. Feb. 2025 (CET)
Vorschlag:
- Die laufende Nummer kann entfallen. Sie kann sich ändern und ist somit nutzlos. Die Anzahl der gelisteten Gedichte sollte mitgeteilt werden wie in der Liste der Autoren.
- Der BS kann auch entfallen. Nur Gedichte mit BS korrigiert und fertig in die Liste aufnehmen.
- Unterkategorien der Kategorie:Gedicht auch aufnehmen. Dort sollten dann nur sinnvolle Unterkategorien stehen.
Wenn feststeht, wie mit Punkt 3. verfahren wird, sollten wir uns die Kategorien einmal ansehen. Mir ist aufgefallen: die Kategorie:Gedicht enthält Das Lied von der Glocke (1800), Das Lied von der Glocke (1854) steht in der Kategorie:Ballade; in der Kategorie:Gedicht steht nur Die Wacht am Rhein (Stoltze), Die Wacht am Rhein steht in der Kategorie:Gedicht (vertont). --9xl (Diskussion) 16:39, 13. Feb. 2025 (CET)
- Nummer 1 und 2 nehme ich liebend gern auf. Nur Fertig und Korrigiert sollte simpel sein. Die Suche in Unterkategorien habe ich gerade schon eingebaut.
- Kinderlyrik
- Mundartgedicht
- Sonett
- Tafellied
- wirken auf mich sinnvoll.
- Man könnte rein technisch natürlich auch die gesammte Kategorie:Versdichtung aufnehmen, fraglich ist hierbei ob, dass alles sich in der Liste finden sollte? Technisch umsetzbar wäre das relativ simpel, ist eine inhaltliche Frage. ... bei der Erweiterung auf Versdichtung eventuell auch wieder eine Größenfrage.
- THE IT (Diskussion) 09:15, 14. Feb. 2025 (CET)
- Nächste Frage: Ich würde stehts das Entstehungsjahr vorziehen, sollte das nicht vorhanden sein, einfach Erscheinungsjahr nutzen, oder das deutlich machen "1905 (veröff.)"? THE IT (Diskussion) 19:22, 14. Feb. 2025 (CET)
- (Die Telekom hat mich drei Tage ruhiggestellt. Aber jetzt … )
- Zu der Frage der Jahreszahl habe ich keine Meinung.
- Ich habe noch die Kategorie:Ballade in die Kategorie:Gedicht gestellt. So könnte man jetzt sagen, die Liste enthält alles was in Kategorie:Gedicht und ihrer Unterkategorien steht. --9xl (Diskussion) 11:22, 19. Feb. 2025 (CET)
- Der Bot nimmt Gestalt an. Liste der Gedichte/New zeigt einen Ausschnitt, wo wir gerade sind. Ich habe noch ein paar härtere Probleme vor mir (Einbindung via PR2 ist ein Problem um die erste Zeile zu erkennen.). Aber ich bin guter Dinge, dass es nicht so lange dauert, bis wir etwas haben, was die momentane Version ersetzten kann. THE IT (Diskussion) 15:13, 19. Feb. 2025 (CET)
- Nächste Frage: Ich würde stehts das Entstehungsjahr vorziehen, sollte das nicht vorhanden sein, einfach Erscheinungsjahr nutzen, oder das deutlich machen "1905 (veröff.)"? THE IT (Diskussion) 19:22, 14. Feb. 2025 (CET)
Heute hat der Bot es zum ersten mal durch geschafft ... es fehlt noch eine Menge an Infos. Aber zumindest ist die Liste jetzt erzeugbar ... und es werden schon erstaunlich viele erste Zeilen gefunden.
- Mit der Vorlage:GartenlaubenArtikel scheint es Probleme zu geben, der Autor wird nicht gefunden, der Titel wird zwar gefunden aber mit "NO TITLE" ergänzt. --9xl (Diskussion) 18:33, 20. Feb. 2025 (CET)
- Ja, dass ist einer der bekannten Fehler. Vorlage:Kapitel ist auch noch Problematisch. Aber das bekommen wir hin. Ich bin sehr positiv überrascht, wie viele erste Zeilen gefunden werden. THE IT (Diskussion) 09:12, 21. Feb. 2025 (CET)
- Was die 1. Zeile betrifft, da gibt es ja haarsträubende Konstruktionen. Wie ein Programm da die erste Gedichtzeile immer sicher erkennen soll, wird nicht ohne Nachbesserung am Quelltext möglich sein, es sei denn wir versuchen es 'mal mit KI ;-) --9xl (Diskussion) 11:03, 21. Feb. 2025 (CET)
- Ich habe schon eingebaut, dass man in die erste Zeile das Konstrukt packen kann, dass führt dann dazu, dass dies den Algorithmus überschreibt. Ich mache dadraus aber noch einen deutschen Kommentar. Dann ist es nicht wirklich notwendig in die Darstellung einzugreifen. Wartet aber bitte noch ab, ich möchte die automatische Erkennung noch etwas weiter treiben (keine KI notwendig). ;-) THE IT (Diskussion) 12:49, 21. Feb. 2025 (CET)
<!-- first_line -->
- Ich habe schon eingebaut, dass man in die erste Zeile das Konstrukt
- Was die 1. Zeile betrifft, da gibt es ja haarsträubende Konstruktionen. Wie ein Programm da die erste Gedichtzeile immer sicher erkennen soll, wird nicht ohne Nachbesserung am Quelltext möglich sein, es sei denn wir versuchen es 'mal mit KI ;-) --9xl (Diskussion) 11:03, 21. Feb. 2025 (CET)
- Ja, dass ist einer der bekannten Fehler. Vorlage:Kapitel ist auch noch Problematisch. Aber das bekommen wir hin. Ich bin sehr positiv überrascht, wie viele erste Zeilen gefunden werden. THE IT (Diskussion) 09:12, 21. Feb. 2025 (CET)
- PS: Ab morgen früh sollten sich auch die Infos zu Gartenlaube und Kapiteln einfinden.
- Wir nähern uns einem guten Stand. Alle Spalten sind jetzt vernünftig sortierbar (und bisher sprengen wir noch nicht die 2MB Pagegrenze).
- @9xl: (als bisher einziger Interessent für das Thema). Ich habe ein paar Probleme mit der Erkennung der ersten Zeilen. Es funktioniert sehr gut mit der Logik die 5. Zeile zu erkennen (anhand des Templates) und dann einfach 4 Zeilen hoch zu gehen, das geht super. Problematisch wird es bei Gedichten, die das nicht haben. Momentan versuche ich mich mit einer Mischung aus Erkennung des Poem tags und Detektion der Überschrift. Das ist leider recht anfällig (viele Gedichte, viele verschiedene Formate, Unterüberschriften), dass führt leider auch zu falsch erkannten ersten Zeilen. Wollen wir eher defensiv da ran gehen und für die fragwürdigen Gedichte die erste Zeile händisch setzen, oder wollen wir potentiell falsch erkannte erste Zeilen in Kauf nehmen (kann durch händische Intervention auch korrigiert werden)? THE IT (Diskussion) 11:17, 25. Feb. 2025 (CET)
- PS: Um das mit Zahlen zu unterlegen. Mit der konservativen Strategie bekommen wir 86% Erkennungsquote. Mit der progressiven, aber fehleranfälligen Methode landen wir bei 97% Erkennungsquote (wie viel davon Fehler sind kann ich nicht sagen).THE IT (Diskussion) 17:51, 25. Feb. 2025 (CET)
- Um falsche Positive zu erkennen müsste man alle Gedichte mit der Liste vergleichen, um die fehlenden Gedichtanfänge mit first_line zu ergänzen muss man 'nur' 1400 Seiten editieren. Also so lassen wie es eben ist*. Mir sind Gedichtanfänge mit Seitenzahlen aufgefallen, verursacht durch die Vorlage SeitePR, besonders viele bei Gedichten von Wilhelm Busch. Kannst du die noch unterdrücken? evtl. auch andere Vorlagen wie {{idt}} vor dem eigentlichen Zeilentext. --9xl (Diskussion) 10:30, 26. Feb. 2025 (CET)
- PS *wie es gestern Abend war --9xl (Diskussion) 12:45, 26. Feb. 2025 (CET)
- Einziger Interessent: Ich wundere mich auch, dass man mir das überlasst, der ich doch keinen besonderen Hang zu Gedichten habe. Ich glaube allerdings, dass unsere Sammlung von fast 10.000 deutschsprachigen Gedichten einzigartig im Netz ist. Sie herauszustellen und die Zugänglichkeit zu verbessern, kann dem Projekt nur gut tun. --9xl (Diskussion) 12:59, 26. Feb. 2025 (CET)
- geht klar. Dann gehen ich da eher mit der konservativen Strategie ran. Die Nummern unterdrücke ich jetzt schon größtenteils. Ich werde die nächsten Tage noch ein wenig die Daten säubern und versuchen die fehlenden ersten Zeilen unter 1000 zu bringen. Dann ergänzen wir den Rest händisch 😃. 2A02:8108:4C91:B300:9087:8033:2D78:34A9 23:34, 26. Feb. 2025 (CET)
- Habe die Erkennungsquote jetzt bei 92%. Hab noch ein paar Fehler beseitigt, aber ich habe das Gefühl wir sind jetzt bei einem guten Stand. THE IT (Diskussion) 22:32, 28. Feb. 2025 (CET)
- geht klar. Dann gehen ich da eher mit der konservativen Strategie ran. Die Nummern unterdrücke ich jetzt schon größtenteils. Ich werde die nächsten Tage noch ein wenig die Daten säubern und versuchen die fehlenden ersten Zeilen unter 1000 zu bringen. Dann ergänzen wir den Rest händisch 😃. 2A02:8108:4C91:B300:9087:8033:2D78:34A9 23:34, 26. Feb. 2025 (CET)
- Um falsche Positive zu erkennen müsste man alle Gedichte mit der Liste vergleichen, um die fehlenden Gedichtanfänge mit first_line zu ergänzen muss man 'nur' 1400 Seiten editieren. Also so lassen wie es eben ist*. Mir sind Gedichtanfänge mit Seitenzahlen aufgefallen, verursacht durch die Vorlage SeitePR, besonders viele bei Gedichten von Wilhelm Busch. Kannst du die noch unterdrücken? evtl. auch andere Vorlagen wie {{idt}} vor dem eigentlichen Zeilentext. --9xl (Diskussion) 10:30, 26. Feb. 2025 (CET)
Werde die Liste der Gedichte heute Nacht auf die automatische Version umstellen (in dieser Version). Danach können wir beginnen bei allen ersten Zeilen, die bisher nicht korrekt erkannt wurden den Kommentar zu setzen, der der Erkennung hilft. THE IT (Diskussion) 19:11, 3. Mär. 2025 (CET)
Eine Kopie dieser Diskussion wurde nach Diskussion:Liste der Gedichte verschoben.
- Archivierung dieses Abschnittes wurde gewünscht von: 9xl (Diskussion) 10:17, 5. Mär. 2025 (CET)