Aktuelles Resultat als CSV (vom 23. Oktober 11:00 Uhr)
retrieve-bgbl.py
lädt PDF und HTML Version nachdata/bgbl
und Metadaten nachdata/metadata
extract-info.py
extrahiert Metadaten aus PDF (Signatur-Zeitpunkt und Erstellungsdatum) nachdata/extracted
retrieve-history.py
sucht alle Änderungen des BGBl im konsolidierten Bundesrecht und schreibt sie nachdata/history
create-csv.py
erstellt den Output aus obigen Daten
- In
retrieve-bgbl.py
ist der Zeitraum für 2020 derzeit hard-coded. extract-info.py
benötigtpdfsig
für das Auslesen der Signatur-Daten undpdfinfo
für die sonstigen Metadaten.create-csv.py
versucht, aus Inkraft- und Ausserkrafttretedatum in Verbindung mit dem Ausgabedatum sinnvolle Werte zu extrahieren.- Der reguläre Ausdruck in
extract-info.py
für das Erkennen der Textstellen ist - wie sag' ich's - verbesserungsfähig.
Danke an https://twitter.com/MartinThuer für die willkommene Ablenkung.