Skip to content

index

https://defence.arcangelomassari.com

arcangelo7
arcangelo7 Feb 12, 2026 · opencitations/time-agnostic-library

refactor!: replace python-dateutil with datetime.fromisoformat

BREAKING CHANGE: date/time values must now be in ISO 8601 format. Non-ISO formats (e.g., "May 21, 2021") are no longer accepted.

+8 -8 7f2bf30
arcangelo7
arcangelo7 Feb 14, 2026 · opencitations/heritrace

build!: adapt to time-agnostic-library v6.0.0

The library now returns N3-encoded string tuples instead of RDFLib Graph/Dataset objects from get_history() and get_state_at_time(). Add converter functions at the boundary to restore RDFLib objects for downstream code. Remove cache_endpoint and cache_update_endpoint parameters dropped from generate_config_file().

BREAKING CHANGE: requires time-agnostic-library >= 6.0.0

+94 -84 947b6ee
arcangelo7
arcangelo7 Feb 18, 2026 · opencitations/time-agnostic-library

feat(benchmark): add disk usage tracking and per-query memory measurement

Replace resource.getrusage with tracemalloc for per-query peak memory tracking. Add timestamped run files with query-level resume support. Record OCDM, QLever, and OSTRICH disk usage from setup scripts. Add storage comparison and memory comparison plots to analysis.

+280 -64 200ff4f
arcangelo7
arcangelo7 Feb 14, 2026 · opencitations/heritrace

feat: replace Flask dev server with Gunicorn

Use Gunicorn as WSGI server in both development and production. Workers and timeout are configurable via GUNICORN_WORKERS and GUNICORN_TIMEOUT env vars, defaulting to (2 * CPU + 1) workers. Dev environment generates self-signed SSL certs and runs with --reload.

+133 -16 626b266
arcangelo7
arcangelo7 Feb 14, 2026 · opencitations/heritrace

build: migrate from Poetry to uv

+1330 -1687 eef1f77
arcangelo7
arcangelo7 Feb 14, 2026 · dharc-org/changes-metadata-manager

feat: add SHACL validation of generated metadata against CHAD-AP shapes

Validate each stage's metadata against SHACL shapes during folder processing and report non-conforming stages at the end. Add pyshacl dependency and type annotations to generate_provenance_snapshots.

+387 -4 a4825b5
arcangelo7
arcangelo7 Feb 14, 2026 · dharc-org/changes-metadata-manager

feat(zenodo): add CC0 Italian cultural heritage law disclaimer

Append a disclaimer about Italian cultural heritage regulations to Zenodo descriptions for CC0-licensed content. Fix license identifier assertion and add not-None guards in zip tests.

+43 -4 dd11c0c
arcangelo7
arcangelo7 Feb 18, 2026 · dharc-org/changes-metadata-manager

feat(zenodo): add keeper institution and location to record description

Extract curation activity data from the knowledge graph following the CHAD-AP ontology pattern (crm:E7_Activity with aat:300054277) to include the conserving institution and its location in each Zenodo record description.

+102 -4 d4fa80a
arcangelo7
arcangelo7 Feb 18, 2026 · dharc-org/changes-metadata-manager

feat(zenodo): add file scope description to license rights entries

Metadata license (CC0) now explicitly lists meta.ttl and prov.trig. Content license describes coverage as all data files except those two.

+3 -0 d6af8c3

Zenodo non usa CREDIT, usa https://datacite-metadata-schema.readthedocs.io/en/4.6/appendices/appendix-1/contributorType/

arcangelo7
arcangelo7 Feb 18, 2026 · dharc-org/changes-metadata-manager

feat(zenodo): convert config format to InvenioRDM API schema

Restructure creators with person_or_org/role/affiliations format, split family_name/given_name fields, add datacollector/datacurator roles, convert related_identifiers and locations to InvenioRDM nested format, and add optional SHACL validation skip flag.

+504 -220 a795568

https://sandbox.zenodo.org/records/442870

arcangelo7
arcangelo7 Feb 18, 2026 · dharc-org/changes-metadata-manager

feat(zenodo): generate entity-to-DOI association table after upload

+110 -3 c25bd49
arcangelo7
arcangelo7 Feb 17, 2026 · thinkcompute/thinkcompute.github.io

refactor: move D&C and file handling labs from part 3 to new part 5

Move divide-and-conquer exercises from lab-06 to lab-07 and file handling content from lab-07 to new lab-08, creating a dedicated Part 5 for these topics. Remove CSV and JSON sections from the file handling lab.

+429 -890 5fe5b74
arcangelo7
arcangelo7 Feb 18, 2026 · thinkcompute/thinkcompute.github.io

feat: add part 7 laboratories on pandas and Python classes

Add lab-09 (pandas exercises with Caravaggio dataset) and lab-10 (Python classes for Baroque painters). Include CSV dataset files for the pandas lab. Update _toc.yml to include new Part 7 and renumber Databases to Part 8. Add clean step to build scripts.

+532 -2 cbcf3e6

https://thinkcompute.github.io/

arcangelo7Feb 18, 2026 · opencitations/oc_meta

build: migrate from Poetry to UV

+2908-3816e8e4c4a
arcangelo7Feb 18, 2026 · opencitations/oc_meta

feat(finder): add merged entities reconstruction from provenance

Add tool to scan provenance files and reconstruct merge chains. The script identifies entities that were merged by detecting multiple wasDerivedFrom references in provenance snapshots, then follows the chain to find the final surviving entity.

Usage: python -m oc_meta.run.find.merged_entities -c -o <output.csv> --entity-type br

+167-01163da8
  • La data del libro di Computational Management of Data va aggiornata tutti gli anni al nuovo anno? Perché vedo che c’è ancora il 2025 per la citazione e il 2023 nel footer. Dovremmo tenere aggiornate queste date sempre all’anno in corso o comunque alla data di ultimo aggiornamento?
  • comp-think

Aldrovandi

  • Bisogna chiedere a Silvio la tabella CSV da cui ricavare i nomi delle colonne, tabella che andrà compilata con le informazioni sui documenti che abbiamo caricato su Zenodo.

  • Scrivere a Ilaria Manzini per inserire Changes su OpenAIRE. Vizioso

  • https://en.wikipedia.org/wiki/Compilers:_Principles,_Techniques,_and_Tools

  • https://en.wikipedia.org/wiki/GNU_Bison

  • https://en.wikipedia.org/wiki/Yacc

  • HERITRACE

    • C’è un bug che si verifica quando uno seleziona un’entità preesistente, poi clicca sulla X e inserisce i metadati a mano. Alcuni metadati vengono duplicati.
    • Se uno ripristina una sotto entità a seguito di un merge, l’entità principale potrebbe rompersi.
  • Meta

    • Bisogna produrre la tabella che associa temp a OMID per produrre le citazioni.
  • OpenCitations

    • Rilanciare processo eliminazione duplicati
    • trovare tutti quelli che ci usano
  • “reference”: { “@id”: “frbr:part”, “@type”: “@vocab” } → bibreference

  • “crossref”: { “@id”: “biro:references”, “@type”: “@vocab”} → reference

  • “crossref”: “datacite:crossref”

  • oc_ocdm

    • Automatizzare mark_as_restored di default. è possibile disabilitare e fare a mano mark_as_restored.
  • https://opencitations.net/meta/api/v1/metadata/doi:10.1093/acprof:oso/9780199977628.001.0001

  • Guida per Meta e cerotti

  • DELETE con variabile

  • Modificare Meta sulla base della tabella di Elia

  • embodiment multipli devono essere purgati a monte

  • Portare il Meta Editor fuori. oc_editor

  • Modificare documentazione API aggiungendo omid

  • Heritrace

    • Per risolvere le performance del time-vault non usare la time-agnostic-library, ma guarda solo la query di update dello snapshot di cancellazione.
    • Ordine dato all’indice dell’elemento
    • date: formato
    • anni: essere meno stretto sugli anni. Problema ISO per 999. 0999?
    • Opzione per evitare counting
    • Opzione per non aggiungere la lista delle risorse, che posso comunque essere cercate
    • Configurabilità troppa fatica
    • Timer massimo. Timer configurabile. Messaggio in caso si stia per toccare il timer massimo.
    • Riflettere su @lang. SKOS come use case. skos:prefLabel, skos:altLabel
    • Possibilità di specificare l’URI a mano in fase di creazione
    • la base è non specificare la sorgente, perché non sarà mai quella iniziale.
    • desvription con l’entità e stata modificata. Tipo commit
    • display name è References Cited by VA bene
    • Avvertire l’utente del disastro imminente nel caso in cui provi a cancellare un volume
  • Meta

    • Fusione: chi ha più metadati compilati. A parità di metadato si tiene l’omid più basso
    • Issue github parallelizzazione virtuoso
    • frbr:partOf non deve aggiungere nel merge: https://opencitations.net/meta/api/v1/metadata/omid:br/06304322094
    • API v2
    • Usare il triplestore di provenance per fare 303 in caso di entità mergiate o mostrare la provenance in caso di cancellazione e basta.
  • RML

    https://github.com/oeg-upm/gtfs-bench

    • Chiedere Ionannisil diagramma che ha usato per auto rml.
  • Crowdsourcing

    • Quando dobbiamo ingerire Crossref stoppo manualmente OJS. Si mette una nota nel repository per dire le cose. Ogni mese.
    • Aggiornamenti al dump incrementali. Si usa un nuovo prefisso e si aggiungono dati solo a quel CSV.
    • Bisogna usare il DOI di Zenodo come primary source. Un unico DOI per batch process.
    • Bisogna fare l’aggiornamento sulla copia e poi bisogna automatizzare lo switch