Tu vuo far el phdino

HERITRACE

  • Quando viene cancellata una proprietà virtuale, viene in realtà cancellata l’entità attraverso la quale è stata implementata quella proprietà virtuale.
  • Le proprietà virtuali ovviamente non compaiono nel change tracking dell’entità. Per ora va bene così.
  • La ricerca delle entità esistenti ora mostra un menu a tendina in cui ogni elemento è multilinea in maniera tale che il nome dell’elemento sia interamente visibile.
    8716d32bc4dbcfb3746f6381604963ae.png
  • Risolto il bug per cui venivano catturati i click programmatici per espandere le proprietà obbligatorie e questi chiudevano il menu a tendina per la ricerca delle entità preesistenti.
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    $(document).on('click', function(e) {
    // Ignora i click programmatici (non generati dall'utente)
    if (!e.isTrusted) {
    return;
    }

    if (!$(e.target).closest('.newEntityPropertyContainer').length) {
    $('.entity-search-results').addClass('d-none');
    $('.search-spinner').addClass('d-none');
    }
    });
  • Non avevo ancora gestito il caso in cui sh:hasvalue è un elenco di URI e non un elenco di nodi, ovvero di shape o di datatype e in particolare non avevo gestito la generazione del form di modifica per questo tipo di casistica in cui deve essere mostrato un select option e non un input type text.
  • introdurre la possibilità di selezionare il tipo di risorsa bibliografica citata ha reintrodotto il problema di performance lato frontend che pure era stato parzialmente risolto caricando in maniera asincrona soltanto i modelli per l’edità selezionata. Ho scelto di affrontare questo nuovo problema in maniera ibrida, continuando a caricare in maniera asincrona soltanto il modello dell’entità selezionata ma non delle entità annidate oltre il livello di profondità 1, che vengono caricate in maniera asincrona anch’esse.

User testing

  • Uno dei tester mi ha segnalato che la porta 5000 è di default occupata nelle ultime versioni di macOS da AirPlay, quindi ho modificato l’ambiente per esporre la 5001.

sus\_visualizations.png

task\_success\_rates.png

task\_error\_heatmaps.png

task\_duration\_expected\_vs\_actual.png

Bugfix

  • Mi ero dimenticato di aggiornare anche l’inizializzatore dei contatori per tenere conto dei nuovi URI delle citazioni e ora l’ho fatto.

Crash course su Git

OC Meta

  • Il sistema di conversione del dump in RDF da Virtuoso alla struttura di cartelle e sottocartelle di OpenCentations Meta è fallito a 40 su 53 batch per la provenance dopo 10 giorni di processing.
  • Questo mi ha dato l’occasione per ripensare il sistema e renderlo più efficiente. Anziché fare merge dei file temporanei dopo batch artificiali, ad esempio ogni 300 file, che richiede ogni volta 3 ore per fare il merge esplorando milioni di file, anche se in parallelo, adesso il merge viene triggerato soltanto quando mancano meno di 10 milioni di inode disponibili.
  • Già che c’ero ho aggiunto un sistema di caching per cui processato un file del dump di virtuoso correttamente e viene salvato su un file in maniera tale da non essere più riprocessato.

a1d8eab9cf55ef637181cbdbc9d5c66b.png

Domande

  • 20 ottobre

Memo

  • HERITRACE

    • C’è un bug che si verifica quando uno seleziona un’entità preesistente, poi clicca sulla X e inserisce i metadati a mano. Alcuni metadati vengono duplicati.
    • Se uno ripristina una sotto entità a seguito di un merge, l’entità principale potrebbe rompersi.
  • Tesi

    • Aggiungere ParaText
    • RML
    • Crowdsourcing future works
    • Descrivere l’architettura di HERITRACE
  • OpenCitations

    • Rifare dump (Crossref e Datacite)
    • Risolvere la questione ORCID
    • Rilanciare processo eliminazione duplicati
  • “reference”: { “@id”: “frbr:part”, “@type”: “@vocab” } → bibreference

  • “crossref”: { “@id”: “biro:references”, “@type”: “@vocab”} → reference

  • “crossref”: “datacite:crossref”

  • Ripubblicare dbpedia agnostica su Zenodo e si può usare time-agnostic-library su db pedia agnostica

  • oc_ocdm

    • Automatizzare mark_as_restored di default. è possibile disabilitare e fare a mano mark_as_restored.
  • https://opencitations.net/meta/api/v1/metadata/doi:10.1093/acprof:oso/9780199977628.001.0001

  • Guida per Meta e cerotti

  • DELETE con variabile

  • Modificare Meta sulla base della tabella di Elia

  • embodiment multipli devono essere purgati a monte

  • Portare il Meta Editor fuori. oc_editor

  • Modificare documentazione API aggiungendo omid

  • Heritrace

    • Per risolvere le performance del time-vault non usare la time-agnostic-library, ma guarda solo la query di update dello snapshot di cancellazione.
    • Ordine dato all’indice dell’elemento
    • date: formato
    • anni: essere meno stretto sugli anni. Problema ISO per 999. 0999?
    • Opzione per evitare counting
    • Opzione per non aggiungere la lista delle risorse, che posso comunque essere cercate
    • Configurabilità troppa fatica
    • Collegamento da review e articolo revisionato.
    • Timer massimo. Timer configurabile. Messaggio in caso si stia per toccare il timer massimo.
    • Riflettere su @lang. SKOS come use case. skos:prefLabel, skos:altLabel
    • Possibilità di specificare l’URI a mano in fase di creazione
    • la base è non specificare la sorgente, perché non sarà mai quella iniziale.
    • desvription con l’entità e stata modificata. Tipo commit
    • display name è References Cited by VA bene
    • Avvertire l’utente del disastro imminente nel caso in cui provi a cancellare un volume
  • Meta

    • Fusione: chi ha più metadati compilati. A parità di metadato si tiene l’omid più basso
    • Issue github parallelizzazione virtuoso
    • frbr:partOf non deve aggiungere nel merge: https://opencitations.net/meta/api/v1/metadata/omid:br/06304322094
    • API v2
    • Usare il triplestore di provenance per fare 303 in caso di entità mergiate o mostrare la provenance in caso di cancellazione e basta.
  • RML

    https://github.com/oeg-upm/gtfs-bench

    • Chiedere Ionannisil diagramma che ha usato per auto rml.
  • Crowdsourcing

    • Quando dobbiamo ingerire Crossref stoppo manualmente OJS. Si mette una nota nel repository per dire le cose. Ogni mese.
    • Aggiornamenti al dump incrementali. Si usa un nuovo prefisso e si aggiungono dati solo a quel CSV.
    • Bisogna usare il DOI di Zenodo come primary source. Un unico DOI per batch process.
    • Bisogna fare l’aggiornamento sulla copia e poi bisogna automatizzare lo switch
  • docker compose atom melody, con un volume per gli asset. C’è una documentazione su come si lanciano entrambi fatti da Giulia Renda. Fine maggio

Archivio

06-12-2021

16-12-2021

22-12-2021

13-01-2022

20-01-2022

27-01-2022

03-02-2022

10-02-2022. Triplestore del terzo tipo

17-02-2022

22-02-2022

02-03-2022

09-03-2022

16-03-2022. Opinionated Meta model

22-03-2022. GraphDB vs Blazegraph

29-03-2022. Pattern per volumi e numeri

08-04-2022. Time-agnostic-library +300%

12-04-2022. Meta piantata

19-04-2022. 1 task per process and lock on files

06-05-2022. oc_meta è partita

13-05-2022. Time-agnostic-library ultra-compatibile

17-05-2022. Codice benchmark tab aggiornato

26-05-2022. Progetto di dottorato v1.0.0

07-06-2022. In preparazione alla lettera di risposta

21-06-2022. It’s outreach time

28-06-2022. SPARQL fun

19-07-2022. I wish my code will work at the first time

26-07-2022. Metadata ON AIR

30-08-2022. HDD = bottleneck

06-09-2022. Query combinate con le apette

13-09-2022. OpenCitations full automations

20-09-2022. OpenCitations full automated

29-09-2022. Catastrofe

06-10-2022. Threadripper

13-10-2022. Anche Crossref rompe i DOI

20-10-2022. OpenAIRE Research Graph

25-10-2022. OpenCitations Meta

03-11-2022. Fuso orario nella provenance

08-11-2022. Ottimizzazione API OC Meta

17-11-2022. JaLC e mEDRA

22-11-2022. Programmazione agile

01-12-2022. L’articolo su Meta è pronto

13-12-2022. indexapi_v2

20-12-2022. Il giorno del lancio

09-01-2023. AR order

17-01-2023. Inizio del dottorato

25-01-2023. Generic oc_ocdm

31-01-2023. merge tra entità con prefissi diversi

07-02-2023. rdflib-ocdm genera gli snapshot

14-02-2023. rdflib-ocdm merge

23-02-2023. Clef

28-02-2023. Accanimento

07-03-2023. oc_ocdm usa SHACLE

31-03-2023. Ritorno da Graz

17-04-2023. SPARQLWrapper timeout

27-04-2023. Conversione BEAR fatta

02-05-2023. Meta: 28 min → 3 min

09-05-2023. Bug autori API risolto

16-05-2023. Pseudocodice in LaTeX

23-05-2023. Pseudocodice come?

06-06-2023. Dump POCI

12-06-2023. 1:1 Bear

22-06-2023. Miracolo parte n

27-06-2023. OROCI fatto

17-07-2023. Graz

25-07-2023. Una-Her-Doc bureaucracy

12-09-2023. Mi è scappata la mano e ho finito il dottorato

26-09-2023. Articolo Meta fatto

03-10-2023. CZI first steps

10-10-2023. Display Rules

16-10-2023. Briciole di pane

03-11-2023. PhD a buon punto

10-11-2023. Provenance rotta

22-11-2023. Risolto il bug dei bug in Meta

11-01-2023. ExportKB dà problemi

14-12-2023. Meta rigenerato

18-12-2023. Merge delle entità duplicate

16-01-2024. AIUCD2024

23-01-2024. Programmazione tutoraggio

01-02-2023. Primo lancio dei test su BEAR

07-02-2024. time-agnostic-library da ripensare

14-02-2024. Errori in BEAR

21-02-2024. Habemus API

27-02-2024. Funzioni RML

05-03-2023. Check provenance

12-03-2024. Align data with triplestore

19-03-2024. supplier_prefix once again

26-03-2024. Ricorsione SPARQL manuale

05-04-2024. Revisione AIUCD

10-04-2024. OpenAlex ingerito

17-04-2024. Il lusso della qualità

23-04-2024. Ho sfasciato il PC

30-05-2024. Tijs

10-05-2024. Limiti inversione

20-05-2024. Primo tentativo di resuscitazione fallito

30-05-2024. Migrazione su Virtuoso

04-06-2024. Esoterismo virtuoso

11-06-2024. Migrazione riuscita

25-06-2024. R2RML tests completed

30-07-2024. Finalmente ho trovato i bug in Meta

03-09-2024. Creazione entità

09-11-2024. Tre entità alla volta

18-09-2024. HERITRACE: issue, volume, journal

27-09-2024. SHACL Advanced Features

01-10-2024. Contatori su Redis

08-10-2024. Nuove proprietà di entità esistenti

17-10-2024. Redesign catalogo

24-10/2024. HERITRACE online

31-10-2024. Correzione della provenance

07-11-2024. Ricerca su HERITRACE

11-11-2024. HERITACE è più bellino

21-11-2024. HERITRACE: Delete

28-11-2024. ASK. KEEP. DELETE

02-12-2024. Meta: disaster recovery

09-12-2024. HERITRACE: lock risorse

16-01-2025. Filtro input Meta

30-01-2025. Bug storici di Meta risolti

04-02-2025. Archiviazione automatica report validazione

23-02-2025. Revisione provenance DSH

20-02-2020. DSH2

27-02-2025. HERITRACE Francesca buggifixxi

06-03-2025. HERITRACE testato

13-03-2025. SPBv

19-03-2025. Ansible

25-03-2025. Top level search in nested search

02-04-2025. Script provenance Aldrovandi

16-04-2025. Interfaccia di merge

24-04-2025. Time Agnostic Mess

08-05-2025. Bulk load della provenance fatto

20-03-2025. HERITRACE 1.0.0

05-06-2025. Meta fulmine di guerra ed HERITRACE 1.0.0 terminata

10-06-2025. Merge CSV dumps light

24-06-2025. Test di usabilità su HERITRACE

01-07-2025. Starlight

08-07-2025. Ambiente DEMO

03-09-2025. Ho scritto la tesi

09-09-2025. csv,conf,v9


Tu vuo far el phdino
https://arcangelo7.github.io/p/dec37327560443e9a1ebd48f41f44f22/
Author
Arcangelo Massari
Posted on
October 5, 2025
Licensed under