Tu vuo far el phdino

Heritrace

Analisi dei dati

Test

  • Partecipanti finora
    • Utenti finali: 4
    • Configuratori: 4

Domande

Gentilissimo, Trattandosi di documentazione amministrativa, è possibile contattare anche gli uffici dell’ateneo partner e, a tal proposito, possiamo certamente scrivere noi ai colleghi. Le rammento, ad ogni modo, che dovrà anche richiedere il riconoscimento delle attività svolte durante la mobilità Erasmus al collegio di dottorato, presentando al collegio una lettera in carta intestata della sua referente di Leuven in cui siano indicate le attività svolte e un giudizio sulle stesse. Il collegio delibererà, di conseguenza, il riconoscimento delle attività da lei svolte durante il periodo di scambio Eramsus+. Se desidera supporto nel contattare gli uffici amministrativi di Leuven la prego di non esitare a chiedere. Saluti, Andrea Zaniboni, PhD

RML

  • Test dockerizzati
  • Recupero informazioni dallo schema originale. Utile per ricostruire ordine colonne e datatype se non inferibili dai mapping
  • considero bad mapping nel caso in cui la tabella originale abbia righe duplicate e il mapping non contenga informazioni sugli indici
  • Un altro caso di bad mapping sono mappature con solo costanti
  • Un altro caso di bad mapping è quello in cui una certa colonna non venga minimamente menzionata nel mapping e i dati di quella colonna non vengano minimamente menzionati nell’RDF prodotto tramite il mapping. In quel caso io posso anche recuperare dallo schema l’esistenza di quella colonna, però non ho poi modo di ricostruire i dati
  • Miglioramenti query SPARQL di inversione
    • Nomi variabili parlanti, non semplici numeri impossibili da debuggare. (?1, ?2, ?3) -> (?Name, ?StudentID, ?Name_2)
    • Più efficienti, non filter bind (bind da solo basta) e no bind vuoti, che tra l’altro causavano errori
    • No ENCODE_FOR_URI, che rende le query più complesse. Ciò che va encodato viene encodato direttamente via Python, tipo stringhe contenenti spazi dentro template. Questo ha permesso una semplificazione enorme del codice, perché è più semplice costruire le query
    • Rimosso OPTIONAL, non ha senso e rende le query più lente.
    • Benchmark con 10000 righe e 150k triple passato da 184 secondi a 6 e ha reso possibile il benchmark con 50k righe e 2 milioni di triple che prima andava in timeout. Quest’ultimo impiega comunque 55s

CSV,conf,v9

  • Promettiamo una data di lancio?
  • Non mi è chiaro se OJS estragga automaticamente le citazioni o meno
  • Sarebbe carico avere un mockup di OJS, no?
  • OJS è un software. Questo software potrebbe essere usato da riviste predatorie, che poi usato il plugin di OpenCitations. A noi questa cosa va bene? Immagino di sì perché puntiamo a essere universali, dopodiché è l’utente che decide cosa usare e cosa no. Chi decide quali journal sono trusted?
  • Io cosa voglio dal mio pubblico? Cosa gli sto chiedendo? Qual è la call to action?
  • Come si diventa trusted agent?

Domande

  • 1825 euro

Memo

  • Tesi
    • Aggiungere ParaText
    • Crowdsourcing future works
  • Csv,conf,v9

CSV,conf,v9
- Scrivo a Gazi per dire che sto presentando e vorrei mostrare un mockup se ne hanno uno. Nella email che gli mando dico che ho la presentazione nella stessa email gli dico di organizzare una ripresa dei lavori.

  • OpenCitations

    • Rifare dump (Crossref e Datacite)
    • Risolvere la questione ORCID
    • Rilanciare processo eliminazione duplicati
  • “reference”: { “@id”: “frbr:part”, “@type”: “@vocab” } → bibreference

  • “crossref”: { “@id”: “biro:references”, “@type”: “@vocab”} → reference

  • “crossref”: “datacite:crossref”

  • Ripubblicare dbpedia agnostica su Zenodo e si può usare time-agnostic-library su db pedia agnostica

  • oc_ocdm

    • Automatizzare mark_as_restored di default. è possibile disabilitare e fare a mano mark_as_restored.
  • https://opencitations.net/meta/api/v1/metadata/doi:10.1093/acprof:oso/9780199977628.001.0001

  • Guida per Meta e cerotti

  • DELETE con variabile

  • Modificare Meta sulla base della tabella di Elia

  • embodiment multipli devono essere purgati a monte

  • Portare il Meta Editor fuori. oc_editor

  • Modificare documentazione API aggiungendo omid

  • Heritrace

    • Per risolvere le performance del time-vault non usare la time-agnostic-library, ma guarda solo la query di update dello snapshot di cancellazione.
    • Ordine dato all’indice dell’elemento
    • date: formato
    • anni: essere meno stretto sugli anni. Problema ISO per 999. 0999?
    • Opzione per evitare counting
    • Opzione per non aggiungere la lista delle risorse, che posso comunque essere cercate
    • Configurabilità troppa fatica
    • Collegamento da review e articolo revisionato.
    • Timer massimo. Timer configurabile. Messaggio in caso si stia per toccare il timer massimo.
    • Riflettere su @lang. SKOS come use case. skos:prefLabel, skos:altLabel
    • Possibilità di specificare l’URI a mano in fase di creazione
    • la base è non specificare la sorgente, perché non sarà mai quella iniziale.
    • desvription con l’entità e stata modificata. Tipo commit
    • display name è References Cited by VA bene
    • Avvertire l’utente del disastro imminente nel caso in cui provi a cancellare un volume
  • Meta

    • Fusione: chi ha più metadati compilati. A parità di metadato si tiene l’omid più basso
    • Issue github parallelizzazione virtuoso
    • frbr:partOf non deve aggiungere nel merge: https://opencitations.net/meta/api/v1/metadata/omid:br/06304322094
    • API v2
    • Usare il triplestore di provenance per fare 303 in caso di entità mergiate o mostrare la provenance in caso di cancellazione e basta.
  • RML

    https://github.com/oeg-upm/gtfs-bench

    • Chiedere Ionannisil diagramma che ha usato per auto rml.
  • Crowdsourcing

    • Quando dobbiamo ingerire Crossref stoppo manualmente OJS. Si mette una nota nel repository per dire le cose. Ogni mese.
    • Aggiornamenti al dump incrementali. Si usa un nuovo prefisso e si aggiungono dati solo a quel CSV.
    • Bisogna usare il DOI di Zenodo come primary source. Un unico DOI per batch process.
    • Bisogna fare l’aggiornamento sulla copia e poi bisogna automatizzare lo switch
  • docker compose atom melody, con un volume per gli asset. C’è una documentazione su come si lanciano entrambi fatti da Giulia Renda. Fine maggio

Archivio

06-12-2021

16-12-2021

22-12-2021

13-01-2022

20-01-2022

27-01-2022

03-02-2022

10-02-2022. Triplestore del terzo tipo

17-02-2022

22-02-2022

02-03-2022

09-03-2022

16-03-2022. Opinionated Meta model

22-03-2022. GraphDB vs Blazegraph

29-03-2022. Pattern per volumi e numeri

08-04-2022. Time-agnostic-library +300%

12-04-2022. Meta piantata

19-04-2022. 1 task per process and lock on files

06-05-2022. oc_meta è partita

13-05-2022. Time-agnostic-library ultra-compatibile

17-05-2022. Codice benchmark tab aggiornato

26-05-2022. Progetto di dottorato v1.0.0

07-06-2022. In preparazione alla lettera di risposta

21-06-2022. It’s outreach time

28-06-2022. SPARQL fun

19-07-2022. I wish my code will work at the first time

26-07-2022. Metadata ON AIR

30-08-2022. HDD = bottleneck

06-09-2022. Query combinate con le apette

13-09-2022. OpenCitations full automations

20-09-2022. OpenCitations full automated

29-09-2022. Catastrofe

06-10-2022. Threadripper

13-10-2022. Anche Crossref rompe i DOI

20-10-2022. OpenAIRE Research Graph

25-10-2022. OpenCitations Meta

03-11-2022. Fuso orario nella provenance

08-11-2022. Ottimizzazione API OC Meta

17-11-2022. JaLC e mEDRA

22-11-2022. Programmazione agile

01-12-2022. L’articolo su Meta è pronto

13-12-2022. indexapi_v2

20-12-2022. Il giorno del lancio

09-01-2023. AR order

17-01-2023. Inizio del dottorato

25-01-2023. Generic oc_ocdm

31-01-2023. merge tra entità con prefissi diversi

07-02-2023. rdflib-ocdm genera gli snapshot

14-02-2023. rdflib-ocdm merge

23-02-2023. Clef

28-02-2023. Accanimento

07-03-2023. oc_ocdm usa SHACLE

31-03-2023. Ritorno da Graz

17-04-2023. SPARQLWrapper timeout

27-04-2023. Conversione BEAR fatta

02-05-2023. Meta: 28 min → 3 min

09-05-2023. Bug autori API risolto

16-05-2023. Pseudocodice in LaTeX

23-05-2023. Pseudocodice come?

06-06-2023. Dump POCI

12-06-2023. 1:1 Bear

22-06-2023. Miracolo parte n

27-06-2023. OROCI fatto

17-07-2023. Graz

25-07-2023. Una-Her-Doc bureaucracy

12-09-2023. Mi è scappata la mano e ho finito il dottorato

26-09-2023. Articolo Meta fatto

03-10-2023. CZI first steps

10-10-2023. Display Rules

16-10-2023. Briciole di pane

03-11-2023. PhD a buon punto

10-11-2023. Provenance rotta

22-11-2023. Risolto il bug dei bug in Meta

11-01-2023. ExportKB dà problemi

14-12-2023. Meta rigenerato

18-12-2023. Merge delle entità duplicate

16-01-2024. AIUCD2024

23-01-2024. Programmazione tutoraggio

01-02-2023. Primo lancio dei test su BEAR

07-02-2024. time-agnostic-library da ripensare

14-02-2024. Errori in BEAR

21-02-2024. Habemus API

27-02-2024. Funzioni RML

05-03-2023. Check provenance

12-03-2024. Align data with triplestore

19-03-2024. supplier_prefix once again

26-03-2024. Ricorsione SPARQL manuale

05-04-2024. Revisione AIUCD

10-04-2024. OpenAlex ingerito

17-04-2024. Il lusso della qualità

23-04-2024. Ho sfasciato il PC

30-05-2024. Tijs

10-05-2024. Limiti inversione

20-05-2024. Primo tentativo di resuscitazione fallito

30-05-2024. Migrazione su Virtuoso

04-06-2024. Esoterismo virtuoso

11-06-2024. Migrazione riuscita

25-06-2024. R2RML tests completed

30-07-2024. Finalmente ho trovato i bug in Meta

03-09-2024. Creazione entità

09-11-2024. Tre entità alla volta

18-09-2024. HERITRACE: issue, volume, journal

27-09-2024. SHACL Advanced Features

01-10-2024. Contatori su Redis

08-10-2024. Nuove proprietà di entità esistenti

17-10-2024. Redesign catalogo

24-10/2024. HERITRACE online

31-10-2024. Correzione della provenance

07-11-2024. Ricerca su HERITRACE

11-11-2024. HERITACE è più bellino

21-11-2024. HERITRACE: Delete

28-11-2024. ASK. KEEP. DELETE

02-12-2024. Meta: disaster recovery

09-12-2024. HERITRACE: lock risorse

16-01-2025. Filtro input Meta

30-01-2025. Bug storici di Meta risolti

04-02-2025. Archiviazione automatica report validazione

23-02-2025. Revisione provenance DSH

20-02-2020. DSH2

27-02-2025. HERITRACE Francesca buggifixxi

06-03-2025. HERITRACE testato

13-03-2025. SPBv

19-03-2025. Ansible

25-03-2025. Top level search in nested search

02-04-2025. Script provenance Aldrovandi

16-04-2025. Interfaccia di merge

24-04-2025. Time Agnostic Mess

08-05-2025. Bulk load della provenance fatto

20-03-2025. HERITRACE 1.0.0

05-06-2025. Meta fulmine di guerra ed HERITRACE 1.0.0 terminata

10-06-2025. Merge CSV dumps light

24-06-2025. Test di usabilità su HERITRACE

01-07-2025. Starlight

08-07-2025. Ambiente DEMO

03-09-2025. Ho scritto la tesi


Tu vuo far el phdino
https://arcangelo7.github.io/p/dec37327560443e9a1ebd48f41f44f22/
Author
Arcangelo Massari
Posted on
July 20, 2025
Licensed under