2024-04-17 Il lusso della qualità
La Novitade
Section titled “La Novitade”Meta
-
Ho indagato perché il numero di triple nell’RDF derivante dal triplestore continuasse a essere sbagliato.
- Problema di concorrenza? Yess, risolto
-
Ho migliorato il plugin per caricare su IA, rendendolo lanciabile da linea di comando passando il percorso a un file di configurazione YAML
identifier: meta-triplestore-2024-04-06file_paths:- /vltd/triplestore/meta/openalex_out/blazegraph.zipmetadata:identifier: meta-triplestore-2024-04-06mediatype: datacollection:- ia_biblio_metadata- theinternetarchivecreator: Arcangelo Massaridate: '2024-04-06'description: The OpenCitations Meta database stores and delivers bibliographic metadata for all publications involved in the OpenCitations Index.language: englicenseurl: http://creativecommons.org/publicdomain/zero/1.0/subject:- open citations- OpenCitations- OpenCitations Meta- RDF- triplestore- open data- CC0title: Meta triplestore data, archived on 2024-04-06website: https://opencitations.net/metayear: 2024access_key: ACCESS_KEYsecret_key: SECRET_KEY- Ho scritto a Internet Archive per risolvere il problema di permessi che mi impedisce di caricare il triplestore
-
Mi sono accorto che alla fine non avevo più aggiunto le fonti primarie alla provenance.
- Le ho ricavate dai dump di provenance passati anziché dalle sorgenti, per semplicità, sebbene consapevole che il risultato non potesse essere completo
- Con l’occasione, ho corretto l’errore della provenance di Crossref salvata come https://api.crossref.org/, inserendo il riferimento alla versione corretta (ad esempio, https://api.crossref.org/snapshots/monthly/2022/12/all.json.tar.gz)
- Così facendo, sono avanzate n entità di provenance senza fonte primaria
-
Script che trova tutti gli orfani. Cerca tutti i soggetti, tutti gli oggetti URI. Poi fa soggetti - oggetti - soggetti con oggetto URI e salva. Non cancella, trova e basta.
-
Script che trova tutte le br con più embodiment e li salva. Qui sono andato di query sparql (100G di RAM e passa la paura)
PREFIX frbr: <http://purl.org/vocab/frbr/core#>SELECT ?br (COUNT(?embodiment) as ?countOfEmbodiment)WHERE {?br frbr:embodiment ?embodiment .}GROUP BY ?brHAVING (COUNT(?embodiment) > 1)
AIUCD
- Integrato nell’abstract la risposta alle revisioni
- Rapporto con Cultural Heritage Data Space e European Collaborative Cloud for Cultural Heritage
- Criteri di valutazione
- Immagini
oc_ocdm
-
Guardando meglio oc_ocdm, in realtà il merge gestisce l’aderenza al data model. La presenza di pagine di pubblicazione multiple dopo il merge si spiega perché FRBR.embodiment non è considerata una functional property:
Altro
- Ho imparato a usare Docker e a configurare una serie di servizi