17-04-2024 Il lusso della qualità

La Novitade

Meta

  • Ho indagato perché il numero di triple nell’RDF derivante dal triplestore continuasse a essere sbagliato.

    • Problema di concorrenza? Yess, risolto
  • Ho migliorato il plugin per caricare su IA, rendendolo lanciabile da linea di comando passando il percorso a un file di configurazione YAML

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    identifier: meta-triplestore-2024-04-06
    file_paths:
    - /vltd/triplestore/meta/openalex_out/blazegraph.zip
    metadata:
    identifier: meta-triplestore-2024-04-06
    mediatype: data
    collection:
    - ia_biblio_metadata
    - theinternetarchive
    creator: Arcangelo Massari
    date: '2024-04-06'
    description: The OpenCitations Meta database stores and delivers bibliographic metadata for all publications involved in the OpenCitations Index.
    language: eng
    licenseurl: http://creativecommons.org/publicdomain/zero/1.0/
    subject:
    - open citations
    - OpenCitations
    - OpenCitations Meta
    - RDF
    - triplestore
    - open data
    - CC0
    title: Meta triplestore data, archived on 2024-04-06
    website: https://opencitations.net/meta
    year: 2024
    access_key: ACCESS_KEY
    secret_key: SECRET_KEY
    • Ho scritto a Internet Archive per risolvere il problema di permessi che mi impedisce di caricare il triplestore
  • Mi sono accorto che alla fine non avevo più aggiunto le fonti primarie alla provenance.

  • Script che trova tutti gli orfani. Cerca tutti i soggetti, tutti gli oggetti URI. Poi fa soggetti - oggetti - soggetti con oggetto URI e salva. Non cancella, trova e basta.

  • Script che trova tutte le br con più embodiment e li salva. Qui sono andato di query sparql (100G di RAM e passa la paura)

    1
    2
    3
    4
    5
    6
    7
    PREFIX frbr: <http://purl.org/vocab/frbr/core#>
    SELECT ?br (COUNT(?embodiment) as ?countOfEmbodiment)
    WHERE {
    ?br frbr:embodiment ?embodiment .
    }
    GROUP BY ?br
    HAVING (COUNT(?embodiment) > 1)

AIUCD

  • Integrato nell’abstract la risposta alle revisioni
    • Rapporto con Cultural Heritage Data Space e European Collaborative Cloud for Cultural Heritage
    • Criteri di valutazione
    • Immagini

oc_ocdm

Altro

  • Ho imparato a usare Docker e a configurare una serie di servizi

17-04-2024 Il lusso della qualità
https://arcangelo7.github.io/p/a35381b97b6448f69c31c0956c6e4a3d/
Author
Arcangelo Massari
Posted on
April 16, 2024
Licensed under