22-06-2023 Miracolo parte n

Novità

  • Meta
    • Il generatore di CSV cancella un’entità dal dump in JSON nel caso in cui questa non esista sul triplestore. Devo aver inavvertitamente interrotto il processo di Meta dopo l’aggiornamento del dump e prima del caricamento sul triplestore.
    • Implementato il multiprocessing per OROCI
      • Sqlite.Curson non è pickable → Redis
      • Processi totalmente indipendenti tra di loro. Ciascuno ha il suo dizionario doi-orcid
      • Ogni processo crea il suo collegamento a redis
    • Ho aggiornato Meta e oc_ocdm e OCDM con i nuovi tipi
  • Articolo SWJ
    • C’è un problema legato al consumo di memoria:
      • chunk più piccolo per il salvataggio su file e salvare
      • triple aggiunte e rimosse come liste di stringhe e non grafi
        • Queste informazioni vengono salvate su Redis (provare con un altro db)
    • Migliorata l’efficienza: un unica query a Redis per trovare tutte le entità che già hanno snapshot e un’unica query alla fine per aggiornare i contatori

22-06-2023 Miracolo parte n
https://arcangelo7.github.io/p/50ddcda00b0a4723879a50ff9169ff6b/
Author
Arcangelo Massari
Posted on
June 21, 2023
Licensed under