27-06-2023 OROCI fatto

Meta

  • Software che scarta le risorse in cui tutti gli id sono già presenti su Redis
    • OROCI: 5,879,707 entità nuove
      • Rimosse righe perfettamente identiche: 2,097,967
      • Rimosse righe identiche tenendo in considerazione id, autori ed editor in ordine diverso: 1,959,360
    • OROCI è in Meta
  • Aggiunto create_arxiv a oc_ocdm e a Meta
  • Software per generare l’input di Meta a partire dai dati forniti dal gruppo di OpenScience di Olga, Marta, Lorenzo e Sara.
    • Righe totali: 67,241,628
    • Righe senza duplicati: 15,148,903
    • Ho usato Redis per scartare tutti gli id già presenti in Meta e ho rimosso i duplicati
      • Righe risultanti: 58,268
    • Gli id mancanti sono in Meta
  • Ivan mi ha fornito un file con 1,190,770 id diversi mancanti in Meta
    • Usando Redis, risulta che quelli effettivamente mancanti sono
  • Ho mandato l’articolo a QSS

BEAR

  • Le modifiche vengono salvate e recuperate da un db PostgreSQL

27-06-2023 OROCI fatto
https://arcangelo7.github.io/p/1fdc88a912434a9ba5a15a4e258dc025/
Author
Arcangelo Massari
Posted on
June 26, 2023
Licensed under