2023-07-25 Una-Her-Doc bureaucracy
Novità
Section titled “Novità”Sito (https://opencitations.net/download)
- Ho aggiunto i record di tutte le versioni di Meta. Ogni record include le informazioni su:
- Qual è stata la modifica principale
- Le statistiche
- Link alla versione del dump corrispondente su Figshare
JWS
- Ho implementato l’uso di PostgreSQL per salvare su disco le modifiche su cui basare la creazione degli snapshot e diminuire in questo modo il carico sulla RAM
- Tempi drasticamente aumentati
- Tentativo 1: multiprocessing e multithreading → collo di bottiglia. Dove? Non lo so
- Tentativo 2: richieste in batch a PostGreSQL, 1,000,000 di entità alla volta. Problema risolto
- Qualche statistica:
- Versione 1-2: 34 minuti
- Tempi drasticamente aumentati
- Le query di update vengono generate direttamente dalla stringa delle triple aggiunte e rimosse, senza passare da rdflib, che da solo rallenta enormemente il processo.
attachments/ea137a8ec3ea42e0ad6dae93f4969f9f.json
Una-Her-DOC

- Da questo calendario sembrerebbe che io debba partecipare a un workshop in presenza a novembre
- Marco Polo
attachments/f50f6a426cc44c42bcfdbec9facc6ad2.docx
California
- Volo pagato da CZI