20-10-2022 OpenAIRE Research Graph
Cosa ho fatto
- Risolto un bug di OC Meta per cui DOI validi contenenti backslash rompevano le query SPARQL.
- Ho corretto a mano tutti i DOI invalidi contenenti backslash nell’input di OC Meta. Ecco l’elenco completo, da correggere su COCI:
10.2111/1551-5028(2004)057[0517:aabcsa]2.0.co;2 →
10.2111/1551-5028(2004)057[0517:AABCSA]2.0.CO;2
Il DOI invalido è stranamente un citato
10.2111/1551-5028(2004)057[0546:sdiamr]2.0.co;2 →
Il DOI invalido non si corregge rimuovendo i backslash
- Ho aggiornato il manuale del laboratorio di comp-think.
- Ho installato delle macchine virtuali con Windows e macOS per testare la procedura di installazione di Python ovunque.
- Per esempio, ho scoperto che Windows non resistuisce un messaggio di errore se si digita
python --version
da terminale e Python non è installato, ma restituisce un messaggio vuoto.
- Per esempio, ho scoperto che Windows non resistuisce un messaggio di errore se si digita
- Ho consigliato l’utilizzo di Powershell anziché cmd su Windows.
- Ho specificato che la procedura di installazione su Linux si riferisce a Ubuntu, perché altrimenti non c’è
apt
o cambia l’interfaccia grafica. Ammesso che qualcuno che usa Linux abbia bisogno di un tutorial su come si installa Python. - Ho scritto un cappello introduttivo sugli IDE
- Ho installato delle macchine virtuali con Windows e macOS per testare la procedura di installazione di Python ovunque.
- Per quanto riguarda l’articolo su OpenCitations Meta, ho scritto descritto l’OpenAIRE Research Graph, Springer Nature SciGraph e ScholarlyData. Manca Wikidata
Domande
JWS consiglia di inviare il software alla rivista Software Impact nel caso in cui l’articolo venga accettato (https://www.elsevier.com/journals/journal-of-web-semantics/1570-8268/guide-for-authors).
This journal encourages and enables you to share software that supports your research publication where appropriate, and enables you to interlink the software and data with your published article.You have the option to convert your open source software into an additional journal publication in Software Impacts, a multi-disciplinary open access journal that provides a scholarly reference to software that has been used to address a research challenge. It ensures that your software is actively reviewed, curated, formatted, indexed, given a DOI and publicly available to all upon publication. You are encouraged to submit your article to Software Impacts as an additional item If your research article is accepted. Please note an open access fee of 250 USD is payable for publication in Software Impacts. Full details can be found on the Software Impacts website. Please use this template to write your Software Impacts article.
Cosa ne pensate?
- Su Elsevier, non sembra esserci un modo ovvio per caricare la risposta ai revisori in modo che venga inviata ai nuovi revisori. Come faccio ad assicurarne? Supplementary material, anche copia delle review, specificare in cover letter e note all’editore.
I dump di OpenAIRE Research Graph, Springer Nature SciGraph, ScholarlyData e BioTea sono distribuiti con licenza CC-BY, CC-BY-SA o CC-BY-NC. Il dump di Meta sarà in CC0?
Da quello che ho letto la deduplicazione su ScholarlyData avviene sulla base dei nomi delle persone e usando un algoritmo di maching learning supervisionato, ma non tiene in considerazione la possibilità di omonimi. Vi risulta?
Sto scrivendo il sofware per aggiungere il fuso orario ai dati di provenance, sia in CSV che in nquads. Ho tre domande:
- Aggiungo il nostro fuso orario, Europe/Rome, +01:00, va bene?
- Ogni file in nquads è organizzati a blocchi, dove ogni blocco contiene tutte le quadruple di ciascuna entità. Dov’è il software che produce questo risultato? Così riutilizzo direttamente quello.
- Devo aggiungere il fuso orario solo all’ultimo dump o lo aggiungo a tutti i dump?
Perché IRIS mi rigetta le pubblicazioni? Mi ha rifiutato l’atto di convegno di ULITE e i software.
Secondo me non ha senso generare i CSV di OC Meta alla fine e si possono pubblicare quelli già generati.
- Infatti, via del preprocessing, non dovrebbe esserci alcuna differenza tra i CSV generati al primo colpo e quelli generati a posteriori.
- Tutti i conflitti sono stati gestiti in anticipo.
- Le entità presenti su più file sono state preprocessate con il maggior numero di informazioni disponibili.
- Infatti, via del preprocessing, non dovrebbe esserci alcuna differenza tra i CSV generati al primo colpo e quelli generati a posteriori.
Note
- C’è un bug della OpenCitations Indexes Search Interface. Se un DOI contiene un carattere da codificare nell’URL, l’interfaccia restituisce risultati solo l’utente inserisce il DOI già codificato. Ad esempio, il DOI 10.2111/1551-5028(2004)057[0613:cipfgl]2.0.co;2 restituisce risultati solo cercato come 10.2111/1551-5028%282004%29057%5B0613%3Acipfgl%5D2.0.co%3B2
- È curioso che nell’URL del secondo esempio i caratteri speciali vengono codificati due volte. Cioé, “(“ -> “%28” -> “%2528”, dove “%25” è la codifica del carattere “%”