Indica un intervallo di date:
  • Dal Al

Big data, opportunità e problemi

 

unnamed (1)
Cosa hanno in comune una pila di test psicologici, un hard-disk pieno di sequenze di DNA, un database di sondaggi di sociologia e una cartella di strutture cristallografiche su un cloud? Sono  aspetti di uno dei problemi più attuali con cui la ricerca odierna si deve confrontare: la produzione e la gestione di quantità immense di dati sperimentali, i cosiddetti Big Data. Tema vastissimo e articolato e ancora tutto da scoprire, per questo abbiamo  incontrato Antonella De Robbio, coordinatrice delle biblioteche del Polo Giuridico all’Università degli Studi Padova e referente per le questioni legate al diritto d’autore al Centro di Ateneo per le Biblioteche. Una lunga chiaccherata che riassumiamo per punti per maggiore chiarezza.

I Big Data, in campo scientifico (research data), possono essere di svariate tipologie e differenti ambiti disciplinari. Comprendono quelli provenienti da laboratori scientifici o da ricerche sociologiche; includono i dati sperimentali, ma anche gli articoli (paper) che da quei dati sono stati prodotti.

Tra i molti aspetti problematici di questo nuovo metodo di accumulare sapere scientifico, sono emersi 5 fattori critici:

• La condivisione e la validazione
Diventa sempre più fondamentale che i dati vengano messi a disposizione della comunità scientifica intera, per permettere allo stesso tempo un progresso molto più veloce e un controllo molto più efficace della veridicità delle conclusioni che dai dati sono tratte. Queste considerazioni sono alla base del movimento che propugna il diritto all’accesso aperto (open access) a tutta la letteratura scientifica.

• Archiviazione
Per essere scambiati, questi dati devono essere immagazzinati e conservati in modo sicuro, a lungo termine, senza corrompersi o andare persi. Nasce quindi il bisogno di grandi archivi fiduciari (trust repository) disponibili a tutti.

Rispetto della proprietà intellettuale
Allo stesso tempo, è necessario che sia riconosciuta la paternità delle scoperte, e delle loro applicazioni, che sono pur sempre una fonte di fondi preziosa per la ricerca.

Policy
Questo ci porta alla necessità di politiche armonizzate e condivise a livello istituzionale, nazionale e internazionale, con normative che regolino le interazioni tra tutti gli attori del processo: enti di ricerca, università, aziende, editoria scientifica, ecc. C’è assoluto bisogno di “buone pratiche”, regole coerenti e ben definite, nella gestione dei dati.

Responsabilità e ruoli
In tutte le problematiche esposte finora emerge la questione della responsabilità personale e istituzionale a tutti i livelli nel trattamento dei dati. Ciascun attore del processo deve assumersi la responsabilità insita nel proprio ruolo, che va definito a priori con chiarezza. L’obiettivo comune è quello di mettere in pratica nuove norme e nuovi comportamenti che tengano conto di queste trasformazioni della produzione di conoscenza.

Secondo Antonella DeRobbio, le Istituzioni devono appropriarsi di un ruolo chiave in questa rivoluzione, senza delegarlo al settore privato: pianificare la formazione dei giovani, creare nuove professioni legate alla gestione dei dati, delle licenze e della proprietà intellettuale, aprire nuovi sbocchi e investire in modo importante in questo ambito. E poi gestire i dati in modo consapevole e sistematico, sviluppandone una mappatura per tipologia e studiandone la migliore strategia di archiviazione.
Perché chi controlla i dati controlla il futuro.

di Sara Gasparetto, @Sara_Gasparetto  e Nabila Rassifi, @NabilaRassifi