Continua il percorso di digitalizzazione dell’Amministrazione Pubblica con il corso di formazione sul tema Open Data promosso da AVATAR. Anche per il secondo incontro con gli esperti è stato scritto un articolo riassuntivo da uno dei partecipanti di Cittadini Giornalisti Digitali.
Il 27 Maggio 2021, dalle 10:00 alle 12:00 si è tenuto il secondo incontro sugli open data (letteralmente dati aperti), organizzato da AVATAR, Alleanza per Azioni in Rete, rivolto alla Pubblica Amministrazione. Si tratta del secondo di tre incontri settimanali che permettono di avvicinare la Pubblica Amministrazione alla digitalizzazione e di rendere accessibili e interoperabili i dati che l’Amministrazione raccoglie, con il fine di agevolare la vita ai cittadini, alle imprese e a chiunque abbia interesse nel conoscere i dati di un determinato luogo.
Nel primo incontro, in data 20 Maggio, ci si è presi il tempo di definire nel dettaglio questi open data e le norme che devono seguire, durante il secondo incontro, invece, ci si è concentrati sui mezzi e le tecnologie che rendono open questi data.
Maurizio Napolitano, tecnologo e coordinatore del Digital Commons Lab e della Fondazione Bruno Kessler, insieme a Francesca De Chiara, ricercatrice per Digital Commons Lab e Fondazione Bruno Kessler, hanno curato gli interventi formativi e parlato degli strumenti utili per il riuso quotidiano dei dati.
Andiamo con ordine.
Il primo punto interessante toccato nel discorso di Napolitano sono state le licenze per la citazione di fonti terze (valide anche per foto, immagini e tanto altro). Ce ne sono di diversi tipi, a seconda degli obblighi che prevedono, e sono note come Creative Commons (abbreviato CC), presenti nella maggior parte delle foto e immagini su Google.
In Italia ci sono delle licenze create ad hoc dallo stato e dalle Regioni che regolano la citazione delle fonti e l’uso dei dati, e seguono di base il concetto delle Creative Commons. Ciò nonostante, l’Unione Europea ha rimproverato il nostro Stato perché questi provvedimenti sono scritti in italiano e questo è un ostacolo per chi non conosce la lingua. Dunque, in questo caso i dati non possono essere considerati open verso di loro.
In secondo luogo, è bene ricordare che il PDF non è un formato open, in quanto non si può operare al suo interno. Al contrario, tutto quello che si scrive e si pubblica su un sito internet è open, in quanto facilmente accessibile a basso costo.
Bisogna però fare attenzione a ciò che si scrive sui siti, specialmente su quelli di una Pubblica Amministrazione, che per la loro importanza istituzionale possono attirare l’attenzione di hacker e malintenzionati. Infatti, esiste una tecnica, chiamata web scraping, che permette a chiunque, anche con conoscenze informatiche base, di mappare un sito in profondità. Mappare significa svelare la tela di ragno che c’è dietro le pagine e i post del sito. Questa tecnica permette anche di legge quanto estratto dal sito in questione ed elabora dei dati. E’ un fatto grave, invasivo e potenzialmente pericoloso.
Il web scraping rende ancora più importante fare attenzione a cosa si scrive e soprattutto a non pubblicare informazioni sensibili o che rendano identificabili persone, aziende e quant’altro, in nessun caso. Rispettare la privacy è cruciale oggi più che mai.
A questo scopo, è utile che la Pubblica Amministrazione preveda in ogni sede un responsabile dell’attuazione del GPDR (Regolamento generale per la protezione dei dati personali), in quanto la formazione è il primo passo per prevenire danni. Un modo efficace per evitare di dare troppi dettagli è il segreto statistico.
Napolitano ha anche menzionato INSPIRE, una politica europea che regola le informazioni nello spazio, anche web.
L’ultima parte del discorso è stata un breve riassunto delle linee guida nazionali adottate dal 2017.
Elena Scalabrin GDC
1 Trackback