Questo articolo si propone di esplorare l’impatto della tecnologia blockchain nel contesto della data science. Partendo dalla definizione e dalle caratteristiche dei big data, vengono esaminati gli effetti della blockchain su diversi aspetti dell’elaborazione dei dati, come la sicurezza, la privacy, la trasparenza e l’efficienza. Attraverso una revisione della letteratura scientifica, vengono presentati gli studi più rilevanti sul tema, fornendo un quadro esaustivo delle ricerche condotte fino ad oggi; vengono infine fornite considerazioni critiche e possibili direzioni future di ricerca.
L’impatto della blockchain sui big data
Negli ultimi anni, la tecnologia blockchain è divenuta oggetto di crescente attenzione grazie alla sua ampia applicabilità; allo stesso tempo, l’elaborazione dei big data ha rappresentato una sfida significativa per molti settori, e richiede soluzioni all’avanguardia per gestire il volume sempre crescente di informazioni (Deepa et al., 2022).
L’affermazione di nuovi approcci metodologici al mondo dei dati e alle tecnologie ha quindi aperto la strada ad ulteriori campi di indagine che riguardano l’interazione tra essi. Una domanda stimolante riguarda proprio come la tecnologia blockchain possa influenzare l’elaborazione dei big data, esplorando nuove opportunità.
Con la continua evoluzione delle tecnologie digitali, la mole di dati generati e raccolti sta crescendo in modo esponenziale, creando ambienti complessi in cui gestire, analizzare e trarre valore da queste informazioni. Affrontare una grande quantità di dati richiede quindi metodi innovativi e strumenti specifici. L’approccio tradizionale ai big data è basato principalmente su architetture centralizzate e database tradizionali. Tuttavia, questo modello mostra alcune limitazioni in termini di scalabilità, sicurezza e fiducia nei dati.
Ruolo e implicazioni della blockchain nell’elaborazione dei big data
In questo contesto, la blockchain è emersa come una tecnologia promettente per affrontare alcune delle sfide associate ai big data. In particolare, l’integrità, la trasparenza e la sicurezza offerte dalla blockchain possono contribuire a risolvere problemi come la manipolazione dei dati, la frode e la mancanza di fiducia nei sistemi centralizzati.
Deepa et al. (2022), in una review aggiornata, sottolineano l’importanza dei big data per le organizzazioni e individuano le potenziali implicazioni della blockchain nell’elaborazione dei dati.
In primo luogo vi è la sicurezza: la blockchain utilizza algoritmi crittografici per proteggere l’integrità e la confidenzialità dei dati, fornendo un meccanismo affidabile per la memorizzazione e la condivisione delle informazioni. Inoltre, la natura decentralizzata della blockchain supera la necessità di un’autorità centrale per gestire i dati, consentendo la creazione di reti peer-to-peer in cui i partecipanti possono condividere, accedere e validare i dati in modo diretto e autonomo; questo aspetto apre nuove possibilità per la collaborazione
e lo scambio di dati tra diverse organizzazioni o entità. Infine la trasparenza e l’immutabilità dei dati consentono una maggiore fiducia e verificabilità dei dati.
Applicazioni pratiche della blockchain sui big data
Per meglio comprendere l’impatto della blockchain sui big data, è fondamentale definire concetti chiave e caratteristiche di questi ultimi.
Big data, cosa sono?
I big data sono caratterizzati da tre dimensioni fondamentali: volume, velocità e varietà.
Il volume fa riferimento alla vasta quantità di dati generati e raccolti dalle diverse fonti, inclusi sensori, dispositivi mobili, social media e sistemi aziendali. La velocità indica la rapidità nella generazione e trasmissione dei dati, che spesso richiede una gestione tempestiva. La varietà riguarda la diversità dei tipi e delle strutture di dati (dati strutturati, non strutturati o semi strutturati).
Potenzialità della blockchain nella gestione dei big data
La blockchain offre caratteristiche che possono influenzare l’elaborazione dei big data in relazione a queste dimensioni. Ad esempio, la possibilità di archiviare grandi quantità di dati sulla blockchain può contribuire a gestire il volume dei dati stessi. La natura distribuita e la capacità di scalabilità della blockchain permettono di trattare grandi flussi di dati in tempo reale, sostenendo la velocità dei big data. Inoltre, essa può fornire un ambiente sicuro per la memorizzazione e la gestione di dati di diversa natura, contribuendo ad affrontare la varietà dei big data. Liu e colleghi (2020) identificano diverse implicazioni e potenziali applicazioni della tecnologia blockchain nell’ambito dei big data:
- Sicurezza dei dati: la blockchain offre un’architettura immutabile, in cui i dati possono essere crittografati e condivisi in modo trasparente. I big data possono essere gestiti in modo sicuro, riducendo il rischio di accessi non autorizzati, frodi o alterazioni dei dati.
- Tracciabilità e provenienza dei dati: grazie alla natura trasparente della blockchain, è possibile tracciare l’origine e la storia dei dati. Ciò è particolarmente utile per garantire la provenienza e l’integrità dei dati all’interno di un’ampia rete di partecipanti, consentendo una maggiore fiducia e tracciabilità nella gestione dei big data.
- Condivisione dei dati peer-to-peer: la blockchain permette la creazione di reti decentralizzate, in cui gli attori possono condividere e scambiare dati senza la necessità di intermediari. Ciò facilita la condivisione e l’accesso ai big data in modo rapido ed efficiente, favorendo la collaborazione e l’innovazione.
- Consenso e governance distribuita: la tecnologia blockchain utilizza algoritmi di consenso distribuito per raggiungere accordi sulla validità dei dati. Questo aspetto può essere applicato ai big data, consentendo la creazione di meccanismi di governance distribuita e consentendo una maggiore partecipazione e controllo dei dati da parte degli utenti.
- Smart contracts per l’elaborazione automatizzata dei dati: gli smart contracts, contratti digitali auto eseguibili basati sulla tecnologia blockchain, possono automatizzare l’elaborazione dei big data. Questi contratti possono eseguire operazioni specifiche sui dati in modo automatico e programmabile, consentendone una gestione efficiente e automatizzata.
- Monetizzazione dei dati: la blockchain può fornire un framework per la monetizzazione dei dati, consentendo agli utenti di vendere o scambiare i propri dati in modo sicuro e trasparente. Ciò crea opportunità per nuovi modelli di business basati sui dati, in cui i proprietari dei dati possono trarre valore dalle loro informazioni.
Possibili sviluppi futuri e direzioni di ricerca
Gli autori offrono quindi una visione critica delle limitazioni dei sistemi tradizionali rispetto al panorama dei big data, mettendo in evidenza come la blockchain possa contribuire a superare tali limiti e fornire soluzioni innovative.
Un database basato su blockchain consente di gestire ed elaborare grandi volumi di dati in modo sicuro e distribuito; questo concetto può essere cruciale nella gestione dei dati, adattandosi a numerosi aspetti quali la sicurezza, la privacy e la scalabilità, consentendo di tracciare l’origine e la provenienza dei dati provenienti da più fonti e di verificare l’integrità delle informazioni.
La blockchain applicata ai big data del settore sanitario
La maggior parte degli studi si concentra sull’applicazione della blockchain a big data in settori specifici. Un esempio per tutti è quello del lavoro di Ghayvat et al. (2022), i quali propongono un framework basato sulla blockchain per la condivisione dei dati sanitari, garantendo – anche in questo caso – privacy, sicurezza e tracciabilità dei dati. Il framework offre inoltre un meccanismo per la condivisione e l’accesso ai dati sanitari, facilitando la collaborazione tra diverse istituzioni e migliorando la qualità complessiva dell’assistenza sanitaria. Questo approccio potenzia la condivisione sicura dei dati sensibili e consente una migliore collaborazione tra le diverse entità coinvolte.
Il campo sanitario costituisce un ottimo esempio di come la tecnologia blockchain possa avere un impatto significativo sull’elaborazione dei big data, influenzando diversi aspetti cruciali; infatti ne risulta un incremento in termini di sicurezza e privacy dei dati (Jin et al. 2019; Soni et al., 2021), e di conseguenza di integrità e immutabilità delle informazioni. Inoltre, la trasparenza della blockchain migliora l’efficienza e la tracciabilità delle operazioni, facilitando la condivisione dei dati tra le parti interessate (Wang et al., 2023).
Date le premesse, risulta necessario svolgere ulteriori ricerche per approfondire aspetti tecnici, implicazioni pratiche e possibili applicazioni di questa convergenza per i numerosi settori interessati dai big data.
Alcuni possibili sviluppi e direzioni per la ricerca futura potrebbero includere l’approfondimento di modelli e algoritmi per garantire la privacy dei dati, consentendo la condivisione e l’elaborazione dei big data in modo sicuro e affidabile (Song et al., 2023). Inoltre lo studio di soluzioni per affrontare la scalabilità dei sistemi blockchain nell’ambito dei big data consentirebbe di trattare in modo efficiente grandi volumi di informazioni. Infine, l’utilizzo di algoritmi di consenso distribuito permetterebbe la gestione di grandi dataset all’interno di una rete blockchain, garantendo coerenza e affidabilità dei risultati. Queste sono solo alcune possibili prospettive per l’integrazione tra big data e sistemi blockchain based.
In conclusione, per affrontare le sfide associate all’elaborazione dei big data, sono necessari metodi innovativi e strumenti specifici. In questo contesto, la tecnologia blockchain emerge come una soluzione promettente, in quanto può essere applicata in modo efficace, favorendo la collaborazione tra diverse entità e consentendo la creazione di reti di fiducia.
Riferimenti:
– Deepa, N., et al. (2022). A survey on blockchain for big data: Approaches, opportunities, and future directions. Future Gener. Comput. Syst. 131, 209–226.
– Ghayvat, H., et al. (2022). CP-BDHCA: Blockchain-Based Confidentiality-Privacy Preserving Big Data Scheme for Healthcare Clouds and Applications, IEEE Journal of Biomedical and Health Informatics, 26 (5), 1937-1948.
– Jin, H., et al. (2019), A Review of Secure and Privacy-Preserving Medical Data Sharing, in IEEE Access, 7, 61656-61669.
– Liu, J., et al. (2020). Blockchain for Data Science. In Proceedings of the 2020 The 2nd International Conference on Blockchain Technology (ICBCT’20). Association for Computing Machinery, New York, NY, USA, 24–28.
– Soni, M., & Singh, D.K. (2021). Blockchain Implementation for Privacy preserving and securing the Healthcare data, 2021 10th IEEE International Conference on Communication Systems and Network Technologies (CSNT), 729- 734.
– Song, R., et al. (2023). A Survey of Blockchain-based Schemes for Data Sharing and Exchange, IEEE Transactions on Big Data, doi: 10.1109/TBDATA.2023.3293279. – Wang, M., et al. (2023). MedShare: A Privacy-Preserving Medical Data Sharing System by Using Blockchain, IEEE Transactions on Services Computing, 16 (1), 438-451.