I Big Data sono una delle evoluzioni più profonde e pervasive del mondo digitale. Questo trend è destinato a rimanere e a incidere profondamente sulla nostra vita, ma non solo. È anche destinato cambiare il nostro modo di fare business.
In questo momento di grande innovazione tecnologica come quello attuale, però, il contesto economico e geopolitico costringe le imprese a muoversi in una situazione di grande incertezza. Tuttavia, i dati rappresentano una risorsa preziosa per imprese e istituzioni. Grazie ai Business Analytics, infatti, i Big Data offrono l'opportunità di estrarre informazioni significative e prendere decisioni consapevoli.
Ma cosa si intende con il termine Big Data e perché sono importanti per le aziende? Come vengono raccolti i Big Data e quali sono le metodologie di Business Analytics? Quanto vale il mercato dei Big Data in Italia? Le domande sono tante e le implicazioni toccano anche ambiti trasversali e sensibili come quello della Privacy e della tutela dei dati personali. Proviamo a rispondere ai quesiti con la Ricerca dell'Osservatorio Big Data & Business Analytics del Politecnico di Milano, da anni punto di riferimento per gli innovatori del settore.
In questa pagina:
- Che cosa sono i Big Data e i Business Analytics
- Qual è l'obiettivo dei Big Data e dei Business Analytics
- Big Data: dalle 3V alle 6V
- Analizzare i Big Data: i Business Analytics
- Dentro la trasformazione "data-driven" delle aziende
- Chi analizza i Big Data: le competenze per gestire la Data Science
- I trend tecnologici dei Big Data e dei Business Analytics
- La diffusione dei Big Data e dei Business Analytics in Italia
- La Privacy ai tempi dei Big Data Analytics
Che cosa sono i Big Data e i Business Analytics?
Per comprenderne le caratteristiche e la rilevanza nelle strategie aziendali è importante definire chiaramente cosa si intende per Big Data.
Per capire cosa sono i Big Data pensiamo un attimo al nostro quotidiano: interazioni sui Social Network, un click su un sito web, i nostri smartphone interconnessi. Tutto ciò genera una mole di dati incredibilmente più elevata di qualche decennio fa. Enormi volumi di dati eterogenei per fonte e formato, analizzabili in tempo reale: tutto questo sono i Big Data.
La definizione di Big Data non è però sufficiente per offrire un quadro completo del fenomeno. La trasformazione in atto è più profonda, cambia il processo di raccolta e gestione dei dati, si evolvono le tecnologie a supporto del ciclo di vita del dato e si sviluppano nuove competenze e professioni per la valorizzazione del dato (come quella del Data Scientist, che vedremo meglio in seguito). In questo contesto, assume un’importanza fondamentale l'output derivante dall'analisi dei Big Data, che prende il nome di Big Data Analytics, assimilabile al concetto più ampio di Business Analytics.
Qual è l'obiettivo dei Big Data e dei Business Analytics
I Big Data sono il nuovo petrolio e saperne estrarre valore è la vera chiave competitiva per grandi aziende e PMI. La definizione di Big Data appena fornita in questa guida, sebbene utile, non basta per cogliere appieno l’importanza dei Business Analytics, per loro natura inscindibile dai Big Data.
Sono le competenze e le tecnologie dei Business Analytics a trasformare i dati grezzi in informazioni di valore per i decision maker aziendali: è oggi possibile ottenere vantaggio competitivo grazie a decisioni tempestive e più informate, non solo per le organizzazioni più grandi, ma anche per le piccole e medie imprese.
La rilevanza dei Big Data e dei Business Analytics è confermata anche dai numeri: il mercato, come vedremo nel seguito della guida, continua a crescere e la gestione dei Big Data si conferma ai vertici tra le priorità di investimento di CIO e Innovation Manager italiani.
Come vengono utilizzati i Big Data: i benefici per le imprese
I Big Data e i Business Analytics possono essere utilizzati nelle aziende in vari modi, a seconda degli obiettivi da raggiungere. Attraverso di essi è possibile ottenere molteplici benefici, ad esempio si possono generare vantaggi di tipo economico. Possono, infatti, migliorare l’engagement con il cliente, contribuire ad aumentare le vendite e a diminuire il time to market, ampliare la propria offerta di prodotti e servizi, ma possono anche identificare nuovi mercati, ottimizzare l’offerta attuale e, infine, possono ridurre i costi.
Cosa si può fare con i Big Data: gli impatti sulla Società
Oltre a essere un vantaggio per le aziende, i Big Data possono avere anche impatti positivi a livello sociale. I dati diventano un patrimonio per la collettività, contribuiscono a creare posti di lavoro, a ripristinare i bilanci delle Pubbliche Amministrazioni e a monitorare il comportamento online degli utenti. Infine, contribuiscono all'ottimizzazione di vari settori, incluso quello sanitario, il turismo e quello per la gestione delle catastrofi naturali. I Big Data possono, dunque, salvare delle vite e, in generale, migliorare la qualità delle stesse.
Big Data: dalle 3V alle 6V
Per spiegare ancora meglio l'evoluzione dei Big Data non si può non rispondere ad una domanda: cosa sono le loro 5V? Per farlo dobbiamo introdurre un po' di storia di questo paradigma tecnologico. Era il 2001 quando, Doug Laney, all'epoca vicepresidente e Service Director presso l'azienda Meta Group, introdusse il Modello delle 3V dei Big Data.
In questo modello, le 3V dei Big Data elencate da Laney si riferiscono a Volume, Velocità e Varietà. Questo modello, semplice e conciso, è nato con lo scopo di definire i nuovi dati generati dall'incremento delle fonti informative e, in generale, dalle nuove evoluzioni tecnologiche.
Nel corso del tempo, queste 3V dei Big Data definite dal modello di Laney sono state ulteriormente arricchite da altre due V. Sono state, infatti, aggiunte Veridicità e Variabilità. Negli ultimi anni, infatti, alle 5V dei Big Data si è aggiunto il Valore generato dai dati, portando coì il totale a 6V. Vediamo, con un elenco dettagliato, a cosa si riferiscono queste 6V riferite ai Big Data:
- Veridicità, dove per Veridicità dei Big Data, si intende la qualità e l'affidabilità dei dati
- Volume, dove per volume si intendono le elevate moli di dati o in forte crescita
- Velocità dove per Velocità si intende quanto i Dati generati e acquisiti vengono raccolti rapidamente
- Varietà dove si intende per Varietà i Dati eterogenei per fonte e formato
- Variabilità, dove per variabillità si intende la mutevolezza del significato in base al contesto
- Valore, dove per Valore si intende la fonte di valore economico-finanziario
Analizzare i Big Data: i Business Analytics
Analizzare i Big Data permette di generare nuova conoscenza utile per prendere decisioni più consapevoli, in ambito business e non solo. Dall’incremento delle revenue, tramite ottimizzazioni dei processi produttivi e miglioramento del customer engagement, fino alla diminuzione dei rischi aziendali, passando per la riduzione dei costi complessivi, i Business Analytics hanno un impatto in tutti i processi.
L’analisi dei Big Data è resa possibile da diversi elementi. In primis da tecnologie che permettono di gestire anche dati destrutturati e processare ampi volumi di dati in tempo reale. In secundis, dalla diffusione di algoritmi e metodologie di analisi innovative, in grado di estrapolare autonomamente le informazioni nascoste nei dati.
Dopo la teoria e le prime definizioni del mondo Big Data, è bene passare alla pratica. Iniziamo dunque facendo il punto sulle principali progettualità e metodologie di Business Analytics:
Descriptive Analytics
I Descriptive Analytics sono strumenti di Business Analytics volti a descrivere la situazione attuale e passata dei processi aziendali e/o aree funzionali. Questi strumenti consentono di visualizzare i dati attraverso grafici contenenti i principali indicatori. Si tratta di una tipologia di dati che mira a illustrare cosa è successo e/o cosa sta succedendo, senza fare previsioni per il futuro. Per questo motivo vengono utilizzati per le tradizionali operazioni di Business Intelligence. I Descriptive Analytics rappresentano infatti una classe “semplice” di modelli di Analytics rispetto ai differenti modelli di Advanced Analytics, di cui parleremo nei prossimi paragrafi.
Advanced Analytics
Gli Advanced Analytics, come suggerisce l'espressione stessa, sono metodologie avanzate di Business Analytics, che hanno finalità almeno predittive. Hanno, dunque, l’obiettivo di fornire supporto decisionale ai diversi decision-maker aziendali. Questo modello consente pertanto di rispondere a domande come “cosa succederà”, ma non solo. All’interno degli Advanced Analytics esistono più categorie, quali Predictive Analytics, Prescriptive Analytics e Automated Analytics. Vediamole più nel dettaglio:
Predictive Analytics
I Predictive Analytics sono strumenti avanzati che effettuano l’analisi dei dati per rispondere a domande relative a cosa potrebbe accadere nel futuro. Per farlo utilizzano tecniche matematiche complesse, come forecasting, regressione, modelli predittivi, ecc.
Prescriptive Analytics
I Prescriptive Analytics sono invece strumenti avanzati che utilizzano le analisi svolte attraverso i Descriptive Analytics e i Predictive Analytics per proporre al decision-maker diverse soluzioni strategiche. Sarà poi quest’ultimo a scegliere l’alternativa più opportuna.
Automated Analytics
Gli Automated Analytics sono strumenti capaci di scegliere e di implementare autonomamente l’azione proposta in base al risultato delle analisi dati svolte. Nonostante rappresentino un’evoluzione dei Predictive Analytics, gli Automated Analytics non costituiscono necessariamente il fine ultimo dei Business Analytics. In alcune circostanze l'intervento umano potrebbe risultare più adatto rispetto alle azioni automatizzate.
Come impostare un progetto di Business Analytics
A questo punto occorre capire come realizzare un progetto di Business Analytics. Analizzare e gestire i Big Data all'interno di un'azienda vuol dire fronteggiare diverse sfide. Queste sono legate agli obiettivi di business da perseguire, agli strumenti tecnologici a disposizione e alle competenze da introdurre. I progetti di Business Analytics possono essere classificati in base al livello di maturità delle metodologie utilizzate nell’analisi dati. Quasi tutte le organizzazioni fanno uso di Descriptive Analytics, ma sta aumentando in modo considerevole anche la parte relativa ai livelli successivi più avanzati, grazie anche all’ingresso di figure professionali altamente specializzate.
A cosa possono servire i Big Data e i Business Analytics: gli esempi applicativi
Dai dispositivi connessi ai Social Network, dai satelliti al web, l’esplosione della mole di dati a disposizione e l’evoluzione delle tecnologie per raccoglierli, gestirli e analizzarli ha aperto nuovi scenari e opportunità. Sono tanti gli esempi applicativi che possono aiutare a rendere tale idea, dal loro utilizzo nel Marketing e nella comunicazione, al loro contributo nella prevenzione delle frodi, passando per l'ottimizzazione dei flussi turistici e il loro utilizzo in sanità.
I dati raccolti dai siti web aziendali sugli utenti, per esempio, permettono di intercettare nuovi prospect, oppure di elaborare sistemi di raccomandazione per attività di cross-selling. I dati ricavati dagli smart watch, invece, consentono di rilevare in tempo reale paramenti vitali per la nostra salute. Gli esempi delle applicazioni concrete dei Big Data e dei Business Analytics sono molteplici e ciascuno di essi ha il potenziale di impattare processi, siano essi per le aziende o per la società.
Dentro la trasformazione "data-driven" delle aziende
Attuare progetti di Business Analytics per ottenere un vantaggio competitivo dai Big Data rappresenta il primo passo per attuare strategie data-driven (ossia guidate dai dati).
Cosa si intende per data driven
Con il termine data-driven si intende la costruzione di processi decisionali basati sulle informazioni estraibili dai dati, anche attraverso una rivisitazione dei modelli di governance. Per supportare le aziende nella trasformazione data-driven, l’Osservatorio ha sviluppato un framework di sintesi, denominato “Analytics Skill Journey”. Questo framework è fondato sulla capacità di analizzare e interpretare i dati e sulla formazione di un team altamente specializzato, ed è dotato di competenze trasversali riguardanti gli ambiti di Business Analytics e IT.
I metodi per realizzare strategie di business data-driven negli anni sono cambiati. Si sono evolute le metodologie per creare business analytics e sono emerse nuove materie in risposta alle necessità moderne. La Business Intelligence tradizionale ha visto un’evoluzione nella Data Science, che si basa su metodologie più sofisticate e soprattutto Big Data. Ciò ha richiesto un’accelerazione della Data Management aziendale, necessitando l’affiancamento dalla Data Governance per definire policy aziendali che supporteranno l’implementazione della Data Strategy. In questa parte della guida analizziamo più nel dettaglio tutti gli aspetti che caratterizzano la trasformazione data-driven delle aziende.
Business Intelligence: cos’è
La business intelligence si concentra sull'utilizzo di dati strutturati storici per generare rapporti, dashboard o visualizzazioni interattive in supporto al decision-maker aziendale. La business intelligence più tradizionale fornisce agli utenti aziendali una panoramica approfondita delle performance aziendali passate o di altri indicatori. Gli output sono quindi tipicamente i descriptive analytics.
Cos’è la Data Science
La Data Science è una scienza interdisciplinare che abbraccia la Statistica, la Matematica, la Computer Science, la Data Visualization e la comprensione delle variabili e del linguaggio gestionale. Questa scienza ha origini negli anni '70 ed era inizialmente concepita come mera disciplina per lo studio dei dati. Con l'avvento dei Big Data, la Data Science ha un ruolo sempre più di primaria importanza nei contesti aziendali. Si occupa non solo dell'analisi dei dati, ma anche dell'estrazione di informazioni per i processi di business.
Cos’è il Data Management
Si dice che l’80% del tempo dei Data Scientist sia dedicato alla preparazione e alla pulizia dei dati. Varietà, volume, velocità, veridicità e variabilità: maggiore è la complessità dei dati, maggiore è il tempo da dedicare ad attività preliminari all’analisi. Il Data Management consente lo “sviluppo e esecuzione di architetture, policy, pratiche e procedure che permettono di gestire propriamente le esigenze legate al ciclo di vita dei dati all’interno di un’azienda”. Le norme, però, impongono sempre maggiore attenzione sul trattamento dei dati, per tale motivo gli strumenti di Data Management (e di Data Governance) sono in grande e costante evoluzione.
Data Governance: a cosa serve
La Data Governance gestisce processi, persone, metodologie e tecnologie, con l'obiettivo di trattare in modo corretto i dati. A tal fine, vengono stabilite regole riguardanti l’accesso, l’uso e l’identificazione dei soggetti coinvolti e le loro responsabilità. Parlare di Data Governance non significa, dunque, parlare solo di tecnologie, ma di un insieme di strategie, regole e processi aziendali. Il suo scopo è quello di garantire un controllo su processi e metodi aziendali, di prevenire criticità e di suggerire best practice in caso di problemi creati dalla scarsa qualità dei dati raccolti.
Che cosa è la Data Strategy
La Data Strategy è un piano d’azione di lungo termine volto al raggiungimento di un obiettivo specifico: valorizzare internamente e/o esternamente i dati. Strutturare una buona Data Strategy, allineata agli obiettivi di business e in grado di gestire Big Data, significa attuare una Data Governance efficace, sviluppare progetti di Advanced Analytics, passando per la monetizzazione diretta dei dati e per l’introduzione di nuovi strumenti tecnologici e organizzativi.
Chi analizza i Big Data: le competenze per gestire la Data Science
L'avvento dei Big Data fa breccia nelle aziende sotto diversi aspetti. Cambiano le priorità di investimento, evolvono tecnologie e modelli interpretativi. Di conseguenza, le aziende corrono ai ripari, creando veri e propri team di professionisti volti alla gestione e alla valorizzazione di questa grande mole di dati, i cosiddetti "specialisti della Data Science".
Ecco le cinque professioni fondamentali a cui deve rifarsi un'azienda "data-driven" per formare un team esperto di Big Data e Business Analytics.
Data Analyst
Il Data Analyst è colui che esplora, analizza e interpreta i dati, con l’obiettivo di estrapolare informazioni utili al processo decisionale. In altre parole, l’obiettivo del suo lavoro è ricercare evidenze quantitative all’interno di grandi moli di dati. L’obiettivo è quello di supportare le decisioni di business.
Data Scientist
Per molti è il mestiere del futuro. Per altri è già quello del presente. Il Data Scientist è la figura professionale che comunemente si associa alla capacità di gestire i Big Data e trarne informazioni rilevanti. Si occupa delle fasi di sviluppo, training e testing di modelli statistici e algoritmi di apprendimento automatico.
Data Engineer
Il Data Engineer è una figura tecnica che si occupa di gestire le fasi di raccolta, processamento e integrazione dei dati. Il suo compito è quello di rendere i dati disponibili per le analisi nel giusto formato e in modo tempestivo. Questo può avvenire anche in contesti complessi, come l’integrazione di fonti non eterogenee.
Data Science Manager
Il Data Science Manager gestisce l'intero processo di Data Science, coordinando un team centralizzato e favorendo la crescita e la formazione di figure di Data Science distribuite in azienda.
Analytics Translator
L’Analytics Translator funge da "Traduttore" tra la Data Science e il business. Sa tradurre gli use-case in linguaggio analitico ed è in grado di interpretare i risultati delle analisi per i decision-maker aziendali.
I trend tecnologici dei Big Data e dei Business Analytics
Oltre alle competenze utili alla gestione della Data Science, un altro elemento abilitante la valorizzazione dei Big Data è l’infrastruttura tecnologica. Le tecnologie più innovative permettono lo sviluppo di analisi avanzate (abilitate dagli algoritmi di Machine Learning), l’ingestione e l’analisi dei dati in tempo reale e l’integrazione di tipologie di dati sempre più eterogenee.
L’ecosistema tecnologico legato ai Big Data è però estremamente vario, tanti sono i nuovi strumenti e numerose le nuove sfide da affrontare. Per comprendere come costruire un’architettura Big Data, tecnologicamente all'avanguardia proviamo a fare ordine sulle principali scelte tecnologiche e sui processi di "gestione del dato":
Machine Learning
Il Machine Learning, o “apprendimento automatico”, è un sistema di Artificial Intelligence che consente di prevedere il comportamento dei clienti e il riconoscimento di immagini. Le sue potenzialità future, però, sono assai più numerose.
Real Time Analytics
I Real Time Analytics svolgono un’analisi dei dati in tempo reale, favorendo così la velocità di quest'ultima. Si tratta di uno dei maggiori vantaggi competitivi per le aziende. Ciò sia in termini di processi interni che di miglioramento dei prodotti.
Nuove Architetture
La grande quantità di dati raccolti implica anche nuovi approcci architetturali. I sistemi open source (su tutti il framework software Hadoop) per l’analisi parallela di dati o per l’analisi in tempo reale contribuiscono alla nascita di nuovi modelli di Analytics all’interno di una corretta Data Architecture.
Hybrid Cloud
L’Hybrid Cloud permette di connettere il proprio ambiente privato con uno o più sistemi di Public Cloud e soluzioni on-premises. Consente così di limitare i movimenti dei dati e di eseguire le analisi dove i dati sono memorizzati.
Data Literacy
La Data Literacy consiste nella capacità di organizzare e interpretare i dati per comunicare informazioni, descrivendo un fenomeno attraverso di essi. Si tratta di una competenza sempre più importante per le aziende, soprattutto tra le figure manageriali.
Data Monetization e Data-as-a-service
Poiché i Big Data sono diventati una “materia prima” che attira sempre più investimenti, venderne le informazioni derivanti significa monetizzare e generare business. La Data Monetization a sua volta necessita di un’ampia fornitura di dati on-demand, costituendo la base del paradigma del Data-as-a-Service (DaaS).
Data Integration: dal Data Warehouse al Data Lake
Oggi molte aziende gestiscono ancora i dati con soluzioni tradizionali come i silos o i Data Warehouse. Gli attori più proattivi, però, si stanno muovendo verso strumenti più avanzati per la Data Integration per unificare le diverse sorgenti di dati. Il modello di integrazione Data Lake è uno di questi.
Data Visualization: raccontare i Big Data
La Data Visualization consente di raccontare fenomeni più o meno complessi attraverso grafici e infografiche. Dopo l’avvento dei Big Data, nelle aziende si sono resi necessari strumenti di visualizzazione più evoluti. Dal classico report, ci si è orientati verso i concetti di dashboard, per sopperire alla necessità degli utenti di rappresentare fenomeni complessi e dinamici, in tempo reale e in totale autonomia.
La diffusione dei Big Data e dei Business Analytics in Italia
Abbiamo definito i Big Data sia da un punto di vista teorico (cogliendone significato, importanza, storia e valore) sia da un punto di vista pratico (attraverso le metodologie di Business Analytics, le competenze e le tecnologie per gestirli). Ma quanto è veramente diffuso il tema dei Big Data e dei Business Analytics tra le aziende italiane?
Prima di tutto, è opportuno precisare che il contesto geopolitico ed economico che ha caratterizzato gli ultimi anni ha influenzato notevolmente le imprese, che si trovano in una situazione di grande incertezza.
Ciò nonostante, secondo la Ricerca dell’Osservatorio Big Data & Business Analytics, nel 2023 la spesa delle aziende italiane in risorse infrastrutturali, software e servizi per la gestione e analisi dei dati è cresciuto del +18%. Il valore totale raggiunto è stato pari a 2,85 miliardi di euro. Le grandi imprese assorbono l’83% della spesa totale, contro il 17% delle microimprese e PMI.
La crescita trainata dalla componente Cloud, che pesa circa il 27% della spesa in soluzioni e servizi Data Management & Analytics. La Cloud Transformation è infatti un’evoluzione ritenuta ormai necessaria per perseguire la cosiddetta Data Strategy.
In crescita risultano anche gli strumenti per abilitare progetti di Advanced Analytics, come piattaforme di Data Science e soluzioni di Artificial Intelligence. La Generative Artificial Intelligence, in particolare, ha ampliato (e sta tutt’ora ampliando) le opportunità nell’ambito della gestione e dell’analisi dei dati.
Basti pensare che dopo il lancio di ChatGPT nel novembre 2022, nel luglio 2023 la società OpenAI ha reso disponibile il plugin Code Interpreter per l’analisi dei dati, attraverso cui è possibile caricare ed estrarre insight, anche da dataset di grandi dimensioni.
La Privacy ai tempi dei Big Data Analytics
Tutto questo proliferare di Big Data, opportunità per il business, metodologie, competenze e tecnologie ci pone davanti il problema della privacy. Chiudiamo quindi la lunga guida con un approfondimento sull'impatto dei Business Analytics sulla protezione dei dati personali.
L'analisi e la gestione dei Big Data comportano enormi criticità dal punto di vista del trattamento dei dati personali e della tutela della privacy. L'entrata in vigore del GDPR, inoltre, ha ridisegnato i confini della protezione dei dati personali, basati sui concetti di liceità, correttezza e trasparenza, consenso, limitazione della finalità, minimizzazione ed esattezza.
In questo contesto, per promuovere la crescita economica la Commissione europea si pone l’obiettivo di creare uno spazio unico europeo di dati. Attraverso la Strategia Europea in materia di dati, la Commissione vuole costituire un mercato unico e sicuro di dati, personali e non personali (inclusi i dati commerciali sensibili), in cui le imprese possano accedere facilmente a un’alta quantità e qualità dei dati. Il Data Governance Act e il Data Act costituiscono delle iniziative legislative per favorire la condivisione dei dati e di favorire un accesso e un riutilizzo equo degli stessi.