Big Data Scientist: storia di una professione

25 gennaio 2018 / Di Filippo Leccardi / 2 Comments

Il Data Scientist è la figura professionale che comunemente si associa alla capacità di gestire i Big Data e trarne informazioni rilevanti. Tuttavia, forse proprio per l’interesse che ha suscitato, ha generato molta confusione. In quest'articolo andremo alla scoperta di questa figura professionale, scomodando un esempio illustre, quello di Linkedin, tra le prime aziende ad aver colto l'importanza del Data Scientist.

 

L’origine del Big Data Scientist

Il 18 febbraio 2015 DJ Patil è stato nominato dall’ex Presidente degli Stati Uniti Obama primo U.S. Chief Data Scientist. Il compito affidato a questa nuova figura, inserita all’interno del White House Office of Science and Technology Policy, era di liberare il valore contenuto nei dati in mano alla Pubblica Amministrazione Americana, portando benefici che potessero ripagare gli investimenti effettuati nella raccolta di dati.

Il titolo di cui è stato insignito DJ Patil non è casuale, infatti a lui e Jeff Hammerbacher, founder e Chief Scientist di Cloudera, viene attribuito il merito di aver coniato il termine Data Scientist nel 2008, per indicare una nuova figura professionale in grado di effettuare analisi su grandi moli di dati volte a estrarne informazioni rilevanti che possano essere di valore per l’azienda in cui operano.

Nonostante il termine sia solo di recente inserimento nel linguaggio comune del business, l’interesse che ha suscitato ha portato Harvard Business Review a pubblicare un articolo nell’ottobre del 2012 che titolava: ”Data Scientist: The Sexiest Job of the 21st Century”.

La crescente mole di dati a disposizione delle aziende, generata dai dispositivi connessi dell’Internet of Things e dalle nuove modalità di interazione tra le persone nell’Internet of People, se analizzata da chi è in grado di estrarne valore, può rappresentare un elemento indispensabile all’azienda stessa per crearsi un vantaggio competitivo.

 

Quando i Big Data salvarono Linkedin

All’interno dell’articolo citato in precedenza di Harvard Business Review viene proposto un esempio del contributo che una figura come il Data Scientist può portare in un’azienda e di quanto le attività che svolge possano risultare determinanti nel successo di questa. L’esempio è di Linkedin, nota azienda fondata nel 2002, che a pochi anni dalla sua nascita, nel 2006, quand’era ancora considerabile una startup, aveva già raccolto meno di 8 milioni di utenti. Nonostante il numero fosse in crescita le connessioni tra i profili registrati non aumentavano al tasso che Linkedin si aspettava. Cresceva quindi il timore che gli iscritti potessero abbandonare presto la piattaforma, perché non vi trovavano le persone con le quali avrebbero avuto piacere di entrare in contatto. Questo avrebbe arrestato la crescita di Linkedin e ne avrebbe potuto impedire il futuro di successo di cui al giorno d’oggi siamo testimoni.

Jonathan Goldman, entrato in Linkedin nel 2006, cominciò a studiare i network che venivano formati dalle persone iscritte al sito: ne formulò teorie, testò alcune ipotesi e cercò di scoprire modelli che consentissero di predire quale network avrebbe probabilmente costruito un determinato profilo. Egli pensò che partendo dai dati delle reti costruite dagli utenti e dalle loro ricerche, già a disposizione di Linkedin, si potessero estrarre informazioni utili ad aumentare le performance dell’azienda. In particolare, egli pensò che se fosse stato in grado di prevedere con un certo grado di sicurezza quali collegamenti ciascun utente avrebbe gradito costruire, Linkedin avrebbe potuto agevolare le operazioni di ricerca di contatti, suggerendo quei profili che il modello da lui sviluppato riteneva fossero d’interesse per l’utente.

Tuttavia Goldman si dovette scontrare con le resistenze interne a un approccio “data driven”. Inoltre, una delle critiche mosse alla strategia appena descritta è stata: “Perché gli utenti del sito dovrebbero aver bisogno che Linkedin gli agevoli la creazione di un network quando possono costruirselo da sé?”.

A fronte della sfiducia e dello scetticismo che aleggiava attorno alle proposte di Goldman da parte dei suoi colleghi, il CEO di Linkedin, Reid Hoffman, grazie alle sua pregresse esperienze lavorative, aveva fiducia nel potere degli Analytics come strumento per indirizzare nella maniera migliore le decisioni aziendali. Hoffman consentì a Goldman di poter autonomamente apportare piccole modifiche al sito di Linkedin per favorire la user experience e quindi per provare a raggiungere le performance auspicate inizialmente.

Il primo intervento apportato da Goldman fu di suggerire agli utilizzatori del sito tre profili di persone già iscritte che era probabile conoscessero e che potessero essere d’interesse per loro, sulla base dei modelli interpretativi sviluppati. Il successo di questo primo rilascio fu immediato. Visti i risultati sorprendentemente positivi, Goldman ebbe la possibilità di perfezionare la modalità con cui i suggerimenti di utenti venivano generati. “People You May Know” è ormai una possibilità consolidata all’interno della piattaforma di Linkedin che ogni giorno genera migliaia di collegamenti tra utenti, ma tutto nacque da questo episodio.

 

l Big Data Scientist... oggi

Negli ultimi anni la figura dello specialista dei Big Data sta ottenendo sempre più un riconoscimento formale all’interno delle imprese. Nelle sezioni dedicate al recruiting presenti nei siti istituzionali delle organizzazioni, è sempre più frequente imbattersi in una richiesta di assunzione di un Data Scientist, a testimonianza del fatto che vi è un’attenzione notevole a questo tipo di figura. Va detto, a onor del vero, che molto spesso ancora oggi, c’è confusione su quelli che sono i possibili profili e le competenze necessarie per ricoprire un tale ruolo. Cos è realmente un Data Scientist? Abbiamo provato a raccontarlo in un più recente articolo dall'emblematico titolo "Data Scientist: cosa fa e quanto guadagna in Italia"

Dal Data Scientist al Data Analyst: quali figure professionali compongono un team di Data Science?

Vai al Video

  • Autore

Ricercatore Osservatorio Big Data Analytics & Business Intelligence

Gli ultimi articoli di Filippo Leccardi