Menu

Dati Tradizionali e Big Data: connubio ragionevole? Possibile?

Sta arrivando il momento di dare addio ai Database relazionali, all'SQL, alle tabelle fatte di righe e colonne per lanciarsi nel nuovo mondo dei dati non strutturati, di Hadoop e dei nuovi modelli di organizzazione e analisi dei dati? No, certo che no. Le transazioni si faranno ancora come sempre per ancora lungo tempo. E allora, come far convivere i due mondi in modo ragionevole ed efficiente?

Per chi si occupa di Dati da quasi trent'anni come me, direi che viviamo un momento storico particolare. Dopo anni di sonnecchiare fra le coltri del modello Relazionale e dei Data Warehouse, è arrivata la sveglia dei Big Data e degli Analytics relativi.

Dire Big Data vuol dire tutto e niente, è vero, infatti se volessimo cercare una definizione univoca, non la troveremmo se non tradurre l’espressione inglese.

Nei Big Data ci sono grandi quantità di dati, impensabili fino a ieri, che possono essere strutturati (intabellabili in DBMS di varia marca) e non strutturati, memorizzati in strutture dati varie (file system distribuiti, DBMS Not only SQL e Non SQL …); l’importante è che siano Big.

Non sto qui a ricordarvi i prodotti, le tecnologie, le modalità di utilizzo perché si farebbe notte e quindi non arriveremmo al punto su cui vorrei soffermare la vostra attenzione: ci sono dati “tradizionali” e Big Data. Dal punto di vista tecnologico verrebbe da pensare che siano due categorie solo perché guardiamo la cosa dal punto di vista tecnologico.

L'utente, però, non si pone neanche il problema, nel senso che vorrebbe vedere non solo l’anagrafica di un cliente con tutti i suoi acquisti (ERP), ma anche i suoi giudizi su ciò che ha acquistato (vedi Social Forum), i problemi che ha rilevato (Problem Management), come ha pagato i vari prodotti, dove li ha comprati etc.

Una visione olistica del cliente, da una parte, e la catalogazione del medesimo in gruppi di acquisto che hanno esigenze, potenziali e stili di consumo simili dall’altra, questi sono i due estremi d’indagine e di capacità predittiva.

Big Data e Tabelle Relazionali: Si o No alla convivenza?Per arrivare a questo livello di conoscenza bisogna che tutti i dati siano disponibili ed integrati all’interno di un’unica visione, ovvero all’interno di un unico modello logico dei dati.

Fisicamente questi dati sono su tecnologie diverse, ma questo non deve preoccupare. L'importante è avere sempre una visione unitaria del modello dati e sapere che cosa c’è, dov’è e quali sono le regole semantiche d’integrazione: in altri termini bisogna avere un modello dati ben ricco di metadati, ovvero le informazioni che descrivono i dati.

Un connubio che non solo si PUO' fare, ma che si DEVE fare: i metadati sono l’unica chance per mantenere sotto controllo la proliferazione dei dati e per gestire la ridondanza oramai inevitabile. Potrà sembrare un discorso rétro, tutti ricordano il data modelling mandato in soffitta perché faceva perdere tempo in fase di analisi agile.

Oggi molti stanno cercando di raccapezzarsi fra le migliaia di tabelle ridondate da: applicazioni proprie, proprie ma gestite da terzi (Application Management), package, user application, SaaS e chissà che altro. E in tutto questo arriva lo tsunami dei Big Data e di Analytics sempre più voraci di dati, anche in tempo reale.

Egregi colleghi, voi vorreste continuare ad espandere l’universo dei dati senza avere conoscenza degli asset dati?

Big Data non è solo comprare un super hardware / software per far girare il giocattolo delle meraviglie; bisogna sfruttare al massimo le loro potenzialità integrandoli con i dati tradizionali secondo precisi contesti semantici, altrimenti perdete il meglio dell’integrazione, ovvero 1+1=3.

Ultima modifica ilGiovedì, 18 Giugno 2015 09:09

Commenti   

0 #1 Gherardo Infunti 2014-01-02 09:44
Ciao Renato,
è sempre un piacere leggerti.
A proposito di mettere insieme dati strutturati e non, ti segnalo Endeca 3.1, un nuovo prodotto Oracle che è nato per questo e che lo fa in modo etremamente semplice, tanto è vero che è self-service, ovvero gli utenti possono usarlo con un minimo supporto da parte dell' IT.
A presto,
gherardo
Citazione

Aggiungi commento


Codice di sicurezza
Aggiorna

Torna in alto