Democratizzare i dati con l'invenzione digitale

Il carbone, il petrolio e il potenziale umano sono stati i tre asset più consequenziali durante la rivoluzione industriale. Questi asset hanno creato aziende, spostato i mercati e infine cambiato le nazioni. Nell'economia digitale esistono tre asset altrettanto importanti per l'innovazione: dati, dispositivi e potenziale umano. Questi asset hanno un grande potenziale di innovazione. Per qualsiasi progetto di innovazione nell'era moderna, i dati sono il nuovo petrolio.

In ogni azienda sono disponibili dati che possono essere usati per individuare e soddisfare le esigenze dei clienti. Sfortunatamente, il processo di data mining di tali dati per promuovere l'innovazione può essere costoso e richiedere tempi prolungati, quindi le esigenze non vengono individuate e non vengono create soluzioni. La democratizzazione dei dati può risolvere questo problema.

Che cos'è la democratizzazione dei dati? È il processo di recupero dei dati nelle mani adatte per promuovere l'innovazione. Questo processo di democratizzazione può assumere diverse forme, ma in genere include soluzioni per l'inserimento o l'integrazione di dati non elaborati, la centralizzazione dei dati, la condivisione dei dati e la protezione dei dati. Quando i dati vengono democratizzati, gli esperti dell'azienda possono usarli per formulare e testare le ipotesi. In molti casi, i team di adozione del cloud possono creare con empatia per i clienti usando solo i dati, per soddisfare rapidamente le esigenze dei clienti.

Modi per democratizzare i dati

Esistono diversi modi per democratizzare i dati, ma la maggior parte include metodi di raccolta, centralizzazione, gestione e condivisione dei dati. Le sezioni seguenti descrivono alcuni di questi metodi. Quando si crea una soluzione per un'ipotesi del cliente, è necessario valutare se democratizzare i dati, in quale misura e in che modo.

Processo per la democratizzazione dei dati, mostra questi processi: governance, centralizzazione, raccolta e condivisione dei dati.

Condividere dati

Quando si crea con empatia per i clienti, sono le esigenze dei clienti a guidare la soluzione. Se la necessità riguarda i dati, la soluzione consente al cliente di interrogare, analizzare e creare report sui dati direttamente, senza il supporto del personale IT.

Molte innovazioni di successo iniziano come un prodotto minimo funzionante (MVP) che recapita i dati al cliente. Un MVP è una versione del prodotto con funzionalità sufficienti per essere utilizzabili dal cliente. Mostra le possibili potenzialità del prodotto per raccogliere feedback dal cliente. In questo modello concierge, un dipendente è il consumer di dati. Il dipendente usa i dati per aiutare il cliente. Ogni volta che il cliente interagisce con il supporto manuale, è possibile testare e convalidare un'ipotesi. Questo approccio è spesso un mezzo conveniente per testare un'ipotesi incentrata sul cliente prima di investire pesantemente in soluzioni integrate.

Gli strumenti principali per condividere i dati direttamente con i consumer di dati includono la creazione di report self-service o i dati incorporati in altre esperienze, usando strumenti come Power BI.

Nota

Prima di condividere i dati, assicurarsi di aver letto le sezioni seguenti. La condivisione dei dati potrebbe richiedere la governance per garantire la protezione dei dati. Inoltre, se i dati si estendono su più cloud, potrebbe essere necessaria la centralizzazione. Se i dati risiedono all'interno delle applicazioni, è necessario raccoglierli per condividerli.

Governance dei dati

La condivisione dei dati può generare rapidamente un prodotto minimo funzionante da usare nelle conversazioni dei clienti. Tuttavia, per trasformare i dati condivisi in informazioni di utilità pratica, sono necessarie varie considerazioni.

Dopo che un'ipotesi è stata convalidata tramite la condivisione dei dati, la fase successiva di sviluppo è in genere la governance dei dati.

La governance dei dati è un argomento ampio che può richiedere un proprio framework dedicato, una materia che non rientra nell'ambito di Cloud Adoption Framework.

Esistono diversi aspetti della governance dei dati da considerare non appena si convalida l'ipotesi del cliente. Ad esempio:

  • I dati condivisi sono sensibili?I dati devono essere classificati prima di essere condivisi pubblicamente per proteggere gli interessi dei clienti e dell'azienda.
  • Se i dati sono sensibili, sono stati protetti? La protezione dei dati sensibili è un imperativo per i dati democratizzati. Il carico di lavoro di esempio illustrato in Protezione delle soluzioni dati fornisce alcuni riferimenti per la protezione dei dati.
  • I dati sono catalogati? Identificare la natura dei dati condivisi facilita la gestione dei dati a lungo termine. Gli strumenti per documentare i dati, come Azure Data Catalog, semplificano questo processo nel cloud. Le indicazioni relative all'annotazione dei dati e alla documentazione delle origini dati possono accelerare il processo.

Quando la democratizzazione dei dati è importante per un'ipotesi incentrata sul cliente, assicurarsi che la governance dei dati condivisi sia nel piano di rilascio. In questo modo si proteggono i clienti, i consumer di dati e l'azienda.

Centralizzare i dati

La centralizzazione dei dati consente di creare report più significativi, garantisce la disponibilità degli stessi dati nell'organizzazione e aumenta il ROI. Quando i dati sono sparpagliati in tutto l'ambiente IT, le opportunità di innovazione possono essere estremamente limitate, costose e dispendiose in termini di tempo. Il cloud offre nuove opportunità per centralizzare i dati. Quando è necessaria la centralizzazione di più origini dati per la creare con empatia per i clienti, il cloud può accelerare il test delle ipotesi.

Attenzione

La centralizzazione dei dati rappresenta un punto di rischio in qualsiasi processo di innovazione. Quando la centralizzazione dei dati è un picco tecnico e non una fonte di valore del cliente, è consigliabile ritardare la centralizzazione fino a quando le ipotesi del cliente non sono state convalidate.

Quando si centralizza, è necessario un archivio dati appropriato per i dati centralizzati. È consigliabile stabilire un data warehouse nel cloud. Questa opzione scalabile offre una posizione centrale per tutti i dati. Questo tipo di soluzione è disponibile nelle opzioni OLAP (Online Analytical Processing) o Big Data.

Le architetture di riferimento per le soluzioni OLAP e Big Data consentono di scegliere la soluzione di centralizzazione più appropriata in Azure. Se è necessaria una soluzione ibrida, anche l'architettura di riferimento per l'estensione dei dati locali può contribuire ad accelerare lo sviluppo della soluzione.

Importante

Per alcune esigenze e soluzioni dei clienti, potrebbe essere sufficiente un approccio semplice. Il cloud architect deve incentivare il team a valutare soluzioni a basso costo per convalidare l'ipotesi del cliente, soprattutto durante le prime fasi di sviluppo. Questa sezione sulla raccolta dei dati illustra scenari che potrebbero suggerire una soluzione diversa per la propria situazione.

Raccogliere i dati

Le due forme principali di raccolta dei dati sono l'integrazione e l'inserimento.

Integrazione: i dati che risiedono in un archivio dati esistente possono essere integrati nell'archivio dati centralizzato usando le tecniche di spostamento dei dati tradizionali. Si tratta di un approccio comune per gli scenari che coinvolgono l'archiviazione dei dati multi-cloud. Queste tecniche prevedono l'estrazione dei dati dall'archivio dati esistente e il caricamento nell'archivio dati centrale. A un certo punto di questo processo, i dati vengono in genere trasformati in modo da essere più utilizzabili e pertinenti nell'archivio centrale.

Gli strumenti basati sul cloud hanno trasformato queste tecniche in strumenti con pagamento in base al consumo, riducendo gli ostacoli alla raccolta e alla centralizzazione dei dati. Strumenti come Servizio Migrazione del database di Azure e Azure Data Factory sono due esempi. L'architettura di riferimento per Data Factory con un archivio dati OLAP è un esempio di una di queste soluzioni.

Inserimento: alcuni dati risiedono in un archivio dati esistente. Quando questi dati temporanei sono una fonte primaria di innovazione, è opportuno prendere in considerazione approcci alternativi. I dati temporanei sono disponibili in un'ampia gamma di origini esistenti, ad esempio applicazioni, API, flussi di dati, dispositivi IoT, blockchain, cache di applicazioni, contenuto multimediale o anche in file flat.

È possibile integrare queste varie forme di dati in un archivio dati centrale in una soluzione OLAP o Big Data. Tuttavia, per le iterazioni iniziali del ciclo creazione-misurazione-apprendimento, una soluzione di elaborazione delle transazioni online (OLTP) potrebbe essere sufficiente per convalidare un'ipotesi del cliente. Le soluzioni OLTP non sono l'opzione migliore per gli scenari di creazione report. Tuttavia, quando si crea con empatia per i clienti, è più importante concentrarsi sulle esigenze dei clienti che sulle decisioni relative agli strumenti tecnici. Dopo che l'ipotesi del cliente è stata convalidata su larga scala, potrebbe essere necessaria una piattaforma più adatta. L'architettura di riferimento sugli archivi dati OLTP consente di determinare l'archivio dati più appropriato per la soluzione.

Virtualizzazione: l'integrazione e l'inserimento dei dati possono talvolta rallentare l'innovazione. Quando è già disponibile una soluzione per la virtualizzazione dei dati, potrebbe rappresentare un approccio più ragionevole. L'inserimento e l'integrazione possono entrambi duplicare i requisiti di archiviazione e sviluppo, aggiungere latenza dei dati, aumentare la superficie di attacco, attivare problemi di qualità e aumentare le attività di governance. La virtualizzazione dei dati è un'alternativa più contemporanea che lascia i dati originali in un'unica posizione e crea query pass-through o memorizzate nella cache dei dati di origine.

SQL Server 2017 e Azure SQL Data Warehouse supportano entrambi PolyBase, ovvero l'approccio alla virtualizzazione dei dati più comunemente usato in Azure.

Passaggi successivi

Dopo aver implementato una strategia per la democratizzazione dei dati, è necessario valutare gli approcci allo sviluppo di applicazioni.