Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Carbone, petrolio e potenziale umano erano i tre asset più consequenziali durante la rivoluzione industriale. Questi asset hanno costruito aziende, influenzato i mercati e infine cambiato nazioni. Nell'economia digitale ci sono tre asset ugualmente importanti per l'innovazione: dati, dispositivi e potenziale umano. Questi asset hanno un grande potenziale di innovazione. Per qualsiasi sforzo di innovazione nell'era moderna, i dati sono il nuovo petrolio.
In ogni azienda sono disponibili dati che possono essere usati per trovare e soddisfare le esigenze dei clienti. Sfortunatamente, il processo di data mining per favorire l'innovazione può essere costoso e dispendioso in termini di tempo, quindi le esigenze non vengono individuate e le soluzioni non vengono create. La democratizzazione dei dati può risolvere questo problema.
Che cos'è la democratizzazione dei dati? È il processo di recupero dei dati nelle mani giuste per favorire l'innovazione. Questo processo di democratizzazione può assumere diverse forme, ma in genere includono soluzioni per i dati non elaborati inseriti o integrati, centralizzazione dei dati, condivisione dei dati e protezione dei dati. Quando i dati sono democratizzati, gli esperti dell'azienda possono usarli per formare e testare ipotesi. In molti casi, i team di adozione del cloud possono creare con empatia per i clienti usando solo i dati, per soddisfare rapidamente le esigenze dei clienti.
Modi per democratizzare i dati
Esistono diversi modi per democratizzare i dati, ma la maggior parte include metodi di raccolta, centralizzazione, governance e condivisione dei dati. Le sezioni seguenti descrivono alcuni di questi metodi. Quando si compila una soluzione a un'ipotesi del cliente, è necessario valutare se democratizzare i dati, in quale misura e come farlo.
Condividere dati
Quando si costruisce con l'empatia del cliente, i bisogni del cliente guidano la soluzione. Se la necessità è di dati, la soluzione consente al cliente di interrogare, analizzare e segnalare direttamente i dati, senza supporto del personale IT.
Molte innovazioni di successo iniziano come prodotto minimo funzionante (MVP) che fornisce dati al cliente. Un MVP è una versione del prodotto con funzionalità sufficienti per essere utilizzabile dal cliente. Mostra il possibile potenziale del prodotto per raccogliere feedback dal cliente. In questo modello concierge, un dipendente è l'utilizzatore di dati. Il dipendente usa i dati per aiutare il cliente. Ogni volta che il cliente interagisce con il supporto manuale, è possibile testare e convalidare un'ipotesi. Questo approccio è spesso un mezzo conveniente per testare un'ipotesi mirata al cliente prima di investire molto nelle soluzioni integrate.
Gli strumenti principali per la condivisione dei dati direttamente con i consumer di dati includono la creazione di report self-service o i dati incorporati all'interno di altre esperienze, usando strumenti come Power BI.
Annotazioni
Prima di condividere i dati, assicurarsi di aver letto le sezioni seguenti. La condivisione dei dati potrebbe richiedere la governance per garantire la protezione dei dati. Inoltre, se i dati si estendono su più cloud, potrebbe richiedere la centralizzazione. Se i dati si trovano all'interno delle applicazioni, è necessario raccoglierli per condividerli.
Gestire i dati
La condivisione dei dati può produrre rapidamente un prodotto minimo funzionante da usare nelle conversazioni dei clienti. Tuttavia, per trasformare i dati condivisi in conoscenze utili e utilizzabili, più è generalmente necessario.
Dopo la convalida di un'ipotesi tramite la condivisione dei dati, la fase successiva dello sviluppo è in genere la governance dei dati.
La governance dei dati è un argomento generale che può richiedere un proprio framework dedicato, una questione che non rientra nell'ambito di Cloud Adoption Framework.
Esistono diversi aspetti della governance dei dati da considerare non appena si convalida l'ipotesi del cliente. Per esempio:
- I dati condivisi sono sensibili?I dati devono essere classificati prima di essere condivisi pubblicamente per proteggere gli interessi dei clienti e dell'azienda.
- Se i dati sono sensibili, sono stati protetti? La protezione dei dati sensibili è un must per i dati democratizzati. Il carico di lavoro di esempio illustrato in Protezione delle soluzioni dati fornisce alcuni riferimenti per la protezione dei dati.
- I dati sono catalogati? L'identificazione della natura dei dati condivisi facilita la gestione dei dati a lungo termine. Gli strumenti per documentare i dati, ad esempio Azure Data Catalog, rendono questo processo molto più semplice nel cloud. Le indicazioni relative all'annotazione dei dati e alla documentazione delle origini dati possono accelerare il processo.
Quando la democratizzazione dei dati è importante per un'ipotesi orientata al cliente, assicurarsi che la governance dei dati condivisi sia nel piano di rilascio. Ciò protegge i clienti, i consumer di dati e l'azienda.
Centralizzare i dati
La centralizzazione dei dati porta a report più significativi, garantisce che gli stessi dati siano disponibili nell'organizzazione e aumenti il ROI. Quando i dati vengono dispersi in un ambiente IT, le opportunità di innovazione possono essere estremamente limitate, costose e dispendiose in termini di tempo. Il cloud offre nuove opportunità per centralizzare i dati. Quando la centralizzazione di più origini dati è necessaria per creare con empatia per i clienti, il cloud può accelerare i test delle ipotesi.
Attenzione
La centralizzazione dei dati rappresenta un punto di rischio in qualsiasi processo di innovazione. Quando la centralizzazione dei dati è un picco tecnico e non una fonte di valore del cliente, è consigliabile ritardare la centralizzazione fino a quando le ipotesi dei clienti non sono state convalidate.
Quando si centralizza, è necessario un archivio dati appropriato per i dati centralizzati. È consigliabile stabilire un data warehouse nel cloud. Questa opzione scalabile fornisce una posizione centrale per tutti i dati. Questo tipo di soluzione è disponibile nelle opzioni OLAP (Online Analytical Processing) o Big Data.
Le architetture di riferimento per le soluzioni OLAP e Big Data consentono di scegliere la soluzione di centralizzazione più appropriata in Azure. Se è necessaria una soluzione ibrida, l'architettura di riferimento per l'estensione dei dati locali può contribuire anche ad accelerare lo sviluppo di soluzioni.
Importante
Per alcune esigenze e soluzioni dei clienti, un approccio semplice potrebbe essere sufficiente. L'architetto cloud deve sfidare il team a prendere in considerazione soluzioni a basso costo per convalidare l'ipotesi del cliente, soprattutto durante lo sviluppo iniziale. Questa sezione sulla raccolta dei dati illustra scenari che potrebbero suggerire una soluzione diversa per la situazione.
Raccogliere dati
Le due forme principali di raccolta dati sono l'integrazione e l'inserimento.
Integrazione: I dati che risiedono in un archivio dati esistente possono essere integrati nell'archivio dati centralizzato usando tecniche di spostamento dei dati tradizionali. Ciò è particolarmente comune per gli scenari che coinvolgono l'archiviazione dei dati multicloud. Queste tecniche comportano l'estrazione dei dati dall'archivio dati esistente e quindi il caricamento nell'archivio dati centrale. A un certo punto di questo processo, i dati vengono in genere trasformati in modo da essere più utilizzabili e pertinenti nell'archivio centrale.
Gli strumenti basati sul cloud hanno trasformato queste tecniche in strumenti con pagamento in base al consumo, riducendo la barriera all'ingresso per la raccolta dei dati e la centralizzazione. Gli strumenti come Servizio Migrazione del database di Azure e Azure Data Factory sono due esempi. L'architettura di riferimento per Data Factory con un archivio dati OLAP è un esempio di una di queste soluzioni.
Ingestione: Alcuni dati non risiedono in un archivio dati esistente. Quando questi dati temporanei sono una fonte principale di innovazione, è consigliabile prendere in considerazione approcci alternativi. I dati temporanei sono disponibili in un'ampia gamma di origini esistenti, ad esempio applicazioni, API, flussi di dati, dispositivi IoT, blockchain, cache di applicazioni, contenuto multimediale o anche in file flat.
È possibile integrare queste varie forme di dati in un archivio dati centrale in una soluzione OLAP o Big Data. Tuttavia, per le iterazioni iniziali del ciclo build-measure-learn, una soluzione di elaborazione transazionale online (OLTP) potrebbe essere sufficiente per convalidare un'ipotesi del cliente. Le soluzioni OLTP non sono l'opzione migliore per qualsiasi scenario di creazione di report. Tuttavia, quando si crea con l'empatia dei clienti, è più importante concentrarsi sulle esigenze dei clienti che sulle decisioni tecniche di strumenti. Dopo aver convalidato l'ipotesi del cliente su larga scala, potrebbe essere necessaria una piattaforma più adatta. L'architettura di riferimento negli archivi dati OLTP consente di determinare quale archivio dati è più appropriato per la soluzione.
Virtualizzare: L'integrazione e l'inserimento dei dati possono talvolta rallentare l'innovazione. Quando una soluzione per la virtualizzazione dei dati è già disponibile, potrebbe rappresentare un approccio più ragionevole. L'inserimento e l'integrazione possono anche duplicare i requisiti di archiviazione e sviluppo, aggiungere latenza dei dati, aumentare la superficie di attacco, attivare problemi di qualità e aumentare le attività di governance. La virtualizzazione dei dati è un'alternativa più contemporanea che lascia i dati originali in un'unica posizione e crea query pass-through o memorizzate nella cache dei dati di origine.
SQL Server 2017 e Azure SQL Data Warehouse supportano entrambi PolyBase, che è l'approccio alla virtualizzazione dei dati più comunemente usata in Azure.
Passaggi successivi
Con una strategia per la democratizzazione dei dati, è opportuno valutare gli approcci allo sviluppo di applicazioni.