Data warehouse moderni per piccole o medie imprese

Azure Data Lake

Database SQL di Microsoft Azure

Microsoft Fabric

Questo articolo descrive i modi in cui le piccole o medie imprese possono eseguire la migrazione e modernizzare gli archivi dati legacy all'interno dei budget e del set di competenze correnti. Illustra come esplorare progressivamente strumenti e funzionalità di Big Data. Queste soluzioni di data warehousing si integrano con Azure Machine Learning, Foundry Tools, Microsoft Power Platform, Dynamics 365 e altre tecnologie Microsoft. Queste soluzioni forniscono un punto di ingresso iniziale a Microsoft Fabric, ovvero una piattaforma dati SaaS (Software as a Service) gestita che può espandersi man mano che aumentano le esigenze.

Questo modello supporta le piccole o medie imprese con le caratteristiche seguenti:

Utilizzare SQL Server in sede per soluzioni di data warehousing inferiori a 1 terabyte (TB)
Usare strumenti tradizionali di SQL Server come SQL Server Integration Services (SSIS), SQL Server Analysis Services (SSAS), SQL Server Reporting Services (SSRS), stored procedure SQL comuni e processi di SQL Server Agent
Usare gli strumenti di estrazione, trasformazione e caricamento esterni (ETL) ed estrazione, caricamento e trasformazione (ELT)
Fare affidamento sulla replica snapshot per la sincronizzazione dei dati
Eseguire operazioni basate su batch e non richiedere la creazione di report in tempo reale

Architettura semplificata

Diagramma che illustra un'architettura aziendale semplificata di piccole o medie dimensioni.

Scaricare un file di Visio di questa architettura.

Un'opportunità di modernizzazione concettuale implica la transizione di una soluzione di data warehousing legacy a una combinazione di database SQL di Azure, Istanza gestita di SQL di Azure e Infrastruttura. Questa strategia garantisce un'ampia compatibilità con gli strumenti client SQL Server e SQL tradizionali come SQL Server Management Studio (SSMS). Fornisce anche opzioni di rehosting per i processi esistenti e richiede un upskilling minimo per il team di supporto. Questa soluzione offre un passo iniziale verso una modernizzazione completa. Man mano che il data warehouse cresce e il team acquisisce competenze, è possibile passare alla gestione completa del data warehouse SaaS su Fabric o adottare un approccio lakehouse.

I data warehouse legacy per le piccole o medie imprese possono contenere diversi tipi di dati:

Dati non strutturati, ad esempio documenti e grafica
Dati semistrutturati, ad esempio log, valori delimitati da virgole (CSV), JSON e file XML
Dati relazionali strutturati, inclusi i database che usano stored procedure per le attività ETL ed ELT

Architettura

Scaricare un file di Visio di questa architettura.

Flusso di dati

Il flusso di dati seguente corrisponde al diagramma precedente:

Pipeline di dati Fabric o pipeline di Azure Data Factory ingestano dati transazionali nella soluzione di archiviazione dati.
- Le pipeline orchestrano il flusso di database legacy e pacchetti SSIS sottoposti a refactoring parziale o migrati nel database SQL o in Istanza gestita di SQL. Questo approccio di rehosting fornisce una transizione da una soluzione SQL locale a un ambiente SaaS di infrastruttura futuro. È possibile modernizzare i database in modo incrementale dopo la migrazione iniziale.
- Le pipeline possono spostare dati non strutturati, semistrutturati e strutturati in Azure Data Lake Storage per l'archiviazione centralizzata e l'analisi tra origini. Usare questo approccio quando si combinano dati da più origini offre un valore aziendale maggiore rispetto alla migrazione dei dati a una nuova piattaforma.
Usare i dati di Dynamics 365 per creare dashboard di business intelligence centralizzati usando gli strumenti di analisi serverless di Fabric in set di dati arricchiti. È possibile inserire dati di Dynamics 365 in Data Lake Storage o collegare l'ambiente Dataverse direttamente a Fabric usando un collegamento rapido di Dynamics 365 in OneLake. È possibile scrivere nuovamente i risultati dell'analisi in Dynamics 365 o continuare l'analisi all'interno di Fabric.
Hub eventi di Azure o altre soluzioni di streaming trasmetteno dati in tempo reale nel sistema. Fabric Real-Time Intelligence offre un'analisi immediata per supportare dashboard in tempo reale.
I collegamenti a Data Lake Storage portano i dati in Fabric OneLake per l'analisi, l'archiviazione e la creazione di report. Questo approccio analizza i dati sul posto senza spostarli e renderli disponibili per i consumer downstream.
Fabric offre strumenti di analisi serverless su richiesta, come l'endpoint di analisi SQL e Apache Spark, senza richiedere risorse provisionate. Questi strumenti supportano le attività seguenti:
- Attività ETL ed ELT sui dati di OneLake
- Fornire il livello oro dell'architettura a medaglione per i report di Power BI tramite la funzionalità DirectLake
- Esplorazioni improvvisate di data science in T-SQL o Python
- Prototipazione anticipata per le entità del data warehouse

Fabric si integra con i consumatori dei set di dati multisource, inclusi i report front-end di Power BI, Machine Learning, Power Apps, Azure Logic Apps, Azure Functions e le app Web di Azure App Service.

Componenti

Fabric è un servizio di analisi che combina funzionalità di data engineering, data warehousing, data science e dati e BI in tempo reale. In questa architettura, le funzionalità di ingegneria dei dati di Fabric offrono una piattaforma collaborativa per ingegneri dei dati, data scientist, analisti dei dati e professionisti bi. Fabric usa motori di calcolo serverless per generare informazioni dettagliate che supportano il processo decisionale aziendale.
Database SQL e Istanza gestita di SQL sono servizi di database relazionali basati sul cloud. In questa architettura, questi servizi ospitano il data warehouse aziendale ed eseguono attività ETL ed ELT usando stored procedure o pacchetti esterni (SSIS). database SQL e Istanza gestita di SQL sono ambienti PaaS (Platform as a Service) che è possibile usare per soddisfare i requisiti di disponibilità elevata e ripristino di emergenza. Scegliere uno SKU che soddisfi i requisiti. Per altre informazioni, vedere Disponibilità elevata per il database SQL e Disponibilità elevata per Istanza gestita di SQL.
Hub eventi è una piattaforma di streaming di dati in tempo reale e un servizio di inserimento eventi. In questa architettura Hub eventi si integra con i servizi dati di Azure per inserire dati di streaming da varie origini in Data Lake Storage per l'analisi e la creazione di report. Hub eventi può anche trasmettere i dati direttamente a Real-Time Intelligence.
Data Lake Storage è un repository centralizzato basato sul cloud che archivia dati strutturati e non strutturati. In questa architettura Data Lake Storage può archiviare i dati di streaming archiviati e le copie dei dati di Dynamics 365.

Alternative

È possibile usare l'hub IoT di Azure per sostituire o integrare Hub eventi. Scegliere la soluzione in base all'origine dei dati di streaming e se è necessaria la clonazione e la comunicazione bidirezionale con i dispositivi di report.
È possibile usare le pipeline di dati di Fabric anziché le pipeline di Data Factory per l'integrazione dei dati. La decisione dipende da diversi fattori. Per altre informazioni, vedere Differenze tra Azure Data Factory e Data Factory di Fabric.
È possibile usare Fabric Data Warehouse anziché il database SQL o Istanza gestita di SQL per archiviare i dati aziendali. Questo articolo assegna priorità al time-to-market (TTM) per i clienti che vogliono modernizzare i data warehouse. Per altre informazioni, vedere Opzioni dell'archivio dati di Fabric.

Dettagli dello scenario

Le piccole o medie imprese che modernizzare i data warehouse locali per il cloud possono scegliere tra due approcci. È possibile adottare strumenti per Big Data per la scalabilità futura o usare soluzioni tradizionali basate su SQL per l'efficienza dei costi e una transizione prevedibile. Un approccio ibrido consente di eseguire la migrazione dei dati esistenti usando gli strumenti moderni e le funzionalità di intelligenza artificiale. È possibile mantenere le origini dati basate su SQL in esecuzione nel cloud e modernizzarle in modo incrementale.

Questo articolo descrive in che modo le piccole o medie imprese possono modernizzare gli archivi dati legacy e adottare strumenti di Big Data mantenendo al contempo budget e set di competenze esistenti. Queste soluzioni di data warehousing di Azure si integrano con i servizi Di Azure e Microsoft, tra cui Foundry Tools, Dynamics 365 e Power Platform.

Potenziali casi d'uso

Eseguire la migrazione di un data warehouse relazionale locale tradizionale inferiore a 1 TB e usa pacchetti SSIS per orchestrare le stored procedure.
combinare dati Dynamics 365 o Dataverse con dati batch e in tempo reale da Data Lake Storage.
Usare tecniche innovative per interagire con i dati di Data Lake Storage centralizzati. Queste tecniche includono analisi serverless, estrazione di conoscenze, fusione dei dati tra domini ed esplorazione dei dati self-service utilizzando Copilot in Fabric.
Consentire alle aziende di e-commerce di adottare il data warehousing cloud per l'ottimizzazione operativa.

Questa soluzione non è consigliata per gli scenari seguenti:

Implementazioni di data warehouse greenfield. Per questo scenario, vedere Greenfield lakehouse in Fabric.
Data warehouse locali di dimensioni pari o superiori a 1 TB o che raggiungono tale dimensione entro un anno. La maggior parte delle organizzazioni adotta soluzioni di data warehousing specializzate per i data warehouse di questa dimensione. Per questi scenari, vedere Alternative di riposizionamento su una nuova piattaforma.

Considerazioni

Queste considerazioni implementano i pilastri di Azure Well-Architected Framework, che è un set di set di principi guida che è possibile usare per migliorare la qualità di un carico di lavoro. Per altre informazioni, vedere Well-Architected Framework.

Reliability

L'affidabilità aiuta a garantire che l'applicazione possa soddisfare gli impegni che l'utente ha preso con i clienti. Per maggiori informazioni, consultare la sezione Elenco di controllo per la revisione della progettazione per l'affidabilità.

L'utente e Microsoft condividono la responsabilità per l'affidabilità della maggior parte dei servizi di Azure. Microsoft offre funzionalità per supportare resilienza e ripristino. È necessario comprendere il funzionamento di queste funzionalità in ogni servizio usato e selezionare le configurazioni che soddisfano gli obiettivi aziendali e gli obiettivi di tempo di attività. Esaminare la documentazione specifica del servizio per selezionare le configurazioni che soddisfano gli obiettivi di continuità aziendale e ripristino di emergenza.

Ottimizzazione dei costi

L'ottimizzazione dei costi è incentrata sui modi per ridurre le spese non necessarie e migliorare l'efficienza operativa. Per altre informazioni, vedere Elenco di controllo per la revisione della progettazione per Ottimizzazione costi.

Il calcolatore prezzi di Azure consente di modificare i valori per comprendere in che modo i requisiti specifici influiscono sui costi. Vedere un esempio di prezzi per uno scenario di data warehouse aziendale di piccole o medie dimensioni.
I prezzi del database SQL dipendono dal livello di calcolo, dal livello di servizio, dal numero di vCore e dalle unità di transazione del database. L'esempio di prezzi utilizza un database singolo con calcolo predefinito e otto vCore per eseguire stored procedure nel database SQL. È possibile ridurre i costi usando la capacità riservata e i vantaggi di Azure Hybrid.
I prezzi di Data Lake Storage dipendono dal volume di archiviazione e dalla frequenza di accesso ai dati. L'esempio di prezzi include 1 TB di archiviazione dei dati e i costi delle transazioni associati. 1 TB rappresenta le dimensioni del data lake, non le dimensioni originali del database legacy. Data Lake Storage è un costo di modernizzazione aggiuntivo oltre il database legacy.
Fabric pricing dipende dal modello di capacità Fabric F o dal modello Premium Per Persona. Le funzionalità serverless usano CPU e memoria dalla capacità dedicata acquistata. Dopo la modernizzazione, i report esistenti continuano a funzionare connettendosi al nuovo data warehouse (database SQL o Istanza gestita di SQL) con le licenze esistenti. L'esempio di prezzi include lo SKU F2 per rappresentare l'espansione futura della business intelligence tramite la preparazione dei dati self-service, i datamarts, l'intelligence Real-Time e i flussi di lavoro assistito dall'intelligenza artificiale. Lo SKU F2 con prenotazione di un anno fornisce un punto di ingresso conveniente. Se attualmente si usa Power BI Premium o si esegue la migrazione a F64, potrebbe non essere necessaria una capacità F aggiuntiva.
Il prezzo di Event Hubs dipende dal livello selezionato, dalle unità di throughput con provisioning (PTU) e dal volume di traffico in ingresso. L'esempio di prezzi presuppone che un'unità di throughput nel livello Standard gestisca più di un milione di eventi al mese. Hub eventi rappresenta un costo di modernizzazione aggiuntivo se si aggiungono funzionalità di streaming in tempo reale alla soluzione.

Collaboratori

Microsoft gestisce questo articolo. I collaboratori seguenti hanno scritto questo articolo.

Autore principale:

Galina Polyakova | Senior Cloud Solution Architect

Altro collaboratore:

Bhaskar Sharma | Senior Program Manager

Per visualizzare i profili LinkedIn non pubblici, accedere a LinkedIn.

Passaggi successivi

Commenti e suggerimenti

Questa pagina è stata utile?