Condividi tramite


Che cos'è il data warehousing in Microsoft Fabric?

Si applica a:✅ Endpoint sql analitica e Warehouse in Microsoft Fabric

Microsoft Fabric è una soluzione di data warehousing di nuova generazione all'interno di Microsoft Fabric.

Il warehouse incentrato sul lago è basato su un motore di elaborazione distribuito di livello aziendale che consente prestazioni leader del settore su larga scala riducendo al minimo la necessità di configurazione e gestione. Vivere nel data lake e progettato per supportare in modo nativo i formati di dati aperti, il data warehouse di Fabric consente una perfetta collaborazione tra data engineer e utenti aziendali senza compromettere la sicurezza o la governance.

L'esperienza SaaS facile da usare è anche strettamente integrata con Power BI per semplificare l'analisi e la creazione di report, convergendo il mondo dei data lake e dei warehouse e semplificando notevolmente gli investimenti di un'organizzazione nel proprio analitica estate. 

I clienti del data warehouse traggono vantaggio da:

  • I dati archiviati in formato Delta-Parquet consentono transazioni ACID e interoperabilità con altri carichi di lavoro di Fabric significa che non sono necessarie più copie di dati.
  • Le query tra database possono usare più origini dati per ottenere informazioni rapide con zero duplicazione dei dati.
  • Inserire, caricare e trasformare facilmente i dati su larga scala tramite pipeline, flussi di dati, query tra database o il comando COPY INTO.
  • La gestione autonoma dei carichi di lavoro con il motore di elaborazione delle query distribuite leader del settore non significa che nessuna manopola si trasformi per ottenere prestazioni ottimali in classe.
  • Ridimensionare quasi istantaneamente per soddisfare le esigenze aziendali. L'archiviazione e il calcolo sono separati.
  • Riduzione del tempo a informazioni dettagliate con un modello semantico facilmente utilizzabile e sempre connesso integrato con Power BI in modalità Direct Lake. I report hanno sempre i dati più recenti per l'analisi e la creazione di report.
  • Creato per qualsiasi livello di competenza, dallo sviluppatore cittadino al data engineer o all'amministratore del database.

Elementi di data warehousing

Fabric Warehouse non è un data warehouse aziendale tradizionale, si tratta di un lake warehouse che supporta due diversi elementi di warehousing: il data warehouse dell'infrastruttura e l'endpoint sql analitica. Entrambi sono appositamente creati per soddisfare le esigenze aziendali dei clienti, offrendo prestazioni ottimali in classe, riducendo al minimo i costi e riducendo il sovraccarico amministrativo.

Data Warehouse in Synapse

In un'area di lavoro di Microsoft Fabric un data warehouse o un data warehouse Synapse viene etichettato come "Warehouse" nella colonna Tipo . Quando sono necessarie le funzionalità complete di potenza e transazionale (supporto di query DDL e DML) di un data warehouse, questa è la soluzione rapida e semplice.

Screenshot che mostra il tipo di magazzino nell'area di lavoro.

Il warehouse può essere popolato da uno dei metodi di inserimento dati supportati, ad esempio COPY INTO, Pipeline, Flussi di dati o opzioni di inserimento tra database, ad esempio CREATE TABLE AS SELECT (CTAS), INSERT. SELECT o SELECT INTO.

Per iniziare a usare il warehouse, vedere:

Creare un magazzino in Microsoft Fabric

Endpoint sql analitica di Lakehouse

In un'area di lavoro di Microsoft Fabric, ogni Lakehouse ha un "endpoint SQL analitica" generato automaticamente che può essere usato per passare dalla vista "Lake" di Lakehouse (che supporta la progettazione dei dati e Apache Spark) alla visualizzazione "SQL" della stessa Lakehouse per creare viste, funzioni, stored procedure e applicare la sicurezza SQL.

Screenshot che mostra il tipo di endpoint sql analitica nell'area di lavoro.

Con l'endpoint SQL analitica di Lakehouse, i comandi T-SQL possono definire ed eseguire query su oggetti dati, ma non modificare o modificare i dati. È possibile eseguire le azioni seguenti nell'endpoint sql analitica:

  • Eseguire query sulle tabelle che fanno riferimento ai dati nelle cartelle Delta Lake nel lake.
  • Creare viste, funzioni di tabella e procedure inline per incapsulare la semantica e la logica di business in T-SQL.
  • Gestire le autorizzazioni per gli oggetti.

Per iniziare a usare l'endpoint sql analitica, vedere:

Magazzino o lakehouse

Quando si decide di usare un magazzino o una lakehouse, è importante considerare le esigenze specifiche e il contesto della gestione dei dati e dei requisiti di analitica. Altrettanto importante, questa non è una decisione unidirezionale!

È sempre possibile aggiungere uno o l'altro in un secondo momento, in caso di cambiamento delle esigenze aziendali e indipendentemente dalla posizione iniziale, sia il warehouse che il lakehouse usano lo stesso motore SQL potente per tutte le query T-SQL.

Ecco alcune linee guida generali che consentono di prendere la decisione:

  • Scegliere un data warehouse quando è necessaria una soluzione su scala aziendale con formato standard aperto, senza prestazioni di manopole e configurazione minima.  Ideale per formati di dati semistrutturati e strutturati, il data warehouse è adatto sia per professionisti dei dati principianti che esperti, offrendo esperienze semplici e intuitive.

  • Scegliere un lakehouse quando è necessario un archivio di grandi dimensioni di dati altamente non strutturati da origini eterogenee, sfruttando l'archiviazione di oggetti a basso costo e si vuole usare SPARK come strumento di sviluppo principale. Fungendo da data warehouse "leggero", è sempre possibile usare l'endpoint SQL e gli strumenti T-SQL per fornire scenari di creazione di report e di intelligence per i dati nel lakehouse.

Per indicazioni più dettagliate sulle decisioni, vedere La guida alle decisioni di Microsoft Fabric: Scegliere tra Warehouse e Lakehouse.