Comprendere V-Order per Microsoft Fabric Warehouse
Si applica a✅: magazzino in Microsoft Fabric
Il Warehouse nell'archiviazione di Microsoft Fabric usa il formato di tabella Delta Lake per tutti i dati utente. Oltre alle ottimizzazioni fornite dal formato Delta, un Warehouse applica ottimizzazioni all'archiviazione per offrire prestazioni di query più veloci sugli scenari di analisi mantenendo al tempo stesso la conformità al formato Parquet. Questo articolo illustra l'ottimizzazione della scrittura di V-Order, i relativi vantaggi e come controllarlo.
Cos’è V-Order?
V-Order è un'ottimizzazione del tempo di scrittura nel formato di file parquet che consente letture veloci nei motori di calcolo di Microsoft Fabric, ad esempio Power BI, SQL, Spark e altri.
I motori Power BI e SQL usano la tecnologia Microsoft Verti-Scan e i file parquet V-Order per ottenere tempi di accesso ai dati simili alla memoria. Spark e altri motori di calcolo non Verti-Scan traggono vantaggio anche dai file V-Order con una media del 10% più veloce, con alcuni scenari fino al 50%.
V-Order funziona applicando ordinamento speciale, distribuzione di gruppi di righe, codifica del dizionario e compressione nei file Parquet. Di conseguenza, i motori di calcolo richiedono meno risorse di rete, disco e CPU per leggere i dati dall'archiviazione, offrendo efficienza dei costi e prestazioni. È conforme al 100% al formato parquet open source; tutti i motori parquet possono leggerlo come normali file parquet.
Considerazioni sulle prestazioni
Prima di decidere di disabilitare l'ordine V, tenere presente quanto segue:
- La modalità Direct Lake di Microsoft Fabric dipende dal V-Order.
- Nel Warehouse, l'effetto delle prestazioni di V-Order può variare a seconda degli schemi di tabella, dei volumi di dati, delle query e degli schemi di inserimento.
- Assicurarsi di testare il modo in cui V-Order influisce sulle prestazioni dell'inserimento dati e delle query prima di decidere di disabilitarla. Prendere in considerazione la creazione di una copia del Warehouse di test usando il controllo del codice sorgente, la disabilitazione del V-Order nella copia e l'esecuzione di attività di inserimento ed esecuzione di query sui dati per testare le implicazioni delle prestazioni.
Gli scenari in cui il V-Order potrebbe non essere utile
Prendere in considerazione l'effetto delle prestazioni di V-Order prima di decidere se è opportuno disabilitare V-Order.
Attenzione
Attualmente, la disabilitazione di V-Order può essere eseguita solo a livello di warehouse ed è irreversibile: una volta disabilitata, non può essere abilitata di nuovo. Gli utenti devono considerare le prestazioni se scelgono di disabilitare V-Order in Fabric Warehouse.
La disabilitazione di V-Order può essere utile per i warehouse a elevato utilizzo di scrittura, ad esempio per i warehouse dedicati ai dati di gestione temporanea come parte di un processo di inserimento dati. Le tabelle di gestione temporanea vengono spesso eliminate e ricreate (o troncate) per elaborare nuovi dati. Queste tabelle di gestione temporanea potrebbero quindi essere lette una o due volte, che potrebbe non giustificare il tempo di inserimento aggiunto applicando il V-Order. Disabilitando il V-Order e riducendo il tempo di inserimento dei dati, il tempo complessivo per elaborare i dati durante i processi di inserimento potrebbe essere ridotto. In questo caso, è consigliabile segmentare il magazzino di gestione temporanea dal warehouse principale rivolto all'utente, in modo che le query di analisi e Power BI possano trarre vantaggio da V-Order.