Inzicht in V-Order voor Microsoft Fabric Warehouse
Van toepassing op:✅ Warehouse in Microsoft Fabric
Het magazijn in Microsoft Fabric Storage maakt gebruik van de Delta Lake-tabelindeling voor alle gebruikersgegevens. Naast optimalisaties die worden geleverd door de Delta-indeling, past een magazijn optimalisaties toe op opslag om snellere queryprestaties te bieden voor analysescenario's, terwijl de naleving van de Parquet-indeling behouden blijft. In dit artikel wordt beschreven hoe u schrijfoptimalisatie van V-Order, de voordelen ervan en hoe u dit kunt beheren.
V-Order is een optimalisatie van schrijftijd voor de Parquet-bestandsindeling waarmee razendsnelle leesbewerkingen mogelijk zijn onder de Microsoft Fabric-rekenengines, zoals Power BI, SQL, Spark en andere.
Power BI- en SQL-engines maken gebruik van Microsoft Verti-Scan-technologie en V-Geordende Parquet-bestanden om in-memory-achtige gegevenstoegangstijden te bereiken. Spark en andere niet-Verti-Scan-rekenprogramma's profiteren ook van de V-Geordende bestanden met gemiddeld 10% snellere leestijden, met sommige scenario's tot 50%.
V-Order werkt door speciale sortering, rijgroepdistributie, woordenlijstcodering en compressie toe te passen op Parquet-bestanden. Als gevolg hiervan vereisen rekenengines minder netwerk-, schijf- en CPU-resources om gegevens uit de opslag te lezen, waardoor kostenefficiëntie en prestaties worden geboden. Het is 100% compatibel met de opensource parquet-indeling; alle parquet-engines kunnen het lezen als gewone Parquet-bestanden.
Houd rekening met het volgende voordat u besluit V-Order uit te schakelen:
- De Direct Lake-modus van Microsoft Fabric is afhankelijk van V-Order.
- In het magazijn kan het effect van V-Order op prestaties variëren, afhankelijk van uw tabelschema's, gegevensvolumes, query- en opnamepatronen.
- Zorg ervoor dat u test hoe V-Order van invloed is op de prestaties van gegevensopname en van uw query's voordat u besluit deze uit te schakelen. U kunt een kopie van uw testwarehouse maken met behulp van broncodebeheer, V-Order uitschakelen bij het kopiëren en het uitvoeren van gegevensopname- en querytaken om de gevolgen voor de prestaties te testen.
Houd rekening met het effect van V-Order op prestaties voordat u beslist of het uitschakelen van V-Order geschikt is voor u.
Waarschuwing
Op dit moment kan het uitschakelen van V-Order alleen worden uitgevoerd op magazijnniveau en kan het niet meer ongedaan worden gemaakt: zodra dit is uitgeschakeld, kan deze niet meer worden ingeschakeld. Gebruikers moeten rekening houden met de prestaties als ze ervoor kiezen om V-Order in Fabric Warehouse uit te schakelen.
Het uitschakelen van V-Order kan handig zijn voor schrijfintensieve magazijnen, zoals voor magazijnen die zijn toegewezen aan faseringsgegevens als onderdeel van een gegevensopnameproces. Faseringstabellen worden vaak verwijderd en opnieuw gemaakt (of afgekapt) om nieuwe gegevens te verwerken. Deze faseringstabellen kunnen dan slechts één of twee keer worden gelezen, waardoor de opnametijd die is toegevoegd door V-Order toe te passen, mogelijk niet wordt gerechtvaardigd. Door V-Order uit te schakelen en de tijd voor het opnemen van gegevens te verkorten, kan uw totale tijd voor het verwerken van gegevens tijdens opnametaken worden verminderd. In dit geval moet u het faseringswarehouse segmenteren van uw belangrijkste gebruikersgerichte magazijn, zodat de analysequery's en Power BI kunnen profiteren van V-Order.