Co je nového a plánujeme pro Synapse Datoví technici v Microsoft Fabric
Důležité
Plány vydaných verzí popisují funkce, které mohly nebo ještě nebyly vydány. Časové osy doručení a předpokládané funkce se můžou změnit nebo nemusí dodávat. Další informace najdete v zásadách Microsoftu.
Synapse Datoví technici ing umožňuje datovým inženýrům transformovat data ve velkém měřítku pomocí Sparku a vytvářet architekturu jezera.
Lakehouse pro všechna data vaší organizace: Lakehouse kombinuje to nejlepší z datového jezera a datového skladu v jediném prostředí. Umožňuje uživatelům ingestovat, připravovat a sdílet data organizace v otevřeném formátu v jezeře. Později k němu budete mít přístup prostřednictvím několika modulů, jako je Spark, T-SQL a Power BI. Poskytuje různé možnosti integrace dat, jako jsou toky dat a kanály, klávesové zkratky pro externí zdroje dat a možnosti sdílení datových produktů.
Výkonný modul Spark a modul runtime: Technologie Synapse Data poskytuje zákazníkům optimalizovaný modul runtime Sparku s nejnovějšími verzemi Sparku, Delta a Pythonu. Používá Delta Lake jako společný formát tabulky pro všechny moduly, což umožňuje snadné sdílení dat a vytváření sestav bez přesunu dat. Modul runtime se dodává s optimalizacemi Sparku a vylepšuje výkon dotazů bez jakýchkoli konfigurací. Nabízí také úvodní fondy a režim vysoké souběžnosti, které urychlují a znovu používají relace Sparku, což šetří čas a náklady.
Správci Sparku a konfigurace: Správci pracovního prostoru s příslušnými oprávněními můžou vytvářet a konfigurovat vlastní fondy pro optimalizaci výkonu a nákladů na úlohy Sparku. Tvůrci můžou nakonfigurovat prostředí pro instalaci knihoven, vybrat verzi modulu runtime a nastavit vlastnosti Sparku pro své poznámkové bloky a úlohy Sparku.
Prostředí pro vývojáře: Vývojáři můžou k vytváření a spouštění kódu Spark v prostředcích infrastruktury používat poznámkové bloky, úlohy Sparku nebo upřednostňované integrované vývojové prostředí (IDE). Můžou nativně přistupovat k datům lakehouse, spolupracovat s ostatními, instalovat knihovny, sledovat historii, provádět online monitorování a získávat doporučení od poradce pro Spark. Data Wrangler můžou také použít k snadné přípravě dat pomocí uživatelského rozhraní s nízkým kódem.
Integrace platformy: Všechny položky přípravy dat Synapse, včetně poznámkových bloků, úloh Sparku, prostředí a jezerahouse, jsou hluboko integrované do platformy Fabric (možnosti správy podnikových informací, rodokmen, popisky citlivosti a doporučení).
Investiční oblasti
Funkce | Odhadovaná časová osa vydání |
---|---|
Vysoká souběžnost v kanálech | Q3 2024 |
VS Code pro web – podpora ladění | Q3 2024 |
Rozšíření VSCode Core pro Prostředky infrastruktury | Q3 2024 |
Satelitní rozšíření VSCode pro funkce uživatelských dat v prostředcích infrastruktury | Q3 2024 |
Možnost řazení a filtrování tabulek a složek v Lakehouse | Q4 2024 |
Veřejná rozhraní API pro monitorování | Q4 2024 |
Zabezpečení dat Lakehouse | Q4 2024 |
Podpora schématu a pracovní prostor v oboru názvů v Lakehouse | Odesláno (3. čtvrtletí 2024) |
Konektor Spark pro datový sklad prostředků infrastruktury | Odesláno (2. čtvrtletí 2024) |
Nativní prováděcí modul Sparku | Odesláno (2. čtvrtletí 2024) |
Vytváření a připojení prostředí | Odesláno (2. čtvrtletí 2024) |
Rozhraní Microsoft Fabric API pro GraphQL | Odesláno (2. čtvrtletí 2024) |
Řazení úloh do fronty pro úlohy poznámkového bloku | Odesláno (2. čtvrtletí 2024) |
Optimistické přijetí úloh pro Fabric Spark | Odesláno (2. čtvrtletí 2024) |
Automatické ladění Sparku | Odesláno (Q1 2024) |
Vysoká souběžnost v kanálech
Odhadovaná časová osa vydání: 3. čtvrtletí 2024
Typ verze: Obecná dostupnost
Kromě vysoké souběžnosti vpoznámkch Tato funkce vám umožní spouštět více poznámkových bloků v kanálu s jednou relací.
VS Code pro web – podpora ladění
Odhadovaná časová osa vydání: 3. čtvrtletí 2024
Typ verze: Public Preview
Visual Studio Code pro web se v současné době podporuje ve verzi Preview pro scénáře vytváření a spouštění. Do seznamu funkcí přidáme možnost ladit kód pomocí tohoto rozšíření pro poznámkový blok.
Rozšíření VSCode Core pro Prostředky infrastruktury
Odhadovaná časová osa vydání: 3. čtvrtletí 2024
Typ verze: Public Preview
Základní rozšíření VSCode pro Prostředky infrastruktury poskytne společnou podporu pro vývojáře pro služby Fabric.
Satelitní rozšíření VSCode pro funkce uživatelských dat v prostředcích infrastruktury
Odhadovaná časová osa vydání: 3. čtvrtletí 2024
Typ verze: Public Preview
Rozšíření VSCode Satellite pro User Data Functions bude poskytovat podporu pro vývojáře (úpravy, sestavování, ladění, publikování) pro funkce uživatelských dat v prostředcích infrastruktury.
Možnost řazení a filtrování tabulek a složek v Lakehouse
Odhadovaná časová osa vydání: 4. čtvrtletí 2024
Typ verze: Obecná dostupnost
Tato funkce umožňuje zákazníkům řadit a filtrovat tabulky a složky v Lakehouse několika různými metodami, včetně abecedy, data vytvoření a dalších.
Veřejná rozhraní API pro monitorování
Odhadovaná časová osa vydání: 4. čtvrtletí 2024
Typ verze: Obecná dostupnost
Veřejná rozhraní API pro monitorování umožňují programově načíst stav úloh Sparku, souhrny úloh a odpovídající protokoly ovladače a exekutoru.
Zabezpečení dat Lakehouse
Odhadovaná časová osa vydání: 4. čtvrtletí 2024
Typ verze: Public Preview
V jezeře budete mít možnost použít zabezpečení souborů, složek a tabulek (nebo na úrovni objektů). Můžete také řídit, kdo má přístup k datům v jezeře, a úroveň oprávnění, která mají. Můžete například udělit oprávnění ke čtení u souborů, složek a tabulek. Po použití oprávnění se automaticky synchronizují napříč všemi moduly. To znamená, že oprávnění jsou konzistentní napříč Sparkem, SQL, Power BI a externími moduly.
Odeslané funkce
Podpora schématu a pracovní prostor v oboru názvů v Lakehouse
Odesláno (3. čtvrtletí 2024)
Typ verze: Public Preview
To umožní uspořádat tabulky pomocí schémat a dotazovat data napříč pracovními prostory.
Konektor Spark pro datový sklad prostředků infrastruktury
Odesláno (2. čtvrtletí 2024)
Typ verze: Public Preview
Konektor Sparku pro Data Warehouse (Data Warehouse) umožňuje vývojáři Sparku nebo datovému vědci přistupovat k datům z datového skladu Fabric a pracovat na nich pomocí zjednodušeného rozhraní Spark API, které doslova funguje jenom s jedním řádkem kódu. Nabízí možnost dotazovat se na data paralelně z datového skladu Fabric, aby se škáluje s rostoucím objemem dat a respektuje model zabezpečení (OLS/RLS/CLS) definovaný na úrovni datového skladu při přístupu k tabulce nebo zobrazení. Tato první verze bude podporovat pouze čtení dat a podpora pro zápis dat zpět bude brzy k dispozici.
Nativní prováděcí modul Sparku
Odesláno (2. čtvrtletí 2024)
Typ verze: Public Preview
Nativní prováděcí modul je zásadní vylepšení pro spouštění úloh Apache Sparku v Microsoft Fabric. Tento vektorizovaný modul optimalizuje výkon a efektivitu dotazů Sparku jejich spuštěním přímo v infrastruktuře lakehouse. Bezproblémová integrace modulu znamená, že nevyžaduje žádné úpravy kódu a zabraňuje uzamčení dodavatele. Podporuje rozhraní Apache Spark API a je kompatibilní s modulem Runtime 1.2 (Spark 3.4) a funguje s formáty Parquet i Delta. Bez ohledu na umístění dat v rámci OneLake nebo pokud přistupujete k datům prostřednictvím zástupců, nativní prováděcí modul maximalizuje efektivitu a výkon.
Vytváření a připojení prostředí
Odesláno (2. čtvrtletí 2024)
Typ verze: Obecná dostupnost
Pokud chcete prostředí Sparku přizpůsobit na podrobnější úrovni, můžete vytvářet a připojovat prostředí k poznámkovým blokům a úlohám Sparku. V prostředí můžete nainstalovat knihovny, nakonfigurovat nový fond, nastavit vlastnosti Sparku a nahrát skripty do systému souborů. To vám dává větší flexibilitu a kontrolu nad úlohami Sparku, aniž by to mělo vliv na výchozí nastavení pracovního prostoru. V rámci ga provádíme různá vylepšení prostředí, včetně podpory rozhraní API a integrace CI/CD.
Rozhraní Microsoft Fabric API pro GraphQL
Odesláno (2. čtvrtletí 2024)
Typ verze: Public Preview
Rozhraní API pro GraphQL umožní datovým inženýrům infrastruktury, vědcům, architektům datových řešení snadno zveřejnit a integrovat data Fabric, aby mohli rychleji reagovat, provádět a bohaté analytické aplikace s využitím výkonu a flexibility GraphQL.
Řazení úloh do fronty pro úlohy poznámkového bloku
Odesláno (2. čtvrtletí 2024)
Typ verze: Obecná dostupnost
Tato funkce umožňuje, aby se naplánované poznámkové bloky Sparku zařadily do fronty, když je využití Sparku na maximálním počtu úloh, které může spustit paralelně, a pak se spustí, jakmile se využití vrátí pod maximální povolený počet paralelních úloh.
Optimistické přijetí úloh pro Fabric Spark
Odesláno (2. čtvrtletí 2024)
Typ verze: Obecná dostupnost
V případě optimistického přístupu úloh si Spark pouze vyhrazuje minimální počet jader, která úloha musí spustit, na základě minimálního počtu uzlů, na které může úloha vertikálně snížit kapacitu. To umožňuje povolení více úloh, pokud je k dispozici dostatek prostředků pro splnění minimálních požadavků. Pokud se úloha potřebuje vertikálně navýšit kapacitu později, žádosti o vertikální navýšení kapacity se schválí nebo zamítnou na základě dostupných jader v kapacitě.
Automatické ladění Sparku
Odesláno (Q1 2024)
Typ verze: Public Preview
Autotune používá strojové učení k automatické analýze předchozích spuštění úloh Sparku a ladění konfigurací za účelem optimalizace výkonu. Konfiguruje způsob dělení, připojení a čtení dat sparkem. Tímto způsobem výrazně zlepší výkon. Viděli jsme, že úlohy zákazníků s touto schopností běží 2x rychleji.