Novinky a plány pro synapse Datová Věda v Microsoft Fabric

Důležité

Plány vydaných verzí popisují funkce, které ještě mohly nebo nemusely být vydány. Časové osy doručení a předpokládané funkce se můžou změnit nebo nemusí být odeslány. Další informace najdete v zásadách Společnosti Microsoft .

Synapse Datová Věda poskytuje datovým vědcům ucelený pracovní postup pro vytváření modelů strojového učení, od zkoumání až po vyhodnocování modelů. Z hlediska zkoumání dat můžou datoví vědci používat R a Python v poznámkových blocích a integrované nástroje, jako je Data Wrangler, pro snadnou analýzu. Uživatelé můžou sledovat a porovnávat experimenty a spuštění modelů pomocí MLFlow. Můžou uložit nejvýkonnější model v pracovním prostoru jako novou položku modelu a snadno použít Funkci Predict pro dávkové bodování ve velkém měřítku. Datové vědy v prostředcích infrastruktury jsou hluboce integrované se zbytkem zásobníku, což znamená, že je bezproblémové bodovat data v lakehouse, zapisovat předpovědi zpět do OneLake a vizualizovat data v sestavách pomocí režimu Direct Lake.

Synapse Datová Věda je ve verzi Public Preview. Další informace najdete v dokumentaci a na blogu s oznámením.

Investiční oblasti

Funkce Odhadovaná časová osa vydání
Sémantický odkaz 4. čtvrtletí 2023
Vylepšení služby Data Wrangler 4. čtvrtletí 2023
Aktualizace sledování modelů a experimentů 4. čtvrtletí 2023
Ladění hyperparametrů automatického strojového učení s využitím FLAML 4. čtvrtletí 2023
Předem vytrénovaná AI se službou Azure Cognitive Services 4. čtvrtletí 2023
Podpora CI/CD pro položky datových věd 2. čtvrtletí 2024
Podpora datových věd v sadě Fabric SDK 4. čtvrtletí 2023
Integrace centra monitorování 2. čtvrtletí 2024

Odhadovaná časová osa vydání: 4. čtvrtletí 2023

Sémantické propojení překlenuje mezeru mezi datovými vědami a BI tím, že poskytuje knihovnu Pythonu (SemPy), která datovým vědcům umožňuje interakci s datovými sadami a mírami Power BI. Pomocí nástroje SemPy můžete číst, zkoumat, dotazovat a ověřovat data v Power BI z poznámkových bloků Pythonu a používat funkce knihovny k detekci a řešení problémů s daty. Uživatelé můžou také zapisovat zpět do datové sady Power BI prostřednictvím lakehouse s Direct Lake režimem.

Vylepšení služby Data Wrangler

Odhadovaná časová osa vydání: 4. čtvrtletí 2023

Data Wrangler podporuje datové rámce Sparku, což umožňuje škálovat přípravu dat na větší datové sady. Díky této integraci je příprava dat intuitivnější a výkonnější.

Aktualizace sledování modelů a experimentů

Odhadované časové osy vydání: 4. čtvrtletí 2023

Můžete protokolovat a monitorovat spuštění, metriky a parametry z prostředí pro vytváření vložených poznámkových bloků. Můžete použít funkce MLFlow, jako jsou značky a fáze. Můžete také spolupracovat a sdílet položky experimentu a modelu ML s ostatními a nahrávat a importovat prostředky modelu z různých zdrojů pro lepší sledování a správu.

Ladění hyperparametrů automatického strojového učení s využitím FLAML

Odhadované časové osy vydání: 4. čtvrtletí 2023

Proces trénování a optimalizace modelů strojového učení můžete automatizovat s flexibilitou FLAML. Pomocí Sparku můžete snížit náklady paralelizací zkušebních verzí hyperparametrů a snadno vyladit modely SparkML a SynapseML. MLflow automaticky zaznamenává spuštění AutoML a metriky hyperparametrů.

Předem vytrénovaná AI se službou Azure Cognitive Services

Odhadované časové osy vydání: 4. čtvrtletí 2023

Abychom AI umožnili uživatelům na všech úrovních, integrujeme předem vytvořené modely AI služby Azure Cognitive Service do prostředků infrastruktury poznámkových bloků Fabric. Můžete používat modely Analýza textu, UVAD a Text Translator integrované do prostředků infrastruktury, aniž byste museli provádět jakékoli nastavení.

Podpora CI/CD pro položky datových věd

Odhadovaná časová osa vydání: 2. čtvrtletí 2024

Kanály integrace a nasazení platformy Git můžete použít k vytváření verzí řešení pro datové vědy a jejich nasazení napříč vývojovými, testovacími a produkčními pracovními prostory. Můžete použít uživatelské rozhraní nebo proces automatizovat prostřednictvím Azure Pipelines.

Podpora datových věd v sadě Fabric SDK

Odhadovaná časová osa vydání: 4. čtvrtletí 2023

Sada Fabric SDK umožňuje uživatelům programově vytvářet, spravovat a monitorovat položky datových věd.

Integrace centra monitorování

Odhadovaná časová osa vydání: 2. čtvrtletí 2024

Spuštění položek datových věd jsou k dispozici pro monitorování v centru monitorování spolu se všemi ostatními položkami prostředků infrastruktury.