Novinky a plány pro synapse Datová Věda v Microsoft Fabric
Důležité
Plány vydaných verzí popisují funkce, které ještě mohly nebo nemusely být vydány. Časové osy doručení a předpokládané funkce se můžou změnit nebo nemusí být odeslány. Další informace najdete v zásadách Společnosti Microsoft .
Synapse Datová Věda poskytuje datovým vědcům ucelený pracovní postup pro vytváření modelů strojového učení, od zkoumání až po vyhodnocování modelů. Z hlediska zkoumání dat můžou datoví vědci používat R a Python v poznámkových blocích a integrované nástroje, jako je Data Wrangler, pro snadnou analýzu. Uživatelé můžou sledovat a porovnávat experimenty a spuštění modelů pomocí MLFlow. Můžou uložit nejvýkonnější model v pracovním prostoru jako novou položku modelu a snadno použít Funkci Predict pro dávkové bodování ve velkém měřítku. Datové vědy v prostředcích infrastruktury jsou hluboce integrované se zbytkem zásobníku, což znamená, že je bezproblémové bodovat data v lakehouse, zapisovat předpovědi zpět do OneLake a vizualizovat data v sestavách pomocí režimu Direct Lake.
Synapse Datová Věda je ve verzi Public Preview. Další informace najdete v dokumentaci a na blogu s oznámením.
Investiční oblasti
Funkce | Odhadovaná časová osa vydání |
---|---|
Sémantický odkaz | 4. čtvrtletí 2023 |
Vylepšení služby Data Wrangler | 4. čtvrtletí 2023 |
Aktualizace sledování modelů a experimentů | 4. čtvrtletí 2023 |
Ladění hyperparametrů automatického strojového učení s využitím FLAML | 4. čtvrtletí 2023 |
Předem vytrénovaná AI se službou Azure Cognitive Services | 4. čtvrtletí 2023 |
Podpora CI/CD pro položky datových věd | 2. čtvrtletí 2024 |
Podpora datových věd v sadě Fabric SDK | 4. čtvrtletí 2023 |
Integrace centra monitorování | 2. čtvrtletí 2024 |
Sémantický odkaz
Odhadovaná časová osa vydání: 4. čtvrtletí 2023
Sémantické propojení překlenuje mezeru mezi datovými vědami a BI tím, že poskytuje knihovnu Pythonu (SemPy), která datovým vědcům umožňuje interakci s datovými sadami a mírami Power BI. Pomocí nástroje SemPy můžete číst, zkoumat, dotazovat a ověřovat data v Power BI z poznámkových bloků Pythonu a používat funkce knihovny k detekci a řešení problémů s daty. Uživatelé můžou také zapisovat zpět do datové sady Power BI prostřednictvím lakehouse s Direct Lake režimem.
Vylepšení služby Data Wrangler
Odhadovaná časová osa vydání: 4. čtvrtletí 2023
Data Wrangler podporuje datové rámce Sparku, což umožňuje škálovat přípravu dat na větší datové sady. Díky této integraci je příprava dat intuitivnější a výkonnější.
Aktualizace sledování modelů a experimentů
Odhadované časové osy vydání: 4. čtvrtletí 2023
Můžete protokolovat a monitorovat spuštění, metriky a parametry z prostředí pro vytváření vložených poznámkových bloků. Můžete použít funkce MLFlow, jako jsou značky a fáze. Můžete také spolupracovat a sdílet položky experimentu a modelu ML s ostatními a nahrávat a importovat prostředky modelu z různých zdrojů pro lepší sledování a správu.
Ladění hyperparametrů automatického strojového učení s využitím FLAML
Odhadované časové osy vydání: 4. čtvrtletí 2023
Proces trénování a optimalizace modelů strojového učení můžete automatizovat s flexibilitou FLAML. Pomocí Sparku můžete snížit náklady paralelizací zkušebních verzí hyperparametrů a snadno vyladit modely SparkML a SynapseML. MLflow automaticky zaznamenává spuštění AutoML a metriky hyperparametrů.
Předem vytrénovaná AI se službou Azure Cognitive Services
Odhadované časové osy vydání: 4. čtvrtletí 2023
Abychom AI umožnili uživatelům na všech úrovních, integrujeme předem vytvořené modely AI služby Azure Cognitive Service do prostředků infrastruktury poznámkových bloků Fabric. Můžete používat modely Analýza textu, UVAD a Text Translator integrované do prostředků infrastruktury, aniž byste museli provádět jakékoli nastavení.
Podpora CI/CD pro položky datových věd
Odhadovaná časová osa vydání: 2. čtvrtletí 2024
Kanály integrace a nasazení platformy Git můžete použít k vytváření verzí řešení pro datové vědy a jejich nasazení napříč vývojovými, testovacími a produkčními pracovními prostory. Můžete použít uživatelské rozhraní nebo proces automatizovat prostřednictvím Azure Pipelines.
Podpora datových věd v sadě Fabric SDK
Odhadovaná časová osa vydání: 4. čtvrtletí 2023
Sada Fabric SDK umožňuje uživatelům programově vytvářet, spravovat a monitorovat položky datových věd.
Integrace centra monitorování
Odhadovaná časová osa vydání: 2. čtvrtletí 2024
Spuštění položek datových věd jsou k dispozici pro monitorování v centru monitorování spolu se všemi ostatními položkami prostředků infrastruktury.