Nejčastější dotazy ke službě Data Factory v Microsoft Fabric

Tento článek obsahuje odpovědi na nejčastější dotazy týkající se služby Data Factory v Microsoft Fabric.

Jaká je budoucnost služby Azure Data Factory (ADF) a kanálů Synapse?

Kanály Azure Data Factory (ADF) a Azure Synapse udržují samostatné plány paaS (Platform as a Service). Tato dvě řešení nadále existují společně se službou Fabric Data Factory, která slouží jako nabídka Software jako služba (SaaS). Kanály ADF a Synapse zůstávají plně podporované a žádné plány odpisů nejsou. Je důležité zdůraznit, že pro všechny nadcházející projekty je naším návrhem zahájit používání služby Fabric Data Factory. Kromě toho máme zavedené strategie pro usnadnění přechodu kanálů ADF a Synapse do služby Fabric Data Factory, které jim umožňují využívat nové funkce infrastruktury.

Jaké jsou důvody pro výběr kanálů ADF nebo Synapse ve verzi Public Preview služby Fabric Data Factory?

Vzhledem k tomu, že se snažíme přemostět mezery mezi funkcemi a začlenit robustní orchestraci datových kanálů a možnosti pracovních postupů, které najdete v kanálech ADF nebo Azure Synapse, do služby Fabric Data Factory bereme na vědomí, že některé funkce, které jsou přítomné v kanálech ADF nebo Synapse, můžou být pro vaše potřeby nezbytné. I když se doporučuje pokračovat v využívání kanálů ADF nebo Synapse, pokud jsou tyto funkce nezbytné, doporučujeme vám nejprve prozkoumat nové možnosti integrace dat v Prostředcích infrastruktury. Vaše zpětná vazba na to, které funkce jsou klíčové pro váš úspěch, je neocenitelná. Abychom to usnadnili, aktivně pracujeme na zavedení nové funkce, která umožňuje také migraci stávajících datových továren z Azure do pracovních prostorů Fabric.

Jsou v ADF/Synapse dostupné také nové funkce služby Fabric Data Factory?

Nové funkce z kanálů Fabric do kanálů ADF nebo Synapse nepřeportujeme. Udržujeme dva samostatné plány pro službu Fabric Data Factory a ADF/ Synapse. Požadavky backportu vyhodnocujeme v reakci na příchozí zpětnou vazbu.

Je kanál fabric stejný jako kanál Azure Synapse?

Hlavní funkce kanálu Fabric je podobná kanálu Azure Synapse, ale pomocí kanálu Fabric můžou uživatelé použít všechny možnosti analýzy dat na platformě Fabric. Rozdíly a mapování funkcí mezi kanálem Infrastruktury a kanálem Azure Synapse najdete tady: Rozdíly mezi službou Data Factory v Prostředcích infrastruktury a Azure.

Jaký je rozdíl mezi objektem pro vytváření dat a kartou přípravy dat v prostředcích infrastruktury?

Data Factory pomáhá řešit složité scénáře integrace dat a ETL s využitím cloudových služeb pro přesun a transformaci dat, zatímco datové inženýrství pomáhá vytvářet jezero, pomocí Apache Sparku transformovat a připravovat data. Rozdíly mezi jednotlivými terminologií a prostředími prostředků infrastruktury jsou k dispozici v terminologii Microsoft Fabric.

Kde najdu měsíční aktualizace dostupné v prostředcích infrastruktury?

Měsíční aktualizace Prostředků infrastruktury jsou k dispozici na blogu Microsoft Fabric.

Návody migrovat existující kanály z pracovního prostoru Azure Data Factory (nebo) Azure Synapse do služby Fabric Data Factory?

V současné době se službou Fabric Data Factory ve verzi Public Preview je jedinou dostupnou metodou opětovného vytvoření kanálů ve službě Fabric Data Factory. Usilovně vyvíjíme novou funkci, která uživatelům umožňuje efektivně dohlížet na kanály Fabric a ADF a spravovat je v rámci platformy Fabric. Tato inovativní nová funkce nejen zaručuje bezproblémovou zachování kontinuity produktů, ale také poskytuje uživatelům možnost ponořit se do vylepšených funkcí nabízených možnostmi integrace dat fabric.

Návody sledovat a monitorovat kapacitu prostředků infrastruktury používaných s kanály?

Správci kapacity Microsoft Fabric můžou použít aplikaci Microsoft Fabric Capacity Metrics , označovanou také jako aplikace metrik, a získat tak přehled o prostředcích kapacity. Tato aplikace umožňuje správcům zjistit, kolik využití procesoru, doby zpracování a paměti využívají datové kanály, toky dat a další položky v pracovních prostorech s podporou kapacity Infrastruktury. Získejte přehled o příčinách přetížení, dobách špičky poptávky, spotřebě prostředků a snadnější identifikaci nejnáročnějších nebo nejoblíbenějších položek.

Je tok dat fabric Gen2 podobný Power Query vložený do Azure Data Factory?

Aktivita Power Query v rámci ADF sdílí podobnosti s tokem dat Gen2, ale má další funkce, které umožňují akce, jako je zápis do konkrétních cílů dat atd. Toto porovnání odpovídá lépe toku dat Gen1 (toky dat Power BI nebo toky dat Power Apps). Další podrobnosti najdete tady: Rozdíly mezi tokem dat Gen1 a Tokem dat Gen2.

Jak se můžu připojit k místním zdrojům dat ve službě Fabric Data Factory?

Naše aktuální zaměření zahrnuje aktivní vývoj podpory kanálu Infrastruktury v rámci místní brány dat. Tato připravovaná funkce vám umožňuje bezproblémově využívat kanály Infrastruktury pro přímý přístup k místním datům. Dokud nebude tato funkce dostupná, je možné alternativní řešení: tok dat Fabric můžete využít k přenosu dat do cloudového úložiště a následnému využití kanálu Fabric k usnadnění přesunu dat do požadovaného cíle. Tím zajistíte hladký přechod, dokud nebude dostupná integrace místní brány dat.

Je možné se připojit k existujícím prostředkům s podporou privátního koncového bodu (PE) ve službě Fabric Data Factory?

Brána virtuální sítě v současné době nabízí injektivní metodu pro bezproblémovou integraci do vaší virtuální sítě a poskytuje robustní způsob použití privátních koncových bodů k navázání zabezpečených připojení k úložišti dat. Je důležité si uvědomit, že brána virtuální sítě v tuto chvíli hostuje pouze toky dat Fabric. Naše nadcházející iniciativy však zahrnují rozšíření svých schopností tak, aby zahrnovaly kanály Fabric.

Jak rychle můžu ingestovat data v datových kanálech infrastruktury?

Služba Fabric Data Factory umožňuje vyvíjet kanály, které maximalizují propustnost přesunu dat pro vaše prostředí. Tyto kanály plně využívají následující prostředky:

  • Šířka pásma sítě mezi zdrojovým a cílovým úložištěm dat
  • Vstupně-výstupní operace zdrojového nebo cílového úložiště dat za sekundu (IOPS) a šířka pásma– Toto úplné využití znamená, že můžete odhadnout celkovou propustnost měřením minimální dostupné propustnosti s následujícími prostředky:
  • Zdrojové úložiště dat
  • Cílové úložiště dat
  • Šířka pásma sítě mezi zdrojovým a cílovým úložištěm dat Mezitím průběžně pracujeme na inovacích, abychom zvýšili nejlepší možnou propustnost, kterou můžete dosáhnout. Dnes může služba přesunout datovou sadu TPC-DI (soubory parquet) o 1 TB do tabulky Fabric Lakehouse i datového skladu během 5 minut – přesun 1B řádků pod 1 min. Upozorňujeme, že tento výkon je pouze odkaz spuštěním výše uvedené testovací datové sady. Skutečná propustnost stále závisí na faktorech uvedených dříve. Propustnost můžete navíc vždy vynásobit spuštěním více aktivit kopírování paralelně. Například použití smyčky ForEach.

Jaký přístup se doporučuje pro přiřazování rolí v rámci služby Fabric Data Factory?

Různé úlohy mezi pracovními prostory můžete oddělit a použít role, jako je člen a prohlížeč, a vytvořit tak pracovní prostor pro přípravu dat, který předpí data pro pracovní prostor, který se používá pro trénování sestavy nebo umělé inteligence. S rolí čtenáře pak můžete využívat data z pracovního prostoru přípravy dat.