Sdílet prostřednictvím


Migrace z Azure Synapse Sparku do prostředků infrastruktury

Než začnete s migrací, měli byste ověřit, že Datoví technici Fabric je nejlepším řešením pro vaši úlohu. Datové inženýrství Fabricu podporuje lakehouse, poznámkový blok, prostředí, definici úlohy Spark (SJD) a položky pipeline, včetně podpory různých možností runtime a funkcionalit Sparku.

Klíčové aspekty

Počátečním krokem při vytváření strategie migrace je posouzení vhodnosti. Stojí za zmínku, že některé funkce infrastruktury související se Sparkem jsou aktuálně ve vývoji nebo plánování. Další podrobnosti a aktualizace najdete v plánu infrastruktury.

V případě Sparku si prohlédnou podrobné porovnání rozdílů mezi Azure Synapse Sparkem a prostředky infrastruktury.

Scénáře migrace

Pokud zjistíte, že Datoví technici Fabric je správnou volbou pro migraci stávajících úloh Sparku, proces migrace může zahrnovat několik scénářů a fází:

  • Položky: Migrace položek zahrnuje přenos jedné nebo různých položek z existujícího pracovního prostoru Azure Synapse do prostředků infrastruktury. Přečtěte si další informace o migraci fondů Sparku, konfigurací Sparku, knihoven Sparku, poznámkových bloků a definici úlohy Spark.
  • Data a kanály: Pomocí zkratek OneLake můžete zpřístupnit data ADLS Gen2 (propojená s pracovním prostorem Azure Synapse) v Fabric Lakehouse. Migrace potrubí zahrnuje přesun stávajících potrubí do Fabric platformy, včetně aktivit potrubí specifikace notebooku a úlohy Spark. Přečtěte si další informace o migraci dat a kanálů.
  • Metadata: Migrace metadat zahrnuje přesun metadat katalogu Sparku (databáze, tabulky a oddíly) z existujícího metastoru Hive (HMS) v Azure Synapse do fabric lakehouse. Přečtěte si další informace o migraci metadat HMS.
  • Pracovní prostor: Uživatelé můžou migrovat existující pracovní prostor Azure Synapse vytvořením nového pracovního prostoru v Microsoft Fabric, včetně metadat. Migrace pracovního prostoru se v těchto doprovodných materiálech nevztahuje, předpokládá se, že uživatelé potřebují vytvořit nový pracovní prostor nebo mít existující pracovní prostor Fabric. Přečtěte si další informace o rolích pracovního prostoru v prostředcích infrastruktury.

Snímek obrazovky znázorňující scénáře migrace

Přechod z Azure Synapse Sparku na Fabric Spark vyžaduje hluboké porozumění vaší aktuální architektuře a rozdíly mezi Azure Synapse Sparkem a prostředky infrastruktury. Prvním zásadním krokem je posouzení, po kterém následuje vytvoření podrobného plánu migrace. Tento plán je možné přizpůsobit tak, aby odpovídal jedinečným vlastnostem systému, závislostem fází a složitostem úloh.