Sdílet prostřednictvím


Migrace dat a kanálů z Azure Synapse do Microsoft Fabric

Prvním krokem při migraci dat a kanálů je identifikace dat, která chcete zpřístupnit ve OneLake, a kanály, které chcete přesunout.

Pro migraci dat máte dvě možnosti:

  • Možnost 1: Azure Data Lake Storage (ADLS) Gen2 jako výchozí úložiště Pokud aktuálně používáte ADLS Gen2 a chcete se vyhnout kopírování dat, zvažte použití klávesových zkratek OneLake.
  • Možnost 2: OneLake jako výchozí úložiště Pokud chcete přejít z ADLS Gen2 na OneLake jako vrstvu úložiště, zvažte čtení a zápis z/do OneLake z poznámkových bloků a definic úloh Sparku.

Migrace dat

Možnost 1: ADLS Gen2 jako úložiště (klávesové zkratky)

Pokud pracujete s ADLS Gen2 a chcete se vyhnout duplikaci dat, můžete ve OneLake vytvořit zástupce zdrojové cesty ADLS Gen2. Klávesové zkratky můžete vytvořit v oddílech Soubory a tabulky v lakehouse v prostředcích infrastruktury s následujícími aspekty:

  • Oddíl Soubory je nespravovaná oblast jezera. Pokud jsou vaše data ve formátu CSV, JSON nebo Parquet, doporučujeme vytvořit zástupce této oblasti.
  • Oddíl Tabulky je spravovaná oblast jezera. Tady jsou zaregistrované všechny tabulky spravované Sparkem i nespravované tabulky. Pokud jsou vaše data ve formátu Delta, můžete v této oblasti vytvořit zástupce a proces automatického zjišťování tyto tabulky Delta automaticky zaregistruje v metastoru lakehouse.

Přečtěte si další informace o vytvoření zástupce ADLS Gen2.

Možnost 2: OneLake jako úložiště

Pokud chcete oneLake použít jako vrstvu úložiště a přesunout data z ADLS Gen2, měli byste nejprve nasměrovat položky související se Sparkem Azure Synapse na OneLake a pak přenést existující data do OneLake. Pokud jde o předchozí verzi, podívejte se na integraci OneLake s Azure Synapse Sparkem.

Pokud chcete přesunout existující data do OneLake, máte několik možností:

  • mssparkutils fastcp: Knihovna mssparkutils poskytuje rozhraní API fastcp, které umožňuje kopírovat data mezi ADLS Gen2 a OneLake.
  • AzCopy: Ke kopírování dat z ADLS Gen2 do OneLake můžete použít nástroj příkazového řádku AzCopy.
  • Azure Data Factory, Azure Synapse a Data Factory v prostředcích infrastruktury: Kopírování dat do jezera pomocí aktivity kopírování
  • Klávesové zkratky: Historická data ADLS Gen2 můžete ve OneLake povolit pomocí klávesových zkratek. Není potřeba žádná kopie dat.
  • Průzkumník služby Azure Storage: Soubory můžete přesunout z umístění ADLS Gen2 do OneLake pomocí Průzkumník služby Azure Storage. Podívejte se, jak integrovat OneLake s Průzkumník služby Azure Storage.

Pokud vaše datové kanály Azure Synapse zahrnují aktivity definice poznámkových bloků nebo úloh Sparku, budete muset tyto kanály přesunout z Azure Synapse do datových kanálů služby Data Factory v prostředcích infrastruktury a odkazovat na cílové poznámkové bloky. Aktivita poznámkového bloku je dostupná v datových kanálech služby Data Factory. Tady najdete všechny podporované aktivity datového kanálu v prostředcích infrastruktury.