Sdílet prostřednictvím


Ingestování dat do Azure Data Lake Storage Gen2

V tomto článku se dozvíte, jak přenést data z jednoho umístění do jiného v účtu úložiště Azure Data Lake Gen2 pomocí Azure Synapse Analytics.

Požadavky

Vytvoření propojených služeb

V Azure Synapse Analytics je propojená služba, ve které definujete informace o připojení k jiným službám. V této části přidáte Azure Synapse Analytics a Azure Data Lake Gen2 jako propojené služby.

  1. Otevřete uživatelské prostředí Azure Synapse Analytics a přejděte na kartu Spravovat .
  2. V části Externí připojení vyberte Propojené služby.
  3. Pokud chcete přidat propojenou službu, vyberte Nový.
  4. V seznamu vyberte dlaždici Azure Data Lake Storage Gen2 a vyberte Pokračovat.
  5. Zadejte svoje ověřovací přihlašovací údaje. Klíče účtu, služební principal a spravovaná identita jsou aktuálně podporované typy ověřování. Vyberte testovací připojení a ověřte správnost přihlašovacích údajů.
  6. Po dokončení vyberte Vytvořit .

Vytvořit potrubí

Potrubí obsahuje logický průběh pro provedení sady aktivit. V této části vytvoříte kanál obsahující aktivitu kopírování, která ingestuje data z Azure Data Lake Gen2 do vyhrazeného fondu SQL.

  1. Přejděte na kartu Orchestrate. Vyberte ikonu plus vedle záhlaví sestavení a vyberte Pipeline.
  2. V části Přesunout a transformovat v podokně aktivit přetáhněte Kopírovat data na plátno potrubí.
  3. Vyberte aktivitu kopírování a přejděte na kartu Zdroj . Výběrem možnosti Nový vytvoříte novou zdrojovou datovou sadu.
  4. Jako úložiště dat vyberte Azure Data Lake Storage Gen2 a vyberte pokračovat.
  5. Jako formát vyberte Text s oddělovači a vyberte pokračovat.
  6. V podokně nastavit vlastnosti vyberte propojenou službu ADLS, kterou jste vytvořili. Zadejte cestu k souboru zdrojových dat a určete, jestli má první řádek záhlaví. Schéma můžete importovat z úložiště souborů nebo z ukázkového souboru. Po dokončení vyberte OK.
  7. Přejděte na kartu Jímka . Výběrem možnosti Nový vytvořte novou datovou sadu jímky.
  8. Jako úložiště dat vyberte Azure Data Lake Storage Gen2 a vyberte pokračovat.
  9. Jako formát vyberte Text s oddělovači a vyberte pokračovat.
  10. V podokně nastavit vlastnosti vyberte propojenou službu ADLS, kterou jste vytvořili. Zadejte cestu ke složce, do které chcete zapisovat data. Po dokončení vyberte OK.

Ladění a publikování pipeliny

Jakmile dokončíte konfiguraci pipeline, můžete spustit testovací spuštění před publikováním artefaktů a ověřit, že je vše správné.

  1. Chcete-li ladit potrubí, na panelu nástrojů vyberte Ladit. Stav spuštění kanálu se zobrazí na panelu Výstup ve spodní části okna.
  2. Po úspěšném spuštění pipeline vyberte na horním panelu nástrojů možnost Publikovat vše. Tato akce publikuje entity (datové sady a kanály), které jste vytvořili ve službě Synapse Analytics.
  3. Počkejte, dokud se nezobrazí zpráva Publikování proběhlo úspěšně. Pokud chcete zobrazit zprávy s oznámením, vyberte v pravém horním rohu tlačítko zvonku.

Aktivace a monitorování kanálu

V tomto kroku ručně aktivujete pipeline publikovaný v předchozím kroku.

  1. Na panelu nástrojů vyberte Přidat aktivační událost a pak vyberte Aktivovat. Na stránce Běh kanálu vyberte Dokončit.
  2. Přejděte na kartu Monitorování umístěnou na levém bočním panelu. Zobrazí se stav ručně aktivovaného spuštění kanálu. Pomocí odkazů ve sloupci Akce můžete zobrazit podrobnosti o aktivitě a znovu spustit kanál.
  3. Pokud chcete zobrazit běhy aktivit související se spuštěním kanálu, vyberte odkaz Zobrazit běhy aktivit ve sloupci Akce. V tomto příkladu je jenom jedna aktivita, takže v seznamu uvidíte jenom jednu položku. Podrobnosti o operaci kopírování získáte tak, že ve sloupci Akce vyberete odkaz Podrobnosti (ikona brýle). Výběrem možnosti Spuštění kanálu v horní části se vraťte do zobrazení Spuštění kanálu. Pokud chcete zobrazení aktualizovat, vyberte Aktualizovat.
  4. Ověřte, že jsou vaše data správně zapsaná ve vyhrazeném fondu SQL.

Další kroky

Další informace o integraci dat pro Azure Synapse Analytics najdete v článku Ingestování dat do vyhrazeného fondu SQL .