Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
V tomto článku se dozvíte, jak ingestovat data z účtu úložiště Azure Data Lake Gen2 do vyhrazeného fondu SQL ve službě Azure Synapse Analytics.
Požadavky
- Předplatné Azure: Pokud nemáte předplatné Azure, vytvořte si před zahájením bezplatný účet Azure.
- Účet úložiště Azure: Jako zdrojové úložiště dat používáte Azure Data Lake Storage Gen2. Pokud účet úložiště nemáte, přečtěte si téma Vytvoření účtu služby Azure Storage , kde najdete postup jeho vytvoření.
-
Azure Synapse Analytics: Jako cílové úložiště dat použijete vyhrazený fond SQL.
- Pokud nemáte existující pracovní prostor Synapse, přečtěte si téma Vytvoření pracovního prostoru Synapse.
- Pokud nemáte existující vyhrazený fond SQL. Viz Vytvoření vyhrazeného fondu SQL.
Vytvoření propojených služeb
V Azure Synapse Analytics se propojená služba používá k definování informací o připojení k jiným službám. V této části přidáte propojenou službu Azure Synapse Analytics a Azure Data Lake Storage Gen2.
- Otevřete uživatelské prostředí Azure Synapse Analytics a přejděte na kartu Spravovat .
- V části Externí připojení vyberte Propojené služby.
- Pokud chcete přidat propojenou službu, vyberte Nový.
- V seznamu vyberte dlaždici Azure Data Lake Storage Gen2 a vyberte Pokračovat.
- Zadejte svoje ověřovací přihlašovací údaje. Klíč účtu, služební principál a spravovaná identita jsou v současnosti podporované typy ověřování. Vyberte testovací připojení a ověřte správnost přihlašovacích údajů. Po dokončení vyberte Vytvořit.
- Opakujte kroky 3 až 5, ale místo Azure Data Lake Storage Gen2 vyberte dlaždici Azure Synapse Analytics a zadejte odpovídající přihlašovací údaje pro připojení. Aktuálně jsou podporovány Azure Synapse Analytics, ověřování SQL, spravovaná identita a služba hlavního účtu.
Vytvořit potrubí
Kanál obsahuje logický tok pro spuštění sady aktivit. V této části vytvoříte kanál obsahující aktivitu kopírování, která ingestuje data z ADLS Gen2 do vyhrazeného fondu SQL.
- Přejděte na kartu Integrace . Vyberte ikonu plus vedle záhlaví kanálů a vyberte Kanál.
- V části Přesunout a transformovat v podokně aktivit přetáhněte Kopírovat data na plátno potrubí.
- Vyberte aktivitu kopírování a přejděte na kartu Zdroj . Výběrem možnosti Nový vytvoříte novou zdrojovou datovou sadu.
- Jako úložiště dat vyberte Azure Data Lake Storage Gen2 a vyberte pokračovat.
- Jako formát vyberte Text s oddělovači a vyberte pokračovat.
- V podokně nastavit vlastnosti vyberte propojenou službu ADLS, kterou jste vytvořili. Zadejte cestu k souboru zdrojových dat a určete, jestli má první řádek záhlaví. Schéma můžete importovat z úložiště souborů nebo z ukázkového souboru. Po dokončení zvolte OK.
- Přejděte na kartu Jímka . Výběrem možnosti Nový vytvořte novou datovou sadu jímky.
- Jako úložiště dat vyberte Azure Synapse Analytics a vyberte pokračovat.
- V podokně nastavit vlastnosti vyberte propojenou službu Azure Synapse Analytics, kterou jste vytvořili. Pokud píšete do existující tabulky, vyberte ji z rozevíracího seznamu. V opačném případě zaškrtněte políčko Upravit a zadejte nový název tabulky. Po dokončení vyberte OK.
- Pokud vytváříte tabulku, povolte v poli možností tabulky možnost Automaticky vytvořit tabulku .
Ladění a publikování potrubí
Jakmile dokončíte konfiguraci kanálu, můžete spustit ladicí běh před publikováním artefaktů a ověřit správnost všeho.
- K ladění potrubí vyberte na panelu nástrojů Debug. Stav běhu kanálu se zobrazuje na kartě Výstup v dolní části okna.
- Po úspěšném spuštění potrubí vyberte na horním panelu nástrojů možnost Publikovat vše. Tato akce publikuje entity (datové sady a kanály), které jste vytvořili ve službě Synapse Analytics.
- Počkejte, dokud se nezobrazí zpráva Publikování proběhlo úspěšně. Pokud chcete zobrazit zprávy s oznámením, vyberte v pravém horním rohu tlačítko zvonku.
Aktivace a monitorování kanálu
V tomto kroku ručně spustíte tzv. pipeline publikovanou v předchozím kroku.
- Na panelu nástrojů vyberte Přidat aktivační událost a pak vyberte Aktivovat. Na stránce Spouštění kanálu vyberte Dokončit.
- Přejděte na kartu Monitorování umístěnou na levém bočním panelu. Vidíte spuštění pipeline, které je aktivováno ručním spouštěčem. Pomocí odkazů ve sloupci Akce můžete zobrazit podrobnosti o aktivitě a spustit kanál znovu.
- Pokud chcete zobrazit spuštění aktivit související se spuštěním datového kanálu, vyberte odkaz Zobrazit spuštění aktivit ve sloupci Akce. V tomto příkladu je jenom jedna aktivita, takže v seznamu uvidíte jenom jednu položku. Podrobnosti o operaci kopírování získáte tak, že ve sloupci Akce vyberete odkaz Podrobnosti (ikona brýle). Výběrem možnosti Spuštění kanálu v horní části se vraťte do zobrazení Spuštění kanálu. Jestliže chcete zobrazení aktualizovat, vyberte Aktualizovat.
- Ověřte, že jsou vaše data správně zapsaná ve vyhrazeném fondu SQL.
Další kroky
Další informace o integraci dat pro Azure Synapse Analytics najdete v článku Ingestování dat do Azure Data Lake Storage Gen2 .