Začínáme s Azure Data Factory

VZTAHUJE SE NA: Azure Data Factory Azure Synapse Analytics

Tip

Data Factory v Microsoft Fabric je nová generace Azure Data Factory s jednodušší architekturou, integrovanou AI a novými funkcemi. Pokud s integrací dat začínáte, začněte Fabric Data Factory. Stávající úlohy ADF lze upgradovat na Fabric pro přístup k novým funkcím v oblastech datové vědy, analýz v reálném čase a vytváření sestav.

Vítá vás Azure Data Factory! Tento článek vám pomůže vytvořit vaši první datovou továrnu a pipelinu za pět minut.

Šablona Azure Resource Manager (šablona ARM) v tomto článku vytvoří a nakonfiguruje vše, co potřebujete. Pak můžete přejít do ukázkové datové továrny a aktivovat kanál, který přesune některá ukázková data z jedné Azure Blob Storage složky do jiné.

Požadavky

Pokud nemáte předplatné Azure, vytvořte si účet free než začnete.

Souhrn videa

Následující video obsahuje návod k příkladu v tomto článku.

Krok 1: Použijte ukázku k vytvoření prostředků

V tomto ukázkovém scénáři použijete aktivitu copy v datové továrně ke zkopírování objektu blob s názvem moviesDB2.csv ze vstupní složky ve Azure Blob Storage do výstupní složky. V reálném scénáři by tato operace kopírování mohla probíhat mezi libovolným z mnoha podporovaných zdrojů a cílů dat dostupných ve službě. Může také zahrnovat transformace v datech.

  1. Vyberte následující tlačítko.

    Vyzkoušejte si svou první ukázku datové továrny

    Výběrem tlačítka vytvoříte následující Azure prostředky:

    • Účet Azure Data Factory
    • Datová továrna, která obsahuje potrubí s jednou aktivitou kopírování
    • Účet Azure Blob Storage s moviesDB2.csv nahraný do vstupní složky jako zdroj
    • Propojená služba pro připojení datové továrny k Blob Storage
  2. Budete přesměrováni na stránku konfigurace pro nasazení šablony. Na této stránce:

    1. V části Skupina prostředků vyberte Vytvořit novou a vytvořte skupinu prostředků. U všech ostatních hodnot můžete ponechat výchozí hodnoty.

    2. Vyberte Zkontrolovat a vytvořit a pak vyberte Vytvořit a nasaďte prostředky.

    Snímek obrazovky stránky pro nasazení šablony na tvorbu prostředků.

Poznámka:

Uživatel, který šablonu nasadí, musí přiřadit roli spravované identitě. Tento krok vyžaduje oprávnění, která je možné udělit prostřednictvím role Vlastník, Správce uživatelských přístupů nebo Operátor spravované identity.

Všechny prostředky v této ukázce se vytvoří v nové skupině prostředků, abyste je mohli později snadno vyčistit.

Krok 2: Kontrola nasazených prostředků

  1. Ve zprávě, která ukazuje úspěšné dokončení nasazení, vyberte Přejít do skupiny prostředků.

    Screenshot stránky portálu Azure, která ukazuje úspěšné nasazení ukázkové šablony.

  2. Skupina prostředků zahrnuje novou datovou továrnu, Blob Storage účet a spravovanou identitu, kterou nasazení vytvořilo. Vyberte datovou továrnu ve skupině prostředků, abyste ji zobrazili.

    Snímek obrazovky s obsahem skupiny prostředků vytvořené pro ukázku se zvýrazněnou Data Factory

  3. Vyberte tlačítko Spustit studio .

    Screenshot portálu Azure, který zobrazuje podrobnosti pro nově vytvořenou datovou továrnu a tlačítko pro otevření Azure Data Factory Studio zvýrazněné.

  4. V Azure Data Factory Studiu:

    1. Vyberte kartu Autorkarta Autor.
    2. Vyberte kanál, který šablona vytvořila.
    3. Výběrem možnosti Otevřít zkontrolujte zdrojová data.

    Snímek obrazovky Azure Data Factory Studia, který zobrazuje datový kanál vytvořený šablonou.

  5. Ve zdrojové datové sadě vyberte Procházet a zobrazte vstupní soubor vytvořený pro ukázku.

    Snímek obrazovky se zdrojovou datovou sadou se zvýrazněným tlačítkem Procházet

    Všimněte si moviesDB2.csv souboru, který byl již odeslán do vstupní složky.

    Snímek obrazovky s obsahem vstupní složky zobrazující vstupní soubor použitý v ukázce

Krok 3: Spuštění ukázkového kanálu

  1. Vyberte Přidat trigger a pak vyberte Spustit trigger.

    Snímek obrazovky s tlačítkem pro spuštění ukázkového kanálu

  2. V pravém podokně v části Spuštění pipeline vyberte OK.

Sledujte potrubí

  1. Vyberte kartu MonitorMonitor tab. Tato karta poskytuje přehled spuštění vašich pipeline, včetně času začátku a stavu.

    Snímek obrazovky záložky pro monitorování běhů kanálu v datové továrně.

  2. V tomto rychlém úvodu má pipeline pouze jeden typ aktivity: Kopírovat data. Výběrem názvu kanálu zobrazíte podrobnosti o výsledcích spuštění aktivity kopírování.

    Snímek obrazovky z výsledků spuštění aktivity kopírování na kartě pro monitorování datové továrny

  3. Výběrem ikony Podrobnosti zobrazíte podrobný proces kopírování. Ve výsledcích jsou velikosti čtení dat a zápisu dat stejné a jeden soubor byl načten a zapsán. Tyto informace ukazují, že všechna data byla úspěšně zkopírována do cíle.

    Snímek obrazovky s podrobnými výsledky spuštění aktivity kopírování

Uvolnění prostředků

Všechny prostředky, které jste vytvořili v tomto článku, můžete vyčistit jedním ze dvou způsobů:

  • Můžete odstranit celou skupinu prostředků Azure, která obsahuje všechny vytvořené prostředky.

  • Pokud chcete zachovat některé prostředky beze změny, přejděte do skupiny prostředků a odstraňte pouze konkrétní prostředky, které chcete odebrat.

    Pokud například tuto šablonu používáte k vytvoření datové továrny pro použití v jiném kurzu, můžete ostatní prostředky odstranit, ale zachovat pouze datovou továrnu.

V tomto článku jste vytvořili datovou továrnu, která obsahovala potrubí s činností kopírování. Další informace o Azure Data Factory najdete v následujícím článku a školicím modulu: