Modul 1: Vytvoření kanálu pomocí služby Data Factory

Tento modul trvá 10 minut a ingestuje nezpracovaná data ze zdrojového úložiště do bronzové tabulky datového jezera pomocí aktivita Copy v kanálu.

Základní kroky v modulu 1 jsou následující:

  1. Vytvořte datový kanál.
  2. Pomocí aktivity kopírování v kanálu načtěte ukázková data do data Lakehouse.

Vytvoření datového kanálu

  1. Vyžaduje se účet tenanta Microsoft Fabric s aktivním předplatným. Vytvořte si bezplatný účet.

  2. Ujistěte se, že máte povolený pracovní prostor Microsoft Fabric: Vytvořte pracovní prostor.

  3. Přihlaste se k Power BI.

  4. Vyberte výchozí ikonu Power BI v levém dolním rohu obrazovky a přepněte do prostředí služby Data Factory .

    Screenshot showing the selection of the Data Factory experience.

  5. Vyberte Datový kanál a zadejte název kanálu. Pak vyberte Vytvořit.

    Screenshot of the Data Factory start page with the button to create a new data pipeline selected.

    Screenshot showing the dialog to give the new pipeline a name.

Načtení ukázkových dat do data Lakehouse pomocí aktivita Copy v kanálu

Krok 1: Ke konfiguraci aktivity kopírování použijte pomocníka pro kopírování.

Výběrem možnosti Kopírovat data otevřete nástroj Pomocník pro kopírování.

Screenshot showing the selection of the Copy data activity from the new pipeline start page.

Krok 2: Nakonfigurujte nastavení v pomocníkovi pro kopírování.

  1. Dialogové okno Kopírovat data se zobrazí s prvním krokem, zvýrazněným výběrem zdroje dat. V případě potřeby se posuňte dolů do části Zdroje dat a vyberte typ zdroje dat služby Azure Blob Storage . Pak vyberte Další.

    Screenshot showing the selection of the Azure Blob Storage data source type in the copy assistant on the Choose data source tab.

  2. V dalším kroku vyberte Vytvořit nové připojení a pak zadejte adresu URL úložiště objektů blob hostujícího ukázková data uvedená v tomto kurzu na adrese https://nyctaxisample.blob.core.windows.net/sample. Typ ověřování je anonymní. Po zadání adresy URL vyberte Další .

    Screenshot showing the creation of a new Azure Blob Storage connection with the URL for the sample data in the tutorial.

  3. Zobrazí se krok Připojení ke zdroji dat a zpočátku se zobrazí chyba Nejde vypsat soubory, protože oprávnění byla udělena pouze ukázkové složce v úložišti objektů blob. Zadejte název složky, ukázku a vyberte Opakovat.

    Screenshot showing the Unable to list files error with the folder name Sample provided.

    Poznámka:

    Složka úložiště objektů blob rozlišují malá a velká písmena a měla by být ve všech malých písmenech.

  4. Zobrazí se další prohlížeč úložiště objektů blob. Vyberte soubor NYC-Taxi-Green-2015-01.parquet a počkejte na zobrazení náhledu dat. Pak vyberte Další.

    Screenshot showing the preview data for the NYC-Taxi-Green-2015-01.parquet file.

  5. V kroku Zvolit cíl dat pomocníka pro kopírování vyberte Lakehouse a pak Další.

    Screenshot showing the selection of the Lakehouse destination on the Choose data destination tab of the Copy data assistant.

  6. Na stránce konfigurace cíle dat, která se zobrazí, vyberte Vytvořit nový Lakehouse a zadejte název nového Lakehouse. Pak znovu vyberte Další .

    Screenshot showing the data destination configuration page of the Copy assistant, choosing the Create new Lakehouse option and providing a Lakehouse name.

  7. Teď nakonfigurujte podrobnosti o cíli Lakehouse na stránce Vybrat a namapovat na cestu ke složce nebo tabulku. Vyberte Tabulky pro kořenovou složku, zadejte název tabulky a zvolte akci Přepsat . Nezaškrtávejte políčko Povolit oddíl , které se zobrazí po výběru akce Přepsat tabulku.

    Screenshot showing the Connect to data destination tab of the Copy data assistant, on the Select and map to folder path or table step.

  8. Nakonec na stránce Zkontrolovat a uložit v nástroji Copy Data Assistant zkontrolujte konfiguraci. Pro účely tohoto kurzu zrušte zaškrtnutí políčka Spustit přenos dat okamžitě , protože aktivitu spouštíme ručně v dalším kroku. Pak vyberte OK.

    Screenshot showing the Copy data assistant on the Review + save page.

Krok 3: Spuštění a zobrazení výsledků aktivita Copy

  1. V editoru kanálů vyberte kartu Spustit. Potom vyberte tlačítko Spustit a pak na příkazovém řádku uložte a spusťte aktivita Copy.

    Screenshot showing the pipeline Run tab with the Run button highlighted.

    Screenshot showing the Save and run dialog with the Save and run button highlighted.

  2. Spuštění můžete monitorovat a zkontrolovat výsledky na kartě Výstup pod plátnem kanálu. Výběrem tlačítka podrobností o spuštění (ikona brýle, která se zobrazí, když najedete myší na spuštěný kanál), zobrazí se podrobnosti o spuštění.

    Screenshot showing the run details button in the pipeline Output tab.

  3. Podrobnosti o spuštění zobrazují 1 508 501 řádků pro čtení a zápis.

    Screenshot of the Copy data details for the pipeline run.

  4. Rozbalte část Rozpis doby trvání a zobrazte dobu trvání každé fáze aktivita Copy. Po kontrole podrobností kopie vyberte Zavřít.

    Screenshot showing the duration breakdown of the Copy activity run.

V tomto prvním modulu kompletního kurzu pro první integraci dat pomocí služby Data Factory v Microsoft Fabric jste se naučili:

  • Vytvořte datový kanál.
  • Přidejte do kanálu aktivita Copy.
  • Použijte ukázková data a vytvořte data Lakehouse k uložení dat do nové tabulky.
  • Spusťte kanál a zobrazte jeho podrobnosti a rozpis doby trvání.

Pokračujte k další části a vytvořte tok dat.