Sdílet prostřednictvím


Návod na Lakehouse: Vložení dat do systému Lakehouse

V tomto kurzu ingestujete vícerozměrné tabulky a tabulky faktů od Wide World Importers (WWI) do jezera.

Požadavky

Přijímání dat

V této části použijete aktivitu kopírování dat kanálu služby Data Factory k ingestování ukázkových dat z účtu úložiště Azure do části Soubory ve službě Lakehouse, kterou jste vytvořili dříve.

  1. V levém navigačním podokně vyberte Pracovní prostory a pak v nabídce Pracovní prostory vyberte nový pracovní prostor. Zobrazí se zobrazení položek vašeho pracovního prostoru.

  2. V možnosti Nová položka na pásu karet pracovního prostoru vyberte Pipelina.

  3. V dialogovém okně Nový kanál zadejte název jako IngestDataFromSourceToLakehouse a vyberte Vytvořit.

  4. Z nově vytvořeného kanálu vyberte aktivitu kanálu , abyste do kanálu přidali aktivitu, a vyberte Kopírovat data. Tato akce přidá aktivitu kopírování dat na plátno kanálu.

    Snímek obrazovky znázorňující, kde vybrat aktivitu kanálu a kopírovat data

  5. Na plátně vyberte nově přidanou aktivitu kopírování dat. Vlastnosti aktivity se zobrazí v podokně pod plátnem (možná budete muset podokno rozbalit nahoru přetažením horního okraje). Na kartě Obecné v podokně vlastností zadejte do pole Názevkopii dat do Lakehouse. Ponechte zbývající vlastnosti na výchozí hodnoty.

    Snímek obrazovky znázorňující, kde přidat název aktivity kopírování na kartě Obecné

  6. Na kartě Zdroj vybrané aktivity kopírování dat otevřete pole Připojení a vyberte Procházet vše. Otevře se okno zdroje dat, vyhledá a vybere objekty blob Azure. Pro účely tohoto kurzu jsou všechna ukázková data dostupná ve veřejném kontejneru služby Azure Blob Storage. Připojíte se k tomuto kontejneru a zkopírujete z něj data.

  7. Do okna Nastavení připojení zadejte následující podrobnosti a výběrem možnosti Připojit vytvořte připojení ke zdroji dat.

    Vlastnost Hodnota
    Název účtu nebo adresa URL https://fabrictutorialdata.blob.core.windows.net/sampledata/
    Připojení Vytvoření nového připojení
    Název připojení wwisampledata
    Druh ověřování Anonymní

    Snímek obrazovky znázorňující, kde vybrat připojení úložiště objektů blob

  8. Po vytvoření nového připojení se vraťte na kartu Zdroj aktivity kopírování dat a nově vytvořené připojení je ve výchozím nastavení vybrané. Před přesunutím do cílového nastavení zadejte následující vlastnosti.

    Vlastnost Hodnota
    Připojení wwisampledata
    Typ cesty k souboru Cesta k souboru
    Cesta k souboru Název kontejneru (první textové pole): sampledata
    Název adresáře (druhé textové pole): WideWorldImportersDW/parquet
    Rekurzívně Zkontrolováno
    Formát souboru Binary

    Snímek obrazovky znázorňující nastavení připojení ke službě Blob Storage

  9. Na kartě Cíl vybrané aktivity kopírování dat zadejte následující vlastnosti:

    Vlastnost Hodnota
    Připojení wwilakehouse (zvolte svůj lakehouse, pokud jste ho pojmenovali jinak)
    Kořenová složka Files
    Cesta k souboru Název adresáře (první textové pole): wwi-raw-data
    Formát souboru Binary

    Snímek obrazovky s kartou Cíl znázorňující, kam zadat konkrétní podrobnosti

  10. Nakonfigurovali jste aktivitu kopírování dat. Výběrem ikony Uložit na horním pásu karet (pod domovskou stránku) uložte změny a výběrem možnosti Spustit spusťte kanál a jeho aktivitu. Kanály můžete také naplánovat tak, aby aktualizovaly data v definovaných intervalech, aby splňovaly vaše obchodní požadavky. Pro účely tohoto kurzu kanál spustíme pouze jednou výběrem možnosti Spustit.

  11. Tato akce aktivuje kopírování dat z podkladového zdroje dat do zadaného jezera a dokončení může trvat až minutu. Spuštění kanálu a jeho aktivity můžete monitorovat na kartě Výstup. Stav aktivity se změní zprobíhajícího> zařazení do >.

    Snímek obrazovky znázorňující, kde vybrat Uložit a spustit potrubí.

  12. Po úspěšném provedení aktivity kopírování otevřete lakehouse (wwilakehouse) a prohlédněte si data. Aktualizujte oddíl Soubory , abyste viděli ingestované data. V části soubory se zobrazí nová složka wwi-raw-data a data z tabulek objektů blob Azure se tam zkopírují.

    Snímek obrazovky zobrazující data blob zkopírovaná do cílového lakehousu.

Další krok