Kurz Lakehouse: Ingestování dat do jezera

V tomto kurzu ingestujete další dimenzionální tabulky a tabulky faktů od Wide World Importers (WWI) do jezera.

Požadavky

Ingestace dat

V této části použijete aktivitu kopírování dat kanálu služby Data Factory k ingestování ukázkových dat z účtu úložiště Azure do části Soubory ve službě Lakehouse, kterou jste vytvořili dříve.

  1. V levém navigačním podokně vyberte Pracovní prostory a pak v nabídce Pracovní prostory vyberte nový pracovní prostor. Zobrazí se zobrazení položek vašeho pracovního prostoru.

  2. Na stránce pracovního prostoru na tlačítku +Nový vyberte Datový kanál.

    Screenshot showing how to create a new data pipeline.

  3. V dialogovém okně Nový kanál zadejte název jako IngestDataFromSourceToLakehouse a vyberte Vytvořit. Vytvoří se a otevře nový kanál datové továrny.

  4. V nově vytvořeném kanálu datové továrny vyberte Přidat aktivitu kanálu a přidejte do kanálu aktivitu a vyberte Kopírovat data. Tato akce přidá aktivitu kopírování dat na plátno kanálu.

    Screenshot showing where to select Add pipeline activity and Copy data.

  5. Na plátně vyberte nově přidanou aktivitu kopírování dat. Vlastnosti aktivity se zobrazí v podokně pod plátnem (možná budete muset podokno rozbalit nahoru přetažením horního okraje). Pod kartou Obecné v podokně vlastností zadejte název kopírování datové aktivity Kopírování dat do Lakehouse.

    Screenshot showing where to add the copy activity name on the General tab.

  6. Na kartě Zdroj vybrané aktivity kopírování dat vyberte Externí jako typ úložiště dat a pak vyberte + Nový a vytvořte nové připojení ke zdroji dat.

    Screenshot showing where to select External and + New on the Source tab.

  7. Pro účely tohoto kurzu jsou všechna ukázková data dostupná ve veřejném kontejneru služby Azure Blob Storage. Připojíte se k tomuto kontejneru a zkopírujete z něj data. V průvodci novým připojením vyberte Azure Blob Storage a pak vyberte Pokračovat.

    Screenshot of the New connection wizard, showing where to select Azure Blob Storage.

  8. Na další obrazovce průvodce vytvořením nového připojení zadejte následující podrobnosti a výběrem možnosti Vytvořit vytvořte připojení ke zdroji dat.

    Vlastnost Hodnota
    Název účtu nebo identifikátor URI https://azuresynapsestorage.blob.core.windows.net/sampledata
    Connection Vytvořit nové připojení
    Název připojení wwisampledata
    Druh ověřování Anonymní

    Screenshot of the Connection settings screen, showing where to enter the details and select Create.

  9. Po vytvoření nového připojení se vraťte na kartu Zdroj aktivity kopírování dat a nově vytvořené připojení je ve výchozím nastavení vybrané. Před přesunutím do cílového nastavení zadejte následující vlastnosti.

    Vlastnost Hodnota
    Typ úložiště dat Externí
    Connection wwisampledata
    Typ cesty k souboru Cesta k souboru
    Cesta k souboru Název kontejneru (první textové pole): sampledata
    Název adresáře (druhé textové pole): WideWorldImportersDW/parquet
    Rekurzivně Zkontrolováno
    File format Binární

    Screenshot of the source tab showing where to enter the specific details.

  10. Na kartě Cíl vybrané aktivity kopírování dat zadejte následující vlastnosti:

    Vlastnost Hodnota
    Typ úložiště dat Pracovní prostor
    Typ úložiště dat pracovního prostoru Jezero
    Jezero wwilakehouse
    Kořenová složka: Files
    Cesta k souboru Název adresáře (první textové pole): wwi-raw-data
    File format Binární

    Screenshot of the Destination tab, showing where to enter specific details.

  11. Dokončili jste konfiguraci aktivity kopírování dat. Výběrem tlačítka Uložit na horním pásu karet (v části Domů) uložte změny a výběrem možnosti Spustit spusťte kanál a jeho aktivitu. Kanály můžete také naplánovat tak, aby aktualizovaly data v definovaných intervalech, aby splňovaly vaše obchodní požadavky. V tomto kurzu kanál spustíme jenom jednou kliknutím na tlačítko Spustit .

    Tato akce aktivuje kopírování dat z podkladového zdroje dat do zadaného jezera a dokončení může trvat až minutu. Spuštění kanálu a jeho aktivity můžete monitorovat na kartě Výstup , která se zobrazí po kliknutí na libovolné místo na plátně. Volitelně můžete vybrat ikonu brýle, která se zobrazí, když najedete myší na název, a podívat se na podrobnosti přenosu dat.

    Screenshot showing where to select Save and Run, and where to find the run details and glasses icon on the Output tab.

  12. Po zkopírování dat přejděte do zobrazení položek pracovního prostoru a výběrem nového jezerahouse (wwilakehouse) spusťte Průzkumníka Lakehouse.

    Screenshot showing where to select the lakehouse to launch the Lakehouse explorer.

  13. Ověřte, že v zobrazení Průzkumníka Lakehouse byla vytvořena nová složka wwi-raw-data a data pro všechny tabulky se tam zkopírovala.

    Screenshot showing the source data is copied into the Lakehouse explorer.

Další krok