Sdílet prostřednictvím


Kurz Lakehouse: Ingestování dat do jezera

V tomto kurzu ingestujete vícerozměrné tabulky a tabulky faktů od Wide World Importers (WWI) do jezera.

Požadavky

Ingestace dat

V této části použijete aktivitu kopírování dat kanálu služby Data Factory k ingestování ukázkových dat z účtu úložiště Azure do části Soubory ve službě Lakehouse, kterou jste vytvořili dříve.

  1. V levém navigačním podokně vyberte Pracovní prostory a pak v nabídce Pracovní prostory vyberte nový pracovní prostor. Zobrazí se zobrazení položek vašeho pracovního prostoru.

  2. V položce nabídky +Nový na pásu karet pracovního prostoru vyberte Datový kanál.

    Snímek obrazovky znázorňující, jak vytvořit nový datový kanál

  3. V dialogovém okně Nový kanál zadejte název jako IngestDataFromSourceToLakehouse a vyberte Vytvořit. Vytvoří se a otevře nový kanál datové továrny.

  4. V nově vytvořeném kanálu datové továrny vyberte aktivitu kanálu a přidejte do kanálu aktivitu a vyberte Kopírovat data. Tato akce přidá aktivitu kopírování dat na plátno kanálu.

    Snímek obrazovky znázorňující, kde vybrat aktivitu kanálu a kopírovat data

  5. Na plátně vyberte nově přidanou aktivitu kopírování dat. Vlastnosti aktivity se zobrazí v podokně pod plátnem (možná budete muset podokno rozbalit nahoru přetažením horního okraje). Na kartě Obecné v podokně vlastností zadejte do pole Název kopii dat do Lakehouse.

    Snímek obrazovky znázorňující, kde přidat název aktivity kopírování na kartě Obecné

  6. Na kartě Zdroj vybrané aktivity kopírování dat vyberte Externí jako typ úložiště dat a pak vyberte + Nový a vytvořte nové připojení ke zdroji dat.

    Snímek obrazovky znázorňující, kde vybrat Externí a + Nový na kartě Zdroj

  7. Pro účely tohoto kurzu jsou všechna ukázková data dostupná ve veřejném kontejneru služby Azure Blob Storage. Připojíte se k tomuto kontejneru a zkopírujete z něj data. Na první obrazovce Nové připojení vyberte Azure Blob Storage a pak vyberte Pokračovat.

    Snímek obrazovky s průvodcem novým připojením, který ukazuje, kde vybrat Azure Blob Storage

  8. Na obrazovce Nastavení připojení zadejte následující podrobnosti a výběrem možnosti Vytvořit vytvořte připojení ke zdroji dat.

    Vlastnost Hodnota
    Název účtu nebo adresa URL https://azuresynapsestorage.blob.core.windows.net/sampledata
    Connection Vytvořit nové připojení
    Název připojení wwisampledata
    Druh ověřování Anonymní

    Snímek obrazovky Nastavení připojení, kde můžete zadat podrobnosti a vybrat Vytvořit

  9. Po vytvoření nového připojení se vraťte na kartu Zdroj aktivity kopírování dat a nově vytvořené připojení je ve výchozím nastavení vybrané. Před přesunutím do cílového nastavení zadejte následující vlastnosti.

    Vlastnost Hodnota
    Typ úložiště dat Externí
    Connection wwisampledata
    Typ cesty k souboru Cesta k souboru
    Cesta k souboru Název kontejneru (první textové pole): sampledata
    Název adresáře (druhé textové pole): WideWorldImportersDW/parquet
    Rekurzívně Zkontrolováno
    File format Binární

    Snímek obrazovky s kartou Zdroj znázorňující, kam zadat konkrétní podrobnosti

  10. Na kartě Cíl vybrané aktivity kopírování dat zadejte následující vlastnosti:

    Vlastnost Hodnota
    Typ úložiště dat Pracovní prostor
    Typ úložiště dat pracovního prostoru Jezero
    Jezero wwilakehouse
    Kořenová složka: Soubory
    Cesta k souboru Název adresáře (první textové pole): wwi-raw-data
    File format Binární

    Snímek obrazovky s kartou Cíl znázorňující, kam zadat konkrétní podrobnosti

  11. Nakonfigurovali jste aktivitu kopírování dat. Výběrem ikony uložit na horním pásu karet (pod domovskou stránku) uložte změny a výběrem možnosti Spustit spusťte kanál a jeho aktivitu. Kanály můžete také naplánovat tak, aby aktualizovaly data v definovaných intervalech, aby splňovaly vaše obchodní požadavky. Pro účely tohoto kurzu kanál spustíme pouze jednou výběrem možnosti Spustit.

    Tato akce aktivuje kopírování dat z podkladového zdroje dat do zadaného jezera a dokončení může trvat až minutu. Spuštění kanálu a jeho aktivity můžete monitorovat na kartě Výstup , která se zobrazí po kliknutí na libovolné místo na plátně. Volitelně můžete vybrat ikonu brýle, která se zobrazí, když najedete myší na název, a podívat se na podrobnosti přenosu dat.

    Snímek obrazovky znázorňující, kde vybrat Uložit a Spustit a kde najít podrobnosti o spuštění a ikonu brýle na kartě Výstup

  12. Po zkopírování dat přejděte do zobrazení položek pracovního prostoru a výběrem nového jezerahouse (wwilakehouse) spusťte zobrazení Průzkumníka.

    Snímek obrazovky znázorňující, kde vybrat lakehouse, aby se spustilo zobrazení Průzkumníka

  13. Ověřte, že se v zobrazení Průzkumníka zobrazí nová složka wwi-raw-data a data pro všechny tabulky se tam zkopírují.

    Snímek obrazovky zobrazující zdrojová data se zkopírují do Průzkumníka Lakehouse.

Pokud chcete načíst přírůstková data do jezera, přečtěte si článek Přírůstkové načtení dat z datového skladu do jezera.

Další krok