Kopírování dat pomocí aktivity kopírování

V datovém kanálu můžete pomocí aktivita Copy kopírovat data mezi úložišti dat umístěnými v cloudu.

Po zkopírování dat můžete pomocí dalších aktivit data data dále transformovat a analyzovat. Pomocí aktivita Copy můžete také publikovat výsledky transformace a analýzy pro business intelligence (BI) a spotřebu aplikací.

Pokud chcete kopírovat data ze zdroje do cíle, služba, která spouští aktivita Copy provádí tyto kroky:

  1. Čte data ze zdrojového úložiště dat.
  2. Provádí serializaci/deserializaci, kompresi/dekompresi, mapování sloupců atd. Provádí tyto operace na základě konfigurace.
  3. Zapíše data do cílového úložiště dat.

Požadavky

Abyste mohli začít, musíte splnit následující požadavky:

  • Účet tenanta Microsoft Fabric s aktivním předplatným. Vytvoření účtu zdarma

  • Ujistěte se, že máte povolený pracovní prostor Microsoft Fabric.

Přidání aktivity kopírování pomocí pomocníka pro kopírování

Podle těchto kroků nastavte aktivitu kopírování pomocí pomocníka pro kopírování.

Začínáme s pomocníkem pro kopírování

  1. Otevřete existující datový kanál nebo vytvořte nový datový kanál.

  2. Začněte tím, že vyberete Kopírovat data na plátně a otevřete nástroj Copy Assistant . Nebo v rozevíracím seznamu Kopírovat data napásu karet vyberte Použít pomocníka pro kopírování dat.

    Screenshot showing options for opening the copy assistant.

Konfigurace zdroje

  1. Vyberte typ zdroje dat z kategorie. Jako příklad použijete Azure Blob Storage. Vyberte Azure Blob Storage a pak vyberte Další.

    Screenshot of Choose data source screen.

    Screenshot showing where to select the correct data source.

  2. Výběrem možnosti Vytvořit nové připojení vytvořte připojení ke zdroji dat.

    Screenshot showing where to select New connection.

    Po výběru možnosti Vytvořit nové připojení vyplňte požadované informace o připojení a pak vyberte Další. Podrobnosti o vytvoření připojení pro každý typ zdroje dat najdete v jednotlivých článcích o konektoru.

    Pokud máte existující připojení, můžete vybrat Existující připojení a v rozevíracím seznamu vybrat připojení.

    Screenshot showing the existing connection.

  3. Zvolte soubor nebo složku, které chcete zkopírovat v tomto kroku konfigurace zdroje, a pak vyberte Další.

    Screenshot showing where to select the data to be copied.

Konfigurace cíle

  1. Vyberte typ zdroje dat z kategorie. Jako příklad použijete Azure Blob Storage. Vyberte Azure Blob Storage a pak vyberte Další.

    Screenshot showing how to select Azure Blob Storage.

  2. Můžete vytvořit nové připojení, které odkazuje na nový účet služby Azure Blob Storage, a to pomocí kroků v předchozí části, nebo použít existující připojení z rozevíracího seznamu připojení. Možnosti testovacího připojení a úpravy jsou k dispozici pro každé vybrané připojení.

    Screenshot showing data connection options.

  3. Nakonfigurujte a namapujte zdrojová data na cíl. Potom výběrem možnosti Další dokončete konfiguraci cíle.

    Screenshot of Map to destination screen.

    Screenshot of Connect to data destination.

Kontrola a vytvoření aktivity kopírování

  1. Zkontrolujte nastavení aktivity kopírování v předchozích krocích a kliknutím na TLAČÍTKO OK dokončete. Nebo se můžete vrátit k předchozím krokům a upravit nastavení v případě potřeby v nástroji.

    Screenshot showing the Review and create screen.

Po dokončení se aktivita kopírování přidá na plátno datového kanálu. Všechna nastavení, včetně upřesňujících nastavení pro tuto aktivitu kopírování, jsou při výběru dostupná na kartách.

Screenshot showing a copy activity on the data pipeline canvas.

Teď můžete buď uložit datový kanál s touto aktivitou s jednou kopií, nebo pokračovat v návrhu datového kanálu.

Přímé přidání aktivity kopírování

Pokud chcete aktivitu kopírování přidat přímo, postupujte podle těchto kroků.

Přidání aktivity kopírování

  1. Otevřete existující datový kanál nebo vytvořte nový datový kanál.

  2. Aktivitu kopírování můžete přidat výběrem možnosti Přidat aktivitu> kanálu aktivita Copy nebo výběrem možnosti Kopírovat data>přidat na plátno na kartě Aktivity.

    Screenshot showing two ways to add a copy activity.

Konfigurace obecných nastavení na kartě Obecné

Informace o konfiguraci obecných nastavení najdete v tématu Obecné.

Konfigurace zdroje na kartě Zdroj

  1. Vyberte + Nový vedle Připojení ion a vytvořte připojení ke zdroji dat.

    Screenshot showing where to select New.

    1. V automaticky otevíraných otevíraných oknech zvolte typ zdroje dat. Jako příklad použijete Azure SQL Database. Vyberte Azure SQL Database a pak vyberte Pokračovat.

      Screenshot showing how to select the data source.

    2. Přejde na stránku pro vytvoření připojení. Na panelu vyplňte požadované informace o připojení a pak vyberte Vytvořit. Podrobnosti o vytvoření připojení pro každý typ zdroje dat najdete v jednotlivých článcích o konektoru.

      Screenshot showing New connection page.

    3. Po úspěšném vytvoření připojení se vrátíte na stránku datového kanálu. Potom výběrem možnosti Aktualizovat načtěte připojení, které jste vytvořili z rozevíracího seznamu. V rozevíracím seznamu můžete také zvolit existující připojení ke službě Azure SQL Database přímo v případě, že jste ho už vytvořili. Možnosti testovacího připojení a úpravy jsou k dispozici pro každé vybrané připojení. Pak v Připojení ionu vyberte Azure SQL Database.

      Screenshot showing where to refresh your connection.

  2. Zadejte tabulku, která se má zkopírovat. Výběrem možnosti Náhled dat zobrazíte náhled zdrojové tabulky. Ke čtení dat ze zdroje můžete použít také dotaz a uloženou proceduru.

    Screenshot showing source table settings options.

  3. Rozbalením možnosti Upřesnit zobrazíte pokročilejší nastavení.

    Screenshot of advanced settings.

Konfigurace cíle na kartě Cíl

  1. Zvolte typ cíle. Může to být interní úložiště dat první třídy z vašeho pracovního prostoru, například Lakehouse, nebo externí úložiště dat. Jako příklad použijete Lakehouse.

    Screenshot showing where to select destination type.

  2. Zvolte použití Lakehouse v typu úložiště dat pracovního prostoru. Vyberte + Nový a přejdete na stránku pro vytvoření Lakehouse. Zadejte název Lakehouse a pak vyberte Vytvořit.

    Screenshot showing Lakehouse creation.

  3. Po úspěšném vytvoření připojení se vrátíte na stránku datového kanálu. Potom výběrem možnosti Aktualizovat načtěte připojení, které jste vytvořili z rozevíracího seznamu. Existující připojení Lakehouse můžete také zvolit přímo z rozevíracího seznamu, pokud jste ho už vytvořili.

    Screenshot showing selecting connection.

  4. Zadejte tabulku nebo nastavte cestu k souboru pro definování souboru nebo složky jako cíle. Tady vyberte Tabulky a zadejte tabulku pro zápis dat.

    Screenshot showing where to find Table settings.

  5. Rozbalením možnosti Upřesnit zobrazíte pokročilejší nastavení.

    Screenshot of Advanced options.

Teď můžete buď uložit datový kanál s touto aktivitou s jednou kopií, nebo pokračovat v návrhu datového kanálu.

Konfigurace mapování na kartě mapování

Pokud konektor, který používáte, podporuje mapování, můžete přejít na kartu Mapování a nakonfigurovat mapování.

  1. Vyberte Importovat schémata pro import schématu dat.

    Screenshot of mapping settings 1.

  2. Zobrazí se automatické mapování. Zadejte sloupec Zdroj a Cílový sloupec. Pokud v cíli vytvoříte novou tabulku, můžete zde přizpůsobit název cílového sloupce. Pokud chcete zapisovat data do existující cílové tabulky, nemůžete změnit název existujícího cílového sloupce. Můžete také zobrazit typ zdrojového a cílového sloupce.

    Screenshot of mapping settings 2.

Kromě toho můžete vybrat + Nové mapování přidat nové mapování, výběrem možnosti Vymazat vymazat všechna nastavení mapování a výběrem možnosti Obnovit obnovit všechny sloupce zdroj mapování.

Konfigurace převodu typů

Rozbalte nastavení převodu typu, abyste v případě potřeby nakonfigurovali převod typu.

Screenshot of mapping type conversion.

Podrobnosti o nastavení najdete v následující tabulce.

Nastavení Popis
Povolit zkrácení dat Umožňuje zkrácení dat při převodu zdrojových dat do cíle s jiným typem během kopírování. Například z desetinného čísla na celé číslo od DatetimeOffset do Datetime.
Považovat logickou hodnotu za číslo Považovat logickou hodnotu za číslo. Například považovat hodnotu true za 1.
Formát DateTime Formátovat řetězec při převodu mezi kalendářními daty bez posunu časového pásma a řetězců Příklad: "yyyy-MM-dd HH:mm:ss.fff".
Formát DateTimeOffset Formátujte řetězec při převodu mezi kalendářními daty s posunem časového pásma a řetězci. Příklad: "yyyy-MM-dd HH:mm:ss.fff zzz".
Formát TimeSpan Formátovat řetězec při převodu mezi časovými obdobími a řetězci Například "dd.hh:mm:ss".
Kultury Informace o jazykové verzi, které se mají použít při převodu typů. Například "en-us", "fr-fr".

Konfigurace dalších nastavení na kartě Nastavení

Karta Nastavení obsahuje nastavení výkonu, přípravy atd.

Screenshot of Settings tab.

Popis jednotlivých nastavení najdete v následující tabulce.

Nastavení Popis
Optimalizace inteligentní propustnosti Určete, jak optimalizovat propustnost. Můžete si vybrat z:
Automaticky
Standardní
Vyvážená
Maximum
Když zvolíte Možnost Automaticky, optimální nastavení se dynamicky použije na základě vašeho páru a vzoru dat cíle zdroje. Propustnost můžete také přizpůsobit a vlastní hodnota může být 2–256, zatímco vyšší hodnota znamená další zisky.
Stupeň paralelismu kopírování Zadejte stupeň paralelismu, který by načítání dat používalo.
Odolnost proti chybám Při výběru této možnosti můžete ignorovat některé chyby, ke kterým došlo uprostřed procesu kopírování. Například nekompatibilní řádky mezi zdrojovým a cílovým úložištěm, odstraněním souboru během přesunu dat atd.
Povolení protokolování Při výběru této možnosti můžete protokolovat zkopírované soubory, přeskočené soubory a řádky.
Povolení přípravy Určete, zda se mají kopírovat data prostřednictvím dočasného přípravného úložiště. Povolte přípravu pouze pro vhodné scénáře.
Připojení k pracovnímu účtu Při výběru možnosti Povolit přípravu zadejte připojení zdroje dat úložiště Azure jako dočasné přípravné úložiště. Pokud ho nemáte, vyberte + Nový a vytvořte přípravné připojení.

Konfigurace parametrů v aktivitě kopírování

Parametry lze použít k řízení chování kanálu a jeho aktivit. Pomocí možnosti Přidat dynamický obsah můžete zadat parametry vlastností aktivity kopírování. Pojďme jako příklad určit databázi Lakehouse, Data Warehouse nebo KQL a podívat se, jak ji používat.

  1. Ve zdroji nebo cíli vyberte Pracovní prostor jako typ úložiště dat a specifikujte databázi Lakehouse/Data Warehouse/KQL jako typ úložiště dat pracovního prostoru, v rozevíracím seznamu Lakehouse nebo Data Warehouse nebo KQL Database vyberte Přidat dynamický obsah.

  2. V automaticky otevírané nabídce Přidat dynamický obsah na kartě Parametry vyberte +.

    Screenshot showing the Add dynamic content page.

  3. Zadejte název parametru a v případě potřeby zadejte výchozí hodnotu, nebo můžete zadat hodnotu parametru po výběru možnosti Spustit v kanálu.

    Screenshot shows creating a new parameter.

    Všimněte si, že hodnota parametru by měla být ID databázového objektu Lakehouse/Data Warehouse/KQL. Pokud chcete získat ID databázového objektu Lakehouse/Data Warehouse/KQL, otevřete databázi Lakehouse/Data Warehouse/KQL v pracovním prostoru a ID je za /lakehouses/nebo /datawarehouses//databases/ v adrese URL.

    • ID objektu Lakehouse:

      Screenshot showing the Lakehouse object ID.

    • ID objektu datového skladu:

      Screenshot showing the Data Warehouse object ID.

    • ID databázového objektu KQL:

      Screenshot showing the KQL Database object ID.

  4. Výběrem možnosti Uložit se vrátíte do podokna Přidat dynamický obsah . Pak vyberte parametr, aby se zobrazil v poli výrazu. Pak vyberte OK. Vrátíte se na stránku kanálu a uvidíte, že je výraz parametru zadaný po ID objektu Data Warehouse ID/objektu Lakehouse ID/objektu KQL Database ID.

    Screenshot showing selecting parameter.