Sdílet prostřednictvím


Použití vlastního úložiště Azure Data Lake Storage Gen2

Power Automate Process Mining vám dává možnost ukládat a číst data protokolu událostí přímo z Azure Data Lake Storage Gen2. Tato funkce zjednodušuje správu extrahování, transformace, načítání (ETL) připojením přímo k vašemu účtu úložiště.

Tato funkce v současné době podporuje příjem následujících:

Tabulky

  • Tabulky Delta
    • Jedna rozdílová tabulka ve Fabric Lakehouse.

Soubory a složky

  • CSV
    • Jeden soubor CSV.
    • Složka s více soubory CSV, které mají stejnou strukturu. Všechny soubory se ingestují.
  • Parketové
    • Jeden soubor parquet.
    • Složka s více soubory parquet, které mají stejnou strukturu. Všechny soubory se ingestují.
  • Delta-parquet
    • Složka, která obsahuje strukturu delta-parquet.

Předpoklady

  • Účet úložiště Data Lake Storage musí být Gen2. Můžete to vyzkoušet v Azure Portal. Účty úložiště Azure Data Lake Gen1 nejsou podporovány.

  • Účet úložiště Azure Data Lake Storage musí mít zapnutou funkci Hierarchický prostor názvů.

  • Role Vlastník (na úrovni účtu úložiště) musí být přiřazena uživateli, který provádí počáteční nastavení kontejneru pro prostředí pro následující uživatele ve stejném prostředí. Tito uživatelé se připojují ke stejnému kontejneru a musí mít tato přiřazení:

    • Přiřazené role Čtenář dat objektů blob úložiště nebo Přispěvatel dat objektů blob úložiště
    • Minimální přiřazená role Čtenář Azure Resource Manager.
  • Pravidlo Sdílení zdrojů (CORS) pro váš účet úložiště by být vytvořeno pro sdílení s Power Automate Process Mining.

    • Povolené zdroje musí být nastaveny na https://make.powerautomate.com a https://make.powerapps.com.

    • Povolené metody musí zahrnovat: get, options, put, post.

    • Povolené záhlaví by mělo být co nejflexibilnější. Doporučujeme ho definovat jako *.

    • Vystavené záhlaví by mělo být co nejflexibilnější. Doporučujeme ho definovat jako *.

    • Maximální staří by mělo být co nejflexibilnější. Doporučujeme používat 86400.

      Snímek obrazovky příkladu obrazovky nastavení CORS.

  • Data CSV ve vašem Data Lake Storage musí splňovat následující požadavky na formát souboru CSV:

    • Typ komprese: Žádná
    • Oddělovač sloupců: Čárka (,)
    • Oddělovač řádků: Výchozí a kódování. Například výchozí (\r,\n nebo \r\n)

    Screenshot obrazovky nastavení formátu souboru.

  • Všechna data musí být ve formátu konečného protokolu událostí a splňovat požadavky uvedené v požadavcích na data. Data musí být připravena k mapování na schéma dolování procesů. Po zpracování není k dispozici žádná transformace dat.

  • Velikost (šířka) řádku záhlaví je aktuálně omezena na 1 MB.

Důležité

Ujistěte se, že časové razítko uvedené v souboru CSV odpovídá standardnímu formátu ISO 8601 (například YYYY-MM-DD HH:MM:SS.sss nebo YYYY-MM-DDTHH:MM:SS.sss).

Připojení k Azure Data Lake Storage

  1. V levém navigačním podokně vyberte Process Mining>Začít zde.

  2. Do pole Název procesu zadejte název vašeho procesu.

  3. Pod nadpisem Zdroj dat vyberte Importovat data>Azure Data Lake>Pokračovat. Screenshot kroku Vytvoření procesu.

  4. Na obrazovce Nastavení připojení vyberte své ID předplatného, Skupina zdrojů, Účet úložiště a Kontejner z rozbalovacích nabídek.

  5. Vyberte soubor nebo složku obsahující data protokolu událostí.

    Můžete vybrat jeden soubor nebo složku s více soubory. Všechny soubory musí mít stejné záhlaví a formát.

  6. Vyberte Další.

  7. Na obrazovce Mapovat data namapujte svá data do požadovaného schématu.

    Snímek obrazovky Mapovat data.

  8. Dokončete připojení výběrem Uložit a analyzovat.

Definování nastavení přírůstkové aktualizace dat

Proces přijatý z Azure Data Lake můžete aktualizovat podle plánu, a to buď prostřednictvím úplné, nebo přírůstkové aktualizace. Ačkoli neexistují žádné zásady uchovávání dat, můžete data zpracovávat postupně pomocí jedné z následujících metod:

Pokud jste vybrali jeden soubor v předchozí části, přidejte k vybranému souboru další data.

Pokud jste vybrali složku v předchozí části, přidejte do vybrané složky přírůstkové soubory.

Důležité

Když přidáváte přírůstkové soubory do vybrané složky nebo podsložky, ujistěte se, že určujete pořadí přírůstků pojmenováním souborů s daty, jako je RRRRMMDD.csv nebo RRRRMMDDHHMMSS.csv.

Aktualizace procesu:

  1. Přejděte na stránku Podrobnosti procesu.

  2. Vyberte Obnovit nastavení.

  3. Na obrazovce Aktualizace plánu proveďte následující kroky:

    1. Zapněte přepínač Udržovat data aktuální.
    2. V rozbalovacích seznamech Obnovovat data každé vyberte frekvenci obnovování.
    3. V polích Začít v vyberte datum a čas obnovení.
    4. Zapněte přepínač Přírůstková aktualizace.