共用方式為


帶入自己的 Azure Data Lake Storage Gen2

Power Automate Process Mining 可讓您選擇直接從 Azure Data Lake Storage Gen2 儲存和讀取事件記錄檔資料。 此功能可透過直接連線至您的儲存帳戶來簡化擷取、轉換、載入 (ETL) 管理。

此功能目前支援擷取下列各項:

表格

  • Delta 資料表
    • Fabric Lakehouse 中的單一 Delta 資料表

檔案和資料夾

  • CSV
    • 單一 CSV 檔案。
    • 包含多個有相同結構之 CSV 檔案的資料夾。 擷取所有檔案。
  • Parquet
    • 單一 Parquet 檔案。
    • 包含多個有相同結構之 Parquet 檔案的資料夾。 擷取所有檔案。
  • Delta-parquet
    • 包含 Delta-parquet 結構的資料夾。

必要條件

  • Data Lake Storage 帳戶必須是 Gen2。 您可以從 Azure 入口網站查看此資訊。 不支援 Azure Data Lake Gen1 storage 帳戶。

  • Data Lake Storage 帳戶必須啟用階層命名空間

  • 在儲存帳戶層級中,必須將擁有者角色指派給負責該環境初始容器設定的使用者,以便後續同一環境中的其他使用者能夠正常使用。 這些使用者連接到同一容器,並且必須具有以下指派:

    • 已指派儲存體 Blob 資料讀者儲存體 Blob 資料參與者角色
    • 至少已指派 Azure Resource Manager 讀取者角色。
  • 應為您的儲存體帳戶建立資源共用 (CORS) 規則,以便與 Power Automate Process Mining 共用。

    • 允許的來源必須是設定為 https://make.powerautomate.comhttps://make.powerapps.com

    • 允許的方法必須包括:getoptionsputpost

    • 允許的標頭應盡量靈活。 建議您將它們定義為 *

    • 顯示標頭應盡量靈活。 建議您將它們定義為 *

    • 最長時數應盡可能靈活。 建議使用 86400

      CORS 設定畫面範例的螢幕擷取畫面。

  • Data Lake Storage 中的 CSV 資料應符合下列 CSV 檔案格式需求:

    • 壓縮類型:
    • 資料行分隔符號:逗號 (,)
    • 資料列分隔符號:預設與編碼。 例如,預設 (\r、\n 或 \r\n)

    檔案格式設定畫面的螢幕擷取畫面。

  • 所有資料都必須是最終事件記錄檔格式,並符合資料要求中所列的要求。 資料應準備好對應至程序挖掘結構描述。 擷取後就無法進行資料轉換。

  • 標題行的大小 (寬度) 目前限制為 1 MB。

重要

請確定 CSV 檔案中所示的時間戳記符合 ISO 8601 標準格式 (例如 YYYY-MM-DD HH:MM:SS.sssYYYY-MM-DDTHH:MM:SS.sss)。

連線至 Azure Data Lake Storage

  1. 在左側瀏覽窗格中,選取 Process Mining>由此開始

  2. 程序名稱欄位中輸入您的程序名稱。

  3. 資料來源標題底下,選取匯入資料> Azure Data Lake>繼續 建立程序步驟的螢幕擷取畫面。

  4. 連線設定畫面上,從下拉式選單中選取您的訂閱識別碼資源群組儲存體帳戶容器

  5. 選取包含事件記錄檔資料的檔案或資料夾。

    您可以選取單一檔案或包含多個檔案的資料夾。 所有檔案都必須有相同的標頭和格式。

  6. 選取下一步

  7. 對應資料畫面中,將您的資料對應至所需的結構描述。

    對應資料畫面的螢幕擷取畫面。

  8. 選取儲存並分析來完成連線。

定義累加式資料重新整理設定

您可以透過完整或累加式重新整理,重新整理從 Azure Data Lake 引入的程序。 雖然沒有保留原則,但您可以使用下列其中一種方法以累加方式來擷取資料:

如果您在上一節中選取了單一檔案,請將更多資料附加到所選檔案。

如果您在上一節中選取了資料夾,請將增量檔案新增至所選資料夾。

重要

當您將累加檔案新增至所選資料夾或子資料夾時,請務必使用日期命名檔案來指示累加順序,例如 YYYMMDD.csv 或 YYYYMMDDHHMMSS.csv。

若要重新整理程序:

  1. 前往程序的詳細資料頁面。

  2. 選取重新整理設定

  3. 排程重新整理畫面上,完成下列步驟:

    1. 開啟讓您的資料保持最新狀態切換開關。
    2. 重新整理資料間隔下拉式清單中,選取重新整理的頻率。
    3. 開始欄位中,選取重新整理的日期與時間。
    4. 開啟累加式重新整理切換開關。