共用方式為


Azure Data Lake Storage Gen2 Microsoft 圖形連接器

Azure Data Lake Storage Gen2 Microsoft Graph 連接器可讓組織中的使用者搜尋儲存在 Azure Blob 儲存體Azure Data Lake Gen 2 儲存器帳戶中的檔案。

本文適用於設定、執行及監視 Azure Data Lake Storage Gen2 Microsoft Graph 連接器的任何人。 它會補充一般設定程式,並顯示僅適用於 Azure Data Lake Storage Gen2 Microsoft Graph 連接器的指示。 它也包含限制 的相關信息。

在本文中,我們會使用 Azure 記憶體作為 Azure Blob 儲存體Azure Data Lake Gen 2 記憶體的一般詞彙。

步驟 1:在 Microsoft 365 系統管理中心 中新增連接器

新增 Azure Data Lake Storage Gen2 Microsoft Graph 連接器

(如需詳細資訊,請參閱一般 設定指示)

步驟 2:命名連線

請遵循一般 設定指示

步驟 3:設定連線設定

輸入您的主要記憶體 連接字串。 需要此字串才能允許存取您的記憶體帳戶。 若要尋找您的 連接字串,請移至 Azure 入口網站 並瀏覽至相關 Azure 儲存體帳戶的 [金鑰] 區段。

如果您不想在主要記憶體 連接字串) 中提供 Accountkey (參數,請為下列角色授與 Microsoft Graph 連接器服務的存取權:

  • 記憶體 Blob 資料讀取器
  • 記憶體佇列數據參與者
  • 記憶體 Blob 委派者

瀏覽至 Azure 記憶體帳戶的 [ 存取權 ] 索引標籤,並遵循該處的指示來授與下列應用程式的存取權:

  • 第一方應用程式標識碼: 56c1da01-2129-48f7-9355-af6d59d42766
  • 第一方應用程式名稱: Microsoft Graph 連接器服務

記憶體帳戶和佇列通知 (選擇性)

未來可能會新增在 Microsoft Graph 連接器服務中即時處理變更的支援。 在此情況下,我們將監視儲存在佇列中的 Azure 記憶體變更通知。 您必須在與 Azure 記憶體帳戶相同的帳戶中建立佇列。

建立佇列之後,請移至佇列頁面上的 [ 事件 ] 索引標籤,以設定 事件訂閱。 選擇佇列收到的所有 Blob 事件,並將佇列連線至 Azure 記憶體帳戶。

測試連線

按兩下 [測試連線] 按鈕來 測試連線

注意事項

測試連線必須成功,您才能移至下一個組態區段。 已啟用ADLS gen 2的記憶體帳戶 至少必須 有一個容器 一個檔案, 測試連線 才能成功。 如果內容不存在,就會引發連線錯誤。

步驟 4:指派屬性標籤

您可以從選項選單中選擇,將來源屬性指派給每個標籤。 雖然此步驟並非必要,但擁有某些屬性標籤可改善搜尋相關性,並確保使用者的搜尋結果更好。

步驟 5:管理架構

在 [ 管理架構 ] 畫面上,您可以變更與屬性相關聯的架構屬性,這些選項為 [查詢]、[ 搜尋]、[擷 ] 和 [ 精簡]。 您也可以新增選擇性別名,然後選擇 Content 屬性。

步驟 6:管理搜尋許可權

Azure Data Lake Gen 2

您可以選擇從 Azure Data Lake Gen 2 儲存器帳戶內嵌 存取控制 清單 (ACL) 。 設定這些搜尋許可權時,會根據登入 Microsoft Entra ID 用戶的權來修剪搜尋內容。 或者,您可以選擇讓組織中的每個人都能看見從記憶體帳戶編製索引的所有內容。 在此情況下,您組織中的每個人都可以存取記憶體帳戶中的所有數據。

Azure Data Lake Storage Gen2 Microsoft 圖形連接器支援所有人只有具有此數據源存取權的人員才能看見的搜尋許可權。 組織中可存取每個項目的使用者,可以看見出現在搜尋結果中的索引數據。

Azure Blob 儲存體

若要連線到 Azure Blob 儲存體,您組織中的每個人都可以看到從已設定來源編製索引的所有內容。 Azure Blob 儲存體 中的 Blob 層級不支援訪問控制清單。

步驟 7:設定重新整理排程

在 [ 重新整理設定] 畫面上,您可以設定累加編目間隔和完整編目間隔。 Azure Data Lake Storage Gen2 Microsoft Graph 連接器的預設間隔為 15 分鐘,累加編目為 15 分鐘,完整編目為一周。

步驟 8:檢閱連線

請遵循一般 設定指示

限制

Azure Blob 儲存體 的已發行連線無法針對 Azure Data Lake Storage Gen2 來源重新設定,相反地。 在這種情況下,建議您設定新的連線。

此外,檔案的大小必須是 4 MB 或更少,才能進行編目。 目前支援的檔案類型如下:

  • Word (docx、.docm、.dotx、.dotm)
  • PowerPoint (.pptm、.pptx、.potm、.potx、.ppam、.ppsm、.ppsx)
  • Excel (.xlsx、.xlsm)
  • 舊版 Office 格式 (.doc、.dot 等 )
  • 文字 (.txt)
  • HTML
  • PDF

不支援影像 (.jpg、.bmp 等二進位檔 ) 。 例如,如果 .docx 檔案只包含影像,可能會因為未傳回任何內容而略過。

疑難排解

發佈連線之後,您可以在系統管理中心的 [數據源] 索引卷標下檢閱狀態。 若要瞭解如何進行更新和刪除,請參閱 管理您的連接器

如果您有任何其他問題或想要提供意見反應,請在 Microsoft Graph 與我們連絡 |支援