共用方式為


將資料載入 Azure AI 搜尋服務中的搜尋索引

本文說明如何在預先定義的搜尋索引中匯入、重新整理和管理內容。 在 Azure AI 搜尋服務中,首先建立搜尋索引,接著匯入資料做為第二個步驟。 匯入資料精靈和索引子管線除外,其會在一個工作流程中建立和載入索引。

搜尋服務會以 JSON 匯入文字和向量並編制其索引,用於全文檢索搜尋、向量搜尋和知識採礦案例。 文字內容可從外部資料源中的英數欄位、搜尋案例中有用的中繼資料,或技能集 (技能可以擷取或推斷影像和非結構化內容的文字描述) 所建立的豐富內容中取得。 向量內容是使用 外部內嵌模型整合向量化 (預覽) 來向量化。

一旦編制資料的索引,索引的實體資料結構就會鎖定在 其中。 如需可變更和無法變更的內容指引,請參閱捨棄和重建索引

索引編制不是背景程序。 搜尋服務會平衡索引編制和查詢工作負載,但如果查詢延遲太高,您可以新增容量或識別載入索引的低查詢活動期間。

載入文件

搜尋服務接受符合索引架構的 JSON 文件。

您可以自行準備這些檔,但如果內容位於支援的資料來源中,則執行索引子或 [匯入資料精靈] 都可以將文件擷取、JSON 序列化和編制索引自動化。

在 Azure 入口網站中,使用匯入資料精靈,以在無縫工作流程中建立和載入索引。 如果您想要載入現有的索引,請選擇替代方法。

  1. 使用您的 Azure 帳戶登入 Azure 入口網站

  2. 尋找您的搜尋服務,然後在 [概觀] 頁面上,選取命令列上的 [匯入資料] 或 [匯入和向量化資料],以建立並填入搜尋索引。 您可以遵循下列連結來檢閱工作流程:快速入門:建立 Azure AI 搜尋服務索引快速入門:整合向量化 (預覽)

    匯入資料命令的螢幕快照

如果已定義索引子,您可以從 Azure 入口網站重設並執行索引子,這在您以累加方式新增欄位時很有用。 重設會強制索引子重新開始,從所有來源文件中挑選所有欄位。

刪除孤立文件

Azure AI 搜尋服務支援文件層級的作業,以便您可以單獨查閱、更新和刪除特定文件。 下列範例說明如何刪除文件。 在搜尋服務中,文件是不相關的,因此刪除一個文件並不會對索引的其餘部分造成影響。

  1. 識別哪一個欄位是文件索引鍵。 在入口網站中,您可以檢視每個索引的欄位。 文件索引鍵是字串欄位,會以鑰匙圖示表示,使其更容易找到。

  2. 檢查文件索引鍵欄位的值:search=*&$select=HotelId。 簡單的字串是直接易懂的,但如果索引使用 base-64 編碼欄位,或是從 parsingMode 設定中產生搜尋文件,則您可能會使用您不熟悉的值。

  3. 查閱文件以確認文件 ID 的值,並在刪除之前檢閱其內容。 在要求中指定索引鍵或文件 ID。 下列範例說明旅館範例索引的一個簡單字串,以及 cog-search-demo 索引之metadata_storage_path 索引鍵的 base-64 編碼字串。

    GET https://[service name].search.windows.net/indexes/hotel-sample-index/docs/1111?api-version=2023-11-01
    
    GET https://[service name].search.windows.net/indexes/cog-search-demo/docs/aHR0cHM6Ly9oZWlkaWJsb2JzdG9yYWdlMi5ibG9iLmNvcmUud2luZG93cy5uZXQvY29nLXNlYXJjaC1kZW1vL2d1dGhyaWUuanBn0?api-version=2023-11-01
    
  4. 刪除文件以將它從搜尋索引中移除。

    POST https://[service name].search.windows.net/indexes/hotels-sample-index/docs/index?api-version=2023-11-01
    Content-Type: application/json   
    api-key: [admin key] 
    {  
      "value": [  
        {  
          "@search.action": "delete",  
          "id": "1111"  
        }  
      ]  
    }
    

另請參閱