將資料載入 Azure AI 搜尋服務中的搜尋索引
本文說明如何在預先定義的搜尋索引中匯入、重新整理和管理內容。 在 Azure AI 搜尋服務中,首先建立搜尋索引,接著匯入資料做為第二個步驟。 匯入資料精靈和索引子管線除外,其會在一個工作流程中建立和載入索引。
搜尋服務會以 JSON 匯入文字和向量並編制其索引,用於全文檢索搜尋、向量搜尋和知識採礦案例。 文字內容可從外部資料源中的英數欄位、搜尋案例中有用的中繼資料,或技能集 (技能可以擷取或推斷影像和非結構化內容的文字描述) 所建立的豐富內容中取得。 向量內容是使用 外部內嵌模型或整合向量化 (預覽) 來向量化。
一旦編制資料的索引,索引的實體資料結構就會鎖定在 其中。 如需可變更和無法變更的內容指引,請參閱捨棄和重建索引。
索引編制不是背景程序。 搜尋服務會平衡索引編制和查詢工作負載,但如果查詢延遲太高,您可以新增容量或識別載入索引的低查詢活動期間。
載入文件
搜尋服務接受符合索引架構的 JSON 文件。
您可以自行準備這些檔,但如果內容位於支援的資料來源中,則執行索引子或 [匯入資料精靈] 都可以將文件擷取、JSON 序列化和編制索引自動化。
在 Azure 入口網站中,使用匯入資料精靈,以在無縫工作流程中建立和載入索引。 如果您想要載入現有的索引,請選擇替代方法。
使用您的 Azure 帳戶登入 Azure 入口網站 。
尋找您的搜尋服務,然後在 [概觀] 頁面上,選取命令列上的 [匯入資料] 或 [匯入和向量化資料],以建立並填入搜尋索引。 您可以遵循下列連結來檢閱工作流程:快速入門:建立 Azure AI 搜尋服務索引和快速入門:整合向量化 (預覽)。
如果已定義索引子,您可以從 Azure 入口網站重設並執行索引子,這在您以累加方式新增欄位時很有用。 重設會強制索引子重新開始,從所有來源文件中挑選所有欄位。
刪除孤立文件
Azure AI 搜尋服務支援文件層級的作業,以便您可以單獨查閱、更新和刪除特定文件。 下列範例說明如何刪除文件。 在搜尋服務中,文件是不相關的,因此刪除一個文件並不會對索引的其餘部分造成影響。
識別哪一個欄位是文件索引鍵。 在入口網站中,您可以檢視每個索引的欄位。 文件索引鍵是字串欄位,會以鑰匙圖示表示,使其更容易找到。
檢查文件索引鍵欄位的值:
search=*&$select=HotelId
。 簡單的字串是直接易懂的,但如果索引使用 base-64 編碼欄位,或是從parsingMode
設定中產生搜尋文件,則您可能會使用您不熟悉的值。查閱文件以確認文件 ID 的值,並在刪除之前檢閱其內容。 在要求中指定索引鍵或文件 ID。 下列範例說明旅館範例索引的一個簡單字串,以及 cog-search-demo 索引之metadata_storage_path 索引鍵的 base-64 編碼字串。
GET https://[service name].search.windows.net/indexes/hotel-sample-index/docs/1111?api-version=2023-11-01
GET https://[service name].search.windows.net/indexes/cog-search-demo/docs/aHR0cHM6Ly9oZWlkaWJsb2JzdG9yYWdlMi5ibG9iLmNvcmUud2luZG93cy5uZXQvY29nLXNlYXJjaC1kZW1vL2d1dGhyaWUuanBn0?api-version=2023-11-01
刪除文件以將它從搜尋索引中移除。
POST https://[service name].search.windows.net/indexes/hotels-sample-index/docs/index?api-version=2023-11-01 Content-Type: application/json api-key: [admin key] { "value": [ { "@search.action": "delete", "id": "1111" } ] }
另請參閱
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應