使用索引子建置索引

已完成

若要為 Azure 儲存體中的文件編制索引,必須將其原始檔案類型匯出為 JSON。 為了將任何格式的資料匯出為 JSON,並將其載入索引中,我們會使用索引子。

若要建立搜尋文件,您可以使用應用程式程式碼產生 JSON 文件,或使用 Azure 的索引子將傳入文件匯出為 JSON。

Azure AI 搜尋可讓您使用兩種方法,建立 JSON 檔並將其載入至索引:

  • 推送方法:JSON 資料會透過 REST API 或 .NET SDK 推送至搜尋索引。 推送資料具有最大的彈性,因為它沒有資料來源類型、位置或執行頻率限制。

  • 提取方法:搜尋服務索引子可以從熱門的 Azure 資料來源提取資料,也能在必要時將該資料匯出為 JSON (若資料尚未採用 JSON 格式)。

使用提取方法藉由索引子載入資料

Azure AI 搜尋服務的索引子是編目程式,可從外部 Azure 資料來源擷取可搜尋的文字和中繼資料,並使用來源資料與索引之間的欄位對欄位對應來填入搜尋索引。 使用索引子有時稱為「提取模型」方法,因為您不需要撰寫任何程式碼來將資料新增至索引,服務就會自行提取資料。 索引子會將來源欄位對應到索引中的相符欄位。

資料匯入監視和驗證

搜尋服務概觀頁面具有可讓您快速查看搜尋服務健康狀態的儀表板。 您可以在儀表板上查看搜尋服務中有多少份文件、已使用多少個索引,以及正在使用多少儲存空間。

將新文件載入索引時,可透過按一下與索引相關聯的索引子來監視進度。 文件計數會隨著載入索引的文件數目增加。 在某些執行個體中,入口網站頁面可能需要數分鐘的時間才會顯示最新文件計數。 一旦索引可供查詢,您就可以接著使用 [搜尋總管] 來驗證結果。 第一份文件成功載入之後,索引便可供使用。

索引子只能匯入新或更新的文件,因此看到未針對任何文件編製索引是很正常的情況。

[搜尋總管] 可用於執行快速搜尋以檢查索引的內容,並確保收到預期的搜尋結果。 在入口網站中提供此工具,可讓您透過檢閱以 JSON 文件傳回的結果,輕鬆查看索引。

對索引進行變更

如果您需要變更欄位定義,則必須卸除並重新建立索引。 支援新增新欄位,且所有現有文件都具有 Null 值。 由於在入口網站中執行操作會需要刪除、重新建立索引並手動填寫結構描述詳細資料,因此使用程式碼型方法來逐一查看您的設計將更加快速。

若要在不影響使用者的情況下更新索引,您必須以不同名稱建立新索引。 您可以使用相同的索引子和資料來源。 匯入資料之後,您可以將應用程式切換為使用新的索引。