識別搜尋解決方案的元素

已完成

Infographic of indexing process.

一般的 Azure AI 搜尋解決方案會從包含您要搜尋之資料成品的資料來源開始。 這可能是 Azure 儲存體中資料夾和檔案的階層,也可以是 Azure SQL Database 或 Azure Cosmos DB 等資料庫中的文字。 Azure AI 搜尋服務支援的資料格式為 JSON。 不論資料來源為何,如果您可以將它當作 JSON 文件來提供,搜尋引擎就可以為它編製索引。

如果您的資料位於支援的資料來源中,就可以使用索引子自動擷取資料,包括以原生格式對來源資料進行 JSON 序列化。 索引子會連線到資料來源、將資料序列化,並傳遞至搜尋引擎進行索引編製。 大多數索引子都支援變更偵測,讓資料重新整理變得更簡單。

除了自動擷取資料之外,索引子也支援 AI 擴充。 您可以連結一個技能,其會套用一系列 AI 技能來擴充資料,使其更容易搜尋。 一組全方位的內建技能 (以 Azure AI 服務 API 為基礎) 可以協助您衍生新欄位,例如,透過辨識文字中的實體、翻譯文字、評估情緒,或者預測影像的適當標題。 (選擇性) 擴充的內容可以傳送到知識存放區,其會將 AI 擴充管線的輸出儲存在 Azure 儲存體的資料表和 Blob 中,以進行獨立分析或下游處理。

無論您是撰寫應用程式程式碼來將資料推送至索引,還是使用索引子來自動擷取資料並新增 AI 擴充,包含內容的欄位都會保存於索引中,讓用戶端應用程式可以搜尋。 欄位可用於搜尋、篩選和排序來產生一組結果,以供用戶端應用程式顯示或使用。