共用方式為


應用程式內容搜尋概觀

Windows AI API 啟用的應用程式內容搜尋功能,讓應用程式開發者能透過 AppContentIndexer API 將智慧搜尋整合到他們的 Windows 應用程式中。 藉由編製應用程式內內容的索引,並透過語意查詢進行搜尋,用戶不僅可以根據確切的關鍵詞,還可以根據語意意義來擷取結果。 您可以使用此語意索引,透過特定領域知識來增強自己的 AI 助理,建立更個人化、內容特定的體驗。

使用此 API 來:

  • 建置使用語意和語彙搜尋的應用程式內搜尋體驗。 使用者可以依意義搜尋,不僅是確切的關鍵詞匹配,這讓他們更容易找到相關資訊。

  • 啟用本地知識檢索來支援 Retrieval-Augmented 生成(RAG)。 當與大型語言模型 (LLM) 配對時,這允許您從應用程式的知識庫中檢索最相關的內容,並產生更準確、上下文感知的回應。

ApplicationContentIndexer API 目前僅適用於 Windows 應用程式 SDK 2.0 版實驗性 2。

AI Dev Gallery 應用程式提供 AppContentIndexer API 的互動式範例,可讓您嘗試應用程式內容搜尋功能。 深入了解 AI 開發人員資源庫,包括如何從 Microsoft Store 或 GitHub 上的原始程式碼安裝。

什麼是 AppContentIndexer API?

AppContentIndexer API 可讓應用程式使用關鍵字型 (詞法) 和意義型 (語意型) 搜尋來搜尋其文字和影像內容,而不需要開發人員瞭解基礎複雜性。

在幕後,它使用嵌入向量、向量資料庫和傳統文字索引等先進技術,但這些細節是完全抽象的。 開發人員與簡單的高階 API 互動。 當內容建立索引時,系統會儲存內嵌向量 (擷取語意意義) 以及內容識別碼。 然後,搜尋請求會根據關鍵字相符或語義相似性傳回識別碼。 例如,搜尋「kitten」可能會回傳有關貓咪的相關文字或小貓圖片。 語意搜尋最適合描述性片語,因此像「坐在窗台上的貓」這樣的查詢更有可能產生高度相關的結果。

索引是持續存在到磁碟,所以每次啟動應用程式時不需要重新索引。

在內部,ApplicationContentIndexer 會結合傳統文字索引,以及由內嵌提供支援的新式向量型搜尋。 這些細節被抽象化——開發人員不需要直接管理嵌入模型、向量存儲或檢索基礎設施。

您可以使用純字串查詢索引。 查詢可能會傳回:

  • 詞彙匹配 – 完全文本匹配(包括在圖像中找到的文本)。
  • 語義匹配 – 含義相似的內容,即使單詞不相同。

例如,查詢「小貓」可能會回傳一個參考:

  • 關於貓的文字記錄,即使沒有明確提到「小貓」這個詞。
  • 視覺上包含小貓的圖像。
  • 包含「貓」或具有足夠語義相關性的詞彙的圖片文字內容。

支援的內容類型

ApplicationContentIndexer 支援新增下列類型的內容:

  • 文字 – 純文字或結構化文字內容。
  • 圖像 – 包括包含文字或可識別視覺元素的螢幕擷取畫面、相片或影像檔案。

應用程式定義的內容識別碼

AppContentIndexer 允許應用程式使用應用程式定義的內容識別碼來索引項目,以支援應用程式管理的內容。 查詢會傳回這些識別碼,應用程式會使用這些識別碼從自己的資料存放區擷取實際內容。

文字查詢會傳回 AppManagedTextQueryMatch 物件,而影像查詢會傳回 AppManagedImageQueryMatch 物件,兩者都只包含 ContentId,而不包含內容本身。

如需如何將此功能整合至應用程式並使用 ApplicationContentIndexer API 的指引,請參閱: 快速入門:應用程式內容搜尋

隱私權與安全性

語意索引和詞彙索引是代表你的應用程式產生的,並儲存在應用程式的本地應用程式資料資料夾中。 作為私人預覽版本的一部分,這項功能旨在為非敏感性應用程式內容編製索引。 為了獲得最佳安全性做法,請勿使用此功能來索引可能包含個人、機密或敏感資訊的使用者資料。

負責任 AI 的考量因素

此預覽版中的語意索引和搜尋功能不會套用任何形式的內容審核,也不會嘗試偵測或減輕基礎模型所引進的語意偏差。 開發人員負責評估和管理實施人工智慧功能時的潛在風險。

建議您檢閱 Windows 上的負責任生成式 AI 開發指導方針 ,以取得在應用程式中建置 AI 體驗時的最佳做法。