Azure AI 搜尋常見問題

尋找 Azure AI 搜尋常見問題的解答。

一般

什麼是 Azure AI 搜尋?

Azure AI 搜尋提供專用的搜尋引擎和可搜尋內容的永續性記憶體,以取得全文檢索和向量搜尋案例。 它也包含選擇性的整合式 AI,可從原始內容擷取更多文字和結構,以及區塊和向量化內容以進行向量搜尋。

如何? 使用 Azure AI 搜尋服務嗎?

主要工作流程是建立、載入和查詢索引。 雖然您可以針對大部分的工作使用入口網站,但 Azure AI 搜尋的目的是要以程式設計方式使用,處理來自用戶端程式代碼的要求。 透過適用於 Azure 的 .NET、Python、Java 和 JavaScript SDK 中的 REST API 和用戶端連結庫,提供程式設計支援。

「Azure 搜尋服務」和「Azure 認知搜尋」和「Azure AI 搜尋」是否為相同的產品?

Azure 搜尋服務於 2019 年 10 月重新命名為 Azure 認知搜尋,以反映認知技能和 AI 處理在服務作業中擴充的(但選擇性)使用。 Azure 認知搜尋 於 2023 年 10 月重新命名為 Azure AI 搜尋服務,以配合 Azure AI 服務。

支援哪些語言?

用於令牌化的預設分析器是標準 Lucene 及其語言無關。 否則,語言支援會透過 將語言規則套用至輸入(索引編製)和輸出(查詢)內容的語言分析器 來表示。 某些功能,例如 語意排名拼字檢查,僅限於語言的子集。

如何? 將搜尋整合到我的解決方案中?

用戶端程式代碼應該呼叫用戶端連結庫或 REST API,以連線到搜尋索引、制定查詢及處理回應。 您也可以撰寫程式代碼來建置及重新整理索引,或以程序設計方式或透過腳本執行索引器。

各種 API 是否有功能同位?

不一定。 REST API 一律是第一個在預覽 API 版本中實作新功能的 API。 Azure SDK 中的用戶端連結庫會隨著時間挑選新功能,但會依自己的排程發行。

雖然 REST API 是第一次使用最新的功能,但 Azure SDK 提供更多的編碼支援,而且除非無法使用必要的功能,否則建議使用 REST。

我可以暫停服務並停止計費嗎?

您無法暫停搜尋服務。 在 Azure AI 搜尋服務中,計算資源會在建立服務時配置。 您無法視需要釋放和回收這些資源。

我可以升級、降級、重新命名或移動服務嗎?

服務層級、名稱和區域會針對服務的存留期固定。

如果我將搜尋服務移轉至另一個訂用帳戶或資源群組,我是否應該預期有任何停機時間?

只要在移動資源之前遵循檢查清單,並確定每個步驟都已完成,就不應該有任何停機時間。

編製索引

「編製索引」在 Azure AI 搜尋中的意義為何?

它是指擷取、剖析和儲存填入搜尋索引的文字內容和標記。 編製索引會建立反向索引和其他支持資訊擷取的實體數據結構。

我可以移動、備份和還原索引嗎?

索引管理沒有原生支援。 搜尋索引會被視為下游數據結構,接受來自收集作業數據之其他數據源的內容。 因此,沒有內建支援備份和還原索引,因為預期您會在刪除索引或想要移動索引時,從源數據重建索引。

不過,如果您想要在搜尋服務之間移動索引,您可以在此 Azure AI 搜尋 .NET 範例存放庫中嘗試 index-backup-restore 範例程式代碼。

刪除索引或服務后,是否可以還原我的索引或服務?

否,如果您刪除 Azure AI 搜尋服務索引或服務,就無法復原。 當您刪除搜尋服務時,服務中的所有索引都會永久刪除。

我可以從 SQL 資料庫 複本編製索引嗎?

如果您使用 Azure SQL 資料庫 的搜尋索引器,則從頭開始建置索引時,不會限制使用主要或次要複本作為數據源。 不過,使用累加式更新重新整理索引(根據變更的記錄)需要主要複本。 這項需求來自 SQL 資料庫,它只保證主要複本的變更追蹤。 如果您嘗試針對索引重新整理工作負載使用次要複本,則不保證您取得所有數據。

向量

什麼是向量搜尋?

向量搜尋是一種技術,可藉由比較其向量表示法來尋找最類似的檔。 由於向量表示的目標是以數值格式擷取專案的基本特性,因此即使沒有以關鍵詞或標記為基礎的明確相符專案,也可以擷取抽象概念並識別相符專案。 當使用者執行搜尋時,查詢會摘要為向量表示法,而向量搜尋引擎會識別最類似的檔。 為了提升大型資料庫的效率,向量搜尋通常會為查詢向量提供最接近的鄰近值。 如需 Azure AI 搜尋的向量搜尋產品供應專案的詳細資訊,請參閱 向量搜尋概觀

Azure AI 搜尋是否支援向量搜尋?

Azure AI 搜尋支援向量索引編製和擷取。 如果您使用預覽和 Beta 連結庫,它可以向量化查詢字串和內容。

向量搜尋如何在 Azure AI 搜尋中運作?

透過獨立向量搜尋,您必須先使用內嵌模型,將內容轉換成內嵌空間內的向量表示法。 接著,您可以在文件承載中提供這些向量給搜尋索引以進行索引編製。 若要提供搜尋要求,您可以使用相同的 DNN 從編製索引,將搜尋查詢轉換成向量表示法,而向量搜尋會尋找最類似的向量,並傳回對應的檔。

在 Azure AI 搜尋中,您可以將向量數據編製索引,做為檔中的欄位,以及文字和其他內容類型。 向量欄位的資料型態為 Collection(Edm.Single)

向量查詢可以獨立發出,或與其他查詢類型結合,包括相同搜尋要求中的字詞查詢和篩選。

Azure AI 搜尋可向量化我的內容或查詢嗎?

整合向量化現在處於公開預覽狀態。

我的搜尋服務是否支援向量搜尋?

大部分現有的服務都支援向量搜尋。 如果您使用支援向量搜尋和索引建立的套件或 API 失敗,基礎搜尋服務不支援向量搜尋,而且必須建立新的服務。 這可能會發生在 2019 年 1 月 1 日之前建立的一小部分服務。

我可以將向量搜尋新增至現有的索引嗎?

如果您的搜尋服務支援向量搜尋,則現有索引和新索引都可以容納向量字段。

為什麼在新搜尋服務和現有搜尋服務之間看到不同的向量索引大小限制?

我們正在針對新的搜尋服務推出改良的向量索引大小限制,但我們仍在在特定區域中建置基礎結構容量。 在支援區域中建立的新搜尋服務將會看到增加向量索引大小限制。 不幸的是,我們無法將現有的服務移轉至新的限制。

如何? 在搜尋索引上啟用向量搜尋?

若要在索引中啟用向量搜尋,您應該:

  • 使用 「dimensions」 屬性和 「vectorSearchConfiguration」 屬性,新增一或多個類型的 Collection(Edm.Single)字段。

  • 將 「vectorSearch」 區段新增至索引架構,以指定向量搜尋欄位所使用的組態,包括所使用的近似近鄰演算法參數,例如 HNSW。

  • 使用 2023-11-01 或 Azure SDK 來建立或更新索引、載入檔及發出查詢。

查詢

查詢執行在哪裡?

查詢會在您搜尋服務上裝載的單一搜尋索引上執行。 您無法將多個索引聯結至兩個或多個索引中的搜尋內容,但您可以在 多個搜尋服務中查詢同名索引。

為什麼我知道字詞上沒有相符專案是否有效?

最常見的案例並不知道每個查詢類型都支援不同的搜尋行為和語言分析層級。 全文搜索是主要工作負載,包含語言分析階段,將字詞細分為根窗體。 查詢剖析的這個層面會透過可能的相符項目轉換更廣泛的網路,因為標記化詞彙符合較多的變體。

不過,通配符、模糊和 regex 查詢不會像一般字詞或片語查詢一樣進行分析,而且如果查詢不符合搜尋索引中單字分析的格式,可能會導致召回率不佳。 如需查詢剖析和分析的詳細資訊,請參閱 查詢架構

為什麼我的通配符搜尋速度很慢?

大部分通配符搜尋查詢,例如前置詞、模糊和 regex,都會在內部使用搜尋索引中的相符字詞重寫。 這個額外的處理會增加延遲。 此外, a* 廣泛的搜尋查詢,例如,可能會以許多字詞重寫,這可能會很慢。 針對效能良好的通配符搜尋,請考慮定義 自定義分析器

我可以跨多個索引搜尋嗎?

否,查詢一律限定為單一索引。

為什麼搜尋會針對每個相符專案為常數 1.0?

系統會根據 比對字詞的統計屬性,針對全文搜索查詢產生搜尋分數,並在結果集中排序高到低。 不是全文搜索的查詢類型(通配符、前置詞、regex)不會依相關性分數進行排名。 這是依照設計的行為。 常數分數允許透過查詢擴充找到的相符專案包含在結果中,而不會影響排名。

例如,假設通配符搜尋中的 「tour*」 輸入會產生 「tour」、“tourettes” 和 “tourmaline” 的相符專案。 鑒於這些結果的性質,無法合理推斷哪些詞彙比其他字詞更有價值。 基於這個理由,在評分結果查詢類型通配符、前置詞和 regex 時,會忽略詞彙頻率。 根據部分輸入的搜尋結果會獲得常數分數,以避免對潛在非預期相符項目產生偏差。

安全性

Azure AI 搜尋服務會將客戶資料儲存在何處?

它會在部署服務的位置儲存您的數據。 Azure AI 搜尋不會將客戶資料儲存在部署區域之外。

Azure AI 搜尋是否將客戶數據傳送至其他服務進行處理?

是,如果您使用以 Azure AI 服務為基礎的內建技能,索引器會透過內部網路將要求傳送至 Azure AI 服務。 如果您新增自定義技能,索引器會透過公用網路將內容傳送至自定義技能中提供的URI。

我可以根據使用者身分識別控制搜尋結果的存取嗎?

不完全是。 一般而言,獲得授權執行應用程式的使用者也會獲得授權,以查看所有搜尋結果。 Azure AI 搜尋沒有數據列層級或檔層級許可權的內建支援,但您可以實 作安全性篩選器 作為因應措施。

我可以根據使用者身分識別控制對作業的存取嗎?

是,您可以針對內容的數據平面作業使用 角色型授權

如果搜尋服務位於IP防火牆或私人端點後方,是否可以使用 Azure 入口網站來檢視和管理搜尋內容?

如果您建立允許用戶端和入口網站存取的網路例外狀況,則可以在受網路保護的搜尋服務上使用 Azure 入口網站。 如需詳細資訊,請參閱 透過IP防火牆 連線或 透過私人端點連線。

下一步

如果此處未回答您的問題,您可以參考下列來源以取得更多問題和解答。

Stack Overflow:Azure AI 搜尋
全文搜索在 Azure AI 搜尋中的運作方式
什麼是 Azure AI 搜尋?