向量索引大小並保持在限制之下

發行項
04/22/2024

針對每個向量欄位，Azure AI 搜尋會使用欄位上指定的演算法參數來建構內部向量索引。因為 Azure AI 搜尋會對向量索引大小施加配額，因此您應該知道如何估計和監視向量大小，以確保您維持在限制之下。

注意

關於術語的附注。在內部，搜尋索引的實體數據結構包括原始內容（用於擷取需要非標記化內容的模式）、反向索引（用於可搜尋的文字欄位），以及向量索引（用於可搜尋向量字段）。本文說明支援每個向量欄位的內部向量索引限制。

提示

向量量化和記憶體組態現在處於預覽狀態。使用縮小數據類型、純量量化和消除備援記憶體等功能，以保持在向量配額和記憶體配額之下。

配額和向量索引大小的要點

向量索引大小是以位元組為單位來測量。
向量配額是以記憶體條件約束為基礎。所有可搜尋的向量索引都必須載入記憶體中。同時，其他運行時間作業也必須有足夠的記憶體。向量配額存在，以確保整體系統對所有工作負載保持穩定且平衡。
向量索引也會受限於磁碟配額，也就是說，所有索引、向量和非向量都是主體磁碟配額。向量索引沒有個別的磁碟配額。
整個搜尋服務會強制執行向量配額，每個數據分割，這表示如果您新增分割區，向量配額就會增加。較新的服務上，每個分割區的向量配額較高：

如何檢查分割區大小和數量

如果您不確定您的搜尋服務限制為何，以下是取得該資訊的兩種方式：

在 Azure 入口網站的搜尋服務 [概觀] 頁面中，[屬性] 索引標籤和 [使用量] 索引標籤都會顯示分割區大小和記憶體，以及向量配額和向量索引大小。
在 [Azure 入口網站] 的 [調整] 頁面中，您可以檢閱分割區的數目和大小。

如何檢查服務建立日期

在 2024 年 4 月 3 日之後建立的較新服務，提供 5 到 10 倍以上的向量記憶體，因為較舊的服務會以相同層級計費費率提供。如果您的服務較舊，請考慮建立新的服務並移轉您的內容。

在 Azure 入口網站中，開啟包含搜尋服務的資源群組。
在最左邊窗格的 [設定] 底下，選取 [部署]。
找出您的搜尋服務部署。如果有許多部署，請使用篩選條件來尋找 "search"。
選取部署。若有多個，請按一下以查看其是否解析為您的搜尋服務。
展開部署詳細資料。您應該會看到「已建立」和建立日期。
既然您知道搜尋服務的存留期，請根據服務建立日期來檢閱向量配額限制：

如何取得向量索引大小

向量計量的要求是資料平面作業。您可以使用 Azure 入口網站、REST API 或 Azure SDK，透過服務統計資料和個別索引，取得服務層級的向量使用量。

入口網站
REST

您可以在 [概觀] 頁面的 [使用量] 索引標籤中找到使用量資訊。入口網站頁面每隔幾分鐘重新整理一次，因此，如果您最近更新了索引，請先稍候一下再檢查結果。

下列螢幕快照適用於舊版標準 1 （S1）搜尋服務，其設定為一個分割區和一個複本。

儲存體配額是磁碟限制式，且包含搜尋服務上的所有索引（向量和非向量）。
向量索引大小配額是記憶體限制。這是載入搜尋服務上每個向量欄位所建立之所有內部向量索引所需的記憶體數量。

螢幕快照指出索引（向量和非向量）會耗用近 460 MB 的可用磁碟記憶體。向量索引在服務層級會耗用近 93 MB 的記憶體。

當您新增或移除分割區時，記憶體和向量索引大小的配額會增加或減少。如果您變更分割區計數，圖格會顯示記憶體和向量配額的對應變更。

注意

在磁碟上，向量索引不是 93 MB。磁碟上的向量索引比記憶體中的向量索引多三倍。如需詳細資訊，請參閱向量字段如何影響磁碟記憶體。

請使用下列資料平面 REST API (版本 2023-10-01-preview、2023-11-01 和更新版本) 取得向量使用量統計資料：

GET 服務統計資料會傳回搜尋服務全部的配額和使用量。
GET 索引統計資料會傳回給定索引的使用量。

使用量和配額會以位元組回報。

以下是 GET 服務統計資料：

GET {{baseUrl}}/servicestats?api-version=2023-11-01  HTTP/1.1
    Content-Type: application/json
    api-key: {{apiKey}}

回應包含的計量 storageSize，其不會區分向量和非向量索引。統計數據 vectorIndexSize 會顯示服務層級的使用量和配額。

{
    "@odata.context": "https://my-demo.search.windows.net/$metadata#Microsoft.Azure.Search.V2023_11_01.ServiceStatistics",
    "counters": {
        "documentCount": {
            "usage": 15377,
            "quota": null
        },
        "indexesCount": {
            "usage": 13,
            "quota": 15
        },
        . . .
        "storageSize": {
            "usage": 39862913,
            "quota": 2147483648
        },
        . . .
        "vectorIndexSize": {
            "usage": 2685436,
            "quota": 1073741824
        }
    },
    "limits": {
        "maxFieldsPerIndex": 1000,
        "maxFieldNestingDepthPerIndex": 10,
        "maxComplexCollectionFieldsPerIndex": 40,
        "maxComplexObjectsInCollectionsPerDocument": 3000
    }
}

您也可以傳送 GET 索引統計數據，以取得磁碟上的索引實體大小，以及向量欄位的記憶體內部大小。

GET {{baseUrl}}/indexes/vector-healthplan-idx/stats?api-version=2023-11-01  HTTP/1.1
    Content-Type: application/json
    api-key: {{apiKey}}

回應包含索引層級的使用資訊。此範例是以整合向量化快速入門中建立的索引為基礎，該快速入門會區塊和向量化健康情況計劃 PDF。每個區塊都會 documentCount參與。

{
    "@odata.context": "https://my-demo.search.windows.net/$metadata#Microsoft.Azure.Search.V2023_11_01.IndexStatistics",
    "documentCount": 147,
    "storageSize": 4592870,
    "vectorIndexSize": 915484
}

影響向量索引大小的因素

有三個主要元件會影響內部向量索引的大小：

資料的原始大小
所選演算法的額外負荷
刪除或更新索引內文件的額外負荷

資料的原始大小

每個向量通常是類型欄位中 Collection(Edm.Single)的單精度浮點數數位。

向量資料結構需要儲存體，在下列計算中以資料的「原始大小」表示。使用此「原始大小」來估計向量欄位的向量索引大小需求。

一個向量的儲存大小取決於其維度。請將一個向量的大小乘以包含該向量欄位的文件數目，以取得「原始大小」：

raw size = (number of documents) * (dimensions of vector field) * (size of data type)

EDM 數據類型	數據類型的大小
`Collection(Edm.Single)`	4 個位元組
`Collection(Edm.Half)`	2 個位元組
`Collection(Edm.Int16)`	2 個位元組
`Collection(Edm.SByte)`	1 個位元組

所選演算法的記憶體額外負荷

每個近似最接近像素 (ANN) 演算法都會在記憶體中產生額外的資料結構，以啟用有效率的搜尋。這些結構會耗用記憶體內的額外空間。

針對 HNSW 演算法，記憶體額外負荷範圍介於 1% 與 20% 之間。

較高維度的記憶體額外負荷較低，因為向量的原始大小會增加，而額外資料結構會維持固定大小，因為其會儲存圖形內連線的相關資訊。因此，額外資料結構的貢獻構成整體大小的一小部分。

對於較大的 HNSW 參數 m 值，記憶體額外負荷較高，這會決定在索引建構期間為每個新向量建立的雙向連結數目。這是因為 m 每份檔貢獻大約 8 個字節到 10 個字節乘以 m。

下表摘要說明內部測試中觀察到的額外負荷百分比：

維度	HNSW 參數 (m)	額外負荷百分比
96	4	20%
200	4	8%
768	4	2%
1536	4	%1

這些結果示範 HNSW 演算法的維度、HNSW 參數 m 和記憶體額外負荷之間的關聯性。

刪除或更新索引內文件的額外負荷

刪除或更新具有向量欄位的文件時 (更新會在內部以刪除和插入作業表示)，基礎文件會在後續查詢期間標示為已刪除和已略過。當新文件編製索引且內部向量索引增長時，系統會清除這些已刪除的文件並回收資源。這表示您可能會觀察到刪除文件與釋放基礎資源之間有延遲的情形。

我們會將此視為 已刪除的檔案比例。由於已刪除的文件比率取決於您服務的索引編製特性，因此沒有通用啟發學習法來估計此參數，而且沒有 API 或指令碼傳回服務的有效比率。我們觀察到一半的客戶具有小於 10% 的已刪除文件比率。如果您傾向於執行高頻率刪除或更新，則可能會觀察到較高的已刪除文件比率。

這是影響向量索引大小的另一個因素。不幸的是，我們沒有一種機制可呈現目前刪除的文件比率。

估計記憶體中的資料大小總計

將先前描述的因素納入考慮，若要估計向量索引的總大小，請使用下列計算：

(raw_size) * (1 + algorithm_overhead (in percent)) * (1 + deleted_docs_ratio (in percent))

例如，若要計算 raw_size，假設您使用熱門的 Azure OpenAI 模型，text-embedding-ada-002 具有 1,536 個維度。這表示一份文件將會取用 1,536 個 Edm.Single (浮點數)，或 6,144 個位元組，因為每個 Edm.Single 為 4 個位元組。 1,000 份具有單一、1,536 維度向量欄位的文件，總共會取用 1000 份文件 x 1536 個浮點數/文件 = 1,536,000 個浮點數，或 6,144,000 個位元組。

如果您有多個向量欄位，則必須針對索引內的每個向量欄位執行此計算，並將其全部加在一起。例如，1,000 份具有兩個 1,536 維度向量欄位的文件，取用 1000 份文件 x 2 個欄位 x 1536 個浮點數/文件 x 4 位元組/浮點數 = 12,288,000 個位元組。

若要取得向量索引大小，請將這個 raw_size 乘以 演算法額外負荷和已刪除的文件比率。如果所選 HNSW 參數的演算法額外負荷為 10%，且已刪除的文件比率為 10%，則我們會取得：6.144 MB * (1 + 0.10) * (1 + 0.10) = 7.434 MB。

向量欄位如何影響磁碟儲存體

本文大部分提供記憶體中向量大小的相關信息。如果您想要知道磁碟上的向量大小，向量數據的磁碟耗用量大約是記憶體中向量索引大小的三倍。例如，如果您的 vectorIndexSize 使用量為100 MB（1000萬位元組），則您至少會使用300 MB的 storageSize 配額來容納向量索引

Share via