本文說明在使用馬賽克 AI 向量搜尋時,如何有效地管理成本。 其中涵蓋下列主題:
- 向量搜尋索引和端點基本概念。
- 計費和使用量監視。
- 同步模式。
- 優化成本的最佳做法。
若要識別和刪除空白端點,請參閱 識別和刪除空白的向量搜尋端點。
Mosaic AI 向量搜尋基本概念
Mosaic AI 向量搜尋是由下列專案所組成:
- 向量搜尋索引:索引會儲存您的向量以供搜尋和擷取。
- 向量搜尋端點:每個端點都會裝載一或多個索引來提供查詢。 您可以在單一端點下提供多個索引,而一個端點最多可提供 50 個索引。 在許多情況下,您可以在單一端點上結合較小的工作負載,以降低總成本。
向量搜尋的定價方式
Databricks 提供兩個端點選項:
標準端點。 一個向量搜尋單位最多可涵蓋維度 768 的 200 萬向量(或同等的向量)。 例如,如果您有100萬個維度1536的向量,這也會計算為一個單位。
記憶體優化的端點。 一個向量搜尋單位最多涵蓋維度 768 的 6400 萬向量(或同等的向量)。
針對這兩個選項,每個端點都有基本價格,並自動相應增加,以符合其服務之索引的總大小。
- 標準端點不會自動縮小。 即使您刪除向量或減少索引的大小,您仍會繼續支付較高的容量費用,直到您手動進行變更為止。
- 刪除索引時,儲存優化的端點會自動縮減。 端點的大小下限是一個向量搜尋單位。
這很重要
標準端點不會自動縮小。 如果您的向量計數大幅下降(例如,從 400 萬到 150 萬向量),則繼續支付更高的容量 (在此範例中為兩個向量搜尋單位),直到您刪除端點並建立新的向量。 這僅適用於標準端點。 儲存優化的端點會自動縮減。
如何監視使用量和成本
Databricks 提供可計費的使用量數據表、使用量儀錶板和預算原則,可協助您監視向量搜尋的使用量和成本。
計費使用量數據表
以下是可計費使用量數據表的範例查詢:
WITH all_vector_search_usage AS (
SELECT *,
CASE WHEN usage_metadata.endpoint_name IS NULL THEN 'ingest'
WHEN usage_type = "STORAGE_SPACE" THEN 'storage'
ELSE 'serving'
END as workload_type
FROM system.billing.usage
WHERE billing_origin_product = 'VECTOR_SEARCH'
),
daily_dbus AS (
SELECT
workspace_id,
cloud,
usage_date,
workload_type,
usage_metadata.endpoint_name as vector_search_endpoint,
CASE WHEN workload_type = 'serving' THEN SUM(usage_quantity)
WHEN workload_type = 'ingest' THEN SUM(usage_quantity)
ELSE null
END as dbus,
CASE WHEN workload_type = 'storage' THEN SUM(usage_quantity)
ELSE null
END as dsus
FROM all_vector_search_usage
GROUP BY 1,2,3,4,5
ORDER BY 1,2,3,4,5 DESC
)
SELECT * FROM daily_dbus;
如需計費使用量數據表的詳細資訊,請參閱 計費使用量系統數據表參考。
以下範例筆記本中有更多查詢。
向量式搜尋系統中的表格查詢筆記本
使用情況儀表板
如需匯入使用量儀錶板以深入瞭解包括向量搜尋在內的成本驅動因素,請參閱 使用量儀錶板。
預算原則
預算原則可讓系統管理員將所有 Azure Databricks 無伺服器產品的帳單記錄分組和篩選,並提供專用的 UI 來追蹤支出。 若要瞭解如何將預算原則套用至向量搜尋端點,請參閱 馬賽克 AI 向量搜尋:預算原則。 如需如何建立和管理預算原則的一般資訊和詳細數據,請參閱 使用無伺服器預算原則的屬性使用量。
如何管理索引同步成本
您可以透過兩種方式設定索引來更新:
- 觸發同步:呼叫 API 或 Python SDK 以觸發索引更新。 這是最具成本效益的選項。
- 連續同步處理:索引會隨著來源 Delta 數據表的變更自動更新,並具有近乎即時的延遲。 這是因為已佈建串流叢集來處理同步處理,因此會花費更多成本。如果近乎即時的更新與幾秒鐘的延遲並不重要,請考慮使用觸發的同步處理來降低成本。
成本管理的最佳做法
- 在單一端點上合併工作負載:如果您預期所有索引的 QPS 較低,則可以在單一端點下合併索引,以避免多個基本端點成本。 如需詳細資訊,請參閱 向量搜尋效能指南 。
- 監視使用量:使用系統計費數據表和內建使用量儀錶板來追蹤容量、使用量和成本。
- 對於標準端點,請手動縮減:如上所述,對於標準端點,如果您的向量計數低於您不再需要的先前容量閾值,您必須刪除端點並重新建立它。 刪除索引時,儲存優化的端點會自動縮減。
- 選擇正確的同步模式:盡可能使用觸發的同步處理,而不是連續同步,以減少串流成本。
- 識別和刪除空白端點:請參閱 識別和刪除空白向量搜尋端點。
其他資源
- 馬賽克 AI 向量搜尋定價
- 使用儀表板及指示
- 如果您想要進一步預測使用量或利用工作負載專屬的成本估計工具,請連絡 Databricks 帳戶小組。