Condividi tramite


Pianificare e gestire i costi di un servizio Azure AI Search

Questo articolo illustra come viene fatturata ricerca per intelligenza artificiale di Azure, inclusi i costi fissi e variabili e fornisce indicazioni per la gestione dei costi.

Prima di creare un servizio di ricerca, usare il calcolatore prezzi di Azure per stimare i costi in base alla capacità e alle funzionalità pianificate. Un'altra risorsa è un foglio di lavoro di pianificazione della capacità che modella le dimensioni dell'indice previste, la velocità effettiva di indicizzazione e i costi di indicizzazione.

Man mano che il carico di lavoro di ricerca si evolve, segui i suggerimenti per ridurre al minimo i costi sia durante la distribuzione che l'operazione. È anche possibile usare le metriche predefinite per monitorare le richieste di query e Gestione costi per creare budget, avvisi ed esportazioni di dati.

Nota

Le partizioni con capacità più elevata sono disponibili alla stessa tariffa di fatturazione per i servizi creati dopo aprile e maggio 2024. Per altre informazioni sugli aggiornamenti delle dimensioni delle partizioni, vedere Limiti del servizio.

Informazioni sul modello di fatturazione

La ricerca AI di Azure offre sia una fatturazione fissa che una basata sul consumo. Si paga una tariffa fissa per il servizio di ricerca purché esista, mentre le funzionalità Premium vengono fatturate in base all'utilizzo.

I costi per Ricerca intelligenza artificiale di Azure sono solo una parte dei costi mensili nella fattura di Azure. Anche se questo articolo è incentrato sulla pianificazione e sulla gestione dei costi di Ricerca di intelligenza artificiale di Azure, vengono fatturati tutti i servizi e le risorse di Azure usati nella sottoscrizione di Azure, inclusi i servizi non Microsoft.

Come vengono addebitati i costi per il servizio di base

Quando si creano o si usano le risorse di ricerca, vengono addebitati i costi per la combinazione minima di replica e partizione richiesta (R × P) alla tariffa oraria ripartita del piano tariffario. Man mano che le unità di ricerca aumentano o diminuiscono, così fanno i tuoi costi. Per altre informazioni e un esempio del modello di fatturazione, vedere Tariffe di fatturazione.

Come vengono addebitati i costi per le funzionalità Premium

Le funzionalità Premium vengono addebitate oltre al costo di base del servizio di ricerca. La tabella seguente elenca le funzionalità Premium e le relative unità di fatturazione. Tutte queste funzionalità sono facoltative, quindi se non vengono usate, non vengono addebitati costi.

Caratteristica / Funzionalità Unità di fatturazione
Estrazione di immagini (arricchimento tramite intelligenza artificiale) 1 Per 1.000 immagini. Vedi la pagina dei prezzi.
Competenza ricerca entità personalizzata (arricchimento tramite intelligenza artificiale) Ogni 1.000 registrazioni di testo. Vedere la pagina dei prezzi
Competenze predefinite o personalizzate (arricchimento tramite intelligenza artificiale) 2 Numero di transazioni. Fatturata alla tariffa del provider di modelli: servizi di intelligenza artificiale di Azure, Azure OpenAI o Azure AI Foundry.
Vettorizzatori2 Numero di operazioni di vettorizzazione. Addebitato alla tariffa del provider del modello: Azure AI Vision, Azure OpenAI o Azure AI Foundry.
Classificatore semantico Numero di query di queryType=semantic. Fatturata a una tariffa progressiva. Vedi la pagina dei prezzi.
Collegamento privato condiviso Fatturato per larghezza di banda purché il collegamento privato condiviso esista e venga usato.

1 Fa riferimento alle immagini estratte da un file all'interno della pipeline dell'indicizzatore. L'estrazione del testo è libera. L'estrazione di immagini viene fatturata quando si abilita il indexAction parametro o quando si chiama la competenza Estrazione documenti.

2 Gli addebiti per i modelli OpenAI di Azure e i modelli di Azure AI Foundry vengono visualizzati nella fattura per tali servizi.

Modalità di addebito in caso contrario

A seconda della configurazione e dell'utilizzo, potrebbero essere applicati gli addebiti seguenti:

Nota

Non ti verrà addebitato nulla per il numero di query full-text o vettoriali, le risposte alle query o i documenti inseriti. Tuttavia, i limiti del servizio si applicano a ogni piano tariffario.

Stimare e pianificare i costi

Usare il calcolatore prezzi di Azure per stimare i costi di base per Ricerca di intelligenza artificiale di Azure. È anche possibile trovare i confronti stimati tra costi e livelli nella pagina Seleziona piano tariffario durante la creazione del servizio.

Per i test iniziali, è consigliabile creare un foglio di lavoro di pianificazione della capacità. Il foglio di lavoro consente di comprendere il rapporto tra indice e origine e l'effetto delle funzionalità di arricchimento o vettore sia sulla capacità che sui costi.

Per creare un foglio di lavoro di pianificazione della capacità:

  1. Indicizzare un piccolo campione (1-5%) dei dati. Includere tutte le competenze di OCR, enrichment o embedding che si prevede di usare.

  2. Misurare le dimensioni dell'indice, la velocità effettiva di indicizzazione e i costi di indicizzazione.

  3. Estrapolare i risultati per stimare i requisiti di scalabilità completa per i dati.

Ridurre al minimo i costi

Per ridurre al minimo i costi della soluzione Ricerca di intelligenza artificiale di Azure, usare le strategie seguenti:

Distribuzione e configurazione

  • Creare un servizio di ricerca in un'area con più spazio di archiviazione per partizione.

  • Creare tutte le risorse di Azure correlate nella stessa area (o il minor numero possibile di aree) per ridurre al minimo o eliminare i costi di larghezza di banda.

  • Scegliere il piano tariffario più leggero che soddisfi le proprie esigenze. Basic e S1 offrono l'accesso completo all'API moderna alla tariffa oraria più bassa per SU.

  • Usare App Web di Azure per l'applicazione front-end per mantenere le richieste e le risposte entro il limite del data center.

Scalabilità

  • Aggiungere partizioni solo quando sono necessarie le dimensioni dell'indice o la velocità effettiva di inserimento.

  • Aggiungere repliche solo quando le query al secondo aumentano, quando le query complesse rallentano il servizio o quando si verifica la necessità di disponibilità elevata.

  • Aumentare le prestazioni per le operazioni a elevato utilizzo di risorse, ad esempio l'indicizzazione, e quindi regolare verso il basso per i normali carichi di lavoro di query.

  • Scrivere codice per automatizzare il ridimensionamento per i modelli di carico di lavoro prevedibili.

  • Tenere presente che la capacità e i prezzi non sono lineari. Quando la capacità viene raddoppiata, i costi più che raddoppiano nello stesso livello. Per ottenere prestazioni migliori a un prezzo simile, è consigliabile passare a un livello superiore.

Indicizzazione e arricchimento

Monitorare i costi

A livello di servizio, è possibile monitorare le metriche predefinite per le query al secondo (QPS), latenza di ricerca, query limitate e dimensioni dell'indice. È quindi possibile creare un dashboard di Monitoraggio di Azure che sovrappone i dati QPS, la latenza e costi per determinare quando aggiungere o rimuovere repliche.

A livello di sottoscrizione o gruppo di risorse, Gestione costi offre strumenti per tenere traccia, analizzare e controllare i costi. È possibile usare Gestione costi per:

  • Creare budget che definiscono e tengono traccia dello stato di avanzamento rispetto ai limiti di spesa. Per un monitoraggio più granulare, personalizzare i budget usando filtri per risorse o servizi di Azure specifici. I filtri impediscono la creazione accidentale di risorse che comportano costi aggiuntivi.

  • Creare avvisi che notificano automaticamente agli stakeholder anomalie di spesa o rischi di spese eccessive. Gli avvisi si basano sul confronto tra la spesa e le soglie di budget e costi. Sia i budget che gli avvisi vengono creati per le sottoscrizioni e i gruppi di risorse, rendendoli utili per il monitoraggio dei costi complessivi.

  • Esportare i dati dei costi in un account di archiviazione. Ciò è utile quando si o altri utenti devono eseguire un'analisi dei costi maggiore. Ad esempio, un team finanziario può analizzare i dati usando Excel o Power BI. È possibile esportare i costi in base a una pianificazione giornaliera, settimanale o mensile e impostare un intervallo di date personalizzato. L'esportazione dei dati sui costi è il metodo consigliato per il recupero dei set di dati dei costi.

Domande frequenti

È possibile arrestare temporaneamente un servizio di ricerca per risparmiare sui costi?

La ricerca viene eseguita come servizio continuo. Le risorse dedicate sono sempre operative e allocate per l'uso esclusivo per la durata del servizio. Per interrompere completamente la fatturazione, è necessario eliminare il servizio. L'eliminazione di un servizio è permanente ed elimina anche i dati associati.

È possibile modificare la tariffa di fatturazione (livello) di un servizio di ricerca esistente?

I servizi esistenti possono essere passati tra i livelli Basic e Standard (S1, S2 e S3). Attualmente, è possibile passare solo da un livello inferiore a un livello superiore, ad esempio passando da Basic a S1. Per altre informazioni, vedere Modificare il piano tariffario.