Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Questo articolo illustra come viene fatturata ricerca per intelligenza artificiale di Azure, inclusi i costi fissi e variabili e fornisce indicazioni per la gestione dei costi.
Prima di creare un servizio di ricerca, usare il calcolatore prezzi di Azure per stimare i costi in base alla capacità e alle funzionalità pianificate. Un'altra risorsa è un foglio di lavoro di pianificazione della capacità che modella le dimensioni dell'indice previste, la velocità effettiva di indicizzazione e i costi di indicizzazione.
Man mano che il carico di lavoro di ricerca si evolve, segui i suggerimenti per ridurre al minimo i costi sia durante la distribuzione che l'operazione. È anche possibile usare le metriche predefinite per monitorare le richieste di query e Gestione costi per creare budget, avvisi ed esportazioni di dati.
Nota
Le partizioni con capacità più elevata sono disponibili alla stessa tariffa di fatturazione per i servizi creati dopo aprile e maggio 2024. Per altre informazioni sugli aggiornamenti delle dimensioni delle partizioni, vedere Limiti del servizio.
Informazioni sul modello di fatturazione
La ricerca AI di Azure offre sia una fatturazione fissa che una basata sul consumo. Si paga una tariffa fissa per il servizio di ricerca purché esista, mentre le funzionalità Premium vengono fatturate in base all'utilizzo.
I costi per Ricerca intelligenza artificiale di Azure sono solo una parte dei costi mensili nella fattura di Azure. Anche se questo articolo è incentrato sulla pianificazione e sulla gestione dei costi di Ricerca di intelligenza artificiale di Azure, vengono fatturati tutti i servizi e le risorse di Azure usati nella sottoscrizione di Azure, inclusi i servizi non Microsoft.
Come vengono addebitati i costi per il servizio di base
Quando si creano o si usano le risorse di ricerca, vengono addebitati i costi per la combinazione minima di replica e partizione richiesta (R × P) alla tariffa oraria ripartita del piano tariffario. Man mano che le unità di ricerca aumentano o diminuiscono, così fanno i tuoi costi. Per altre informazioni e un esempio del modello di fatturazione, vedere Tariffe di fatturazione.
Come vengono addebitati i costi per le funzionalità Premium
Le funzionalità Premium vengono addebitate oltre al costo di base del servizio di ricerca. La tabella seguente elenca le funzionalità Premium e le relative unità di fatturazione. Tutte queste funzionalità sono facoltative, quindi se non vengono usate, non vengono addebitati costi.
Caratteristica / Funzionalità | Unità di fatturazione |
---|---|
Estrazione di immagini (arricchimento tramite intelligenza artificiale) 1 | Per 1.000 immagini. Vedi la pagina dei prezzi. |
Competenza ricerca entità personalizzata (arricchimento tramite intelligenza artificiale) | Ogni 1.000 registrazioni di testo. Vedere la pagina dei prezzi |
Competenze predefinite o personalizzate (arricchimento tramite intelligenza artificiale) 2 | Numero di transazioni. Fatturata alla tariffa del provider di modelli: servizi di intelligenza artificiale di Azure, Azure OpenAI o Azure AI Foundry. |
Vettorizzatori2 | Numero di operazioni di vettorizzazione. Addebitato alla tariffa del provider del modello: Azure AI Vision, Azure OpenAI o Azure AI Foundry. |
Classificatore semantico | Numero di query di queryType=semantic . Fatturata a una tariffa progressiva. Vedi la pagina dei prezzi. |
Collegamento privato condiviso | Fatturato per larghezza di banda purché il collegamento privato condiviso esista e venga usato. |
1 Fa riferimento alle immagini estratte da un file all'interno della pipeline dell'indicizzatore. L'estrazione del testo è libera. L'estrazione di immagini viene fatturata quando si abilita il indexAction
parametro o quando si chiama la competenza Estrazione documenti.
2 Gli addebiti per i modelli OpenAI di Azure e i modelli di Azure AI Foundry vengono visualizzati nella fattura per tali servizi.
Modalità di addebito in caso contrario
A seconda della configurazione e dell'utilizzo, potrebbero essere applicati gli addebiti seguenti:
Il traffico dei dati potrebbe comportare costi di rete. Vedere i prezzi della larghezza di banda.
Diverse funzionalità Premium, ad esempio gli archivi conoscenze, le sessioni di debug e le cache di arricchimento, dipendono da Archiviazione di Azure e comportano costi di archiviazione. Gli addebiti per queste funzionalità vengono visualizzati nella fattura di Archiviazione di Azure.
Le chiavi gestite dal cliente, che forniscono doppia crittografia del contenuto sensibile, richiedono un'istanza fatturabile di Azure Key Vault.
Un set di competenze può includere competenze predefinite fatturabili, competenze di utilità predefinite non fatturabili e competenze personalizzate. Le abilità di utilità non fatturabili includono Condizionale, Shaper, Unisci testo e Dividi testo. Non hanno un requisito di chiave API o un limite di 20 documenti.
Una abilità personalizzata è una funzionalità che fornisci. Le competenze personalizzate sono fatturabili solo se chiamano altri servizi fatturabili. Non hanno un requisito di chiave API o un limite di 20 documenti.
Nota
Non ti verrà addebitato nulla per il numero di query full-text o vettoriali, le risposte alle query o i documenti inseriti. Tuttavia, i limiti del servizio si applicano a ogni piano tariffario.
Stimare e pianificare i costi
Usare il calcolatore prezzi di Azure per stimare i costi di base per Ricerca di intelligenza artificiale di Azure. È anche possibile trovare i confronti stimati tra costi e livelli nella pagina Seleziona piano tariffario durante la creazione del servizio.
Per i test iniziali, è consigliabile creare un foglio di lavoro di pianificazione della capacità. Il foglio di lavoro consente di comprendere il rapporto tra indice e origine e l'effetto delle funzionalità di arricchimento o vettore sia sulla capacità che sui costi.
Per creare un foglio di lavoro di pianificazione della capacità:
Indicizzare un piccolo campione (1-5%) dei dati. Includere tutte le competenze di OCR, enrichment o embedding che si prevede di usare.
Misurare le dimensioni dell'indice, la velocità effettiva di indicizzazione e i costi di indicizzazione.
Estrapolare i risultati per stimare i requisiti di scalabilità completa per i dati.
Ridurre al minimo i costi
Per ridurre al minimo i costi della soluzione Ricerca di intelligenza artificiale di Azure, usare le strategie seguenti:
Distribuzione e configurazione
Creare un servizio di ricerca in un'area con più spazio di archiviazione per partizione.
Creare tutte le risorse di Azure correlate nella stessa area (o il minor numero possibile di aree) per ridurre al minimo o eliminare i costi di larghezza di banda.
Scegliere il piano tariffario più leggero che soddisfi le proprie esigenze. Basic e S1 offrono l'accesso completo all'API moderna alla tariffa oraria più bassa per SU.
Usare App Web di Azure per l'applicazione front-end per mantenere le richieste e le risposte entro il limite del data center.
Scalabilità
Aggiungere partizioni solo quando sono necessarie le dimensioni dell'indice o la velocità effettiva di inserimento.
Aggiungere repliche solo quando le query al secondo aumentano, quando le query complesse rallentano il servizio o quando si verifica la necessità di disponibilità elevata.
Aumentare le prestazioni per le operazioni a elevato utilizzo di risorse, ad esempio l'indicizzazione, e quindi regolare verso il basso per i normali carichi di lavoro di query.
Scrivere codice per automatizzare il ridimensionamento per i modelli di carico di lavoro prevedibili.
Tenere presente che la capacità e i prezzi non sono lineari. Quando la capacità viene raddoppiata, i costi più che raddoppiano nello stesso livello. Per ottenere prestazioni migliori a un prezzo simile, è consigliabile passare a un livello superiore.
Indicizzazione e arricchimento
Usare l'indicizzazione incrementale per elaborare solo dati nuovi o modificati.
Usare la cache degli arricchimenti e un archivio di conoscenze per riutilizzare il contenuto precedentemente arricchito. Anche se la memorizzazione nella cache comporta un addebito di archiviazione, riduce il costo cumulativo dell'arricchimento tramite intelligenza artificiale.
Rendere compatti i payload vettoriali. Per la ricerca vettoriale, vedere le procedure consigliate per la compressione vettoriale.
Monitorare i costi
A livello di servizio, è possibile monitorare le metriche predefinite per le query al secondo (QPS), latenza di ricerca, query limitate e dimensioni dell'indice. È quindi possibile creare un dashboard di Monitoraggio di Azure che sovrappone i dati QPS, la latenza e costi per determinare quando aggiungere o rimuovere repliche.
A livello di sottoscrizione o gruppo di risorse, Gestione costi offre strumenti per tenere traccia, analizzare e controllare i costi. È possibile usare Gestione costi per:
Creare budget che definiscono e tengono traccia dello stato di avanzamento rispetto ai limiti di spesa. Per un monitoraggio più granulare, personalizzare i budget usando filtri per risorse o servizi di Azure specifici. I filtri impediscono la creazione accidentale di risorse che comportano costi aggiuntivi.
Creare avvisi che notificano automaticamente agli stakeholder anomalie di spesa o rischi di spese eccessive. Gli avvisi si basano sul confronto tra la spesa e le soglie di budget e costi. Sia i budget che gli avvisi vengono creati per le sottoscrizioni e i gruppi di risorse, rendendoli utili per il monitoraggio dei costi complessivi.
Esportare i dati dei costi in un account di archiviazione. Ciò è utile quando si o altri utenti devono eseguire un'analisi dei costi maggiore. Ad esempio, un team finanziario può analizzare i dati usando Excel o Power BI. È possibile esportare i costi in base a una pianificazione giornaliera, settimanale o mensile e impostare un intervallo di date personalizzato. L'esportazione dei dati sui costi è il metodo consigliato per il recupero dei set di dati dei costi.
Domande frequenti
È possibile arrestare temporaneamente un servizio di ricerca per risparmiare sui costi?
La ricerca viene eseguita come servizio continuo. Le risorse dedicate sono sempre operative e allocate per l'uso esclusivo per la durata del servizio. Per interrompere completamente la fatturazione, è necessario eliminare il servizio. L'eliminazione di un servizio è permanente ed elimina anche i dati associati.
È possibile modificare la tariffa di fatturazione (livello) di un servizio di ricerca esistente?
I servizi esistenti possono essere passati tra i livelli Basic e Standard (S1, S2 e S3). Attualmente, è possibile passare solo da un livello inferiore a un livello superiore, ad esempio passando da Basic a S1. Per altre informazioni, vedere Modificare il piano tariffario.