Scegliere un livello di servizio per Ricerca intelligenza artificiale di Azure

Parte della creazione di un servizio di ricerca è la scelta di un piano tariffario (o SKU) fisso per la durata del servizio. Nel portale il livello viene specificato nella pagina Seleziona piano tariffario quando si crea il servizio. Se invece si esegue il provisioning tramite PowerShell o l'interfaccia della riga di comando di Azure, il livello viene specificato tramite il -Sku parametro

Il livello selezionato determina:

  • Numero massimo di indici e altri oggetti consentiti nel servizio
  • Dimensione e velocità delle partizioni (archiviazione fisica)
  • Tariffa fatturabile come costo mensile fisso, ma anche un costo incrementale se si aggiunge capacità

In alcuni casi, il livello scelto determina la disponibilità delle funzionalità Premium.

I prezzi , o il costo mensile stimato per l'esecuzione del servizio, vengono visualizzati nella pagina Seleziona piano tariffario del portale. È consigliabile controllare i prezzi del servizio per informazioni sui costi stimati.

Nota

servizio di ricerca creati dopo il 3 aprile 2024 hanno partizioni più grandi e quote di vettori più elevate a quasi ogni livello. Per altre informazioni, vedere Limiti del servizio.

Descrizioni dei livelli

I livelli includono Free, Basic, Standard e Archiviazione Optimized. Standard e Archiviazione Optimized sono disponibili con diverse configurazioni e capacità. Lo screenshot seguente di portale di Azure mostra i livelli disponibili, meno i prezzi (che è possibile trovare nel portale e nella pagina dei prezzi).

Grafico del piano tariffario

Free crea un servizio di ricerca limitato per progetti più piccoli, ad esempio l'esecuzione di esercitazioni ed esempi di codice. Internamente, le risorse di sistema vengono condivise tra più sottoscrittori. Non è possibile ridimensionare un servizio gratuito o eseguire carichi di lavoro significativi. È possibile avere un solo servizio di ricerca gratuito per ogni sottoscrizione di Azure.

I livelli fatturabili più comunemente usati includono quanto segue:

  • Basic ha la possibilità di soddisfare il contratto di servizio con il supporto per tre repliche.

  • Standard (S1, S2, S3) è l'impostazione predefinita. Offre maggiore flessibilità nel ridimensionamento per i carichi di lavoro. È possibile ridimensionare sia le partizioni che le repliche. Con risorse dedicate sotto il controllo, è possibile distribuire progetti di dimensioni maggiori, ottimizzare le prestazioni e aumentare la capacità.

Alcuni livelli sono progettati per determinati tipi di lavoro:

  • Standard 3 High Density (S3 HD) è una modalità di hosting per S3, in cui l'hardware sottostante è ottimizzato per un numero elevato di indici più piccoli ed è destinato a scenari multi-tenancy. S3 HD ha lo stesso addebito per unità di S3, ma l'hardware è ottimizzato per le letture rapide dei file in un numero elevato di indici più piccoli.

  • Archiviazione livelli ottimizzati (L1, L2) offrono capacità di archiviazione più grandi a un prezzo inferiore per TB rispetto ai livelli Standard. Questi livelli sono progettati per indici di grandi dimensioni che non cambiano molto spesso. Il compromesso principale è una latenza di query più elevata, che è necessario convalidare per i requisiti specifici dell'applicazione.

Per altre informazioni sui vari livelli nella pagina dei prezzi, vedere l'articolo Limiti del servizio in Ricerca di intelligenza artificiale di Azure e nella pagina del portale durante il provisioning di un servizio.

Disponibilità delle funzionalità per livello

La maggior parte delle funzionalità è disponibile in tutti i livelli, incluso il livello gratuito. In alcuni casi, il livello determina la disponibilità di una funzionalità. Nella tabella seguente vengono descritti i vincoli.

Funzionalità Limiti
Indicizzatori Gli indicizzatori non sono disponibili in S3 HD. Gli indicizzatori hanno più limitazioni per il livello gratuito.
Arricchimento tramite intelligenza artificiale Viene eseguito nel livello Gratuito, ma non consigliato.
Identità gestite o attendibili per l'accesso in uscita (indicizzatore) Non disponibile nel livello Gratuito.
Chiavi di crittografia gestite dal cliente Non disponibile nel livello Gratuito.
Accesso al firewall IP Non disponibile nel livello Gratuito.
Endpoint privato (integrazione con collegamento privato di Azure) Per le connessioni in ingresso a un servizio di ricerca, non disponibili nel livello Gratuito. Per le connessioni in uscita da indicizzatori ad altre risorse di Azure, non disponibili in Versione gratuita o S3 HD. Per gli indicizzatori che usano set di competenze, non disponibili in Hd Gratuito, Basic, S1 o S3.
Zone di disponibilità Non disponibile nel livello Gratuito o Basic.
Ranker semantico Non disponibile nel livello Gratuito.

Le funzionalità a elevato utilizzo di risorse potrebbero non funzionare correttamente a meno che non venga fornita una capacità sufficiente. Ad esempio, l'arricchimento tramite intelligenza artificiale ha competenze a esecuzione prolungata che si verifica in un servizio gratuito, a meno che il set di dati non sia ridotto.

Limiti superiori

I livelli determinano lo spazio di archiviazione massimo del servizio stesso, nonché il numero massimo di indici, indicizzatori, origini dati, set di competenze e mappe sinonimiche che è possibile creare. Per un'interruzione completa di tutti i limiti, vedere Limiti dei servizi in Ricerca di intelligenza artificiale di Azure.

Dimensioni e velocità delle partizioni

I prezzi dei piani includono informazioni dettagliate sull'archiviazione per partizione compresa tra 15 GB per Basic, fino a 2 TB per i livelli ottimizzati (L2) di Archiviazione. Altre caratteristiche hardware, ad esempio velocità di operazioni, latenza e velocità di trasferimento, non vengono pubblicate, ma i livelli progettati per architetture di soluzioni specifiche sono basati su hardware con le funzionalità per supportare tali scenari. Per altre informazioni sulle partizioni, vedere Stimare e gestire capacità e affidabilità in Ricerca di intelligenza artificiale di Azure.

Tariffe di fatturazione

I livelli hanno tariffe di fatturazione diverse, con tariffe più elevate per i livelli eseguiti su hardware più costoso o offrono funzionalità più costose. La tariffa di fatturazione del livello è disponibile nelle pagine dei prezzi di Azure per Ricerca di intelligenza artificiale di Azure.

Dopo aver creato un servizio, la tariffa di fatturazione diventa sia un costo fisso per l'esecuzione del servizio tutto il giorno che un costo incrementale se si sceglie di aggiungere più capacità.

servizio di ricerca vengono allocate risorse di calcolo sotto forma di partizioni (per l'archiviazione) e repliche (istanze del motore di query). Inizialmente, viene creato un servizio con uno di ognuno e la tariffa di fatturazione è inclusiva di entrambe le risorse. Tuttavia, se si ridimensiona la capacità, i costi aumentano o rallentano in incrementi della tariffa fatturabile.

Di seguito ne viene illustrato un esempio. Si supponga che una tariffa di fatturazione ipotetica di $ 100 al mese. Se si mantiene il servizio di ricerca alla capacità iniziale di una partizione e di una replica, è possibile pagare $ 100 alla fine del mese. Tuttavia, se si aggiungono altre due repliche per ottenere una disponibilità elevata, la fattura mensile aumenta a $300 ($ 100 per la prima coppia di partizioni di replica, seguita da $ 200 per le due repliche).

Questo modello di fatturazione si basa sul concetto di applicazione della tariffa di fatturazione alle unità di ricerca numeri (SU) usate da un servizio di ricerca. Tutti i servizi vengono inizialmente sottoposte a provisioning in un'unità di streaming, ma è possibile aumentare le unità di streaming aggiungendo partizioni o repliche per gestire carichi di lavoro più grandi. Per altre informazioni, vedere Come stimare i costi di un servizio di ricerca.

Aggiornamento o downgrade del livello

Non è disponibile alcun supporto predefinito per l'aggiornamento o il downgrade dei livelli. Se si vuole passare a un livello diverso, l'approccio è:

  • Creare un nuovo servizio di ricerca al nuovo livello.

  • Distribuire il contenuto di ricerca nel nuovo servizio. Seguire questo elenco di controllo per assicurarsi di avere tutto il contenuto.

  • Eliminare il servizio di ricerca precedente dopo aver verificato che non sia più necessario.

Per gli indici di grandi dimensioni che non si vuole ricompilare da zero, è consigliabile usare l'esempio di backup e ripristino per spostarli.

Passaggi successivi

Il modo migliore per scegliere un piano tariffario consiste nell'iniziare con un livello di costo minimo e quindi consentire l'esperienza e il test informano la decisione di mantenere il servizio o crearne uno nuovo a un livello superiore. Per i passaggi successivi, è consigliabile creare un servizio di ricerca a un livello in grado di supportare il livello di test che si propone di eseguire e quindi esaminare le indicazioni seguenti per consigli sulla stima dei costi e della capacità.