Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
I limiti massimi per archiviazione, carichi di lavoro e quantità di indici e altri oggetti dipendono dal piano tariffario scelto per Azure AI Search: Gratuito, Basic, Standard o Ottimizzato per l’archiviazione.
Gratuito è un servizio condiviso multi-tenant fornito con l'abbonamento a Azure.
Basic offre risorse di calcolo dedicate per i carichi di lavoro di produzione a piccola scala.
Il piano Standard prevede computer dedicati con maggiore capacità di elaborazione e archiviazione a ogni livello. Il piano Standard è disponibile in quattro livelli: S1, S2, S3 ed S3 HD. S3 Alta densità (S3 HD) è progettato per configurazioni multi-tenancy e grandi quantità di indici di dimensioni ridotte (3.000 indici per ogni servizio). S3 HD non fornisce la funzionalità dell'indicizzatore e l'inserimento dei dati deve sfruttare le API che eseguono il push dei dati dall'origine all'indice.
Il piano Ottimizzato per l'archiviazione viene eseguito su computer dedicati con una maggiore quantità totale di archiviazione, larghezza di banda di archiviazione e memoria rispetto al piano Standard. Questo livello è adatto a indici di grandi dimensioni e a modifica lenta. Il piano Ottimizzato per l'archiviazione comprende due livelli: L1 e L2.
Limiti delle sottoscrizioni
È possibile creare più servizi di ricerca fatturabili (Basic e superiori), fino al numero massimo di servizi consentiti a ogni livello, per area. Ad esempio, è possibile creare fino a 16 servizi al livello Basic e altri 16 servizi nel livello S1 all'interno della stessa sottoscrizione e area. È quindi possibile creare altri 16 servizi Basic in un'altra area per un totale combinato di 32 servizi Basic nella stessa sottoscrizione. Per altre informazioni sui livelli, vedere Scegliere un livello (o SKU) per Azure AI Search.
È possibile aumentare i limiti massimi del servizio su richiesta. Se sono necessari più servizi nell’ambito della stessa sottoscrizione, inviare una richiesta di supporto.
Risorsa | Gratuito 1 | Fondamentale | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Numero massimo di servizi per area | 1 | 16 | 16 | 8 | 6 | 6 | 6 | 6 |
Numero massimo di unità di ricerca (SU)2 | N/D | 3 unità di archiviazione | 36 unità di archiviazione | 36 unità di archiviazione | 36 unità di archiviazione | 36 unità di archiviazione | 36 unità di archiviazione | 36 unità di archiviazione |
1 È possibile avere un servizio di ricerca gratuito per ogni sottoscrizione di Azure. Il livello gratuito si basa sull'infrastruttura condivisa con altri clienti. Poiché l'hardware non è dedicato, la scalabilità orizzontale non è supportata e l'archiviazione è limitata a 50 MB. Un servizio di ricerca gratuito potrebbe essere eliminato dopo lunghi periodi di inattività per liberare spazio per più servizi.
2 Le unità di ricerca (SU) sono unità di fatturazione allocate come replica o partizione. Sono necessari entrambi. Per altre informazioni sulle combinazioni di SU, vedere Stimare e gestire la capacità di un servizio di ricerca.
Limiti del servizio
La tabella seguente illustra il contratto di servizio, i conteggi delle partizioni e i conteggi delle repliche a livello di servizio.
Risorsa | Gratuito | Fondamentale | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Contratto di servizio (SLA) | NO | Sì | Sì | Sì | Sì | Sì | Sì | Sì |
Partizioni | N/D | 3 1 | 12 | 12 | 12 | 3 | 12 | 12 |
Repliche | N/D | 3 | 12 | 12 | 12 | 12 | 12 | 12 |
1 Il livello Basic supporta tre partizioni e tre repliche, per un totale di nove unità di ricerca (SU) sui nuovi servizi di ricerca creati dopo il 3 aprile 2024. I servizi di base meno recenti sono limitati a una partizione e a tre repliche.
Un servizio di ricerca è soggetto a un limite massimo di archiviazione (dimensioni della partizione moltiplicate per il numero di partizioni) o a un limite rigido per il numero massimo di indici o indicizzatori, a seconda di quale evento si verifica per primo.
Gli accordi sul livello del servizio (SLA) si applicano ai servizi fatturabili che hanno due o più repliche per carichi di lavoro di query, o tre o più repliche per carichi di lavoro di query e indicizzazione. Il numero di partizioni non è un fattore di cui viene tenuto conto ai fini del contratto di servizio. Per altre informazioni, vedere Affidabilità in Azure AI Search.
I servizi gratuiti non hanno partizioni o repliche fisse e condividono risorse con altri sottoscrittori.
Archiviazione della partizione (GB)
I limiti di archiviazione per servizio variano in base a due fattori: data e area di creazione del servizio. Esistono limiti più elevati per i servizi più recenti nella maggior parte delle aree supportate.
Questa tabella illustra l'avanzamento dell'aumento della quota di archiviazione in GB nel tempo. A partire da aprile 2024, le partizioni di capacità più elevate sono state portate online nelle aree elencate nelle note a piè di pagina. Se si dispone di un servizio precedente in un'area supportata, verificare se è possibile aggiornare il servizio ai limiti di archiviazione più elevati.
Data di creazione servizio | Fondamentale | S1 | S2 | S3/HD | L1 | L2 |
---|---|---|---|---|---|---|
Prima del 3 aprile 2024 | 2 | 25 | 100 | 200 | 1.024 | 2.048 |
Dal 3 aprile 2024 al 17 maggio 2024 1 | 15 | 160 | 512 | 1.024 | 1.024 | 2.048 |
Dopo il 17 maggio 2024 2 | 15 | 160 | 512 | 1.024 | 2.048 | 4.096 |
Dopo il 10 febbraio 2025 3 | 15 | 160 | 512 | 1.024 | 2.048 | 4.096 |
1 Archiviazione con capacità superiore per Basic, S1, S2, S3 in queste aree. America:Brasile meridionale, Canada centrale, Canada orientale, Stati Uniti orientali, Stati Uniti orientali 2Stati Uniti centrali, Stati Uniti centro-settentrionali, Stati Uniti centro-meridionali, Stati Uniti occidentali, Stati Uniti occidentali 2, Stati Uniti occidentali 3, Stati Uniti centro-occidentali. Europa: Francia centrale. Italia settentrionale, Europa settentrionale, Norvegia orientale, Polonia centrale, Svizzera settentrionale, Svezia centrale, Regno Unito meridionale, Regno Unito occidentale. Medio Oriente: Emirati Arabi Uniti settentrionali. Africa: Sudafrica settentrionale. Asia Pacifico: Australia East, Australia sud-orientale, India centrale, Jio India occidentale, Asia orientale, Asia sudorientale, Giappone orientale, Giappone occidentale, Corea centrale, Corea meridionale.
2 Maggiore capacità di archiviazione per L1 e L2. Più aree offrono capacità più elevata a ogni livello fatturabile. Europa: Germania settentrionale, Germania centro-occidentale, Svizzera occidentale. Azure per enti pubblici: Texas, Arizona, Virginia. Africa: Sudafrica settentrionale. Asia Pacifico: Cina settentrionale 3, Cina orientale 3.
3 L'archiviazione con capacità superiore è disponibile in Europa occidentale.
Importante
Attualmente, i limiti di archiviazione più elevati non sono disponibili nelle aree seguenti, che sono soggetti ai limiti precedenti al 3 aprile.
- Israele centrale
- Qatar Centrale
- Spagna centrale
- India meridionale
Limiti per gli indici
Risorsa | Gratuito | Base 1 | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Numero massimo di indici | 3 | 5 o 15 | 50 | 200 | 200 | 1000 per partizione o 3000 per servizio | 10 | 10 |
Numero massimo di campi semplici per indice 2 | 1000 | 100 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
Dimensioni massime per campo vettoriale | 4096 | 4096 | 4096 | 4096 | 4096 | 4096 | 4096 | 4096 |
Numero massimo di raccolte complesse per indice | 40 | 40 | 40 | 40 | 40 | 40 | 40 | 40 |
Numero massimo di elementi in tutte le raccolte complesse per documento3 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 |
Profondità massima dei campi complessi | 10 | 10 | 10 | 10 | 10 | 10 | 10 | 10 |
Numero massimo di suggerimenti per indice | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
Numero massimo di profili di punteggio per indice | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 |
Configurazioni semantiche massime per indice | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 |
Numero massimo di funzioni per profilo | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 |
Dimensioni massime dell’indice 4 | N/D | N/D | N/D | 1,88 TB | 2,34 TB | 100 GB | N/D | N/D |
1 I servizi Basic creati prima di dicembre 2017 hanno limiti inferiori (5 anziché 15) per gli indici. Il livello di base è l'unico livello con un limite inferiore di 100 campi per indice.
2Il limite superiore per i campi include sia i campi di primo livello che i sottocampi annidati in una raccolta complessa. Ad esempio, se un indice contiene 15 campi e ha due raccolte complesse con cinque sottocampi ciascuno, il numero dei campi dell'indice è 25. Gli indici con una raccolta di campi molto grandi possono essere lenti. Limitare i campi e gli attributi solo a quelli necessari ed eseguire l'indicizzazione e il test delle query per verificare che le prestazioni siano accettabili.
3 È previsto un limite superiore per gli elementi perché la presenza di un numero elevato di elementi aumenta significativamente lo spazio di archiviazione necessario per l'indice. Un elemento di una raccolta complessa viene considerato un membro di tale raccolta. Si supponga, ad esempio, di avere un documento Hotel con una raccolta Rooms complessa; ogni stanza nella raccolta Rooms sarà considerata un elemento. Durante l'indicizzazione, nel suo complesso il motore di indicizzazione può elaborare in modo sicuro un massimo di 3.000 elementi nel documento. Questo limite è stato introdotto in api-version=2019-05-06
e si applica solo a raccolte complesse e non a raccolte di stringhe o a campi complessi.
4 Per la maggior parte dei livelli, la dimensione massima dell'indice è l'archiviazione totale disponibile nel servizio di ricerca. Per i servizi S2, S3 e S3 HD con più partizioni e quindi più spazio di archiviazione, le dimensioni massime di un singolo indice vengono fornite nella tabella. Si applica ai servizi di ricerca creati dopo il 3 aprile 2024.
Se il provisioning del servizio viene effettuato in un cluster più potente, è possibile che i limiti massimi risultino diversi. I limiti rappresentano il denominatore comune. Gli indici creati in base alle specifiche precedenti sono portabili tra livelli di servizio equivalenti in qualsiasi area.
Limiti per i documenti
Il numero massimo di documenti per indice è:
- 24 miliardi su Basic, S1, S2, S3
- 2 miliardi su S3 HD
- 288 miliardi su L1
- 576 miliardi su L2
Le dimensioni massime di ogni documento sono di circa 16 megabyte. Le dimensioni del documento sono in realtà un limite per le dimensioni del payload della richiesta API di indicizzazione, ovvero 16 megabyte. Tale payload può essere un singolo documento o un batch di documenti. Per un batch con un solo documento, la dimensione massima del documento è di 16 MB di JSON.
Le dimensioni del documento si applicano all'indicizzazione in modalità push che carica i documenti in un servizio di ricerca. Se si usa un indicizzatore per l'indicizzazione in modalità pull, i file di origine possono essere di qualsiasi dimensione del file, soggetti ai limiti dell'indicizzatore. Per l'indicizzatore BLOB, i limiti delle dimensioni dei file sono maggiori per i livelli più elevati. Ad esempio, il limite S1 è di 128 megabyte, il limite S2 è di 256 megabyte e così via.
Quando si stimano le dimensioni del documento, ricordarsi di indicizzare solo i campi che aggiungono valore agli scenari di ricerca ed escludere tutti i campi di origine che non hanno alcun scopo nelle query che si intende eseguire.
Limiti delle dimensioni dell'indice vettoriale
Quando si indicizzano documenti con campi vettoriali, Azure AI Search costruisce indici vettoriali interni usando i parametri dell'algoritmo forniti. Le dimensioni di questi indici vettoriali sono limitate dalla memoria riservata alla ricerca vettoriale del livello del servizio (o SKU
). Per indicazioni sulla gestione e l'ottimizzazione dell'archiviazione vettoriale, vedere Dimensioni dell'indice vettoriale e mantenersi al di sotto dei limiti.
I limiti dei vettori variano in base a:
Esistono limiti di vettori più elevati a partire da aprile 2024 per nuovi servizi di ricerca nelle regioni che forniscono la capacità aggiuntiva, ovvero la maggior parte di esse. Se si dispone di un servizio precedente in un'area supportata, verificare se è possibile aggiornare il servizio ai limiti di vettore più elevati.
Questa tabella mostra l'avanzamento dell'aumento della quota vettoriale in GB nel corso del tempo. La quota è per partizione, quindi se si ridimensiona un nuovo servizio Standard (S1) a 6 partizioni, la quota del vettore totale è 35 moltiplicata per 6.
Data di creazione servizio | Fondamentale | S1 | S2 | S3/HD | L1 | L2 |
---|---|---|---|---|---|---|
Prima del 1° luglio 20231 | 0,5 | 1 | 6 | 12 | 12 | 36 |
Dal 1° luglio 2023 al 3 aprile 20242 | 1 | 3 | 12 | 36 | 12 | 36 |
Dal 3 aprile 2024 al 17 maggio 20243 | 5 | 35 | 150 | 300 | 12 | 36 |
Dopo il 17 maggio 20244 | 5 | 35 | 150 | 300 | 150 | 300 |
1 Limiti iniziali del vettore durante l'anteprima anticipata.
2 Limiti del vettore durante il periodo di anteprima successivo. Tre regioni non hanno i limiti più elevati: Germania centro-occidentale, India occidentale, Qatar centrale.
3 Quota di vettori più elevata in base alle partizioni più grandi per i livelli e le aree supportati.
4 Maggiore quota vettoriale per più livelli e aree in base agli aggiornamenti delle dimensioni della partizione.
Il servizio applica una quota pari alle dimensioni dell'indice vettoriale per ogni partizione nel servizio di ricerca. Ogni partizione aggiuntiva aumenta la quota relativa alle dimensioni dell'indice vettoriale disponibile. Questa quota è un limite rigido che ha lo scopo di garantire che il servizio rimanga integro, il che significa che si verifica un errore in caso di ulteriori tentativi di indicizzazione dopo il superamento del limite. È possibile riavviare l'indicizzazione dopo aver liberato la quota disponibile eliminando alcuni documenti vettoriali o effettuando un ridimensionamento nelle partizioni.
Importante
I limiti dei vettori più elevati sono associati a dimensioni di partizione maggiori. Attualmente, i limiti di vettore più elevati non sono disponibili nelle aree seguenti, che sono soggette ai limiti di luglio-aprile.
- Israele centrale
- Qatar Centrale
- Spagna centrale
- India meridionale
Limiti dell'indicizzatore
Sono previsti tempi di esecuzione massimi per garantire il bilanciamento e la stabilità del servizio nel complesso, ma i set di dati di maggiori dimensioni potrebbero richiedere più tempo di indicizzazione rispetto al massimo consentito. Se un processo di indicizzazione non può essere completato nel tempo massimo consentito, provare a eseguirlo in modo pianificato. L'utilità di pianificazione tiene traccia dello stato di indicizzazione. Se un processo di indicizzazione pianificato viene interrotto per qualsiasi motivo, alla successiva esecuzione pianificata l'indicizzatore può riprendere dall'ultima interruzione.
Risorsa | Gratuito 1 | Basic 2 | S1 | S2 | S3 | S3 HD 3 | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Numero massimo di indicizzatori | 3 | 5 o 15 | 50 | 200 | 200 | N/D | 10 | 10 |
Numero massimo di origini dati | 3 | 5 o 15 | 50 | 200 | 200 | N/D | 10 | 10 |
Numero massimo di set di competenze 4 | 3 | 5 o 15 | 50 | 200 | 200 | N/D | 10 | 10 |
Carico di indicizzazione massimo per chiamata | 10.000 documenti | Limitato solo da numero massimo di documenti | Limitato solo da numero massimo di documenti | Limitato solo da numero massimo di documenti | Limitato solo da numero massimo di documenti | N/D | Nessun limite | Nessun limite |
Pianificazione minima | 5 minuti | 5 minuti | 5 minuti | 5 minuti | 5 minuti | 5 minuti | 5 minuti | 5 minuti |
Tempo massimo di esecuzione 5 | 1-3 o 3-10 minuti | 2 o 24 ore | 2 o 24 ore | 2 o 24 ore | 2 o 24 ore | N/D | 2 o 24 ore | 2 o 24 ore |
Indicizzatore BLOB: dimensione massima del BLOB, MB | 16 | 16 | 128 | 256 | 256 | N/D | 256 | 256 |
Indicizzatore BLOB: numero massimo di caratteri di contenuto estratto da un BLOB 6 | 32.000 | 64.000 | 4 milioni | 8 milioni | 16 milioni | N/D | 4 milioni | 4 milioni |
1 I servizi del livello Gratuito hanno un tempo massimo di esecuzione degli indicizzatori di 3 minuti per le origini BLOB e di 1 minuto per tutte le altre origini dati. La chiamata dell'indicizzatore viene eseguita una volta ogni 180 secondi. Per l'indicizzazione tramite intelligenza artificiale che effettua chiamate ai servizi Azure per intelligenza artificiale, i servizi gratuiti sono limitati a 20 transazioni gratuite al giorno per ogni indicizzatore, in cui una transazione viene definita come documento che passa correttamente attraverso la pipeline di arricchimento (suggerimento: è possibile reimpostare un indicizzatore per reimpostarne il conteggio).
2 I servizi Basic creati prima di dicembre 2017 hanno limiti inferiori (5 anziché 15) per gli indicizzatori, le origini dati e i set di competenze.
3 I servizi del livello S3 HD non includono il supporto per l'indicizzatore.
4 Numero massimo di 30 competenze per set di competenze.
5 Per quanto riguarda la durata massima di 2 o 24 ore degli indicizzatori: un massimo di 2 ore è la durata più comune e quella che dovrebbe essere pianificata. Si riferisce agli indicizzatori eseguiti nel ambiente pubblico, usati per l'offload dell'elaborazione intensiva dal punto di vista computazionale e per lasciare più risorse disponibili per le query. Il limite di 24 ore si applica se si configura l'indicizzatore per l'esecuzione in un ambiente privato usando solo l'infrastruttura allocata al servizio di ricerca. Si noti che alcuni indicizzatori meno recenti non sono in grado di essere eseguiti nell'ambiente pubblico e che tali indicizzatori hanno sempre un intervallo di elaborazione di 24 ore. Se gli indicizzatori non pianificati vengono eseguiti in modo continuo per 24 ore, è possibile presupporre che tali indicizzatori non possano essere migrati all'infrastruttura più recente. Come regola generale, per i processi di indicizzazione che non possono terminare entro due ore, impostare l'indicizzatore su una programmazione di 5 minuti in modo che l'indicizzatore possa velocemente riprendere da dove aveva lasciato. Nel livello gratuito, il tempo di esecuzione massimo di 3-10 minuti è per gli indicizzatori con set di competenze.
6 Il numero massimo di caratteri è basato su unità di codice Unicode, in particolare UTF-16.
Nota
Come indicato in Limiti per gli indici, gli indicizzatori applicheranno anche il limite superiore di 3000 elementi in tutte le raccolte complesse per documento a partire dalla versione più recente dell'API disponibile a livello generale che supporta i tipi complessi (2019-05-06
). Se l'indicizzatore è stato creato con una versione precedente dell'API, non sarà soggetto a questo limite. Per mantenere la massima compatibilità, un indicizzatore creato con una versione precedente dell'API e quindi aggiornato con una versione dell'API 2019-05-06
o successiva verrà comunque escluso dai limiti. I clienti devono essere consapevoli dell'impatto negativo della presenza di raccolte complesse di grandi dimensioni (come indicato in precedenza) ed è consigliabile creare nuovi indicizzatori con la versione più recente dell'API disponibile a livello generale.
Limiti delle risorse del collegamento privato condiviso
Gli indicizzatori possono accedere ad altre risorse di Azure tramite endpoint privati gestiti tramite l'API della risorsa del collegamento privato condiviso. Questa sezione descrive i limiti associati a questa funzionalità.
Risorsa | Gratuito | Fondamentale | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Supporto indicizzatore endpoint privato | NO | Sì | Sì | Sì | Sì | NO | Sì | Sì |
Supporto per endpoint privato per gli indicizzatori con competenze 1 | NO | NO | Sì | Sì | Sì | NO | Sì | Sì |
Supporto endpoint privato per set di competenze con una competenza di incorporamento 2 | NO | Sì | Sì | Sì | Sì | NO | Sì | Sì |
Numero massimo di endpoint privati | N/D | 10 o 30 | 100 | 400 | 400 | N/D | 20 | 20 |
Numero massimo di tipi di risorse distinti 3 | N/D | 4 | 7 | 15 | 15 | N/D | 4 | 4 |
1 L'arricchimento tramite intelligenza artificiale e l'analisi delle immagini sono attività complesse e usano una quantità estremamente elevata della potenza di elaborazione disponibile. Per questo motivo, le connessioni private vengono disabilitate ai livelli inferiori allo scopo di garantire le prestazioni e la stabilità del servizio di ricerca stesso. Nei servizi di base, le connessioni private a una risorsa multiservizio di Servizi di intelligenza artificiale di Azure non sono supportate per mantenere la stabilità del servizio. Per il livello S1, assicurarsi che il servizio sia stato creato con limiti più elevati dopo il 3 aprile 2024.
2 Le connessioni private a un modello di embedding sono supportate nei servizi di ricerca di base e S1 ad alta capacità creati dopo il 3 aprile 2024, con i limiti più elevati per l'archiviazione e l'elaborazione computazionale.
3 Il numero di tipi di risorse distinti viene calcolato come numero di valori univoci groupId
usati in tutte le risorse di collegamento privato condiviso per un determinato servizio di ricerca, indipendentemente dallo stato della risorsa.
Limiti per i sinonimi
Il numero massimo di mappe di sinonimi varia in base al livello. Ogni regola può avere fino a 20 espansioni, dove un'espansione è un termine equivalente. Se ad esempio si specifica "gatto", l'associazione con "gattino", "felino" e "felis" (il genere dei gatti) viene conteggiata come 3 espansioni.
Risorsa | Gratuito | Fondamentale | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Numero massimo di mappe di sinonimi | 3 | 3 | 5 | 10 | 20 | 20 | 10 | 10 |
Numero massimo di regole per mappa | 5.000 | 20000 | 20000 | 20000 | 20000 | 20000 | 20000 | 20000 |
Limiti degli alias di indice
Il numero massimo di alias di indice varia in base al livello e alla data di creazione del servizio. In tutti i livelli, se il servizio è stato creato dopo ottobre 2022, il numero massimo di alias è doppio del numero massimo di indici consentiti. Se il servizio è stato creato prima di ottobre 2022, il limite è il numero di indici consentiti.
Data di creazione del servizio | Gratuito | Fondamentale | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Prima di ottobre 2022 | 3 | 5 o 15 1 | 50 | 200 | 200 | 1000 per partizione o 3000 per servizio | 10 | 10 |
Dopo ottobre 2022 | 6 | 30 | 100 | 400 | 400 | 2000 per partizione o 6000 per servizio | 20 | 20 |
1 I servizi di base creati prima di dicembre 2017 hanno limiti inferiori (5 anziché 15) sugli indici
Limiti dei dati (arricchimento tramite intelligenza artificiale)
Una pipeline di arricchimento tramite intelligenza artificiale che effettua chiamate a una risorsa di Lingua di Azure AI per il riconoscimento di entità, il collegamento di entità, l'estrazione di frasi chiave, l'analisi del sentiment, il rilevamento della lingua e il rilevamento di informazioni personali è soggetta a limiti dei dati. Le dimensioni massime di un record devono essere di 50.000 caratteri in base alla misurazione di String.Length
. Se è necessario suddividere i dati prima di inviarli all'analizzatore di sentimenti, usare l'abilità di divisione del testo.
Limiti della limitazione delle richieste
Le richieste API vengono limitate man mano che il sistema si avvicina alla capacità massima. La limitazione delle richieste si comporta in modo diverso per le diverse API. Le API di query (ricerca/suggerimenti/completamento automatico) e le API di indicizzazione sono regolate in modo dinamico in funzione del carico del servizio. Le API di indice e l'API delle operazioni del servizio hanno limiti di frequenza per le richieste statiche.
Limiti statici per la frequenza delle richieste per le operazioni correlate a un indice:
- Indici di elenco (GET /indexes): 3 al secondo per unità di ricerca
- Ottenere un indice (GET /indexes/myindex): 10 al secondo per unità di ricerca
- Creare un indice (POST /indexes): 12 al minuto per unità di ricerca
- Creare o aggiornare un indice (PUT /indexes/myindex): 6 al secondo per unità di ricerca
- Eliminare un indice (DELETE /indexes/myindex): 12 al minuto per unità di ricerca
Limiti statici delle richieste per le operazioni relative a un servizio.
- Statistiche del servizio (GET /servicestats): 4 al secondo per unità di ricerca
Limiti di limitazione delle richieste del classificatore semantico
Il ranker semantico usa un sistema di accodamento per gestire le richieste simultanee. Questo sistema consente ai servizi di ricerca di ottenere il maggior numero possibile di query al secondo. Quando viene raggiunto il limite di richieste simultanee, le richieste aggiuntive vengono inserite in una coda. Se la coda è piena, ulteriori richieste vengono rifiutate e devono essere ritentate.
Il numero totale di query del classificatore semantico al secondo varia in base ai fattori seguenti:
- Livello del servizio di ricerca. Sia la capacità della coda che i limiti delle richieste simultanei variano in base al livello.
- Numero di unità di ricerca nel servizio di ricerca. Il modo più semplice per aumentare il numero massimo di query di classificazione semantica simultanee consiste nell'aggiungere altre unità di ricerca al servizio di ricerca.
- La capacità totale del classificatore semantico disponibile nell'area.
- Quantità di tempo impiegato per gestire una query usando il ranker semantico. Questo varia in base a quanto è occupato il servizio di ricerca.
La tabella seguente descrive i limiti di limitazione delle richieste del classificatore semantico per livello, a seconda della capacità disponibile nell'area. È possibile contattare il supporto tecnico Microsoft per richiedere un aumento del limite.
Risorsa | Fondamentale | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|
Numero massimo di richieste simultanee (per unità di ricerca) | 2 | 3 | 4 | 4 | 4 | 4 | 4 |
Dimensioni massime della coda delle richieste (per unità di ricerca) | 4 | 6 | 8 | 8 | 8 | 8 | 8 |
Limiti delle richieste API
Esistono limiti per le query perché le query non associate possono destabilizzare il servizio di ricerca. In genere, tali query vengono create a livello di codice. Se l'applicazione genera query di ricerca a livello di codice, è consigliabile progettarla in modo che non generi query di dimensioni illimitate.
I limiti per i payload esistono per motivi simili, garantendo la stabilità del servizio di ricerca. Il limite si applica all'intera richiesta, inclusi tutti i relativi componenti. Ad esempio, se la richiesta esegue il batch di diversi documenti o comandi, l'intera richiesta deve rientrare nel limite supportato.
Se è necessario superare un limite supportato, è necessario testare il carico di lavoro in modo da sapere cosa aspettarsi.
Ad eccezione di quanto indicato, le richieste API seguenti si applicano a tutte le interfacce programmabili, inclusi gli SDK di Azure.
Generale:
- Il limite massimo di payload supportato è di 16 MB per l'indicizzazione e la richiesta di query tramite l'API REST e gli SDK.
- Lunghezza massima dell'URL di 8 KB (si applica solo alle API REST).
API di indicizzazione:
- Sono supportati max 1.000 documenti per ogni batch di carichi, unioni o eliminazioni di indice.
API query:
- Massimo 10 campi in una query vettoriale
- Massimo 32 campi nella clausola $orderby.
- Massimo 100.000 caratteri in una clausola di ricerca.
- Il numero massimo di clausole nella ricerca è 3.000.
- Limiti massimi per query con caratteri jolly ed espressioni regolari, come applicato da Lucene. Limita il numero di modelli, varianti o corrisponde a 1.000 istanze. Questo limite è previsto per evitare l'overload del motore.
Termini di ricerca:
- La dimensione massima supportata del termine di ricerca è di 32.766 byte (32 KB meno 2 byte) di testo con codifica UTF-8. Si applica alla ricerca di parole chiave e alla proprietà text della ricerca vettoriale.
- La dimensione massima supportata dei termini di ricerca è di 1.000 caratteri per la ricerca con prefisso e la ricerca regex.
Limiti delle risposte API
- Al massimo 1,000 documenti restituiti per pagina di risultati della ricerca
- 100 suggerimenti al massimo restituiti per richiesta di API di suggerimento
Il motore di ricerca restituisce 50 risultati per impostazione predefinita, ma è possibile eseguire l'override di questo parametro fino al limite massimo.
Limiti delle chiavi API
Le chiavi API vengono usate per l'autenticazione del servizio. Sono disponibili due tipi. Le chiavi amministratore, specificate nell'intestazione della richiesta, consentono l'accesso completo in lettura e scrittura al servizio. Le chiavi di query sono di sola lettura, sono specificate nell'URL e in genere sono distribuite ad applicazioni client.
- 2 chiavi di amministrazione al massimo per ogni servizio
- 50 chiavi di query al massimo per ogni servizio