Grenzwerte für den Azure KI Search-Dienst

Die Grenzwerte für Speicher, Workloads und Mengen von Indizes und anderen Objekten hängen davon ab, ob die Erstellung von Azure KI Search im Tarif Free, Basic, Standard oder Storage Optimized erfolgt.

  • Free ist ein mehrinstanzenfähiger, gemeinsam genutzter Dienst, der Teil Ihres Azure-Abonnements ist.

  • Basic bietet dedizierte Computeressourcen für Produktionsworkloads mit geringerem Umfang, teilen sich jedoch bestimmte Netzwerkinfrastruktur mit anderen Mandanten.

  • Standard wird auf dedizierten Computern ausgeführt. Sie bieten höhere Speicher- und Verarbeitungskapazität auf jeder Ebene. Standard ist in vier Ebenen verfügbar: S1, S2, S3 und S3 HD. S3 High Density (S3 HD) ist für Mehrinstanzenfähigkeit und große Mengen von kleinen Indizes (3.000 Indizes pro Dienst) konzipiert. S3 HD bietet kein Indexerfeature, und die Datenerfassung muss APIs nutzen, die Daten aus der Quelle an den Index übermitteln.

  • Storage Optimized wird auf dedizierten Computern mit mehr Gesamtspeicher, Speicherbandbreite und Arbeitsspeicher als Standard ausgeführt. Dieser Tarif ist für große Indizes konzipiert, die nur langsam geändert werden. „Storage Optimized“ gibt es auf zwei Ebenen: L1 und L2.

Grenzwerte für Abonnements

Sie können mehrere abrechenbare Suchdienste (Basic und höher) bis zur maximalen Anzahl zulässiger Dienste in den einzelnen Tarifen erstellen. Beispielsweise können Sie im selben Abonnement bis zu 16 Dienste im Basic-Tarif und weitere 16 Dienste im S1-Tarif erstellen. Weitere Informationen zu Tarifen finden Sie unter Auswählen eines Tarifs (oder einer SKU) für Azure KI-Suche.

Die Obergrenze für die maximale Anzahl von Diensten kann auf Anfrage angehoben werden. Senden Sie eine Supportanfrage, wenn Sie in einem Abonnement weitere Dienste benötigen.

Ressource Free 1 Basic S1 S2 S3 S3 HD L1 L2
Maximale Anzahl von Diensten 1 16 16 8 6 6 6 6
Maximale Anzahl der Sucheinheiten (Search Units, SU)2 N/V 3 SU 36 SU 36 SU 36 SU 36 SU 36 SU 36 SU

1 Sie können einen kostenlosen Suchdienst pro Azure-Abonnement nutzen. Der Free-Tarif basiert auf einer Infrastruktur, die gemeinsam mit anderen Kund*innen genutzt wird. Da die Hardware nicht dediziert ist, wird das Hochskalieren nicht unterstützt, und der Speicher ist auf 50 MB beschränkt.

2 Sucheinheiten (SU) sind Abrechnungseinheiten, die entweder als Replikat oder Partition zugeordnet werden. Sie benötigen beide. Weitere Informationen zu SU-Kombinationen finden Sie unter Schätzen und Verwalten der Kapazität eines Suchdiensts.

Diensteinschränkungen

Suchdienstgrenzwerte für Speicher, Partitionen und Replikate variieren je nach Erstellungsdatum des Diensts, mit höheren Grenzwerten für neuere Dienste in unterstützten Regionen.

Ein Suchdienst unterliegt einem maximalen Speichergrenzwert (Partitionsgröße multipliziert mit der Anzahl der Partitionen) oder einem harten Grenzwert für die maximale Anzahl von Indizes oder Indexer, je nachdem, welcher Wert zuerst erreicht wird.

Vereinbarungen auf Serviceebene (Service Level Agreements, SLAs) gelten für abrechnende Dienste mit mindestens zwei Replikaten für Abfrageworkloads oder drei oder mehr Replikate für Abfrage- und Indizierungsworkloads. Die Anzahl der Partitionen wird für eine SLA nicht berücksichtigt. Weitere Informationen finden Sie unter Zuverlässigkeit in Azure KI Search.

Kostenlose Dienste verfügen nicht über feste Partitionen oder Replikate, und sie teilen Ressourcen für andere Abonnenten.

Vor dem 3. April 2024

Resource Kostenlos Basic S1 S2 S3 S3 HD L1 L2
Vereinbarung zum Servicelevel (SLA) No Ja Ja Ja Ja Ja Ja Ja
Speicher (Partitionsgröße) 50 MB 2 GB 25 GB 100 GB 200 GB 200 GB 1 TB 2 TB
Partitionen N/V 1 12 12 12 3 12 12
Replikate 3 12 12 12 12 12 12

Nach dem 3. April 2024

Für neue Dienste, die nach dem 3. April 2024 erstellt wurden:

  • Die Standardebene kann bis zu drei Partitionen und drei Replikate und insgesamt neun Sucheinheiten (SU) aufweisen.
  • Basic, S1, S2, S3 haben mehr Speicherplatz pro Partition, von 3 bis 7 mal mehr, je nach Ebene.
  • Ihr neuer Suchdienst muss sich in einer unterstützten Region befinden, um die zusätzliche Kapazität für "Basic" und andere Ebenen zu erhalten.

Derzeit gibt es kein direktes Upgrade. Sie sollten einen neuen Suchdienst erstellen, um vom zusätzlichen Speicher zu profitieren.

Resource Kostenlos Basic S1 S2 S3 S3 HD L1 L2
Vereinbarung zum Servicelevel (SLA) No Ja Ja Ja Ja Ja Ja Ja
Speicher (Partitionsgröße) 50 MB 15 GB 160 GB 350 GB 700 GB 700 GB 1 TB 2 TB
Partitionen 3 12 12 12 3 12 12
Replikate 3 12 12 12 12 12 12

Unterstützte Regionen mit höheren Speichergrenzwerten

Dienste, die nach dem 3. April 2024 erstellt wurden, müssen in einer der folgenden Regionen vorhanden sein, um den zusätzlichen Speicher zu erhalten. Schauen Sie sich Ankündigungen in What's New in Azure KI Search an, um in andere Regionen zu erweitern.

Land / Region Regionen, die zusätzliche Kapazität pro Partition bereitstellen
USA USA, Osten, USA, Osten 2,USA, Mitte, USA, Norden-Mitte, USA, Süden-Mitte, USA, Westen, USA, Westen 2, USA, Westen 3USA, Westen-Mitte
Vereinigtes Königreich Vereinigtes Königreich, Süden, Vereinigtes Königreich, Westen ​
Vereinigte Arabische Emirate VAE, Norden​
Schweiz Schweiz, Westen
Schweden Schweden, Mitte​
Polen Polen, Mitte​
Norwegen Norwegen, Osten​
Korea Südkorea, Mitte, Südkorea, Süden ​
Japan Japan, Osten, Japan, Westen
Italien Italien, Norden​
Indien Indien, Mitte, Jio Indien, Westen ​
Frankreich Frankreich, Mitte​
Europa Europa, Norden​
Kanada Kanada, Mitte, Kanada, Osten​
Brasilien Brasilien, Süden​
Asien-Pazifik Asien, Osten, Asien, Südosten ​
Australien Australien, Osten, Australien, Südosten​

Indexgrenzwerte

Resource Kostenlos Basic: 1 S1 S2 S3 S3 HD L1 L2
Maximale Anzahl von Indizes 3 5 oder 15 50 200 200 1000 pro Partition oder 3000 pro Dienst 10 10
Maximale Anzahl der einfachen Felder pro Index 2 1.000 100 1000 1000 1000 1000 1000 1000
Maximale Dimensionen pro Vektorfeld 3072 3072 3072 3072 3072 3072 3072 3072
Maximale Anzahl der komplexen Sammlungen pro Index 40 40 40 40 40 40 40 40
Maximale Anzahl der Elemente in allen komplexen Sammlungen pro Dokument 3 3000 3000 3000 3000 3000 3000 3000 3000
Maximale Tiefe der komplexen Felder 10 10 10 10 10 10 10 10
Maximale Anzahl von Vorschlägen pro Index 1 1 1 1 1 1 1 1
Maximale Anzahl von Bewertungsprofilen pro Index 100 100 100 100 100 100 100 100
Maximale Anzahl von Funktionen pro Profil 8 8 8 8 8 8 8 8
Maximale Indexgröße 4 1.92 TB* 2,4 TB 100 GB

1 Basic-Dienste, die vor Dezember 2017 erstellt wurden, haben niedrigere Grenzwerte (5 statt 15) für Indizes. Der Basic-Tarif ist der einzige Tarif mit einem unteren Grenzwert von 100 Feldern pro Index.

2 Die Obergrenze für Felder umfasst Felder der ersten Ebene und geschachtelte Unterfelder in einer komplexen Sammlung. Wenn ein Index beispielsweise 15 Felder enthält und über zwei komplexe Sammlungen mit jeweils fünf Unterfeldern verfügt, beträgt die Feldanzahl Ihres Index 25. Indizes mit sehr vielen Feldern können langsam sein. Beschränken Sie Felder und Attribute auf die benötigten Felder, und führen Sie Indizierungs- und Abfragetests durch, um sicherzustellen, dass die Leistung akzeptabel ist.

3 Es gilt Obergrenze für Elemente, da eine hohe Anzahl von diesen Elementen den für Ihren Index erforderlichen Speicherplatz erheblich erhöht. Ein Element einer komplexen Sammlung ist als Member dieser Sammlung definiert. Angenommen, es gibt ein Hotel-Dokument mit einer komplexen Sammlung „Rooms“, dann wird jedes Zimmer in der Sammlung „Rooms“ als ein Element angesehen. Bei einer Indizierung kann die Indizierungs-Engine maximal 3,000 Elemente sicher im gesamten Dokument verarbeiten. Dieser Grenzwert wurde in api-version=2019-05-06 eingeführt und gilt nur für komplexe Sammlungen, nicht für Zeichenfolgensammlungen oder komplexe Felder.

4 Auf den meisten Ebenen ist die maximale Indexgröße alle verfügbaren Speicher für Ihren Suchdienst. Bei S2, S3 und S3 HD ist die maximale Größe eines indexes die in der Tabelle angegebene Zahl. Gilt für Suchdienste, die nach dem 3. April 2024 erstellt wurden.

Wenn Ihr Dienst in einem leistungsfähigeren Cluster bereitgestellt wird, kann es zu Abweichungen bei den maximalen Grenzwerten kommen. Die hier gezeigten Grenzwerte stellen den kleinsten gemeinsamen Nenner dar. Indizes, die gemäß den oben genannten Spezifikationen erstellt wurden, können über äquivalente Dienstebenen hinweg in jede Region portiert werden.

Dokumentgrenzwerte

Für Basic-, S1-, S2-, S3-, L1- und L2-Suchdienste sind ca. 24 Milliarden Dokumente pro Index möglich. Für S3 HD liegt der Grenzwert bei 2 Milliarden Dokumenten pro Index. Jede Instanz einer komplexen Sammlung zählt für diesen Grenzwert als separates Dokument.

Dokumentgrößenbeschränkungen pro API-Aufruf

Die maximale Dokumentgröße beim Aufrufen einer Index-API beträgt etwa 16 Megabytes.

Die Dokumentgröße ist tatsächlich eine Begrenzung der Größe des Anforderungstexts der Index-API. Da Sie einen Batch von mehreren Dokumenten auf einmal an die Index-API übergeben können, hängt die realistische maximale Größe davon ab, wie viele Dokumente im Batch vorhanden sind. Für einen Batch mit einem einzelnen Dokument beträgt die maximale Dokumentgröße 16 MB von JSON.

Denken Sie beim Schätzen der Dokumentgröße daran, nur die Felder zu berücksichtigen, die von einem Suchdienst verwendet werden können. Sämtliche Binär- oder Bilddaten in den Quelldokumenten sollten aus der Berechnungen ausgeschlossen werden.

Größenbeschränkungen für Vektorindizes

Wenn Sie Dokumente mit Vektorfeldern indizieren, erstellt Azure KI-Suche interne Vektorindizes unter Verwendung der von Ihnen angegebenen Algorithmusparameter. Die Größe dieser Vektorindizes wird durch den Speicher eingeschränkt, der für die Vektorsuche Ihrer Dienstebene (oder SKU) reserviert ist.

Der Dienst erzwingt ein Vektorindexgrößenkontingent für jede Partition in Ihrem Suchdienst. Jede zusätzliche Partition erhöht das verfügbare Kontingent für die Vektorindexgröße. Dieses Kontingent ist eine feste Grenze, um sicherzustellen, dass Ihr Dienst fehlerfrei bleibt, was bedeutet, dass weitere Indizierungsversuche, nachdem der Grenzwert überschritten wurde, scheitern. Sie können die Indizierung fortsetzen, nachdem Sie etwas von dem Kontingent freigegeben haben, indem Sie entweder einige Vektordokumente löschen oder Partitionen hochskalieren.

In der Tabelle wird das Vektorindexgrößenkontingent pro Partition auf den Dienstebenen beschrieben. Sie enthält Folgendes:

  • Partitionsspeichergrenzwerte für die einzelnen Tarife (aus Kontextgründen wiederholt)
  • Menge der einzelnen Partitionen (in GB), die für Vektorindizes verfügbar ist (wird erstellt, wenn Sie einem Index Vektorfelder hinzufügen)
  • Ungefähre Anzahl von Einbettungen (Gleitkommawerte) pro Partition

Verwenden Sie die GET Service Statistics, um Ihr Vektorindexgrößenkontingent abzurufen oder die Registerkarte Indizes oder Verbrauch im Azure-Portal zu überprüfen.

Vektorgrenzwerte variieren je nach Erstellungsdatum und -ebene des Diensts. Wenn Sie das Alter Ihres Suchdiensts überprüfen und mehr über Vektorindizes erfahren möchten, lesen Sie die Vektorindexgröße und bleiben unter Grenzwerten.

Vektorbeschränkungen für Dienste, die nach dem 3. April 2024 in unterstützten Regionen erstellt wurden

Die höchsten Vektorgrenzwerte sind für Suchdienste verfügbar, die nach dem 3. April 2024 in einem unterstützten Bereich erstellt wurden.

Tarif Speicherplatzkontingent (GB) Vektorkontingent pro Partition (GB) Geschätze Floats pro Partition (bei 15% Overhead)
Grundlegend 15 5 1,100 Mio.
S1 160 35 8,200 Mio.
S2 350 100 23,500 Mio.
S3 700 200 47,000 Mio.
L1 1.000 12 2.800 Mio.
L2 2,000 36 8.400 Mio.

Beachten Sie, dass die L1- und L2-Grenzwerte im Rollout vom 3. April unverändert sind.

Vektorbeschränkungen für Dienste, die zwischen dem 1. Juli 2023 und dem 3. April 2024 erstellt wurden

Die folgenden Grenzwerte gelten für neue Dienste, die zwischen dem 1. Juli und dem 3. April 2024 erstellt wurden, mit Ausnahme der folgenden Regionen, die die ursprünglichen Grenzwerte vor dem 1. Juli 2023 aufweisen:

  • Deutschland, Westen-Mitte
  • Indien, Westen
  • Katar, Mitte

Alle anderen Regionen haben diese Grenzwerte:

Tarif Speicherplatzkontingent (GB) Vektorkontingent pro Partition (GB) Geschätze Floats pro Partition (bei 15% Overhead)
Basic 2 1 235 Mio.
S1 25 3 700 Mio.
S2 100 12 2.800 Mio.
S3 200 36 8.400 Mio.
L1 1.000 12 2.800 Mio.
L2 2,000 36 8.400 Mio.

Vektorbeschränkungen für Dienste, die vor dem 1. Juli 2023 erstellt wurden

Tarif Speicherplatzkontingent (GB) Vektorkontingent pro Partition (GB) Geschätze Floats pro Partition (bei 15% Overhead)
Basic 2 0.5 115 Mio.
S1 25 1 235 Mio.
S2 100 6 1.400 Mio.
S3 200 12 2.800 Mio.
L1 1.000 12 2.800 Mio.
L2 2,000 36 8.400 Mio.

Indexergrenzwerte

Es gibt eine maximale Ausführungsdauer, um den Dienst als Ganzes ausgewogen und stabil zu gestalten, aber größere Datensätze benötigen möglicherweise mehr Indizierungszeit, als das Maximum zulässt. Wenn ein Indizierungsauftrag nicht innerhalb der maximal zulässigen Zeit abgeschlossen werden kann, versuchen Sie, den Auftrag nach einem Zeitplan auszuführen. Der Planer verfolgt den Indizierungsstatus. Wenn ein geplanter Indizierungsauftrag aus irgendeinem Grund unterbrochen wird, kann der Indexer den Auftrag bei der nächsten geplanten Ausführung an der Stelle fortsetzen, an der er unterbrochen wurde.

Resource Free 1 Basic 2 S1 S2 S3 S3 HD 3 L1 L2
Maximale Anzahl von Indexern 3 5 oder 15 50 200 200 Nicht zutreffend 10 10
Maximale Datenquellen 3 5 oder 15 50 200 200 Nicht zutreffend 10 10
Maximale Qualifikationsgruppen 4 3 5 oder 15 50 200 200 Nicht zutreffend 10 10
Maximale Indizierungslast pro Aufruf 10.000 Dokumente Nur durch maximale Dokumentanzahl beschränkt Nur durch maximale Dokumentanzahl beschränkt Nur durch maximale Dokumentanzahl beschränkt Nur durch maximale Dokumentanzahl beschränkt Nicht zutreffend Keine Begrenzung Keine Begrenzung
Minimaler Zeitplan 5 Minuten 5 Minuten 5 Minuten 5 Minuten 5 Minuten 5 Minuten 5 Minuten 5 Minuten
Maximale Ausführungsdauer 5 1–3 Minuten 2 oder 24 Stunden 2 oder 24 Stunden 2 oder 24 Stunden 2 oder 24 Stunden Nicht zutreffend 2 oder 24 Stunden 2 oder 24 Stunden
Maximale Laufzeit für Indexer mit einem Skillset 6 3 bis 10 Minuten 2 Stunden 2 Stunden 2 Stunden 2 Stunden Nicht zutreffend 2 Stunden 2 Stunden
Blobindexer: maximale Blobgröße, MB 16 16 128 256 256 Nicht zutreffend 256 256
Blobindexer: maximale Anzahl der Zeichen des aus einem Blob extrahierten Inhalts 32.000 64.000 4 Millionen 8 Millionen 16 Millionen Nicht zutreffend 4 Millionen 4 Millionen

1 Die maximale Indexerausführungszeit bei Diensten im Free-Tarif beträgt drei Minuten für Blobquellen und eine Minute für alle anderen Datenquellen. Indizierungsaufruf erfolgt einmal alle 180 Sekunden. Für eine KI-Indizierung, die Azure KI Services aufruft, gilt bei den kostenlosen Diensten ein Limit von 20 kostenlosen Transaktionen pro Indexer pro Tag. Dabei ist eine Transaktion als ein Dokument definiert, das die Anreicherungspipeline erfolgreich durchläuft (Tipp: Sie können einen Indexer zurücksetzen, um seinen Zähler zurückzusetzen).

2 Basic-Dienste, die vor Dezember 2017 erstellt wurden, haben niedrigere Grenzwerte (5 statt 15) für Indexer, Datenquellen und Qualifikationsgruppen.

3 S3 HD-Dienste bieten keine Indexerunterstützung.

4 Maximal 30 Fähigkeiten pro Qualifikationsgruppe.

5 Hinweis zur maximalen Dauer von zwei oder 24 Stunden für Indexer: Ein Maximum von zwei Stunden ist am gängigsten und sollte als Planungsgrundlage verwendet werden. Der Grenzwert von 24 Stunden stammt aus einer älteren Indexerimplementierung. Wenn bei Ihnen ungeplante Indexer vorhanden sind, die 24 Stunden lang kontinuierlich ausgeführt werden, liegt das daran, dass diese Indexer nicht zur neueren Infrastruktur migriert werden konnten. Faustregel: Legen Sie für Indizierungsaufträge, die nicht innerhalb von zwei Stunden abgeschlossen werden können, einen zweistündigen Zeitplan für den Indexer fest. Nach Abschluss des ersten zweistündigen Intervalls setzt der Indexer seine Arbeit zu Beginn des nächsten zweistündigen Intervalls an der Stelle fort, an der er aufgehört hat.

6 Die Skillset-Ausführung und insbesondere die Bildanalyse sind rechenintensive Vorgänge, die unverhältnismäßig große Mengen der verfügbaren Rechenleistung beanspruchen. Die Laufzeit für diese Workloads wurde verkürzt, damit andere Aufträge in der Warteschlange bessere Chancen haben, ausgeführt zu werden.

Hinweis

Wie unter Indexgrenzwerte beschrieben, erzwingen Indexer die Obergrenze von 3.000 Elementen auch für alle komplexen Sammlungen pro Dokument – ab der neuesten allgemein verfügbaren API-Version, die komplexe Typen (2019-05-06) unterstützt. Dies bedeutet, dass dieser Grenzwert für Sie nicht gilt, wenn Sie Ihren Indexer mit einer früheren API-Version erstellt haben. Zur Sicherstellung der maximalen Kompatibilität wird ein Indexer, der mit einer früheren API-Version erstellt und dann mit API-Version 2019-05-06 oder höher aktualisiert wurde, trotzdem von der Begrenzung ausgenommen. Kunden sollten sich dieser negativen Auswirkungen, die wie oben erwähnt mit der Verwendung sehr komplexer Sammlungen verbunden sind, bewusst sein. Wir empfehlen Ihnen dringend, für die Erstellung aller neuen Indexer die neueste allgemein verfügbare API-Version zu nutzen.

Indexer haben über private Endpunkte, die über die API für freigegebene Private Link-Ressourcen verwaltet werden, Zugriff auf Azure-Ressourcen. In diesem Abschnitt werden die Grenzwerte für diese Funktion beschrieben.

Resource Kostenlos Basic S1 S2 S3 S3 HD L1 L2
Unterstützung für den Indexer des privaten Endpunkts Nein Ja Ja Ja Ja Keine Ja Ja
Unterstützung für private Endpunkte für Indexer mit einem Skillset1 Nein Nr. Nein Ja Ja Keine Ja Ja
Maximale Anzahl privater Endpunkte Nicht zutreffend 10 oder 30 100 400 400 Nicht zutreffend 20 20
Maximale Anzahl unterschiedlicher Ressourcentypen2 Nicht zutreffend 4 7 15 15 Nicht zutreffend 4 4

1 Die KI-Anreicherung und die Bildanalyse sind rechenintensive Vorgänge, die unverhältnismäßig große Mengen der verfügbaren Verarbeitungskapazität verbrauchen. Aus diesem Grund sind private Verbindungen in niedrigeren Tarifen deaktiviert, um die Leistung und Stabilität des eigentlichen Suchdiensts zu gewährleisten.

2 Die Anzahl der unterschiedlichen Ressourcentypen wird als die Anzahl der eindeutigen groupId-Werte berechnet, die in allen freigegebenen Private Link-Ressourcen für einen bestimmten Dienst verwendet werden. Der Status der jeweiligen Ressource spielt dabei keine Rolle.

Synonymlimits

Die maximale Anzahl der Synonymzuordnungen variiert je nach Tarif. Jede Regel kann bis zu 20 Erweiterungen aufweisen. Als Erweiterungen werden gleichwertige Begriffe bezeichnet. Beispielsweise würde für „Katze“, die Zuordnung von „Kätzchen“, „Kater“ und „Felis“ (die Gattung der Katzen) als drei Erweiterungen gezählt werden.

Resource Kostenlos Basic S1 S2 S3 S3-HD L1 L2
Maximale Synonymzuordnungen 3 3 5 10 20 20 10 10
Maximale Anzahl von Regeln pro Zuordnung 5000 20000 20000 20000 20000 20000 20000 20000

Indexaliasgrenzwerte

Die maximale Anzahl von Indexaliasen unterscheidet sich je nach Tarif. In allen Tarifen ist die maximale Anzahl von Aliasen doppelt so hoch wie die maximal zulässige Anzahl von Indizes.

Resource Kostenlos Basic S1 S2 S3 S3-HD L1 L2
Maximale Anzahl von Aliasen 6 10 oder 30 100 400 400 2000 pro Partition oder 6000 pro Dienst 20 20

Datengrenzwerte (KI-Anreicherung)

Für eine KI-Anreicherungspipeline, die Aufrufe zur Entitätserkennung, Entitätsverknüpfung, Schlüsselbegriffserkennung, Stimmungsanalyse, Sprachenerkennung und Erkennung personenbezogener Daten an eine Azure KI Language-Ressource sendet, gelten Datengrenzwerte. Die maximale Größe eines Datensatzes beträgt 50.000 Zeichen (gemessen durch String.Length). Wenn Sie Ihre Daten teilen müssen, bevor Sie sie an das Stimmungsanalysetool senden, verwenden Sie den Skill „Text teilen“.

Drosselungsgrenzen

API-Anforderungen werden gedrosselt, wenn das System sich der Spitzenkapazität nähert. Die Drosselung verhält sich für verschiedene APIs unterschiedlich. Abfrage-APIs (Suchen/Vorschlagen/AutoVervollständigen) und Indizierungs-APIs drosseln dynamisch basierend auf der Last des Diensts. Index-APIs und Dienstvorgangs-APIs verfügen über statische Grenzwerte für Anforderungsraten.

Statische Grenzwerte für Anforderungsraten für Indexvorgänge:

  • Indizes auflisten (GET /indexes): 3 pro Sekunde pro Sucheinheit
  • Index abrufen (GET /indexes/myindex): 10 pro Sekunde pro Sucheinheit
  • Index erstellen (POST /Indizes): 12 pro Minute pro Sucheinheit
  • Index erstellen oder aktualisieren (PUT /indexes/myindex): 6 pro Sekunde pro Sucheinheit
  • Index löschen (DELETE /indexes/myindex): 12 pro Minute pro Sucheinheit

Statische Grenzwerte für Anforderungsraten für Vorgänge in Bezug auf einen Dienst:

  • Dienststatistiken (GET /servicestats): 4 pro Sekunde pro Sucheinheit

API-Anforderungsgrenzwerte

  • Maximal 16 MB pro Anforderung 1
  • Maximale URL-Länge von 8 KB
  • Maximal 1.000 Dokumente pro Batch von Hochlade-, Zusammenführungs- oder Löschvorgängen für Indizes
  • Maximal 32 Felder in $orderby-Klausel
  • Maximal 100.000 Zeichen in einer Suchklausel
  • Die maximale Anzahl von Klauseln in search (durch AND oder OR getrennte Ausdrücke) beträgt 1.024.
  • Maximale Suchbegriffgröße ist 32.766 Byte (32 KB minus 2 Bytes) von UTF-8-codiertem Text
  • Die maximale Suchbegriffgröße beträgt 1.000 Zeichen für die Präfixsuche und die Suche von regulären Ausdrücken
  • Die Platzhaltersuche und die Suche nach regulären Ausdrücken sind bei der Verarbeitung durch Lucene auf maximal 1.000 Zustände beschränkt.

1 In Azure KI Search darf der Inhalt einer Anforderung nicht größer als 16 MB sein. Dies beschränkt möglicherweise den Inhalt einzelner Felder oder Sammlungen, für die keine anderen theoretischen Beschränkungen gelten. (Weitere Informationen zur Feldzusammensetzung und den Beschränkungen finden Sie unter Unterstützte Datentypen).

Die Abfragegröße und -zusammensetzung sind begrenzt, da unbegrenzte Abfragen Ihren Suchdienst destabilisieren können. In der Regel werden solche Abfragen programmgesteuert erstellt. Wenn Ihre Anwendung programmgesteuert Suchabfragen generiert, sollten Sie durch den Entwurf sicherstellen, dass sie keine Abfragen von unbegrenzter Größe erzeugt.

API-Antwortengrenzwerte

  • Maximale Rückgabe von 1.000 Dokumenten pro Seite mit Suchergebnissen
  • Maximale Rückgabe von 100 Vorschlägen pro Anforderung der Vorschlags-API

API-Schlüsselgrenzwerte

API-Schlüssel werden für die Dienstauthentifizierung verwendet. Es gibt zwei Arten. Administratorschlüssel werden im Anforderungsheader angegeben und gewähren vollständigen Lese-und Schreibzugriff für den Dienst. Abfrageschlüssel sind schreibgeschützt, die in der URL angegeben und normalerweise an Clientanwendungen verteilt werden.

  • Maximal 2 Administratorschlüssel pro Dienst
  • Maximal 50 Abfrageschlüssel pro Dienst