Dienstkontingente und Limits
Dieser Inhalt gilt für:Version 4.0 (Vorschau) | Vorherige Versionen:3.1 (allgemein verfügbar)3.0 (allgemein verfügbar)
Dieser Inhalt gilt für:v2.1 | Neueste Version:v4.0 (Vorschau)
Dieser Artikel enthält eine Kurzübersicht und eine ausführliche Beschreibung der Kontingente und Grenzwerte für den Azure KI Dokument Intelligenz-Dienst für alle Tarife. Außerdem finden Sie hier einige bewährte Methoden zur Vermeidung der Anforderungsdrosselung.
Modellverwendung
Unterstützte Dokumenttypen | Lesen | Layout | Vordefinierte Modelle | Benutzerdefinierte Modelle | Add-On-Funktionen |
---|---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
Bilder: JPEG/JPG , PNG , BMP , TIFF , HEIF |
✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX , PPTX , XLS |
✔️ | ✔️ | ✖️ | ✖️ | ✖️ |
✔️ = unterstützt ✖️ = Nicht unterstützt
Unterstützte Dokumenttypen | Lesen | Layout | Vordefinierte Modelle | Benutzerdefinierte Modelle |
---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | |
Bilder: JPEG/JPG , PNG , BMP , TIFF , HEIF |
✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX , PPTX , XLS |
✔️ | ✖️ | ✖️ | ✖️ |
✔️ = unterstützt ✖️ = Nicht unterstützt
Kontingent | Free (F0)1 | Standard (S0) |
---|---|---|
Transaktionen pro Sekunde (TPS) – Grenzwert | 1 | 15 (Standardwert) |
Anpassbar | Nein | Ja 2 |
Max. Dokumentgröße | 4 MB | 500 MB |
Anpassbar | Nein | Nein |
Max. Anzahl von Seiten (Analyse) | 2 | 2000 |
Anpassbar | Nein | Nein |
Max. Größe der Bezeichnungsdatei | 10 MB | 10 MB |
Anpassbar | Nein | Nein |
Max. Größe der OCR-JSON-Antwort | 500 MB | 500 MB |
Anpassbar | Nein | Nein |
Maximale Anzahl von Vorlagenmodellen | 500 | 5.000 |
Anpassbar | Nein | Nein |
Maximale Anzahl von neuronalen Modellen | 100 | 500 |
Anpassbar | Nein | Nein |
Nutzung des benutzerdefinierten Modells
Kontingent | Free (F0) 1 | Standard (S0) |
---|---|---|
Grenzwert beim Zusammenstellen des Modells | 5 | 200 (Standardwert) |
Anpassbar | Nein | Nein |
Größe des Trainingsdatasets * Neuronal | 1 GB 3 | 1 GB (Standardwert) |
Anpassbar | Nein | Nein |
Größe des Trainingsdatasets* Vorlage | 50 MB 4 | 50 MB (Standardwert) |
Anpassbar | Nein | Nein |
Max. Anzahl von Seiten (Training) * Vorlage | 500 | 500 (Standardwert) |
Anpassbar | Nein | Nein |
Max. Anzahl von Seiten (Training) * Neuronal | 50.000 | 50.000 (Standardwert) |
Anpassbar | Nein | Nein |
Trainieren benutzerdefinierter neuronaler Modelle | 10 pro Monat | 20 USD pro Monat |
Anpassbar | Nein | Ja3 |
Max. Anzahl von Seiten (Training) * Klassifizierer | 10.000 | 10 000 (Standardwert) |
Anpassbar | Nein | Nein |
Maximale Anzahl von Dokumenttypen (Klassen) * Klassifizierer | 500 | 500 (Standardwert) |
Anpassbar | Nein | Nein |
Größe des Trainingsdatasets * Klassifizierer | 1 GB | 1 GB (Standardwert) |
Anpassbar | Nein | Nein |
Minimale Anzahl von Stichproben pro Klasse * Klassifizierer | 5 | 5 (Standardwert) |
Anpassbar | Nein | Nein |
Grenzwerte für benutzerdefinierte Modelle
Kontingent | Free (F0) 1 | Standard (S0) |
---|---|---|
Grenzwert beim Zusammenstellen des Modells | 5 | 200 (Standardwert) |
Anpassbar | Nein | Nein |
Größe des Trainingsdatasets | 50 MB | 50 MB (Standardwert) |
Anpassbar | Nein | Nein |
Max. Anzahl von Seiten (Training) | 500 | 500 (Standardwert) |
Anpassbar | Nein | Nein |
1 Für den Free (F0)-Tarif siehe auch monatliche Freibeträge auf der Preisseite.
2 Siehe bewährte Methoden und [Anpassungsanweisungen(#create-and-submit-support-request).
3 Die Trainingsanzahl neuronaler Modelle wird jeden Kalendermonat zurückgesetzt. Öffnen Sie eine Supportanfrage, um den monatlichen Grenzwert für das Training zu erhöhen.
4 Dieser Grenzwert gilt für alle Dokumente, die vor allen Aktualisierungen im Zusammenhang mit Bezeichnungen im Ordner Ihres Trainingsdatasets gefunden wurden.
Ausführliche Beschreibung, Kontingentanpassung und bewährte Methoden
Überprüfen Sie vor dem Anfordern einer Kontingenterhöhung (sofern zutreffend), dass sie wirklich erforderlich ist. Der Dokument Intelligenz-Dienst nutzt die automatische Skalierung, um die erforderlichen Computeressourcen on-demand
bereitzustellen, die Kosten für Kunden niedrig zu halten und die Bereitstellung nicht genutzter Ressourcen aufzuheben, indem keine übermäßige Hardwarekapazität beibehalten wird.
Wenn Ihre Anwendung den Antwortcode 429 (Zu viele Anforderungen) zurückgibt, obwohl sich Ihre Workload innerhalb der definierten Grenzwerte bewegt, liegt das wahrscheinlich daran, dass der Dienst für Ihren Bedarf hochskaliert wird und die erforderliche Skalierung noch erreichen muss. Daher verfügt der Dienst nicht sofort über genügend Ressourcen, um die Anforderung zu erfüllen. Dieser Zustand ist vorübergehend und sollte nicht lange anhalten.
Allgemeine bewährte Methoden zur Behandlung der Drosselung während der automatischen Skalierung
Verwenden Sie die folgenden Techniken, um Probleme im Zusammenhang mit der Drosselung (Antwortcode 429) zu vermeiden:
- Implementieren Sie eine Wiederholungslogik in der Anwendung.
- Vermeiden Sie plötzliche Änderungen bei der Arbeitsauslastung. Erhöhen Sie die Arbeitsauslastung nach und nach.
Beispiel: Bei Ihrer Anwendung wird Dokument Intelligenz verwendet, und die aktuelle Workload liegt bei 10 TPS (Transaktionen pro Sekunde). In der nächsten Sekunde erhöhen Sie die Last auf 40 TPS (also das Vierfache). Der Dienst beginnt sofort mit dem Hochskalieren, um die neue Last bewältigen zu können, aber wahrscheinlich schafft er es nicht innerhalb einer Sekunde, so dass einige der Anfragen den Antwortcode 429 erhalten.
In den nächsten Abschnitten werden bestimmte Kontingentanpassungsfälle beschrieben. Wechseln Sie zu Dokument Intelligenz: Erhöhen des Grenzwerts für gleichzeitige Anforderungen.
Erhöhen des Anforderungsgrenzwerts für Transaktionen pro Sekunde
Standardmäßig ist die Anzahl der Transaktionen pro Sekunde (TPS) für eine Dokument Intelligenz-Ressource auf 15 TPS begrenzt. Im Tarif „Standard“ kann diese Anzahl erhöht werden. Machen Sie sich vor dem Übermitteln der Anforderung mit dem Material in diesem Abschnitt und mit diesen bewährten Methoden vertraut.
Eine Erhöhung des Grenzwerts für gleichzeitige Anforderungen wirkt sich nicht direkt auf Ihre Kosten aus. Dokument Intelligenz zahlen Sie nur für Ihre tatsächliche Nutzung. Der Grenzwert gibt an, wie hoch der Dienst skaliert werden kann, bevor Ihre Anforderungen gedrosselt werden.
Der vorhandene Wert des Parameters für den Grenzwert für gleichzeitige Anforderungen wird im Azure-Portal, in Befehlszeilentools und in API-Anforderungen nicht angezeigt. Erstellen Sie eine Azure-Supportanfrage, um den vorhandenen Wert zu überprüfen.
Wenn Sie Ihre Transaktionen pro Sekunde erhöhen möchten, können Sie die automatische Skalierung für Ihre Ressource aktivieren. Folgen Sie diesem Dokument, um die automatische Skalierung für Ihre Ressource zu aktivieren * Aktivieren der automatischen Skalierung. Sie können auch eine Supportanfrage zum Erhöhen der TPS senden.
Halten Sie die erforderlichen Informationen bereit
ID der Dokument Intelligenz-Ressource
Region
Abrufen der Informationen (Basismodell):
- Melden Sie sich beim Azure-Portal
- Wählen Sie die Dokument Intelligenz-Ressource aus, deren Transaktionsgrenzwert Sie erhöhen möchten.
- Wählen Sie Eigenschaften (Gruppe Ressourcenverwaltung) aus.
- Kopieren und speichern Sie die Werte der folgenden Felder:
- Ressourcen-ID
- Standort (Ihre Endpunktregion)
Erstellen und Übermitteln der Supportanfrage
Initiieren Sie die Erhöhung des TPS-Grenzwerts (Transaktionen pro Sekunde) für Ihre Ressource, indem Sie eine Supportanfrage übermitteln:
- Vergewissern Sie sich, dass Sie über die erforderlichen Informationen verfügen.
- Melden Sie sich beim Azure-Portal
- Wählen Sie die Dokument Intelligenz-Ressource aus, deren TPS-Grenzwert Sie erhöhen möchten.
- Wählen Sie Neue Supportanfrage (Gruppe Support + Problembehandlung) aus.
- Ein neues Fenster mit automatisch ausgefüllten Informationen zu Ihrem Azure-Abonnement und Ihrer Azure-Ressource erscheint
- Geben Sie eine Zusammenfassung ein, z. B. „TPS-Grenzwert von Dokument Intelligenz erhöhen“.
- Wählen Sie unter „Problemtyp“* die Option für die Kontingent- oder Verbrauchsprüfung aus.
- Wählen Sie Weiter: Lösungen aus.
- Fahren Sie mit der Anforderungserstellung fort.
- Geben Sie auf der Registerkarte Details die folgenden Informationen im Feld Beschreibung ein:
- Ein Hinweis, dass es sich bei der Anforderung um das Dokument Intelligenz-Kontingent handelt
- Geben Sie eine TPS-Erwartung an, auf die Sie skalieren möchten.
- Gesammelte Azure-Ressourceninformationen.
- Geben Sie die übrigen erforderlichen Informationen ein, und wählen Sie auf der Registerkarte Überprüfen + erstellen die Schaltfläche Erstellen aus.
- Notieren Sie sich die Nummer der Supportanfrage aus den Benachrichtigungen im Azure-Portal. Sie werden in Kürze zur weiteren Verarbeitung kontaktiert
Beispiel für eine bewährte Methode für Workloadmuster
Dieses Beispiel zeigt die empfohlene Vorgehensweise zur Vermeidung einer möglichen Drosselung im Rahmen der automatischen Skalierung. Dabei handelt es sich nicht um eine exakte Anleitung, sondern vielmehr um eine empfohlene Vorlage, die Sie nach Bedarf anpassen können.
Angenommen, für eine Dokument Intelligenz-Ressource wurde der Standardgrenzwert festgelegt. Starten Sie die Workload, um Ihre Analyseanforderungen zu übermitteln. Wenn Sie feststellen, dass eine häufige Drosselung mit dem Antwortcode 429 auftritt, sollten Sie zunächst ein exponentielles Backoff für die Antwortanforderung „GET analyze“ implementieren. Verwenden Sie beispielsweise eine zunehmend längere Wartezeit zwischen Wiederholungsversuchen für aufeinanderfolgende Fehlerantworten, z. B. das Muster „2-5-13-34“ für Verzögerungen zwischen Anfragen. Im Allgemeinen empfehlen wir, die „GET analyze“-Antwort nicht häufiger als einmal alle zwei Sekunden für eine entsprechende POST-Anforderung aufzurufen.
Wenn Sie feststellen, dass die Anzahl der POST-Anforderungen für übermittelte Dokumente gedrosselt wird, sollten Sie eine Verzögerung zwischen den Anforderungen hinzufügen. Wenn Ihre Workload ein höheres Maß an gleichzeitiger Verarbeitung erfordert, müssen Sie eine Supportanfrage erstellen, um Ihre Dienstgrenzwerte für Transaktionen pro Sekunde zu erhöhen.
Im Allgemeinen empfehlen wir, die Arbeitsauslastung und die Arbeitsauslastungsmuster vor dem Produktionseinsatz zu testen.
Nächste Schritte
Feedback
https://aka.ms/ContentUserFeedback.
Bald verfügbar: Im Laufe des Jahres 2024 werden wir GitHub-Tickets als Feedbackmechanismus für Inhalte auslaufen lassen und es durch ein neues Feedbacksystem ersetzen. Weitere Informationen finden Sie unter:Einreichen und Feedback anzeigen für