Azure OpenAI Überwachungsdatenreferenz

Artikel
10/21/2024

Dieser Artikel enthält alle Referenzinformationen zur Überwachung dieses Dienstes.

Details zu den Daten, die Sie für den Azure OpenAI-Dienst sammeln können, finden Sie unter "Überwachen von Azure OpenAI " und deren Verwendung.

Metriken

In diesem Abschnitt werden alle automatisch erfassten Plattformmetriken für diesen Dienst aufgeführt. Diese Metriken sind auch Teil der globalen Liste aller in Azure Monitor unterstützten Plattformmetriken.

Informationen zur Aufbewahrung von Metriken finden Sie unter Überblick über Metriken in Azure Monitor.

Unterstützte Metriken für Microsoft.CognitiveServices/Accounts

Hier sind die wichtigsten Metriken, die wir für Azure OpenAI überwachen sollten. Später in diesem Artikel finden Sie eine längere Liste aller verfügbaren Azure AI-Dienstmetriken, die weitere Details zu Metriken in dieser kürzeren Liste enthalten.

Azure OpenAI-Anforderungen
Aktive Token
Generierte Abschlusstoken
Verarbeitete FineTuned-Trainingsstunden
Verarbeitete Rückschlusstoken
Verarbeitete Eingabeaufforderungstoken
Bereitgestellte verwaltete Auslastung V2
Übereinstimmungsrate für den Eingabeaufforderungstokencache
Zeit für Antwort
Zeit zwischen Token

Sie können auch Inhaltssicherheitsmetriken überwachen, die von anderen Azure AI-Diensten verwendet werden.

Blockiertes Volume
Schädliches Volume erkannt
Potenzielle Missbräuchliche Benutzeranzahl
Safety System-Ereignis
Gesamtvolumen, das zur Sicherheitsüberprüfung gesendet wurde

Hinweis

Die Metrik Provisioned-managed Utilization ist jetzt veraltet und wird nicht mehr empfohlen. Diese Metrik wurde durch die Metrik Provisioned-managed Utilization V2 ersetzt.

Cognitive Services-Metriken weisen die Kategorie Cognitive Services - HTTP-Anforderungen in der folgenden Tabelle auf. Diese Metriken sind Legacymetriken, die allen Azure AI Services-Ressourcen gemeinsam sind. Microsoft empfiehlt nicht mehr, diese Metriken mit Azure OpenAI zu verwenden.

In der folgenden Tabelle sind die Metriken aufgeführt, die für den Ressourcentyp "Microsoft.CognitiveServices/accounts" verfügbar sind.

Möglicherweise sind nicht alle Spalten in jeder Tabelle vorhanden.
Einige Spalten können über den Anzeigebereich der Seite hinausgehen. Wählen Sie Tabelle erweitern aus, um alle verfügbaren Spalten anzuzeigen.

Tabellenüberschriften

Kategorie – Die Metrikgruppe oder -klassifizierung.
Metrik – Der Anzeigename der Metrik, wie er im Azure-Portal angezeigt wird.
Name in REST-API: Der Metrikname im REST-API
Einheit – Abrechnungseinheit.
Aggregation – Der Standard-Aggregationstyp. Gültige Werte: Mittelwert (Avg), Minimum (Min), Maximum (Max), Gesamt (Sum), Anzahl
Dimensionen - Für die Metrik verfügbare Dimensionen.
Aggregationsintervall - Intervalle, in denen die Metrik gesampelt wird. PT1M bedeutet zum Beispiel, dass die Metrik jede Minute abgerufen wird, PT30M alle 30 Minuten, PT1H jede Stunde usw.
DS-Export – Gibt an, ob die Metrik über Diagnose-Einstellungen in Azure Monitor-Protokolle exportiert werden kann. Informationen zum Exportieren von Metriken finden Sie unter Diagnoseeinstellungen in Azure Monitor erstellen.

Kategorie	Metrik	Name in der REST-API	Einheit	Aggregation	Dimensionen	Aggregationsintervalle	DS-Export
Auftreten von Features	Aktionsfeatureinstanzen Gibt an, wie häufig jedes Aktionsfeature ausgeführt wird.	`ActionFeatureIdOccurrences`	Anzahl	Gesamt (Summe)	`FeatureId`, `ModeRunId`	PT1M	Ja
Features pro Ereignis	Aktionsfeatures pro Ereignis Durchschnittliche Anzahl von Aktionsfeatures pro Ereignis.	`ActionFeaturesPerEvent`	Anzahl	Average	`Mode`, `RunId`	PT1M	Ja
Aktionen	Auftreten von Aktionen Gibt an, wie häufig jede Aktion ausgeführt wird.	`ActionIdOccurrences`	Anzahl	Gesamt (Summe)	`ActionId`, `ModeRunId`	PT1M	Ja
Namespaces pro Ereignis	Aktionsnamespaces pro Ereignis Durchschnittliche Anzahl von Aktionsnamespaces pro Ereignis.	`ActionNamespacesPerEvent`	Anzahl	Average	`Mode`, `RunId`	PT1M	Ja
Aktionen	Aktionen pro Ereignis Anzahl von Aktionen pro Ereignis.	`ActionsPerEvent`	Anzahl	Average	`Mode`, `RunId`	PT1M	Ja
Azure OpenAI – Verwendung	Aktive Token Gesamtzahl der Token abzüglich der zwischengespeicherten Token über einen bestimmten Zeitraum. Gilt für PTU und PTU-verwaltete Bereitstellungen. Verwenden Sie diese Metrik, um ihre TPS- oder TPM-basierte Auslastung für PTUs zu verstehen und mit Ihren Benchmarks für Ziel-TPS oder -TPM für Ihre Szenarien zu vergleichen. Um API-Anforderungen aufzuschlüsseln, können Sie einen Filter hinzufügen oder die Aufteilung anhand der folgenden Dimensionen anwenden: ModelDeploymentName, ModelName und ModelVersion.	`ActiveTokens`	Anzahl	Minimum, Maximum, Average, Total (Summe)	`Region`, , `ModelDeploymentNameModelNameModelVersion`	PT1M	Ja
SpeechServices – Verwendung	Audio Sekunden transkribiert Anzahl der transkribierten Sekunden	`AudioSecondsTranscribed`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
SpeechServices – Verwendung	Übersetzte Audio sekunden Anzahl der übersetzten Sekunden	`AudioSecondsTranslated`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
SpeechServices – Verwendung	Hostingsekunden des Avatarmodells Anzahl der Sekunden.	`AvatarModelHostingSeconds`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Azure OpenAI – HTTP-Anforderungen	Übereinstimmungsrate für den Eingabeaufforderungstokencache Der Prozentsatz der Eingabeaufforderungstoken trifft auf den Cache, der für PTU verwaltet werden kann.	`AzureOpenAIContextTokensCacheMatchRate`	Percent	Minimum, Maximum, Mittelwert	`Region`, , `ModelDeploymentNameModelNameModelVersion`	PT1M	No
Azure OpenAI – Verwendung	Bereitstellungsverwaltete Nutzung Auslastung % für eine provisoned-verwaltete Bereitstellung, berechnet als (PTUs verbraucht / PTUs bereitgestellt) x 100. Wenn die Auslastung größer oder gleich 100 % ist, werden Aufrufe gedrosselt und der Fehlercode 429 zurückgegeben. Um diese Metrik aufzuschlüsseln, können Sie einen Filter hinzufügen oder durch die folgenden Dimensionen aufteilen: ModelDeploymentName, ModelName, ModelVersion und StreamType (Streaming vs Non-Streaming Requests)	`AzureOpenAIProvisionedManagedUtilization`	Percent	Minimum, Maximum, Mittelwert	`Region`, , `StreamTypeModelDeploymentName`, , `ModelNameModelVersion`	PT1M	No
Azure OpenAI – Verwendung	Bereitgestellte verwaltete Auslastung V2 Auslastung % für eine provisoned-verwaltete Bereitstellung, berechnet als (PTUs verbraucht / PTUs bereitgestellt) x 100. Wenn die Auslastung größer oder gleich 100 % ist, werden Aufrufe gedrosselt und der Fehlercode 429 zurückgegeben. Um diese Metrik aufzuschlüsseln, können Sie einen Filter hinzufügen oder durch die folgenden Dimensionen aufteilen: ModelDeploymentName, ModelName, ModelVersion und StreamType (Streaming vs Non-Streaming Requests)	`AzureOpenAIProvisionedManagedUtilizationV2`	Percent	Minimum, Maximum, Mittelwert	`Region`, , `StreamTypeModelDeploymentName`, , `ModelNameModelVersion`	PT1M	No
Azure OpenAI – HTTP-Anforderungen	Azure OpenAI-Anforderungen Anzahl der Aufrufe an die Azure OpenAI-API über einen bestimmten Zeitraum. Gilt für PTU-, PTU-verwaltete und pay-as-you-go-Bereitstellungen. Um API-Anforderungen aufzuschlüsseln, können Sie einen Filter hinzufügen oder die Aufteilung anhand der folgenden Dimensionen anwenden: ModelDeploymentName, ModelName, ModelVersion, StatusCode (erfolgreich, Clientfehler, Serverfehler), StreamType (Streaming vs non-streaming requests) und Operation.	`AzureOpenAIRequests`	Anzahl	Gesamt (Summe)	`ApiName`, , `OperationNameRegion`, `StreamType`, `ModelDeploymentName`, `ModelName`, , `ModelVersionStatusCode`	PT1M	Ja
Azure OpenAI – HTTP-Anforderungen	Zeit für Antwort Empfohlenes Maß für die Latenzzeit (Reaktionszeit) bei Streaming-Anforderungen. Gilt für PTU und PTU-verwaltete Bereitstellungen. Wird berechnet als Zeit, die benötigt wird, bis die erste Antwort erscheint, nachdem eine Benutzerin einen Prompt gesendet hat, wie vom API-Gateway gemessen. Diese Zahl erhöht sich, wenn die Prompt-Größe zunimmt und/oder die Cachetreffergröße abnimmt. Um die Zeit für die Reaktionsmetrik aufzuschlüsseln, können Sie einen Filter hinzufügen oder die Aufteilung durch die folgenden Dimensionen anwenden: ModelDeploymentName, ModelName und ModelVersion. Hinweis: Bei dieser Metrik handelt es sich um einen Näherungswert, da die gemessene Latenz stark von mehreren Faktoren abhängt, einschließlich gleichzeitiger Anrufe und des gesamten Workload-Musters. Darüber hinaus wird keine clientseitige Latenz berücksichtigt, die zwischen Ihrem Client und dem API-Endpunkt bestehen kann. Bitte beachten Sie Ihre eigene Protokollierung für eine optimale Latenzverfolgung.	`AzureOpenAITimeToResponse`	Millisekunden	Minimum, Maximum, Mittelwert	`ApiName`, , `OperationNameRegion`, `StreamType`, `ModelDeploymentName`, `ModelName`, , `ModelVersionStatusCode`	PT1M	Ja
Slots	Baseline Estimator Overall Rewards Gesamtbelohnung für Baseline-Schätzung.	`BaselineEstimatorOverallReward`	Anzahl	Average	`Mode`, `RunId`	PT1M	Ja
Slots	Baseline Estimator Slot Rewards Baselineschätzung-Belohnung nach Slot.	`BaselineEstimatorSlotReward`	Anzahl	Average	`SlotId`, , `SlotIndexModeRunId`	PT1M	Ja
Slots	Geplante zufällige Schätzwert-Gesamtprämie Gesamtbelohnung für Baseline-Zufallsschätzung.	`BaselineRandomEstimatorOverallReward`	Anzahl	Average	`Mode`, `RunId`	PT1M	Ja
Slots	Baseline Random Estimator Slot Rewards Baseline-Zufallsschätzung-Belohnung nach Slot.	`BaselineRandomEstimatorSlotReward`	Anzahl	Average	`SlotId`, , `SlotIndexModeRunId`	PT1M	Ja
Schätzungen	Geplante Zufallsereignisanzahl Geschätzte Anzahl der zufälligen Baselineereignisse.	`BaselineRandomEventCount`	Anzahl	Gesamt (Summe)	`Mode`, `RunId`	PT1M	Ja
Schätzungen	Geplante zufällige Belohnung Schätzung der zufälligen Baselinebelohnung.	`BaselineRandomReward`	Anzahl	Gesamt (Summe)	`Mode`, `RunId`	PT1M	Ja
Cognitive Services – HTTP-Anforderungen	Blockierte Anrufe Anzahl von Aufrufen, die das Raten- oder Kontingentlimit überschritten haben Verwenden Sie nicht für den Azure OpenAI-Dienst.	`BlockedCalls`	Anzahl	Gesamt (Summe)	`ApiName`, , `OperationNameRegionRatelimitKey`	PT1M	Ja
Verbrauch	Rückschlussanzahl Rückschlussanzahl des Carnegie Frontdoor-Diensts	`CarnegieInferenceCount`	Anzahl	Gesamt (Summe)	`Region`, , `ModalityCategory`, `Language`, , `SeverityLevelUseCustomList`	PT1M	Ja
Verbrauch	Trainierte Zeichen (veraltet) Gesamtzahl trainierter Zeichen	`CharactersTrained`	Anzahl	Gesamt (Summe)	`ApiName`, `OperationNameRegion`	PT1M	Ja
Verbrauch	Übersetzte Zeichen (veraltet) Gesamtanzahl von Zeichen in einer eingehenden Textanforderung	`CharactersTranslated`	Anzahl	Gesamt (Summe)	`ApiName`, `OperationNameRegion`	PT1M	Ja
Cognitive Services – HTTP-Anforderungen	Clientfehler Anzahl von Aufrufen mit Fehler auf Clientseite (HTTP-Antwortcode 4xx) Verwenden Sie nicht für den Azure OpenAI-Dienst.	`ClientErrors`	Anzahl	Gesamt (Summe)	`ApiName`, , `OperationNameRegionRatelimitKey`	PT1M	Ja
Verbrauch	maschinelles Sehen Transaktionen Anzahl der Transaktionen für maschinelles Sehen	`ComputerVisionTransactions`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
ContentSafety – Nutzung	Anrufanzahl für Bildmoderation Anzahl der Aufrufe für die Bildmoderation.	`ContentSafetyImageAnalyzeRequestCount`	Anzahl	Gesamt (Summe)	`ApiVersion`	PT1M	Ja
ContentSafety – Nutzung	Anrufanzahl für Textmoderation Anzahl der Aufrufe für die Textmoderation.	`ContentSafetyTextAnalyzeRequestCount`	Anzahl	Gesamt (Summe)	`ApiVersion`	PT1M	Ja
Auftreten von Features	Vorkommen des Kontextfeatures Gibt an, wie häufig jedes Kontextfeature ausgeführt wird.	`ContextFeatureIdOccurrences`	Anzahl	Gesamt (Summe)	`FeatureId`, `ModeRunId`	PT1M	Ja
Features pro Ereignis	Kontextfeatures pro Ereignis Anzahl der Kontextfeatures pro Ereignis.	`ContextFeaturesPerEvent`	Anzahl	Average	`Mode`, `RunId`	PT1M	Ja
Namespaces pro Ereignis	Kontextnamespaces pro Ereignis Anzahl der Kontextnamespaces pro Ereignis.	`ContextNamespacesPerEvent`	Anzahl	Average	`Mode`, `RunId`	PT1M	Ja
Verbrauch	Benutzerdefinierte Vision-Schulungszeit Trainingszeit für Custom Vision	`CustomVisionTrainingTime`	Sekunden	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Verbrauch	Benutzerdefinierte Vision-Transaktionen Anzahl der Vorhersagetransaktionen für Custom Vision	`CustomVisionTransactions`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Cognitive Services – HTTP-Anforderungen	Eingehende Daten Menge eingehender Daten in Byte Verwenden Sie nicht für den Azure OpenAI-Dienst.	`DataIn`	Byte	Gesamt (Summe)	`ApiName`, `OperationNameRegion`	PT1M	Ja
Cognitive Services – HTTP-Anforderungen	Ausgehende Daten Menge ausgehender Daten in Byte Verwenden Sie nicht für den Azure OpenAI-Dienst.	`DataOut`	Byte	Gesamt (Summe)	`ApiName`, `OperationNameRegion`	PT1M	Ja
Verbrauch	Übersetzte Dokumentzeichen Anzahl der Zeichen in einer Dokumentübersetzungsanforderung	`DocumentCharactersTranslated`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Verbrauch	Übersetzte benutzerdefinierte Zeichen für Dokumente Anzahl der Zeichen in einer Anforderung zur benutzerdefinierten Dokumentübersetzung	`DocumentCustomCharactersTranslated`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Verbrauch	Gesichtsbilder trainiert Anzahl der trainierten Bilder; 1\.000 Bilder pro Transaktion trainiert	`FaceImagesTrained`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Verbrauch	Gespeicherte Gesichter Anzahl der gespeicherten Gesichter, wird täglich anteilig berechnet; die Anzahl der gespeicherten Gesichter wird täglich gemeldet	`FacesStored`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Verbrauch	Transaktionen im Gesicht Anzahl der API-Aufrufe an den Gesichtserkennungsdienst	`FaceTransactions`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
FeatureCardinalität	Featurekardinalität nach Aktion Featurekardinalität basierend auf der Aktion.	`FeatureCardinality_Action`	Anzahl	Average	`FeatureId`, `ModeRunId`	PT1M	Ja
FeatureCardinalität	Featurekardinalität nach Kontext Featurekardinalität basierend auf dem Kontext.	`FeatureCardinality_Context`	Anzahl	Average	`FeatureId`, `ModeRunId`	PT1M	Ja
FeatureCardinalität	Feature-Kardinalität nach Slot Featurekardinalität basierend auf dem Slot.	`FeatureCardinality_Slot`	Anzahl	Average	`FeatureId`, `ModeRunId`	PT1M	Ja
Azure OpenAI – Verwendung	Verarbeitete Feinabstimmungsschulungsstunden Anzahl der in einem OpenAI FineTuned-Modell verarbeiteten Trainingsstunden	`FineTunedTrainingHours`	Anzahl	Gesamt (Summe)	`ApiName`, , `ModelDeploymentNameFeatureName`, , `UsageChannelRegion`	PT1M	Ja
Azure OpenAI – Verwendung	Generierte Abschlusstoken Anzahl der von einem OpenAI-Modell generierten Token (Ausgabe). Gilt für PTU-, PTU-verwaltete und pay-as-you-go-Bereitstellungen. Um diese Metrik aufzuschlüsseln, können Sie einen Filter hinzufügen oder durch die folgenden Dimensionen aufteilen: ModelDeploymentName und ModelName.	`GeneratedTokens`	Anzahl	Gesamt (Summe)	`ApiName`, , `ModelDeploymentNameFeatureName`, `UsageChannel`, , `RegionModelVersion`	PT1M	Ja
Verbrauch	Gespeicherte Bilder Anzahl der in Custom Vision gespeicherten Bilder	`ImagesStored`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Cognitive Services – HTTP-Anforderungen	Latenz Latenz in Millisekunden Verwenden Sie nicht für den Azure OpenAI-Dienst.	`Latency`	Millisekunden	Average	`ApiName`, , `OperationNameRegionRatelimitKey`	PT1M	Ja
Verbrauch	Gelernte Ereignisse Anzahl erfasster Ereignisse.	`LearnedEvents`	Anzahl	Gesamt (Summe)	`IsMatchBaseline`, `ModeRunId`	PT1M	Ja
Verbrauch	LUIS-Sprachanforderungen Anzahl der LUIS-Anforderungen zum Verstehen der Sprach-Absichts-Umsetzung	`LUISSpeechRequests`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Verbrauch	LUIS-Textanforderungen Anzahl der LUIS-Textanforderungen	`LUISTextRequests`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Verbrauch	Abgeglichene Prämien Anzahl übereinstimmender Belohnungen.	`MatchedRewards`	Anzahl	Gesamt (Summe)	`Mode`, `RunId`	PT1M	Ja
Verbrauch	Nicht aktivierte Ereignisse Anzahl von übersprungenen Ereignissen.	`NonActivatedEvents`	Anzahl	Gesamt (Summe)	`Mode`, `RunId`	PT1M	Ja
Slots	Slots Anzahl der Slots pro Ereignis.	`NumberOfSlots`	Anzahl	Average	`Mode`, `RunId`	PT1M	Ja
SpeechServices – Verwendung	Anzahl der Sprecherprofile Anzahl der registrierten Sprecherprofile; wird anteilig stündlich berechnet	`NumberofSpeakerProfiles`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Verbrauch	Beobachtete Belohnungen Anzahl beobachteter Belohnungen.	`ObservedRewards`	Anzahl	Gesamt (Summe)	`Mode`, `RunId`	PT1M	Ja
Verbrauch	Übersetzte Dokumentsynchronisierungszeichen Anzahl der Zeichen in dokumentübersetzungsanforderung (synchron).	`OneDocumentCharactersTranslated`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Slots	Online-Schätzer Gesamtprämie Gesamtbelohnung für Online-Schätzung.	`OnlineEstimatorOverallReward`	Anzahl	Average	`Mode`, `RunId`	PT1M	Ja
Slots	Online-Schätzplatz-Belohnung Onlineschätzung-Belohnung nach Slot.	`OnlineEstimatorSlotReward`	Anzahl	Average	`SlotId`, , `SlotIndexModeRunId`	PT1M	Ja
Schätzungen	Onlineereignisanzahl Geschätzte Anzahl der Onlineereignisse.	`OnlineEventCount`	Anzahl	Gesamt (Summe)	`Mode`, `RunId`	PT1M	Ja
Schätzungen	Online-Belohnung Schätzung für Onlinebelohnung.	`OnlineReward`	Anzahl	Gesamt (Summe)	`Mode`, `RunId`	PT1M	Ja
Verbrauch	Verarbeitete Zeichen Anzahl der vom Immersive Reader verarbeiteten Zeichen	`ProcessedCharacters`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Verbrauch	Verarbeitete Integritätstextdatensätze Anzahl der verarbeiteten Textdatensätze zur Integrität	`ProcessedHealthTextRecords`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Verbrauch	Verarbeitete Bilder Anzahl der verarbeiteten Bilder	`ProcessedImages`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Verbrauch	Verarbeitete Seiten Anzahl der verarbeiteten Seiten	`ProcessedPages`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Azure OpenAI – Verwendung	Verarbeitete Aufforderungstoken Anzahl der in einem OpenAI-Modell verarbeiteten Eingabeaufforderungstoken (Eingabe). Gilt für PTU-, PTU-verwaltete und pay-as-you-go-Bereitstellungen. Um diese Metrik aufzuschlüsseln, können Sie einen Filter hinzufügen oder durch die folgenden Dimensionen aufteilen: ModelDeploymentName und ModelName.	`ProcessedPromptTokens`	Anzahl	Gesamt (Summe)	`ApiName`, , `ModelDeploymentNameFeatureName`, `UsageChannel`, , `RegionModelVersion`	PT1M	Ja
Verbrauch	Verarbeitete Textdatensätze Anzahl von Textdatensätzen.	`ProcessedTextRecords`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Verbrauch	QA-Texteinträge Anzahl der verarbeiteten Textdatensätze	`QuestionAnsweringTextRecords`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
ContentSafety – Risiken& Sicherheit	Anzahl potenziell missbräuchlicher Benutzer Die Anzahl der potenziell missbräuchlichen Benutzer, die über einen bestimmten Zeitraum erkannt wurden. Sie können einen Filter hinzufügen oder die Aufteilung durch die folgende Dimension anwenden: ModelDeploymentName.	`RAIAbusiveUsersCount`	Anzahl	Gesamt (Summe)	`Region`, `ModelDeploymentName`	PT1M	Ja
ContentSafety – Risiken& Sicherheit	Schädliches Volume erkannt Anzahl der Aufrufe an die Azure OpenAI-API und erkannt als schädlich (sowohl Blockmodell als auch Kommentarmodus) durch Inhaltsfilter, der über einen bestimmten Zeitraum angewendet wird. Sie können einen Filter hinzufügen oder die Aufteilung durch die folgenden Dimensionen anwenden: ModelDeploymentName, ModelName und TextType.	`RAIHarmfulRequests`	Anzahl	Gesamt (Summe)	`Region`, , `ModelDeploymentNameModelName`, `ModelVersion`, `ApiName`, `TextType`, , `CategorySeverity`	PT1M	Ja
ContentSafety – Risiken& Sicherheit	Blockiertes Volume Anzahl der Aufrufe an die Azure OpenAI-API und abgelehnt durch Inhaltsfilter, der über einen bestimmten Zeitraum angewendet wurde. Sie können einen Filter hinzufügen oder die Aufteilung durch die folgenden Dimensionen anwenden: ModelDeploymentName, ModelName und TextType.	`RAIRejectedRequests`	Anzahl	Gesamt (Summe)	`Region`, , `ModelDeploymentNameModelName`, `ModelVersion`, `ApiName`, , `TextTypeCategory`	PT1M	Ja
ContentSafety – Risiken& Sicherheit	Safety System-Ereignis Systemereignis für Risiko- und Sicherheitsüberwachung. Sie können einen Filter hinzufügen oder eine Aufteilung anwenden, indem Sie die folgende Dimension verwenden: EventType.	`RAISystemEvent`	Anzahl	Average	`Region`, `EventType`	PT1M	Ja
ContentSafety – Risiken& Sicherheit	Gesamtvolumen, das zur Sicherheitsüberprüfung gesendet wurde Anzahl der Aufrufe an die Azure OpenAI-API und erkannt durch Inhaltsfilter, der über einen bestimmten Zeitraum angewendet wird. Sie können einen Filter hinzufügen oder die Aufteilung durch die folgenden Dimensionen anwenden: ModelDeploymentName, ModelName.	`RAITotalRequests`	Anzahl	Gesamt (Summe)	`Region`, , `ModelDeploymentNameModelName`, , `ModelVersionApiName`	PT1M	Ja
Cognitive Services – HTTP-Anforderungen	Zinslimit Die aktuelle Ratenbegrenzung des Ratelimit-Schlüssels. Verwenden Sie nicht für den Azure OpenAI-Dienst.	`Ratelimit`	Anzahl	Gesamt (Summe)	`Region`, `RatelimitKey`	PT1M	Ja
Prämien	Durchschnittliche Belohnung pro Ereignis Durchschnittliche Belohnung pro Ereignis.	`Reward`	Anzahl	Average	`BaselineAction`, , `ChosenActionIdMatchesBaseline`, `NonDefaultReward`, , `ModeRunId`	PT1M	Ja
Cognitive Services – HTTP-Anforderungen	Serverfehler Anzahl von Aufrufen mit internem Dienstfehler (HTTP-Antwortcode 5xx) Verwenden Sie nicht für den Azure OpenAI-Dienst.	`ServerErrors`	Anzahl	Gesamt (Summe)	`ApiName`, , `OperationNameRegionRatelimitKey`	PT1M	Ja
Auftreten von Features	Steckplatzfunktionsinstanzen Gibt an, wie häufig jedes Slotfeature ausgeführt wird.	`SlotFeatureIdOccurrences`	Anzahl	Gesamt (Summe)	`FeatureId`, `ModeRunId`	PT1M	Ja
Features pro Ereignis	Slot-Features pro Ereignis Durchschnittliche Anzahl von Slotfeatures pro Ereignis.	`SlotFeaturesPerEvent`	Anzahl	Average	`Mode`, `RunId`	PT1M	Ja
Slots	Slot-Vorkommen Gibt an, wie häufig jeder Slot ausgeführt wird.	`SlotIdOccurrences`	Anzahl	Gesamt (Summe)	`SlotId`, , `SlotIndexModeRunId`	PT1M	Ja
Namespaces pro Ereignis	Slot-Namespaces pro Ereignis Durchschnittliche Anzahl von Slotnamespaces pro Ereignis.	`SlotNamespacesPerEvent`	Anzahl	Average	`Mode`, `RunId`	PT1M	Ja
Prämien	Slot-Belohnung Belohnung pro Slot.	`SlotReward`	Anzahl	Average	`BaselineActionId`, , `ChosenActionIdMatchesBaseline`, `NonDefaultReward`, `SlotId`, `SlotIndex`, , `ModeRunId`	PT1M	Ja
SpeechServices – Verwendung	Sprechererkennungstransaktionen Anzahl von Transaktionen zur Sprechererkennung	`SpeakerRecognitionTransactions`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
SpeechServices – Verwendung	Hostingstunden des Sprachmodells Anzahl der Hostingstunden des Sprachmodells	`SpeechModelHostingHours`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Verbrauch	Dauer der Sprachsitzung (veraltet) Gesamtdauer der Sprachsitzung in Sekunden	`SpeechSessionDuration`	Sekunden	Gesamt (Summe)	`ApiName`, `OperationNameRegion`	PT1M	Ja
Cognitive Services – HTTP-Anforderungen	Erfolgreiche Anrufe Anzahl erfolgreicher Aufrufe Verwenden Sie nicht für den Azure OpenAI-Dienst.	`SuccessfulCalls`	Anzahl	Gesamt (Summe)	`ApiName`, , `OperationNameRegionRatelimitKey`	PT1M	Ja
Cognitive Services - SLI	AvailabilityRate Verfügbarkeitsprozentsatz bei der folgenden Berechnung: (Aufrufe gesamt – Serverfehler)/Aufrufe gesamt. Serverfehler umfassen alle HTTP-Antworten >=500. Verwenden Sie nicht für den Azure OpenAI-Dienst.	`SuccessRate`	Percent	Minimum, Maximum, Mittelwert	`ApiName`, , `OperationNameRegionRatelimitKey`	PT1M	No
SpeechServices – Verwendung	Synthetisierte Zeichen Anzahl von Zeichen.	`SynthesizedCharacters`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Verbrauch	Übersetzte Textzeichen Anzahl der Zeichen in eingehenden Textübersetzungsanforderungen	`TextCharactersTranslated`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Verbrauch	Übersetzte benutzerdefinierte Textzeichen Anzahl der Zeichen in eingehenden benutzerdefinierten Textübersetzungsanforderungen	`TextCustomCharactersTranslated`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Verbrauch	Trainierte Textzeichen Anzahl der mithilfe der Textübersetzung trainierten Zeichen	`TextTrainedCharacters`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
Azure OpenAI – Verwendung	Verarbeitete Ableitungstoken Anzahl der in einem OpenAI-Modell verarbeiteten Ableitungstoken. Berechnet als Eingabeaufforderungstoken (Eingabe) plus generierten Token (Ausgabe). Gilt für PTU-, PTU-verwaltete und pay-as-you-go-Bereitstellungen. Um diese Metrik aufzuschlüsseln, können Sie einen Filter hinzufügen oder durch die folgenden Dimensionen aufteilen: ModelDeploymentName und ModelName.	`TokenTransaction`	Anzahl	Gesamt (Summe)	`ApiName`, , `ModelDeploymentNameFeatureName`, `UsageChannel`, , `RegionModelVersion`	PT1M	Ja
Cognitive Services – HTTP-Anforderungen	Gesamtanzahl der Anrufe Gesamtanzahl von Aufrufen Verwenden Sie nicht für den Azure OpenAI-Dienst.	`TotalCalls`	Anzahl	Gesamt (Summe)	`ApiName`, , `OperationNameRegionRatelimitKey`	PT1M	Ja
Cognitive Services – HTTP-Anforderungen	Fehler gesamt Gesamtzahl von Aufrufen mit Fehlerantwort (HTTP-Antwortcode 4xx oder 5xx) Verwenden Sie nicht für den Azure OpenAI-Dienst.	`TotalErrors`	Anzahl	Gesamt (Summe)	`ApiName`, , `OperationNameRegionRatelimitKey`	PT1M	Ja
Verbrauch	Ereignisse insgesamt Anzahl der Ereignisse.	`TotalEvents`	Anzahl	Gesamt (Summe)	`Mode`, `RunId`	PT1M	Ja
Cognitive Services – HTTP-Anforderungen	Tokenaufrufe insgesamt Gesamtanzahl von Tokenaufrufen	`TotalTokenCalls`	Anzahl	Gesamt (Summe)	`ApiName`, `OperationNameRegion`	PT1M	Ja
Verbrauch	Gesamtzahl der Transaktionen (veraltet) Gesamtanzahl von Transaktionen	`TotalTransactions`	Anzahl	Gesamt (Summe)	<none>	PT1M	Ja
Schätzungen	Anzahl der Benutzer baseline-Ereignisse Geschätzte Anzahl der benutzerdefinierten Baselineereignisse.	`UserBaselineEventCount`	Anzahl	Gesamt (Summe)	`Mode`, `RunId`	PT1M	Ja
Schätzungen	Benutzerbasisplan-Belohnung Schätzung der benutzerdefinierten Baselinebelohnung.	`UserBaselineReward`	Anzahl	Gesamt (Summe)	`Mode`, `RunId`	PT1M	Ja
SpeechServices – Verwendung	Synthetisierte Videosekunden Anzahl der synthetisierten Sekunden	`VideoSecondsSynthesized`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
SpeechServices – Verwendung	Hostingstunden des Stimmmodells Anzahl der Stunden.	`VoiceModelHostingHours`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja
SpeechServices – Verwendung	Trainingsminuten des Stimmmodells Anzahl der Minuten.	`VoiceModelTrainingMinutes`	Anzahl	Gesamt (Summe)	`ApiName`, , `FeatureNameUsageChannelRegion`	PT1M	Ja

Metrikdimensionen

Informationen darüber, was metrische Dimensionen sind, finden Sie unter Mehrdimensionale Metriken.

Bei diesem Dienst gelten die folgenden Dimensionen für die zugehörigen Metriken.

ApiName
FeatureName
ModelDeploymentName
ModelName
ModelVersion
Vorgangsname
Region
StatusCode
StreamType
UsageChannel

Ressourcenprotokolle

In diesem Abschnitt werden die Ressourcenprotokolltypen aufgeführt, die für diesen Service erfasst werden können. Der Abschnitt wird aus der Liste aller in Azure Monitor unterstützten Kategorietypen für Ressourcenprotokolle gezogen.

Unterstützte Ressourcenprotokolle für Microsoft.CognitiveServices/Konten

Kategorie	Anzeigename der Kategorie	Protokolltabelle	Unterstützt grundlegenden Protokollplan	Unterstützt die Erfassungszeittransformation	Exportkosten
`Audit`	Überwachungsprotokolle	AzureDiagnostics Protokolle aus mehreren Azure-Ressourcen.	No	Nr.	No
`RequestResponse`	Anforderungs- und Antwortprotokolle	AzureDiagnostics Protokolle aus mehreren Azure-Ressourcen.	No	Nr.	No
`Trace`	Ablaufverfolgungsprotokolle	AzureDiagnostics Protokolle aus mehreren Azure-Ressourcen.	No	Nr.	No

Tabellen in Azure Monitor-Protokollen

Dieser Abschnitt bezieht sich die für diesen Service relevanten Azure-Monitor-Protokolltabellen, die für die Abfrage durch Protokollanalyse mit Kusto-Abfragen zur Verfügung stehen. Diese Tabellen enthalten Ressourcenprotokolldaten und möglicherweise mehr, je nachdem, was erfasst und an sie weitergeleitet wird.

Azure OpenAI microsoft.cognitiveservices/accounts

Aktivitätsprotokoll

In der verknüpften Tabelle sind die Vorgänge aufgeführt, die im Aktivitätsprotokoll für diesen Dienst aufgezeichnet werden können. Diese Operationen sind eine Teilmenge aller möglichen Ressourcenanbietervorgänge im Aktivitätsprotokoll.

Weitere Informationen zum Schema von Aktivitätsprotokolleinträgen finden Sie unter Ereignisschema des Azure-Aktivitätsprotokolls.

AI + Machine Learning-Ressourcenanbietervorgänge

Eine Beschreibung der Überwachung von Azure OpenAI finden Sie unter Überwachen von Azure OpenAI .
Weitere Informationen zur Überwachung von Azure-Ressourcen finden Sie unter Überwachen von Azure-Ressourcen mit Azure Monitor.

Teilen über

Azure OpenAI Überwachungsdatenreferenz

Metriken

Unterstützte Metriken für Microsoft.CognitiveServices/Accounts

Metrikdimensionen

Ressourcenprotokolle

Unterstützte Ressourcenprotokolle für Microsoft.CognitiveServices/Konten

Tabellen in Azure Monitor-Protokollen

Azure OpenAI microsoft.cognitiveservices/accounts

Aktivitätsprotokoll

Feedback

Zusätzliche Ressourcen

Teilen über

Azure OpenAI Überwachungsdatenreferenz

Metriken

Unterstützte Metriken für Microsoft.CognitiveServices/Accounts

Metrikdimensionen

Ressourcenprotokolle

Unterstützte Ressourcenprotokolle für Microsoft.CognitiveServices/Konten

Tabellen in Azure Monitor-Protokollen

Azure OpenAI microsoft.cognitiveservices/accounts

Aktivitätsprotokoll

Zugehöriger Inhalt

Feedback

Zusätzliche Ressourcen