Monitorowanie usługi Azure OpenAI
Gdy masz aplikacje o krytycznym znaczeniu i procesy biznesowe, które opierają się na zasobach platformy Azure, chcesz monitorować te zasoby pod kątem ich dostępności, wydajności i działania.
W tym artykule opisano dane monitorowania generowane przez usługę Azure OpenAI Service. Azure OpenAI jest częścią usług Azure AI, które korzystają z usługi Azure Monitor. Jeśli nie znasz funkcji usługi Azure Monitor, które są wspólne dla wszystkich usług platformy Azure korzystających z tej usługi, zobacz Monitorowanie zasobów platformy Azure za pomocą usługi Azure Monitor.
Pulpity nawigacyjne
Usługa Azure OpenAI udostępnia gotowe pulpity nawigacyjne dla każdego zasobu usługi Azure OpenAI. Aby uzyskać dostęp do logowania się do https://portal.azure.com pulpitów nawigacyjnych monitorowania i wybrać okienko przeglądu dla jednego z zasobów usługi Azure OpenAI.
Pulpity nawigacyjne są pogrupowane w cztery kategorie: żądania HTTP, użycie oparte na tokenach, wykorzystanie jednostki PTU i dostrajanie
Zbieranie i routing danych w usłudze Azure Monitor
Usługa Azure OpenAI zbiera te same rodzaje danych monitorowania co inne zasoby platformy Azure. Usługę Azure Monitor można skonfigurować tak, aby generowała dane w dziennikach aktywności, dziennikach zasobów, dziennikach maszyn wirtualnych i metrykach platformy. Aby uzyskać więcej informacji, zobacz Monitorowanie danych z zasobów platformy Azure.
Metryki platformy i dziennik aktywności usługi Azure Monitor są zbierane i przechowywane automatycznie. Te dane można kierować do innych lokalizacji przy użyciu ustawienia diagnostycznego. Dzienniki zasobów usługi Azure Monitor nie są zbierane i przechowywane do momentu utworzenia ustawienia diagnostycznego, a następnie kierowania dzienników do co najmniej jednej lokalizacji.
Podczas tworzenia ustawienia diagnostycznego należy określić kategorie dzienników, które mają być zbierane. Aby uzyskać więcej informacji na temat tworzenia ustawienia diagnostycznego przy użyciu witryny Azure Portal, interfejsu wiersza polecenia platformy Azure lub programu PowerShell, zobacz Tworzenie ustawienia diagnostycznego w celu zbierania dzienników platformy i metryk na platformie Azure.
Należy pamiętać, że korzystanie z ustawień diagnostycznych i wysyłanie danych do dzienników usługi Azure Monitor wiąże się z innymi kosztami. Aby uzyskać więcej informacji, zobacz Azure Monitor Logs cost calculations and options (Obliczenia i opcje dotyczące kosztów dzienników usługi Azure Monitor).
Metryki i dzienniki, które można zebrać, zostały opisane w poniższych sekcjach.
Analizowanie metryk
Metryki zasobów usługi Azure OpenAI można analizować za pomocą narzędzi usługi Azure Monitor w witrynie Azure Portal. Na stronie Przegląd zasobu usługi Azure OpenAI wybierz pozycję Metryki w obszarze Monitorowanie w okienku po lewej stronie. Aby uzyskać więcej informacji, zobacz Rozpoczynanie pracy z eksploratorem metryk usługi Azure Monitor.
Usługa Azure OpenAI ma wspólność z podzbiorem usług Azure AI. Aby uzyskać listę wszystkich metryk platformy zebranych dla usługi Azure OpenAI i podobnych usług Azure AI według usługi Azure Monitor, zobacz Obsługiwane metryki dla usług Microsoft.CognitiveServices/accounts.
Metryki usług Cognitive Services
Są to starsze metryki wspólne dla wszystkich zasobów usług Azure AI Services. Nie zalecamy już używania tych metryk z usługą Azure OpenAI.
Metryki usługi Azure OpenAI
Uwaga
Metryka Aprowizowanego wykorzystania zarządzanego jest teraz przestarzała i nie jest już zalecana. Ta metryka została zastąpiona przez metryki Aprowizowane wykorzystanie zarządzane w wersji 2 .
Poniższa tabela zawiera podsumowanie bieżącego podzestawu metryk dostępnych w usłudze Azure OpenAI.
Metric | Kategoria | Agregacja | opis | Wymiary |
---|---|---|---|---|
Azure OpenAI Requests |
HTTP | Count | Łączna liczba wywołań wykonanych w interfejsie API usługi Azure OpenAI w danym okresie. Dotyczy jednostek SKU zarządzanych przez paygo, PTU i PTU. | ApiName , ModelDeploymentName ,ModelName ,ModelVersion , OperationName , Region , , StatusCode StreamType |
Generated Completion Tokens |
Użycie | Sum | Liczba wygenerowanych tokenów (wyjściowych) z modelu usługi Azure OpenAI. Dotyczy jednostek SKU płatnych, PTU i PTU | ApiName , ModelDeploymentName ,ModelName , Region |
Processed FineTuned Training Hours |
Użycie | Sum | Liczba godzin trenowania przetworzonych w modelu dostosowanym do usługi Azure OpenAI. | ApiName , ModelDeploymentName ,ModelName , Region |
Processed Inference Tokens |
Użycie | Sum | Liczba tokenów wnioskowania przetwarzanych przez model usługi Azure OpenAI. Obliczane jako tokeny monitu (dane wejściowe) i wygenerowane tokeny. Dotyczy jednostek SKU paygo, PTU i PTU. | ApiName , ModelDeploymentName ,ModelName , Region |
Processed Prompt Tokens |
Użycie | Sum | Łączna liczba tokenów monitu (danych wejściowych) przetworzonych w modelu usługi Azure OpenAI. Dotyczy jednostek SKU zarządzanych przez paygo, PTU i PTU. | ApiName , ModelDeploymentName ,ModelName , Region |
Provision-managed Utilization V2 |
HTTP | Średnia | Wykorzystanie zarządzane przez aprowizację to procent wykorzystania dla danego wdrożenia zarządzanego przez aprowizację. Obliczone jako (zużyte jednostki PTU/wdrożone jednostki PTU)*100. Gdy użycie wynosi lub powyżej 100%, wywołania są ograniczane i zwracają kod błędu 429. | ModelDeploymentName ,ModelName ,ModelVersion , Region , , StreamType |
Prompt Token Cache Match Rate |
HTTP | Średnia | Tylko aprowizacja zarządzana. Liczba trafień pamięci podręcznej tokenu monitu wyrażona jako wartość procentowa. | ModelDeploymentName , , ModelVersion , , ModelName Region |
Time to Response |
HTTP | Średnia | Zalecana miara opóźnienia (czas odpowiedzi) dla żądań przesyłania strumieniowego. Dotyczy wdrożeń PTU i PTU zarządzanych. Ta metryka nie ma zastosowania do standardowych wdrożeń płatności zgodnie z rzeczywistym użyciem. Obliczono jako czas potrzebny na wyświetlenie pierwszej odpowiedzi po wysłaniu przez użytkownika monitu mierzonego przez bramę interfejsu API. Ta liczba zwiększa się wraz ze wzrostem rozmiaru monitu i/lub zmniejszeniem rozmiaru trafień pamięci podręcznej. Uwaga: ta metryka jest przybliżeniem, ponieważ mierzone opóźnienie jest silnie zależne od wielu czynników, w tym współbieżnych wywołań i ogólnego wzorca obciążenia. Ponadto nie uwzględnia żadnych opóźnień po stronie klienta, które mogą istnieć między klientem a punktem końcowym interfejsu API. Aby uzyskać optymalne śledzenie opóźnień, zapoznaj się z własnym rejestrowaniem. | ModelDepIoymentName , ModelName i ModelVersion |
Konfigurowanie ustawień diagnostycznych
Wszystkie metryki można eksportować przy użyciu ustawień diagnostycznych w usłudze Azure Monitor. Aby analizować dzienniki i dane metryk za pomocą zapytań usługi Log Analytics usługi Azure Monitor, należy skonfigurować ustawienia diagnostyczne dla zasobu usługi Azure OpenAI i obszaru roboczego usługi Log Analytics.
Na stronie zasobów usługi Azure OpenAI w obszarze Monitorowanie wybierz pozycję Ustawienia diagnostyczne w okienku po lewej stronie. Na stronie Ustawienia diagnostyczne wybierz pozycję Dodaj ustawienie diagnostyczne.
Na stronie Ustawienia diagnostyczne skonfiguruj następujące pola:
- Wybierz pozycję Wyślij do obszaru roboczego usługi Log Analytics.
- Wybierz subskrypcję konta platformy Azure.
- Wybierz obszar roboczy usługi Log Analytics.
- W obszarze Dzienniki wybierz pozycję wszystkieLogi.
- W obszarze Metryki wybierz pozycję Wszystkie metryki.
Wprowadź nazwę ustawienia diagnostycznego, aby zapisać konfigurację.
Wybierz pozycję Zapisz.
Po skonfigurowaniu ustawień diagnostycznych możesz pracować z metrykami i danymi dziennika dla zasobu usługi Azure OpenAI w obszarze roboczym usługi Log Analytics.
Analizowanie dzienników
Dane w dziennikach usługi Azure Monitor są przechowywane w tabelach, w których każda tabela ma własny zestaw unikatowych właściwości.
Wszystkie dzienniki zasobów w usłudze Azure Monitor mają te same pola, a następnie pola specyficzne dla usługi. Aby uzyskać informacje na temat wspólnego schematu, zobacz Typowe i specyficzne dla usługi schematy dla dzienników zasobów platformy Azure.
Dziennik aktywności to typ dziennika platformy na platformie Azure, który zapewnia wgląd w zdarzenia na poziomie subskrypcji. Ten dziennik można wyświetlić niezależnie lub kierować go do dzienników usługi Azure Monitor. W witrynie Azure Portal możesz użyć dziennika aktywności w dziennikach usługi Azure Monitor do uruchamiania złożonych zapytań za pomocą usługi Log Analytics.
Aby uzyskać listę typów dzienników zasobów dostępnych dla usługi Azure OpenAI i podobnych usług Azure AI, zobacz Microsoft.CognitiveServices Operacje dostawcy zasobów platformy Azure.
Korzystanie z zapytań Kusto
Po wdrożeniu modelu usługi Azure OpenAI możesz wysłać kilka wywołań ukończenia przy użyciu środowiska zabaw w usłudze Azure AI Studio.
Dowolny tekst wprowadzony na placu zabaw ukończenia lub plac zabaw czatu generuje metryki i dane dziennika dla zasobu usługi Azure OpenAI. W obszarze roboczym usługi Log Analytics dla zasobu możesz wykonywać zapytania dotyczące danych monitorowania przy użyciu języka zapytań Kusto .
Ważne
Opcja Otwórz zapytanie na stronie zasobu azure OpenAI przechodzi do usługi Azure Resource Graph, która nie została opisana w tym artykule. Poniższe zapytania używają środowiska zapytań dla usługi Log Analytics. Pamiętaj, aby wykonać kroki opisane w temacie Konfigurowanie ustawień diagnostycznych w celu przygotowania obszaru roboczego usługi Log Analytics.
Na stronie zasobu Azure OpenAI w obszarze Monitorowanie w okienku po lewej stronie wybierz pozycję Dzienniki.
Wybierz obszar roboczy usługi Log Analytics skonfigurowany z diagnostyką dla zasobu usługi Azure OpenAI.
Na stronie obszaru roboczego usługi Log Analytics w obszarze Przegląd w okienku po lewej stronie wybierz pozycję Dzienniki.
W witrynie Azure Portal zostanie wyświetlone okno Zapytania z przykładowymi zapytaniami i sugestiami domyślnie. Możesz zamknąć to okno.
W poniższych przykładach wprowadź zapytanie Kusto w regionie edycji w górnej części okna Zapytanie , a następnie wybierz pozycję Uruchom. Wyniki zapytania są wyświetlane poniżej tekstu zapytania.
Poniższe zapytanie Kusto jest przydatne podczas początkowej analizy danych Diagnostyka Azure (AzureDiagnostics
) dotyczących zasobu:
AzureDiagnostics
| take 100
| project TimeGenerated, _ResourceId, Category, OperationName, DurationMs, ResultSignature, properties_s
To zapytanie zwraca próbkę 100 wpisów i wyświetla podzbiór dostępnych kolumn danych w dziennikach. W wynikach zapytania możesz wybrać strzałkę obok nazwy tabeli, aby wyświetlić wszystkie dostępne kolumny i skojarzone typy danych.
Aby wyświetlić wszystkie dostępne kolumny danych, możesz usunąć wiersz | project ...
parametrów określania zakresu z zapytania:
AzureDiagnostics
| take 100
Aby sprawdzić dane metryk platformy Azure (AzureMetrics
) dla zasobu, uruchom następujące zapytanie:
AzureMetrics
| take 100
| project TimeGenerated, MetricName, Total, Count, Maximum, Minimum, Average, TimeGrain, UnitName
Zapytanie zwraca próbkę 100 wpisów i wyświetla podzestaw dostępnych kolumn danych metryk platformy Azure:
Uwaga
Po wybraniu pozycji Dzienniki monitorowania>w menu Azure OpenAI dla zasobu usługa Log Analytics zostanie otwarta z zakresem zapytania ustawionym na bieżący zasób. Widoczne zapytania dziennika obejmują dane tylko z tego konkretnego zasobu. Aby uruchomić zapytanie zawierające dane z innych zasobów lub danych z innych usług platformy Azure, wybierz pozycję Dzienniki z menu usługi Azure Monitor w witrynie Azure Portal. Aby uzyskać więcej informacji, zobacz Zakres zapytań dzienników i zakres czasu w usłudze Azure Monitor Log Analytics , aby uzyskać szczegółowe informacje.
Konfigurowanie alertów
Alerty usługi Azure Monitor proaktywnie powiadamiają o znalezieniu ważnych warunków w danych monitorowania. Umożliwiają one identyfikowanie i rozwiązywanie problemów w systemie przed ich zauważeniem przez użytkowników. Alerty dotyczące metryk, dzienników i dziennika aktywności można ustawić. Różne typy alertów mają różne korzyści i wady.
Wymagania dotyczące zgłaszania alertów w każdej organizacji różnią się i mogą się zmieniać wraz z upływem czasu. Ogólnie rzecz biorąc, wszystkie alerty powinny być możliwe do działania i mieć określoną określoną odpowiedź, jeśli wystąpi alert. Jeśli alert nie wymaga natychmiastowej odpowiedzi, warunek można przechwycić w raporcie, a nie w alercie. Niektóre przypadki użycia mogą wymagać alertów w dowolnym momencie istnienia określonych warunków błędu. W innych przypadkach mogą być potrzebne alerty dotyczące błędów, które przekraczają określony próg w wyznaczonym przedziale czasu.
Błędy poniżej niektórych progów można często oceniać za pomocą regularnej analizy danych w dziennikach usługi Azure Monitor. Podczas analizowania danych dziennika w czasie może się okazać, że określony warunek nie występuje przez oczekiwany okres czasu. Ten warunek można śledzić przy użyciu alertów. Czasami brak zdarzenia w dzienniku jest tak samo ważny jak sygnał jako błąd.
W zależności od typu aplikacji opracowywanej przy użyciu usługi Azure OpenAI usługa Azure Monitor Application Szczegółowe informacje może oferować więcej korzyści z monitorowania w warstwie aplikacji.
Następne kroki
Opinia
https://aka.ms/ContentUserFeedback.
Dostępne już wkrótce: W 2024 r. będziemy stopniowo wycofywać zgłoszenia z serwisu GitHub jako mechanizm przesyłania opinii na temat zawartości i zastępować go nowym systemem opinii. Aby uzyskać więcej informacji, sprawdź:Prześlij i wyświetl opinię dla