Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Viktig
Om din anpassade modell som betjänar slutpunkten kräver den äldre slutsatsdragningstabellen kan du läsa Inferenstabeller för övervakning och felsökning av modeller.
Den här artikeln beskriver AI Gateway-aktiverade slutsatsdragningstabeller för övervakning av hanterade modeller. Slutsatsdragningstabellen samlar automatiskt in inkommande begäranden och utgående svar för en slutpunkt och loggar dem som en Delta-tabell i Unity Catalog. Du kan använda data i den här tabellen för att övervaka, utvärdera, jämföra och finjustera maskininlärningsmodeller.
Vad är AI Gateway-aktiverade slutsatsdragningstabeller?
AI Gateway-aktiverade slutsatsdragningstabeller förenklar övervakning och diagnostik för modeller genom att kontinuerligt logga indata och svar för begäranden (förutsägelser) från Mosaic AI Model Serving-slutpunkter och spara dem i en Delta-tabell i Unity Catalog. Du kan sedan använda alla funktioner i Databricks-plattformen, till exempel Databricks SQL-frågor och notebook-filer för att övervaka, felsöka och optimera dina modeller.
Du kan aktivera slutsatsdragningstabeller på en befintlig eller nyskapad modell som betjänar slutpunkten, och begäranden till slutpunkten loggas sedan automatiskt till en tabell i Unity Catalog.
Några vanliga program för slutsatsdragningstabeller är följande:
- Skapa en träningskorpus. Genom att sammanfoga inferenstabeller med grundsanningsetiketter kan du skapa ett träningskorpus som du kan använda för att träna om eller finjustera din modell och förbättra den. Med Lakeflow-jobb kan du konfigurera en kontinuerlig feedbackloop och automatisera omträningen.
- Övervaka data och modellkvalitet. Du kan kontinuerligt övervaka modellens prestanda och dataavvikelse med hjälp av Lakehouse Monitoring. Lakehouse Monitoring genererar automatiskt översiktspaneler för data- och modellkvalitet som du kan dela med intressenter. Dessutom kan du aktivera aviseringar för att veta när du behöver träna om din modell baserat på förändringar i inkommande data eller minskningar av modellprestanda.
- Felsöka produktionsproblem. Slutsatsdragningstabeller loggar data som HTTP-statuskoder, JSON-kod för begäran och svar, modellkörningstider samt spårningsutdata under modellkörningstider. Du kan använda dessa prestandadata i felsökningssyfte. Du kan också använda historiska data i slutsatsdragningstabeller för att jämföra modellprestanda på historiska begäranden.
- Övervaka distribuerade AI-agenter. Slutsatsdragningstabeller kan också lagra MLflow-spårningar för AI-agenter som hjälper dig att felsöka problem och övervaka prestanda.
krav
- AI Gateway-aktiverade slutsatsdragningstabeller stöds för slutpunkter som hanterar något av följande:
- En Databricks-arbetsyta i en region där modellhantering stöds. Se Modell som betjänar regional tillgänglighet.
- För arbetsytor som har privat anslutning konfigurerad på Unity Catalog-lagringskontot följer du stegen i Konfigurera privat anslutning till Azure-resurser.
- Databricks rekommenderar att du aktivera förutsägelseoptimering för optimerad prestanda för dina slutsatsdragningstabeller.
- Unity Catalog måste vara aktiverat på arbetsytan.
- Både skaparen av slutpunkten och modifieraren måste ha Kan hantera behörighet på slutpunkten. Se åtkomstkontrollistor.
- Både skaparen av slutpunkten och modifieraren måste ha följande behörigheter i Unity Catalog:
-
USE CATALOG
behörigheter för den angivna katalogen. -
USE SCHEMA
behörigheter för det angivna schemat. -
CREATE TABLE
behörigheter i schemat.
-
Varning
Slutsatsdragningstabellen kan sluta logga data eller skadas om du gör något av följande:
- Ändra tabellschemat.
- Ändra tabellnamnet.
- Ta bort tabellen.
- Förlora behörigheter till Unity Catalog-katalogen eller schemat.
- Ändra eller ta bort tabellägaren.
Aktivera och inaktivera slutsatsdragningstabeller
Det här avsnittet visar hur du aktiverar eller inaktiverar slutsatsdragningstabeller med hjälp av användargränssnittet för servering. Ägaren till slutsatsdragningstabellerna är den användare som skapade slutpunkten. Alla åtkomstkontrollistor (ACL: er) i tabellen följer standardbehörigheterna för Unity-katalogen och kan ändras av tabellägaren.
Använd följande steg för att aktivera slutsatsdragningstabeller när slutpunkten skapas:
- Klicka på Serving i Databricks Mosaic AI UI.
- Klicka på Skapa serverslutpunkt.
- I avsnittet AI Gateway väljer du Aktivera slutsatsdragningstabeller.
Du kan också aktivera slutsatsdragningstabeller på en befintlig slutpunkt. Så här redigerar du en befintlig slutpunktskonfiguration:
- I avsnittet AI Gateway klickar du på Redigera AI Gateway.
- Välj Aktivera slutsatsdragningstabeller.
Följ dessa instruktioner för att inaktivera slutsatsdragningstabeller:
- Gå till slutpunktssidan.
- Klicka på Redigera AI Gateway.
- Klicka på Aktivera slutsatsdragningstabell om du vill ta bort bockmarkeringen.
- När du är nöjd med AI Gateway-specifikationerna klickar du på Uppdatera.
Aktivera slutsatsdragningstabeller för AI-agenter
Du kan också aktivera slutsatsdragningstabeller för distribuerade AI-agenter, dessa slutsatsdragningstabeller lagrar nyttolast och begärandeinformation samt MLflow Trace-loggar.
Aktivera slutsatsdragningstabeller för AI-agenter med hjälp av följande metoder:
- Agenter som distribueras med HJÄLP av API:et
mlflow.deploy()
har inferenstabeller automatiskt aktiverade. Se Distribuera en agent för generativa AI-applikationer. - För programmatiska distributioner anger du
ENABLE_MLFLOW_TRACING
miljövariabeln tillTrue
i slutpunktskonfigurationen. Se Lägg till miljövariabler för oformaterad text.
Mer information om MLflow-agentspårning finns i MLflow Tracing – generativ AI-observerbarhet.
Fråga efter och analysera resultat i slutsatsdragningstabellen
När dina distribuerade modeller är klara loggas alla begäranden som görs till dina modeller automatiskt i inferenstabellen, tillsammans med svaren. Du kan visa tabellen i användargränssnittet, köra frågor mot tabellen från Databricks SQL eller en notebook-fil eller köra frågor mot tabellen med hjälp av REST-API:et.
Om du vill visa tabellen i användargränssnittet: På slutpunktssidan klickar du på namnet på slutsatstabellen för att öppna tabellen i Katalogutforskaren.
Fråga tabellen från Databricks SQL eller en Databricks-notebook-fil: Du kan köra kod som liknar följande för att köra frågor mot slutsatsdragningstabellen.
SELECT * FROM <catalog>.<schema>.<payload_table>
Så här ansluter du dina slutsatsdragningstabelldata med information om den underliggande grundmodellen som hanteras på slutpunkten: Grundläggande modellinformation samlas in i system.serving.served_entities-systemtabellen.
Anmärkning
Systemtabellen system.serving.served_entities
stöds inte för pay-per-token-slutpunkter, men du kan ansluta slutsatsdragnings- och användningstabeller för att få liknande information.
SELECT * FROM <catalog>.<schema>.<payload_table> payload
JOIN system.serving.served_entities se on payload.served_entity_id = se.served_entity_id
AI Gateway-aktiverat slutsatsdragningstabellschema
Slutsatsdragningstabeller som är aktiverade med HJÄLP av AI Gateway har följande schema:
Kolumnnamn | Beskrivning | Typ |
---|---|---|
request_date |
UTC-datumet då modellserverns begäran togs emot. | DATUM |
databricks_request_id |
En Azure Databricks-genererad begärandeidentifierare som är kopplad till alla modelltjänstbegäranden. | STRÄNG |
client_request_id |
Den begärandeidentifierare som tillhandahålls av användaren och som kan anges i den modell som betjänar begärandetexten. | STRÄNG |
request_time |
Tidsstämpeln där begäran tas emot. | TIDSSTÄMPEL |
status_code |
HTTP-statuskoden som returnerades från modellen. | INT |
sampling_fraction |
Samplingsfraktionen som användes i händelse av att begäran var nedsamplad. Det här värdet är mellan 0 och 1, där 1 representerar att 100% inkommande begäranden inkluderades. | DUBBEL |
execution_duration_ms |
Tiden i millisekunder som modellen utförde slutsatsdragning för. Detta inkluderar inte nätverksfördröjningar och representerar bara den tid det tog för modellen att generera förutsägelser. | BIGINT |
request |
JSON-innehållet i den råa begäran som skickades till slutpunkten där modellen betjänas. | STRÄNG |
response |
JSON-brödtexten för råsvaret som returnerades av modellen som betjänar slutpunkten. | STRÄNG |
served_entity_id |
Det unika ID:t för den betjänade entiteten. | STRÄNG |
logging_error_codes |
De fel som uppstod när data inte kunde loggas. Felkoder inkluderar MAX_REQUEST_SIZE_EXCEEDED och MAX_RESPONSE_SIZE_EXCEEDED . |
Array |
requester |
ID för användaren eller tjänstens huvudprincip vars behörigheter används för anropsbegäran till serveringsslutpunkten. Det här fältet returnerar NULL för anpassade modellers routningsoptimerade slutpunkter. |
STRÄNG |
Tabellscheman för AI-agentinferens
För AI-agenter skapar Databricks tre slutsatsdragningstabeller för varje distribution för att logga begäranden och svar till och från den modell som betjänar slutpunkten:
Slutsatsdragningstabell | Exempel på Azure Databricks-tabellnamn | Tabellinnehåll |
---|---|---|
Nyttolast | {catalog_name}.{schema_name}.{model_name}_payload |
Råa JSON-begärande- och svarsnyttolaster |
Loggar för payloadförfrågan | {catalog_name}.{schema_name}.{model_name}_payload_request_logs |
Formaterad begäran och svar, MLflow-spårningar |
Bedömningsloggar för nyttolast | {catalog_name}.{schema_name}.{model_name}_payload_assessment_logs |
Formaterad feedback, enligt beskrivningen i granskningsappen, för varje begäran |
Användarna kan förvänta sig data i nyttolasttabeller inom en timme efter att de interagerat med server-slutpunkten. Loggar för begäranden om nyttolast och utvärdering kan ta längre tid att fyllas i och härleds från tabellen med rå nyttolast. Du kan själv extrahera förfrågnings- och utvärderingsloggar från nyttolasttabellen. Borttagningar och uppdateringar av nyttolasttabellen återspeglas inte i loggarna för nyttolastbegäran eller utvärderingsloggarna för nyttolasten.
Anmärkning
Om du har Azure Storage Firewall aktiverat kontaktar du databricks-kontoteamet för att aktivera slutsatsdragningstabeller för dina slutpunkter.
Följande visar schemat för tabellen för payload-begärandeloggar:
Kolumnnamn | Beskrivning | Typ |
---|---|---|
databricks_request_id |
En Azure Databricks-genererad begärandeidentifierare som är kopplad till alla modelltjänstbegäranden. | STRÄNG |
client_request_id |
En valfri klientgenererad begärandeidentifierare som kan anges i den modell som betjänar begärandetexten. | STRÄNG |
date |
UTC-datumet då modellserverns begäran togs emot. | DATUM |
timestamp_ms |
Tidsstämpeln i epokens millisekunder när modelltjänstanropet togs emot. | LÅNG |
timestamp |
Tidsstämpel för begäran. | TIDSSTÄMPEL |
status_code |
HTTP-statuskoden som returnerades från modellen. | INT |
sampling_fraction |
Samplingsfraktionen som användes i händelse av att begäran var nedsamplad. Det här värdet är mellan 0 och 1, där 1 representerar att 100% inkommande begäranden inkluderades. | DUBBEL |
execution_time_ms |
Utförandetiden i millisekunder för vilken modellen genomförde slutsatsdragning. Detta inkluderar inte nätverksfördröjningar och representerar bara den tid det tog för modellen att generera förutsägelser. | LÅNG |
conversation_id |
Konversations-ID:t som extraherats från begärandeloggarna. | STRÄNG |
request |
Den sista användarfrågan från användarens konversation. | STRÄNG |
response |
Det sista svaret till användaren. | STRÄNG |
request_raw |
Strängrepresentationen av begäran. | STRÄNG |
response_raw |
Strängrepresentation av svar. | STRÄNG |
trace |
Strängrepresentation av spårning som extraherats från databricks_options av svarstrukturen. |
STRÄNG |
request_metadata |
En karta över metadata som är relaterade till den modell som betjänar slutpunkten som är associerad med begäran. Den här kartan innehåller slutpunktsnamnet, modellnamnet och modellversionen som används för slutpunkten. | KARTA<STRÄNG, STRÄNG> |
schema_version |
Schemaversionen. | STRÄNG |
Följande visar strukturen för tabellen över utvärderingsloggar för payload:
Kolumnnamn | Beskrivning | Typ |
---|---|---|
request_id |
Ett ID för Databricks-begäran. | STRÄNG |
step_id |
Steg-ID: t som härleds från hämtningsutvärderingen. | STRÄNG |
source |
Ett struct-fält som innehåller information om vem som skapade utvärderingen. | Struktur |
timestamp |
Tidsstämpel för begäran. | TIDSSTÄMPEL |
text_assessment |
Data för eventuell feedback om agentens svar från granskningsappen. | STRÄNG |
retrieval_assessment |
Data gällande eventuell feedback på de dokument som hämtats för ett svar. | STRÄNG |
begränsningar
- Arbetsbelastningar med provisionerad genomströmningskapacitet.
- Om du skapar en ny modell som betjänar slutpunkten som använder etablerat dataflöde stöds endast AI Gateway-aktiverade slutsatsdragningstabeller.
- Om du har en befintlig modell som betjänar slutpunkten som använder etablerat dataflöde och aldrig tidigare har konfigurerat äldre slutsatsdragningstabeller kan du uppdatera den så att den använder AI Gateway-aktiverade slutsatsdragningstabeller.
- Om du har en befintlig modell som betjänar slutpunkten som använder etablerat dataflöde och den har äldre slutsatsdragningstabeller för närvarande eller tidigare konfigurerade, kan du inte uppdatera den så att den använder AI Gateway-aktiverade slutsatsdragningstabeller.
- För strömningsloggar för AI-agenters svar aggregeras endast ChatCompletion-kompatibla fält och spår.
- Anpassade modellarbetsbelastningar:
- Om du skapar en ny modell som betjänar en slutpunkt som hanterar en anpassad modell rekommenderar Databricks att du använder AI Gateway-aktiverade slutsatsdragningstabeller. Om den äldre inferenstabellupplevelsen krävs kan du bara konfigurera din nya slutpunkt för AI Gateway med REST-API:et.
- Om du har en befintlig modell som betjänar slutpunkten som hanterar en anpassad modell och den inte har inferenstabeller konfigurerade, kan du uppdatera den så att den använder AI Gateway-aktiverade slutsatsdragningstabeller.
- Om du har en befintlig modell som betjänar en slutpunkt som hanterar en anpassad modell och den har konfigurerade äldre slutsatsdragningstabeller måste du inaktivera den äldre slutsatsdragningstabellen innan du kan uppdatera slutpunkten för att använda AI Gateway-aktiverade slutsatsdragningstabeller.
- När AI Gateway-aktiverade slutsatsdragningstabeller har aktiverats kan du inte växla till äldre slutsatsdragningstabeller.
- För närvarande sker leverans av slutsatsloggar för slutpunkter som betjänar Foundation Model API:er, externa modeller eller agenter på bästa möjliga sätt. Du kan förvänta dig att loggarna är tillgängliga inom 1 timme efter en begäran. Kontakta ditt Databricks-kontoteam för mer information.
- Den maximala storleken för begäran och svar som loggas är 1 MiB (1 048 576 byte). Begäran- och svarslaster som överskrider detta loggas som
null
ochlogging_error_codes
fylls medMAX_REQUEST_SIZE_EXCEEDED
ellerMAX_RESPONSE_SIZE_EXCEEDED
. - Inferenstabeller för routningsoptimerade modellserveringsslutpunkter finns i offentlig förhandsversion.
- Inferenstabellloggar är inte garanterade att fyllas i om modellen som betjänar slutpunkten returnerar ett fel.
- För anpassade modellslutpunkter kanske inga loggar registreras vid 4xx- eller 5xx-fel.
- För andra slutpunkter kanske loggar inte registreras för felen 401, 403, 429 eller 500.
För begränsningar som är specifika för AI Gateway, se Begränsningar. För allmänna begränsningar av modelltjänstgöringens slutpunkter, se Modelltjänstgöringens gränser och regioner.