Dela via


Data och sekretess för avvikelseidentifiering

Viktigt!

Översättningar som inte är engelska tillhandahålls endast för enkelhetens skull. Se versionen EN-US av det här dokumentet för bindningsversionen.

Anmärkning

Informationen i den här artikeln refererar bara till avvikelseidentifiering, men de flesta av de begrepp som beskrivs gäller för både avvikelseidentifiering och Azure AI Metrics Advisor. Metrics Advisor bygger på kärntekniken från avvikelseidentifiering.

Vilka data bearbetar Anomaly Detector?

API:et för avvikelseidentifiering kan ta emot indata och bearbeta data baserat på två identifieringslägen: univariate (innehåller mått av en typ) och multivariat (som innehåller mått av flera typer).

Univariat detekteringsläge

I univariatidentifieringsläge bearbetar avvikelseidentifiering följande typer av data:

  • Enkel tidsseriedata: Kunder anropar API:et för avvikelseidentifiering för att skicka tidsseriedata för att utföra avvikelseidentifiering. Tidsseriedata innehåller tidsstämplar, dimensioner (valfritt) och mått för en variabel (till exempel temperatur).
  • Konfigurationsdata: Tillsammans med tidsseriedata som skickas till tjänsten skickas vissa konfigurationsdata tillsammans med dem, till exempel kornighet för mått, maxAnomalyRatio och känslighet. Dessa data kan hjälpa avvikelseidentifieringen att utföra förväntade identifieringsresultat.

Multivariatidentifieringsläge

I multivariatidentifieringsläge bearbetar avvikelseidentifiering följande typer av data:

  • Flera tidsseriedata:

    • Tidsseriedata som används för träning:

      Begäran måste innehålla en källparameter för att ange en externt tillgänglig Azure Storage-URI (helst en signatur-URI för delad åtkomst). Alla tidsserier som används för att generera modellen måste zippas in i en enda fil och lagras i Azure Storage-URI:n som tillhandahålls. Varje tidsserie finns i en enda CSV-fil, där den första kolumnen är tidsstämpel och den andra kolumnen är värde (här är ett exempel).

      För att träna en modell enligt en grupp med tidsseriedata kräver tjänsten att vissa historiska data matas in. Anomalidetektor behåller inte träningsdata. Den används bara för att träna modellen och sedan tas data bort.

    • Tidsseriedata för att utföra avvikelseidentifiering:

      Tidsseriedata innehåller tidsstämplar, dimensioner (valfritt) och mått för flera variabler (till exempel temperatur och luftfuktighet). Kraven på tidsseriedata är desamma som när data används för träning. Men för att utföra avvikelseidentifiering baserat på den tränade modellen kräver avvikelseidentifiering endast de senaste data som kunden vill få avvikelseresultat för.

  • Måttmetadata, till exempel slidingWindow, alignPolicy, startTime och endTime, hjälper till att konfigurera identifieringen.

Hur bearbetar Anomaliavkännaren data?

Univariate detekteringsläge

Univariate-API:erna tar emot tidsseriedata från kunden. Anomaliidentifieraren bearbetar sedan data i minnet, utför univariat anomaliidentifiering och returnerar identifieringsresultaten till kunderna. Avvikelseidentifiering lagrar inga kunddata eller genererade data.

Multivariatidentifieringsläge

Api:erna för flera variater omfattar tränings- och identifieringsfunktioner. Kunder förbereder träningsdata (tidsseriedata för flera variabler) i en zip-fil och laddar upp dem till en blobcontainer . Sedan genererar de en signatur-URI för delad åtkomst och tillhandahåller den till tränings-API:et. Träningsdata är helt ägda av kunder och kan uppdateras när som helst.

Tränings-API:et justerar flera tidsserier till en konsekvent tidsdimension med alignPolicy definierad av kunden. Sedan tränas en modell för multivariatavvikelseidentifiering med kundens data. Träningsprocessen för multivariat lagrar inga kunduppgifter. Den genererar metadata för att representera modellstatus. Kunder kan när som helst ta bort modellen, inklusive metadata. Metadata för varje modell innehåller följande objekt:

  • Status:Modellstatus kan vara Klar, Körs eller Misslyckades.
  • SetupInfo:Träningsbegäran för den här modellen.
  • DiagnoseInfo:Träningsfördröjning, förlust och variabeltillstånd. Variabeltillståndet kan användas för att känna till NA-förhållandet för den här variabeln.

Identifierings-API:et accepterar liknande begäranden och utför liknande databearbetning som tränings-API:et. Eftersom identifieringsprocessen är asynkron får kunderna först ett resultat-ID. Det här resultat-ID:t används för att hämta identifieringsresultat med ett API för multivariatresultat. Identifieringsresultatet lagras tillfälligt i en blob och tas bort automatiskt om sju dagar. Identifieringsresultat innehåller följande objekt:

  • Status: Identifieringsstatus kan vara Redo, Körs eller Misslyckades.
  • VariableStates: Variabeltillståndet kan användas för att analysera NA-förhållandet för varje variabel.
  • SetupInfo: Begärandetext för motsvarande uppgift för multivariatavvikelseidentifiering.
  • Resultat: Avvikelsestatus, poäng och allvarlighetsgrad för varje tidsstämpel.

Identifieringsresultat och metadata i bloben lagras som standard med en Microsoft-hanterad nyckel. Kunder kan aktivera en kundhanterad nyckel med ett eget nyckelvalv i Azure-portalen för att kryptera data.

Hur bevaras data och vilka kundkontroller är tillgängliga?

API för avvikelseidentifiering tar emot kundens indata, inklusive tidsseriedata, relaterade metadata och konfigurationsdata, och bearbetar dem sedan för att returnera resultat. Tjänsten behåller inte indata efter bearbetningen. På samma sätt används alla träningsdata som skickas av kunden för att träna modeller för användning endast av kunden. Underliggande träningsdata behålls inte när träningen har slutförts.

Kunder kan när som helst ta bort tränade modeller med hjälp av API:et Ta bort multivariatmodell.

Mer information om Microsofts sekretess- och säkerhetsåtaganden finns i Microsoft Trust Center.

Nästa steg