Dela via


Självstudie: Avvikelseidentifiering med Azure AI-tjänster

I den här självstudien lär du dig att enkelt utöka dina data i Azure Synapse Analytics med Azure AI-tjänster. Du använder Azure AI-Avvikelseidentifiering för att hitta avvikelser. En användare i Azure Synapse kan helt enkelt välja en tabell för att utöka identifieringen av avvikelser.

Den här självstudiekursen omfattar:

  • Steg för att hämta en Spark-tabelldatauppsättning som innehåller tidsseriedata.
  • Användning av en guideupplevelse i Azure Synapse för att utöka data med hjälp av Avvikelseidentifiering.

Om du inte har någon Azure-prenumeration kan du skapa ett kostnadsfritt konto innan du börjar.

Förutsättningar

Logga in på Azure Portal

Logga in på Azure-portalen.

Skapa en Spark-tabell

Du behöver en Spark-tabell för den här självstudien.

Skapa en PySpark-anteckningsbok och kör följande kod.

from pyspark.sql.functions import lit

df = spark.createDataFrame([
    ("1972-01-01T00:00:00Z", 826.0),
    ("1972-02-01T00:00:00Z", 799.0),
    ("1972-03-01T00:00:00Z", 890.0),
    ("1972-04-01T00:00:00Z", 900.0),
    ("1972-05-01T00:00:00Z", 766.0),
    ("1972-06-01T00:00:00Z", 805.0),
    ("1972-07-01T00:00:00Z", 821.0),
    ("1972-08-01T00:00:00Z", 20000.0),
    ("1972-09-01T00:00:00Z", 883.0),
    ("1972-10-01T00:00:00Z", 898.0),
    ("1972-11-01T00:00:00Z", 957.0),
    ("1972-12-01T00:00:00Z", 924.0),
    ("1973-01-01T00:00:00Z", 881.0),
    ("1973-02-01T00:00:00Z", 837.0),
    ("1973-03-01T00:00:00Z", 9000.0)
], ["timestamp", "value"]).withColumn("group", lit("series1"))

df.write.mode("overwrite").saveAsTable("anomaly_detector_testing_data")

En Spark-tabell med namnet anomaly_detector_testing_data bör nu visas i Spark-standarddatabasen.

Öppna guiden Azure AI-tjänster

  1. Högerklicka på Spark-tabellen som skapades i föregående steg. Välj Machine Learning>Predict with a model (Förutsäga med en modell ) för att öppna guiden.

    Skärmbild som visar val för att öppna bedömningsguiden.

  2. En konfigurationspanel visas och du uppmanas att välja en förtränad modell. Välj Avvikelseidentifiering.

    Skärmbild som visar val av Avvikelseidentifiering som modell.

Konfigurera Avvikelseidentifiering

Ange följande information för att konfigurera Avvikelseidentifiering:

  • Länkad Azure Cognitive Services-tjänst: Som en del av de nödvändiga stegen skapade du en länkad tjänst till din Azure AI-tjänst. Välj det här.

  • Kornighet: Den hastighet med vilken dina data samplas. Välj varje månad.

  • Tidsstämpelkolumn: Den kolumn som representerar tiden för serien. Välj tidsstämpel (sträng).

  • Värdekolumn för tidsserie: Den kolumn som representerar värdet för serien vid den tidpunkt som anges av tidsstämpelkolumnen. Välj värde (dubbelt).

  • Grupperingskolumn: Den kolumn som grupperar serien. Det vill sa att alla rader som har samma värde i den här kolumnen ska bilda en tidsserie. Välj grupp (sträng).

När du är klar väljer du Öppna anteckningsbok. Detta genererar en notebook-fil åt dig med PySpark-kod som använder Azure AI-tjänster för att identifiera avvikelser.

Skärmbild som visar konfigurationsinformation för Avvikelseidentifiering.

Köra anteckningsboken

Anteckningsboken som du precis öppnade använder SynapseML-biblioteket för att ansluta till Azure AI-tjänster. Med den länkade Tjänsten Azure AI-tjänster som du tillhandahöll kan du på ett säkert sätt referera till din Azure AI-tjänst från den här upplevelsen utan att avslöja några hemligheter.

Nu kan du köra alla celler för att utföra avvikelseidentifiering. Välj Kör alla. Läs mer om Avvikelseidentifiering i Azure AI-tjänster.

Skärmbild som visar avvikelseidentifiering.

Nästa steg