Kurz: Detekce anomálií pomocí služeb Azure AI
V tomto kurzu se dozvíte, jak snadno obohatit data v Azure Synapse Analytics o služby Azure AI. K vyhledání anomálií použijete azure AI Detektor anomálií. Uživatel v Azure Synapse může jednoduše vybrat tabulku, která se má rozšířit o detekci anomálií.
Tento kurz zahrnuje:
- Postup získání datové sady tabulky Spark, která obsahuje data časových řad
- Použití prostředí průvodce v Azure Synapse k obohacení dat pomocí Detektor anomálií.
Pokud ještě nemáte předplatné Azure, vytvořte si bezplatný účet, než začnete.
Požadavky
- Azure Synapse pracovní prostor analytics s Azure Data Lake Storage Gen2 účtem úložiště nakonfigurovaným jako výchozím úložištěm. Musíte být přispěvatelem dat v objektech blob služby Storage systému souborů Data Lake Storage Gen2, se kterým pracujete.
- Fond Sparku v pracovním prostoru Azure Synapse Analytics. Podrobnosti najdete v tématu Vytvoření fondu Sparku v Azure Synapse.
- Dokončení kroků před konfigurací v kurzu Konfigurace služeb Azure AI v Azure Synapse.
Přihlášení k webu Azure Portal
Přihlaste se k webu Azure Portal.
Vytvoření tabulky Sparku
Pro účely tohoto kurzu potřebujete tabulku Sparku.
Vytvořte poznámkový blok PySpark a spusťte následující kód.
from pyspark.sql.functions import lit
df = spark.createDataFrame([
("1972-01-01T00:00:00Z", 826.0),
("1972-02-01T00:00:00Z", 799.0),
("1972-03-01T00:00:00Z", 890.0),
("1972-04-01T00:00:00Z", 900.0),
("1972-05-01T00:00:00Z", 766.0),
("1972-06-01T00:00:00Z", 805.0),
("1972-07-01T00:00:00Z", 821.0),
("1972-08-01T00:00:00Z", 20000.0),
("1972-09-01T00:00:00Z", 883.0),
("1972-10-01T00:00:00Z", 898.0),
("1972-11-01T00:00:00Z", 957.0),
("1972-12-01T00:00:00Z", 924.0),
("1973-01-01T00:00:00Z", 881.0),
("1973-02-01T00:00:00Z", 837.0),
("1973-03-01T00:00:00Z", 9000.0)
], ["timestamp", "value"]).withColumn("group", lit("series1"))
df.write.mode("overwrite").saveAsTable("anomaly_detector_testing_data")
Ve výchozí databázi Sparku by se teď měla zobrazit tabulka Sparku s názvem anomaly_detector_testing_data .
Otevřete průvodce službami Azure AI.
Klikněte pravým tlačítkem na tabulku Spark vytvořenou v předchozím kroku. Výběrem možnosti Machine Learning>Predict with a model (Předpověď pomocí modelu ) otevřete průvodce.
Zobrazí se konfigurační panel a zobrazí se výzva k výběru předem natrénovaného modelu. Vyberte Detektor anomálií.
Konfigurace Detektor anomálií
Pokud chcete nakonfigurovat Detektor anomálií, zadejte následující podrobnosti:
Propojená služba Azure Cognitive Services: V rámci požadovaných kroků jste vytvořili propojenou službu pro službu Azure AI. Vyberte ji tady.
Členitost: Rychlost vzorkování dat. Zvolte měsíčně.
Sloupec časového razítka: Sloupec, který představuje čas řady. Zvolte časové razítko (řetězec).
Sloupec hodnoty časové řady: Sloupec, který představuje hodnotu řady v čase určeném sloupcem Časové razítko. Zvolte hodnotu (double).
Seskupovací sloupec: Sloupec, který seskupuje řady. To znamená, že všechny řádky, které mají v tomto sloupci stejnou hodnotu, by měly tvořit jednu časová řada. Zvolte skupinu (řetězec).
Až budete hotovi, vyberte Otevřít poznámkový blok. Tím se vygeneruje poznámkový blok s kódem PySpark, který pomocí služeb Azure AI detekuje anomálie.
Spuštění poznámkového bloku
Poznámkový blok, který jste právě otevřeli, používá knihovnu SynapseML pro připojení ke službám Azure AI. Propojená služba Azure AI, kterou jste poskytli, vám umožňuje bezpečně odkazovat na službu Azure AI z tohoto prostředí, aniž byste museli odhalit tajné kódy.
Teď můžete spustit všechny buňky a provést detekci anomálií. Vyberte Spustit vše. Přečtěte si další informace o Detektor anomálií ve službách Azure AI.