Skapa en modell med SynapseML

Den här artikeln visar hur du skapar en maskininlärningsmodell med SynapseML och hur den förenklar komplexa maskininlärningsuppgifter. Använd SynapseML för att skapa en träningspipeline med ett funktionaliseringssteg och ett LightGBM-regressionssteg. Pipelinen förutspår betyg från text från bokrecensioner. Så här använder du fördefinierade modeller med SynapseML för att lösa maskininlärningsproblem.

Förutsättningar

Skaffa en Microsoft Fabric-prenumeration. Eller registrera dig för en kostnadsfri utvärderingsversion av Microsoft Fabric.
Logga in på Microsoft Fabric.
Växla till Fabric genom att använda upplevelseväxlaren längst ned till vänster på startsidan.

Förbereda resurser

Konfigurera de verktyg och resurser som du behöver för att skapa modellen och pipelinen.

Skapa en ny anteckningsbok
Bifoga anteckningsboken till ett sjöhus. Expandera Lakehouses i Utforskaren och välj sedan Lägg till.
Hämta en Foundry Tools-nyckel genom att följa anvisningarna i Snabbstart: Skapa en resurs för flera tjänster för Foundry Tools.
Skapa en Azure Key Vault-instans och lägg till nyckeln Foundry Tools i nyckelvalvet som en hemlighet.
Registrera ditt nyckelvalvnamn och hemliga namn. Du behöver den här informationen för att köra en stegtransformering senare i den här artikeln.

Konfigurera miljön

Importera SynapseML-bibliotek i anteckningsboken och initiera Spark-sessionen.

from pyspark.sql import SparkSession
from synapse.ml.core.platform import *

spark = SparkSession.builder.getOrCreate()

Läsa in en datauppsättning

Läs in din datauppsättning och dela upp den i träningsdata och testdata.

train, test = (
    spark.read.parquet(
        "wasbs://publicwasb@mmlspark.blob.core.windows.net/BookReviewsFromAmazon10K.parquet"
    )
    .limit(1000)
    .cache()
    .randomSplit([0.8, 0.2])
)

display(train)

Skapa träningspipeline

Skapa en pipeline som funktionaliserar data med hjälp av TextFeaturizersynapse.ml.featurize.text från biblioteket och härleder ett omdöme med hjälp av LightGBMRegressor funktionen.

from pyspark.ml import Pipeline
from synapse.ml.featurize.text import TextFeaturizer
from synapse.ml.lightgbm import LightGBMRegressor

model = Pipeline(
    stages=[
        TextFeaturizer(inputCol="text", outputCol="features"),
        LightGBMRegressor(featuresCol="features", labelCol="rating", dataTransferMode="bulk")
    ]
).fit(train)

Förutsäga utdata från testdata

transform Anropa funktionen i modellen för att förutsäga och visa utdata från testdata som en dataram.

display(model.transform(test))

Använda Foundry Tools för att transformera data i ett steg

För den här typen av uppgifter som har en fördefinierad lösning kan du också använda SynapseML:s integrering med Foundry Tools för att transformera dina data i ett enda steg. Kör följande kod med dessa ersättningar:

Ersätt <secret-name> med namnet på din Foundry Tools-nyckelhemlighet.
Ersätt <key-vault-name> med namnet på ditt nyckelvalv.

from synapse.ml.services import TextSentiment
from synapse.ml.core.platform import find_secret

model = TextSentiment(
    textCol="text",
    outputCol="sentiment",
    subscriptionKey=find_secret("<secret-name>", "<key-vault-name>")
).setLocation("eastus")

display(model.transform(test))

Feedback

Var den här sidan till hjälp?

Last updated on 2026-02-21