Modell létrehozása a SynapseML használatával

Ez a cikk bemutatja, hogyan hozhat létre gépi tanulási modellt a SynapseML használatával, és hogyan egyszerűsíti az összetett gépi tanulási feladatokat. A SynapseML használatával létrehozhat egy betanítási folyamatot egy featurizációs fázissal és egy LightGBM regressziós fázissal. A folyamat előrejelzi a könyvbetekintő szövegből származó értékeléseket. Az alábbiakban bemutatjuk, hogyan használhat előre összeállított modelleket a SynapseML-szel a gépi tanulási problémák megoldásához.

Előfeltételek

Microsoft Fabric-előfizetés lekérése. Vagy regisztráljon egy ingyenes Microsoft Fabric-próbaverzióra.
Jelentkezzen be a Microsoft Fabricbe.
Váltson Fabricre a kezdőlap bal alsó részén található élménykapcsolóval.

Erőforrások előkészítése

Állítsa be a modell és a folyamat létrehozásához szükséges eszközöket és erőforrásokat.

Új jegyzetfüzet létrehozása
Csatolja a jegyzetfüzetet egy tóházhoz. Az Explorerbenbontsa ki a Lakehouses elemet, majd válassza a Hozzáadás lehetőséget.
Az Azure AI-szolgáltatások kulcsának lekéréséhez kövesse a rövid útmutató utasításait : Többszolgáltatásos erőforrás létrehozása az Azure AI-szolgáltatásokhoz.
Hozzon létre egy Azure Key Vault-példányt , és adja hozzá az Azure AI-szolgáltatási kulcsot a kulcstartóhoz titkos kulcsként.
Rögzítse a kulcstartó nevét és titkos nevét. Erre az információra szüksége lesz a cikk későbbi részében az egylépéses átalakítás futtatásához.

A környezet beállítása

A jegyzetfüzetben importálja a SynapseML-kódtárakat, és inicializálja a Spark-munkamenetet.

from pyspark.sql import SparkSession
from synapse.ml.core.platform import *

spark = SparkSession.builder.getOrCreate()

Adatkészlet betöltése

Töltse be az adathalmazt, és ossza fel betanítási és tesztelési csoportokra.

train, test = (
    spark.read.parquet(
        "wasbs://publicwasb@mmlspark.blob.core.windows.net/BookReviewsFromAmazon10K.parquet"
    )
    .limit(1000)
    .cache()
    .randomSplit([0.8, 0.2])
)

display(train)

A betanítási folyamat létrehozása

Hozzon létre egy folyamatot, amely a kódtár használatával featurizálja az TextFeaturizer adatokatsynapse.ml.featurize.text, és a függvény használatával lekér egy minősítéstLightGBMRegressor.

from pyspark.ml import Pipeline
from synapse.ml.featurize.text import TextFeaturizer
from synapse.ml.lightgbm import LightGBMRegressor

model = Pipeline(
    stages=[
        TextFeaturizer(inputCol="text", outputCol="features"),
        LightGBMRegressor(featuresCol="features", labelCol="rating", dataTransferMode="bulk")
    ]
).fit(train)

A tesztadatok kimenetének előrejelzése

Hívja meg a transform modell függvényét a tesztadatok kimenetének előrejelzéséhez és adatkeretként való megjelenítéséhez.

display(model.transform(test))

Adatok átalakítása egy lépésben az Azure AI-szolgáltatások használatával

Az ilyen típusú, előre összeállított megoldással rendelkező feladatok esetében a SynapseML Azure AI-szolgáltatásokkal való integrációjával egyetlen lépésben alakíthatja át az adatokat. Futtassa a következő kódot az alábbi cserekódokkal:

Cserélje le <secret-name> az Azure AI Services kulcstitkának nevére.
Cserélje le <key-vault-name> a kulcstartó nevére.

from synapse.ml.services import TextSentiment
from synapse.ml.core.platform import find_secret

model = TextSentiment(
    textCol="text",
    outputCol="sentiment",
    subscriptionKey=find_secret("<secret-name>", "<key-vault-name>")
).setLocation("eastus")

display(model.transform(test))

Visszacsatolás

Hasznos volt ez az oldal?

Last updated on 2025-09-29