Gépi tanulási modell a Microsoft Fabricben

A gépi tanulási modell egy bizonyos típusú minták felismerésére betanított fájl. Betaníthat egy modellt egy adatkészleten, és egy olyan algoritmust biztosít neki, amely az adott adatkészletből való érvelésre és tanulásra használja. A modell betanítása után felhasználhatja azokat az adatokat, amelyeket korábban még nem látott, és előrejelzéseket készíthet az adatokról.

Az MLflow-ban a gépi tanulási modellek több modellverziót is tartalmazhatnak. Itt minden verzió modell iterációt jelölhet. Ebben a cikkben megtudhatja, hogyan használhatja az ML-modelleket a modellverziók nyomon követéséhez és összehasonlításához.

Gépi tanulási modell létrehozása

Az MLflow-ban a gépi tanulási modellek szabványos csomagolási formátumot tartalmaznak. Ez a formátum lehetővé teszi ezeknek a modelleknek a használatát különböző alsóbb rétegbeli eszközökben, beleértve a kötegelt következtetést az Apache Sparkban. A formátum egy konvenciót határoz meg a modell különböző "ízek" mentésére, amelyeket a különböző alsóbb rétegbeli eszközök képesek megérteni.

Gépi tanulási modellt közvetlenül a Háló felhasználói felületéről hozhat létre. Az MLflow API közvetlenül is létrehozhatja a modellt.

Ha gépi tanulási modellt szeretne létrehozni a felhasználói felületről, a következőket teheti:

  1. Hozzon létre egy új adatelemzési munkaterületet, vagy válasszon ki egy meglévő adatelemzési munkaterületet.

  2. Az + Új legördülő listában válassza a Modell lehetőséget, ha üres modellt szeretne létrehozni az adatelemzési munkaterületen.

    Screenshot showing the New drop-down menu.

  3. A modell létrehozása után megkezdheti a modellverziók hozzáadását a futtatási metrikák és paraméterek nyomon követéséhez. A kísérlet egy meglévő modellbe való regisztrálása vagy mentése.

Gépi tanulási kísérletet is létrehozhat közvetlenül az API-val mlflow.register_model() végzett szerzői élményből. Ha a megadott névvel rendelkező regisztrált gépi tanulási modell nem létezik, az API automatikusan létrehozza azt.

import mlflow

model_uri = "runs:/{}/model-uri-name".format(run.info.run_id)
mv = mlflow.register_model(model_uri, "model-name")

print("Name: {}".format(mv.name))
print("Version: {}".format(mv.version))

Gépi tanulási modell verzióinak kezelése

A gépi tanulási modellek modellverziók gyűjteményét tartalmazzák az egyszerűsített nyomon követés és összehasonlítás érdekében. A modellen belül az adatelemzők különböző modellverziókban navigálhatnak a mögöttes paraméterek és metrikák megismeréséhez. Az adattudósok összehasonlítást is végezhetnek a modellverziók között annak megállapításához, hogy az újabb modellek jobb eredményeket hozhatnak-e.

Gépi tanulási modellek nyomon követése

A gépi tanulási modell verziója egy nyomon követésre regisztrált egyedi modellt jelöl.

Screenshot showing the details screen of a model.

Minden modellverzió a következő információkat tartalmazza:

  • Létrehozás időpontja: A modell létrehozásának dátuma és időpontja.
  • Futtatás neve: Az adott modellverzió létrehozásához használt kísérletfuttatások azonosítója.
  • Hiperparaméterek: A rendszer kulcs-érték párként menti a hiperparamétereket. A kulcsok és az értékek egyaránt sztringek.
  • Metrikák: Kulcs-érték párként mentett metrikák futtatása. Az érték numerikus.
  • Modellséma/aláírás: A modell bemeneteinek és kimeneteinek leírása.
  • Naplózott fájlok: A naplózott fájlok bármilyen formátumban. Rögzíthet például képeket, környezetet, modelleket és adatfájlokat.

Gépi tanulási modellek összehasonlítása és szűrése

A gépi tanulási modellverziók minőségének összehasonlításához és kiértékeléséhez összehasonlíthatja a paramétereket, a metrikákat és a metaadatokat a kiválasztott verziók között.

Gépi tanulási modellek vizuális összehasonlítása

A futtatások vizuálisan összehasonlíthatók egy meglévő modellben. A vizuális összehasonlítás lehetővé teszi a több verzió közötti egyszerű navigálást és rendezést.

Screenshot showing a list of runs for comparison.

A futtatások összehasonlításához a következőt teheti:

  1. Válasszon ki egy meglévő, több verziót tartalmazó gépi tanulási modellt.
  2. Válassza a Nézet lapot, majd lépjen a Modell lista nézetre. A modelllista megtekintésének lehetőségét közvetlenül a részletek nézetből is kiválaszthatja.
  3. Testre szabhatja a táblázat oszlopait. Bontsa ki az Oszlopok testreszabása panelt. Itt kiválaszthatja a megtekinteni kívánt tulajdonságokat, metrikákat és hiperparamétereket.
  4. Végül több verziót is kiválaszthat az eredmények összehasonlításához a metrikák összehasonlító paneljén. Ezen az ablaktáblán testre szabhatja a diagramokat a diagram címének, a vizualizáció típusának, az X tengelynek, az Y tengelynek és egyebeknek a módosításával.

Gépi tanulási modellek összehasonlítása az MLflow API használatával

Az adattudósok az MLflow használatával is kereshetnek a munkaterületen mentett modellek között. Az MLflow dokumentációjában további MLflow API-kat is megismerhet a modell interakciójához.

from pprint import pprint

client = MlflowClient()
for rm in client.list_registered_models():
    pprint(dict(rm), indent=4)

Gépi tanulási modellek alkalmazása

Miután betanított egy modellt egy adatkészleten, alkalmazhatja ezt a modellt azokra az adatokra, amelyeket soha nem látott előrejelzések létrehozásához. Ezt a modellt pontozási vagy következtetési technikának hívjuk. A Microsoft Fabric-modell pontozásával kapcsolatos további információkért lásd a következő szakaszt.