Gépi tanulási modell a Microsoft Fabricben
A gépi tanulási modell egy bizonyos típusú minták felismerésére betanított fájl. Betaníthat egy modellt egy adatkészleten, és egy olyan algoritmust biztosít neki, amely az adott adatkészletből való érvelésre és tanulásra használja. A modell betanítása után felhasználhatja azokat az adatokat, amelyeket korábban még nem látott, és előrejelzéseket készíthet az adatokról.
Az MLflow-ban a gépi tanulási modellek több modellverziót is tartalmazhatnak. Itt minden verzió modell iterációt jelölhet. Ebben a cikkben megtudhatja, hogyan használhatja az ML-modelleket a modellverziók nyomon követéséhez és összehasonlításához.
Gépi tanulási modell létrehozása
Az MLflow-ban a gépi tanulási modellek szabványos csomagolási formátumot tartalmaznak. Ez a formátum lehetővé teszi ezeknek a modelleknek a használatát különböző alsóbb rétegbeli eszközökben, beleértve a kötegelt következtetést az Apache Sparkban. A formátum egy konvenciót határoz meg a modell különböző "ízek" mentésére, amelyeket a különböző alsóbb rétegbeli eszközök képesek megérteni.
Gépi tanulási modellt közvetlenül a Háló felhasználói felületéről hozhat létre. Az MLflow API közvetlenül is létrehozhatja a modellt.
Ha gépi tanulási modellt szeretne létrehozni a felhasználói felületről, a következőket teheti:
Hozzon létre egy új adatelemzési munkaterületet, vagy válasszon ki egy meglévő adatelemzési munkaterületet.
Az + Új legördülő listában válassza a Modell lehetőséget, ha üres modellt szeretne létrehozni az adatelemzési munkaterületen.
A modell létrehozása után megkezdheti a modellverziók hozzáadását a futtatási metrikák és paraméterek nyomon követéséhez. A kísérlet egy meglévő modellbe való regisztrálása vagy mentése.
Gépi tanulási kísérletet is létrehozhat közvetlenül az API-val mlflow.register_model()
végzett szerzői élményből. Ha a megadott névvel rendelkező regisztrált gépi tanulási modell nem létezik, az API automatikusan létrehozza azt.
import mlflow
model_uri = "runs:/{}/model-uri-name".format(run.info.run_id)
mv = mlflow.register_model(model_uri, "model-name")
print("Name: {}".format(mv.name))
print("Version: {}".format(mv.version))
Gépi tanulási modell verzióinak kezelése
A gépi tanulási modellek modellverziók gyűjteményét tartalmazzák az egyszerűsített nyomon követés és összehasonlítás érdekében. A modellen belül az adatelemzők különböző modellverziókban navigálhatnak a mögöttes paraméterek és metrikák megismeréséhez. Az adattudósok összehasonlítást is végezhetnek a modellverziók között annak megállapításához, hogy az újabb modellek jobb eredményeket hozhatnak-e.
Gépi tanulási modellek nyomon követése
A gépi tanulási modell verziója egy nyomon követésre regisztrált egyedi modellt jelöl.
Minden modellverzió a következő információkat tartalmazza:
- Létrehozás időpontja: A modell létrehozásának dátuma és időpontja.
- Futtatás neve: Az adott modellverzió létrehozásához használt kísérletfuttatások azonosítója.
- Hiperparaméterek: A rendszer kulcs-érték párként menti a hiperparamétereket. A kulcsok és az értékek egyaránt sztringek.
- Metrikák: Kulcs-érték párként mentett metrikák futtatása. Az érték numerikus.
- Modellséma/aláírás: A modell bemeneteinek és kimeneteinek leírása.
- Naplózott fájlok: A naplózott fájlok bármilyen formátumban. Rögzíthet például képeket, környezetet, modelleket és adatfájlokat.
Gépi tanulási modellek összehasonlítása és szűrése
A gépi tanulási modellverziók minőségének összehasonlításához és kiértékeléséhez összehasonlíthatja a paramétereket, a metrikákat és a metaadatokat a kiválasztott verziók között.
Gépi tanulási modellek vizuális összehasonlítása
A futtatások vizuálisan összehasonlíthatók egy meglévő modellben. A vizuális összehasonlítás lehetővé teszi a több verzió közötti egyszerű navigálást és rendezést.
A futtatások összehasonlításához a következőt teheti:
- Válasszon ki egy meglévő, több verziót tartalmazó gépi tanulási modellt.
- Válassza a Nézet lapot, majd lépjen a Modell lista nézetre. A modelllista megtekintésének lehetőségét közvetlenül a részletek nézetből is kiválaszthatja.
- Testre szabhatja a táblázat oszlopait. Bontsa ki az Oszlopok testreszabása panelt. Itt kiválaszthatja a megtekinteni kívánt tulajdonságokat, metrikákat és hiperparamétereket.
- Végül több verziót is kiválaszthat az eredmények összehasonlításához a metrikák összehasonlító paneljén. Ezen az ablaktáblán testre szabhatja a diagramokat a diagram címének, a vizualizáció típusának, az X tengelynek, az Y tengelynek és egyebeknek a módosításával.
Gépi tanulási modellek összehasonlítása az MLflow API használatával
Az adattudósok az MLflow használatával is kereshetnek a munkaterületen mentett modellek között. Az MLflow dokumentációjában további MLflow API-kat is megismerhet a modell interakciójához.
from pprint import pprint
client = MlflowClient()
for rm in client.list_registered_models():
pprint(dict(rm), indent=4)
Gépi tanulási modellek alkalmazása
Miután betanított egy modellt egy adatkészleten, alkalmazhatja ezt a modellt azokra az adatokra, amelyeket soha nem látott előrejelzések létrehozásához. Ezt a modellt pontozási vagy következtetési technikának hívjuk. A Microsoft Fabric-modell pontozásával kapcsolatos további információkért lásd a következő szakaszt.