Modellek betanítása az Azure Machine Learning (v1) használatával

A KÖVETKEZŐKRE VONATKOZIK:Python SDK azureml v1

Az Azure Machine Learning számos módszert kínál a modellek betanítása során, az SDK-t használó kódelső megoldásoktól az alacsony kódszámú megoldásokig, például az automatizált gépi tanulásig és a vizuális tervezőig. Az alábbi lista segítségével állapítsa meg, hogy melyik betanítási módszer megfelelő Önnek:

  • Pythonhoz készült Azure Machine Learning SDK: A Python SDK számos módszert kínál a modellek betanítása érdekében, mindegyik különböző képességekkel rendelkezik.

    Betanítási módszer Description
    Konfiguráció futtatása A modellek betanításának tipikus módja a betanítási szkript és a feladatkonfiguráció használata. A feladatkonfiguráció a modell betanításához használt betanítási környezet konfigurálásához szükséges információkat tartalmazza. A feladatkonfigurációban megadhatja a betanítási szkriptet, a számítási célt és az Azure Machine Learning-környezetet, és futtathat egy betanítási feladatot.
    Automatizált gépi tanulás Az automatizált gépi tanulás lehetővé teszi , hogy átfogó adatelemzési vagy programozási ismeretek nélkül tanítsa be a modelleket. Az adatelemzési és programozási háttérrel rendelkező felhasználók számára lehetővé teszi, hogy időt és erőforrásokat takaríthassanak meg az algoritmusok kiválasztásának és a hiperparaméterek finomhangolásának automatizálásával. Az automatizált gépi tanulás használatakor nem kell aggódnia a feladatkonfiguráció definiálása miatt.
    Gépi tanulási folyamat A folyamatok nem egy másik betanítási módszer, hanem a munkafolyamat moduláris, újrafelhasználható lépések használatával történő meghatározásának módja, amely magában foglalhatja a munkafolyamat részét képező betanítást is. A gépi tanulási folyamatok támogatják az automatizált gépi tanulás és a modellek betanítása konfigurációjának futtatását. Mivel a folyamatok nem kifejezetten a betanításra összpontosítanak, a folyamatok használatának okai változatosabbak, mint a többi betanítási módszer. Általában akkor érdemes folyamatokat használni, ha:
    * Felügyelet nélküli folyamatokat szeretne ütemezni , például hosszú ideig futó betanítási feladatokat vagy adat-előkészítést.
    * Használjon több lépést , amelyek heterogén számítási erőforrások és tárolási helyek között vannak koordinálva.
    * A folyamatot újrafelhasználható sablonként használhatja bizonyos forgatókönyvekhez, például újratanításhoz vagy kötegelt pontozáshoz.
    * Nyomon követheti és verziószámozhatja a munkafolyamat adatforrásait, bemeneteit és kimeneteit .
    * A munkafolyamatot különböző csapatok implementálják, amelyek külön-külön dolgoznak bizonyos lépéseken. A lépések ezután összekapcsolhatók egy folyamaton belül a munkafolyamat implementálásához.
  • Tervező: Az Azure Machine Learning-tervező egyszerű belépési pontot biztosít a gépi tanulásba a fogalmak igazolásához, vagy a kevés kódolási tapasztalattal rendelkező felhasználók számára. Lehetővé teszi modellek betanítása húzással webes felhasználói felület használatával. A Python-kódot a tervezés részeként használhatja, vagy kód írása nélkül taníthat be modelleket.

  • Azure CLI: A gépi tanulási parancssori felület parancsokat biztosít az Azure Machine Learning gyakori feladataihoz, és gyakran használják szkriptek futtatására és automatizálására. Ha például létrehozott egy betanítási szkriptet vagy folyamatot, az Azure CLI használatával elindíthat egy betanítási feladatot egy ütemezés szerint, vagy ha a betanításhoz használt adatfájlok frissülnek. A betanítási modellekhez olyan parancsokat biztosít, amelyek betanítási feladatokat küldnek. Futtatási konfigurációk vagy folyamatok használatával küldhet feladatokat.

Ezek a betanítási módszerek különböző típusú számítási erőforrásokat használhatnak a betanításhoz. Ezeket az erőforrásokat együttesen számítási céloknak nevezzük. A számítási cél lehet egy helyi gép vagy egy felhőbeli erőforrás, például egy Azure Machine Learning Compute, az Azure HDInsight vagy egy távoli virtuális gép.

Python SDK

A Pythonhoz készült Azure Machine Learning SDK-val gépi tanulási munkafolyamatokat hozhat létre és futtathat az Azure Machine Learning használatával. A szolgáltatást interaktív Python-munkamenetből, Jupyter-notebookokból, Visual Studio Code-ból vagy más IDE-ből használhatja.

Konfiguráció futtatása

Az Azure Machine Learning általános betanítási feladatai a ScriptRunConfig használatával határozhatók meg. Ezután a rendszer a szkriptfuttatás konfigurációját használja a betanítási szkript(ek)kel együtt egy modell számítási célon való betanításához.

A helyi számítógép futtatási konfigurációjával kezdhet, majd szükség szerint átválthat egy felhőalapú számítási célhoz. A számítási cél módosításakor csak a használt futtatási konfigurációt kell módosítania. A futtatás a betanítási feladat adatait is naplózza, például a bemeneteket, a kimeneteket és a naplókat.

Automatizált gépi tanulás

Határozza meg az iterációkat, a hiperparaméter-beállításokat, a featurizációt és más beállításokat. A betanítás során az Azure Machine Learning különböző algoritmusokat és paramétereket próbál meg párhuzamosan. A betanítás leáll, amint eléri a megadott kilépési feltételeket.

Tipp

A Python SDK mellett az automatizált gépi tanulást is használhatja Azure Machine Learning stúdió.

Gépi tanulási folyamat

A gépi tanulási folyamatok használhatják a korábban említett betanítási módszereket. A folyamatok inkább a munkafolyamatok létrehozásáról szólnak, így nem csupán a modellek betanítására terjednek ki. A folyamatokban automatizált gépi tanulással vagy konfigurációk futtatásával taníthat be modelleket.

A betanítási feladat beküldésekor megjelenő teendők ismertetése

Az Azure betanítási életciklusa a következőkből áll:

  1. Tömörítse a projektmappában lévő fájlokat, figyelmen kívül hagyva az .amlignore vagy .gitignore fájlokat
  2. A számítási fürt vertikális felskálázása
  3. A dockerfile létrehozása vagy letöltése a számítási csomópontra
    1. A rendszer a következő kivonatot számítja ki:
    2. A rendszer ezt a kivonatot használja kulcsként a munkaterület Azure Container Registry (ACR) keresésében
    3. Ha nem található, egyezést keres a globális ACR-ben
    4. Ha nem található, a rendszer létrehoz egy új rendszerképet (amelyet a rendszer gyorsítótáraz és regisztrál az ACR-munkaterületen)
  4. Tömörített projektfájl letöltése ideiglenes tárhelyre a számítási csomóponton
  5. A projektfájl kibontása
  6. A számítási csomópont végrehajtása python <entry script> <arguments>
  7. Naplók, modellfájlok és a munkaterülethez társított tárfiókba ./outputs írt egyéb fájlok mentése
  8. Számítási erőforrások vertikális leskálázása, beleértve az ideiglenes tárterület eltávolítását

Ha a helyi gépen történő betanítása mellett dönt ("helyi futtatásként konfigurálja"), nem kell a Dockert használnia. Ha ezt választja, helyileg is használhatja a Dockert (példa: Gépi tanulási folyamat konfigurálása ).

Azure Machine Learning Designer

A tervező lehetővé teszi modellek betanítása egy húzási felület használatával a webböngészőben.

Azure CLI

A gépi tanulási parancssori felület az Azure CLI bővítménye. Platformfüggetlen CLI-parancsokat biztosít az Azure Machine Learning használatához. Általában a parancssori felülettel automatizálja a feladatokat, például betanít egy gépi tanulási modellt.

Következő lépések

Megtudhatja, hogyan konfigurálhat betanítási futtatásokat.