Modellek betanítása az Azure Machine Learning (v1) használatával
A KÖVETKEZŐKRE VONATKOZIK:Python SDK azureml v1
Az Azure Machine Learning számos módszert kínál a modellek betanítása során, az SDK-t használó kódelső megoldásoktól az alacsony kódszámú megoldásokig, például az automatizált gépi tanulásig és a vizuális tervezőig. Az alábbi lista segítségével állapítsa meg, hogy melyik betanítási módszer megfelelő Önnek:
Pythonhoz készült Azure Machine Learning SDK: A Python SDK számos módszert kínál a modellek betanítása érdekében, mindegyik különböző képességekkel rendelkezik.
Betanítási módszer Description Konfiguráció futtatása A modellek betanításának tipikus módja a betanítási szkript és a feladatkonfiguráció használata. A feladatkonfiguráció a modell betanításához használt betanítási környezet konfigurálásához szükséges információkat tartalmazza. A feladatkonfigurációban megadhatja a betanítási szkriptet, a számítási célt és az Azure Machine Learning-környezetet, és futtathat egy betanítási feladatot. Automatizált gépi tanulás Az automatizált gépi tanulás lehetővé teszi , hogy átfogó adatelemzési vagy programozási ismeretek nélkül tanítsa be a modelleket. Az adatelemzési és programozási háttérrel rendelkező felhasználók számára lehetővé teszi, hogy időt és erőforrásokat takaríthassanak meg az algoritmusok kiválasztásának és a hiperparaméterek finomhangolásának automatizálásával. Az automatizált gépi tanulás használatakor nem kell aggódnia a feladatkonfiguráció definiálása miatt. Gépi tanulási folyamat A folyamatok nem egy másik betanítási módszer, hanem a munkafolyamat moduláris, újrafelhasználható lépések használatával történő meghatározásának módja, amely magában foglalhatja a munkafolyamat részét képező betanítást is. A gépi tanulási folyamatok támogatják az automatizált gépi tanulás és a modellek betanítása konfigurációjának futtatását. Mivel a folyamatok nem kifejezetten a betanításra összpontosítanak, a folyamatok használatának okai változatosabbak, mint a többi betanítási módszer. Általában akkor érdemes folyamatokat használni, ha:
* Felügyelet nélküli folyamatokat szeretne ütemezni , például hosszú ideig futó betanítási feladatokat vagy adat-előkészítést.
* Használjon több lépést , amelyek heterogén számítási erőforrások és tárolási helyek között vannak koordinálva.
* A folyamatot újrafelhasználható sablonként használhatja bizonyos forgatókönyvekhez, például újratanításhoz vagy kötegelt pontozáshoz.
* Nyomon követheti és verziószámozhatja a munkafolyamat adatforrásait, bemeneteit és kimeneteit .
* A munkafolyamatot különböző csapatok implementálják, amelyek külön-külön dolgoznak bizonyos lépéseken. A lépések ezután összekapcsolhatók egy folyamaton belül a munkafolyamat implementálásához.Tervező: Az Azure Machine Learning-tervező egyszerű belépési pontot biztosít a gépi tanulásba a fogalmak igazolásához, vagy a kevés kódolási tapasztalattal rendelkező felhasználók számára. Lehetővé teszi modellek betanítása húzással webes felhasználói felület használatával. A Python-kódot a tervezés részeként használhatja, vagy kód írása nélkül taníthat be modelleket.
Azure CLI: A gépi tanulási parancssori felület parancsokat biztosít az Azure Machine Learning gyakori feladataihoz, és gyakran használják szkriptek futtatására és automatizálására. Ha például létrehozott egy betanítási szkriptet vagy folyamatot, az Azure CLI használatával elindíthat egy betanítási feladatot egy ütemezés szerint, vagy ha a betanításhoz használt adatfájlok frissülnek. A betanítási modellekhez olyan parancsokat biztosít, amelyek betanítási feladatokat küldnek. Futtatási konfigurációk vagy folyamatok használatával küldhet feladatokat.
Ezek a betanítási módszerek különböző típusú számítási erőforrásokat használhatnak a betanításhoz. Ezeket az erőforrásokat együttesen számítási céloknak nevezzük. A számítási cél lehet egy helyi gép vagy egy felhőbeli erőforrás, például egy Azure Machine Learning Compute, az Azure HDInsight vagy egy távoli virtuális gép.
Python SDK
A Pythonhoz készült Azure Machine Learning SDK-val gépi tanulási munkafolyamatokat hozhat létre és futtathat az Azure Machine Learning használatával. A szolgáltatást interaktív Python-munkamenetből, Jupyter-notebookokból, Visual Studio Code-ból vagy más IDE-ből használhatja.
- Mi a Pythonhoz készült Azure Machine Learning SDK?
- Az SDK telepítése vagy frissítése
- Fejlesztési környezet konfigurálása az Azure Machine Learninghez
Konfiguráció futtatása
Az Azure Machine Learning általános betanítási feladatai a ScriptRunConfig használatával határozhatók meg. Ezután a rendszer a szkriptfuttatás konfigurációját használja a betanítási szkript(ek)kel együtt egy modell számítási célon való betanításához.
A helyi számítógép futtatási konfigurációjával kezdhet, majd szükség szerint átválthat egy felhőalapú számítási célhoz. A számítási cél módosításakor csak a használt futtatási konfigurációt kell módosítania. A futtatás a betanítási feladat adatait is naplózza, például a bemeneteket, a kimeneteket és a naplókat.
- Mi az a futtatási konfiguráció?
- Oktatóanyag: Az első ML-modell betanítása
- Példák: betanítási modellek Jupyter Notebook és Python-példái
- Útmutató: Betanítási futtatás konfigurálása
Automatizált gépi tanulás
Határozza meg az iterációkat, a hiperparaméter-beállításokat, a featurizációt és más beállításokat. A betanítás során az Azure Machine Learning különböző algoritmusokat és paramétereket próbál meg párhuzamosan. A betanítás leáll, amint eléri a megadott kilépési feltételeket.
Tipp
A Python SDK mellett az automatizált gépi tanulást is használhatja Azure Machine Learning stúdió.
- Mi az automatizált gépi tanulás?
- Oktatóanyag: Az első besorolási modell létrehozása automatizált gépi tanulással
- Példák: Jupyter Notebook példák az automatizált gépi tanulásra
- Útmutató: Automatizált gépi tanulási kísérletek konfigurálása Pythonban
- Útmutató: Idősorozat-előrejelzési modell automatikus betanítása
- Útmutató: Automatizált gépi tanulási kísérletek létrehozása, feltárása és üzembe helyezése Azure Machine Learning stúdió
Gépi tanulási folyamat
A gépi tanulási folyamatok használhatják a korábban említett betanítási módszereket. A folyamatok inkább a munkafolyamatok létrehozásáról szólnak, így nem csupán a modellek betanítására terjednek ki. A folyamatokban automatizált gépi tanulással vagy konfigurációk futtatásával taníthat be modelleket.
- Mik azok az ML-folyamatok az Azure Machine Learningben?
- Gépi tanulási folyamatok létrehozása és futtatása az Azure Machine Learning SDK-val
- Oktatóanyag: Azure Machine Learning Pipelines használata kötegelt pontozáshoz
- Példák: Jupyter Notebook példák gépi tanulási folyamatokhoz
- Példák: Folyamat automatizált gépi tanulással
A betanítási feladat beküldésekor megjelenő teendők ismertetése
Az Azure betanítási életciklusa a következőkből áll:
- Tömörítse a projektmappában lévő fájlokat, figyelmen kívül hagyva az .amlignore vagy .gitignore fájlokat
- A számítási fürt vertikális felskálázása
- A dockerfile létrehozása vagy letöltése a számítási csomópontra
- A rendszer a következő kivonatot számítja ki:
- Az alaprendszerkép
- Egyéni docker-lépések (lásd : Modell üzembe helyezése egyéni Docker-alaprendszerkép használatával)
- A CONDA-definíció YAML-jének (lásd: Használati szoftverkörnyezetek létrehozása & az Azure Machine Learningben)
- A rendszer ezt a kivonatot használja kulcsként a munkaterület Azure Container Registry (ACR) keresésében
- Ha nem található, egyezést keres a globális ACR-ben
- Ha nem található, a rendszer létrehoz egy új rendszerképet (amelyet a rendszer gyorsítótáraz és regisztrál az ACR-munkaterületen)
- A rendszer a következő kivonatot számítja ki:
- Tömörített projektfájl letöltése ideiglenes tárhelyre a számítási csomóponton
- A projektfájl kibontása
- A számítási csomópont végrehajtása
python <entry script> <arguments>
- Naplók, modellfájlok és a munkaterülethez társított tárfiókba
./outputs
írt egyéb fájlok mentése - Számítási erőforrások vertikális leskálázása, beleértve az ideiglenes tárterület eltávolítását
Ha a helyi gépen történő betanítása mellett dönt ("helyi futtatásként konfigurálja"), nem kell a Dockert használnia. Ha ezt választja, helyileg is használhatja a Dockert (példa: Gépi tanulási folyamat konfigurálása ).
Azure Machine Learning Designer
A tervező lehetővé teszi modellek betanítása egy húzási felület használatával a webböngészőben.
Azure CLI
A gépi tanulási parancssori felület az Azure CLI bővítménye. Platformfüggetlen CLI-parancsokat biztosít az Azure Machine Learning használatához. Általában a parancssori felülettel automatizálja a feladatokat, például betanít egy gépi tanulási modellt.
Következő lépések
Megtudhatja, hogyan konfigurálhat betanítási futtatásokat.