Mik a számítási célok az Azure Machine Learningben?
A számítási cél egy kijelölt számítási erőforrás vagy környezet, amelyben futtatja a betanítási szkriptet, vagy üzemelteti a szolgáltatás üzembe helyezését. Ez a hely lehet a helyi gép vagy egy felhőalapú számítási erőforrás. A számítási célok használata megkönnyíti a számítási környezet későbbi módosítását anélkül, hogy módosítania kellene a kódot.
Egy tipikus modellfejlesztési életciklusban a következőket teheti:
- Első lépésként kis mennyiségű adatot fejleszthet és kísérletezhet. Ebben a szakaszban használja a helyi környezetet, például egy helyi számítógépet vagy felhőalapú virtuális gépet (VM) számítási célként.
- Vertikálisan felskálázhat nagyobb adatokra, vagy elosztott betanítást hajthat végre ezen betanítási számítási célok egyikével.
- Miután a modell elkészült, helyezze üzembe egy webes üzemeltetési környezetben az alábbi üzembehelyezési számítási célok egyikével.
A számítási célokhoz használt számítási erőforrások egy munkaterülethez vannak csatolva. A helyi gépen kívüli számítási erőforrásokat a munkaterület felhasználói osztják meg.
Számítási célok betanítása
Az Azure Machine Learning különböző támogatással rendelkezik a különböző számítási célokhoz. Egy tipikus modellfejlesztési életciklus kis mennyiségű adat fejlesztésével vagy kísérletezésével kezdődik. Ebben a szakaszban használjon helyi környezetet, például a helyi számítógépet vagy egy felhőalapú virtuális gépet. Ha nagyobb adathalmazokon skálázza fel a betanítást, vagy elosztott betanítást végez, az Azure Machine Learning Compute használatával hozzon létre egy vagy több csomópontos fürtöt, amely minden feladat elküldésekor automatikusan skáláz. Saját számítási erőforrást is csatolhat, bár a különböző forgatókönyvek támogatása eltérő lehet.
A számítási célok az egyik betanítási feladattól a következőig újra felhasználhatók. Ha például egy távoli virtuális gépet csatol a munkaterülethez, több feladathoz is újra felhasználhatja. Gépi tanulási folyamatok esetén minden számítási célhoz használja a megfelelő folyamatlépést .
A következő erőforrások bármelyikét használhatja a legtöbb feladat betanítási számítási céljához. Nem minden erőforrás használható automatizált gépi tanuláshoz, gépi tanulási folyamatokhoz vagy tervezőkhöz. Az Azure Databricks használható betanítási erőforrásként helyi futtatásokhoz és gépi tanulási folyamatokhoz, de nem távoli célként más betanításokhoz.
Képzési célok | Automatizált gépi tanulás | Machine Learning-folyamatok | Azure Machine Learning Designer |
---|---|---|---|
Helyi számítógép | Yes | ||
Azure Machine Learning számítási fürt | Igen | Igen | Yes |
Azure Machine Learning számítási példány | Igen (SDK-n keresztül) | Igen | Yes |
Azure Machine Learning Kubernetes | Igen | Igen | Yes |
Távoli virtuális gép | Igen | Yes | |
Apache Spark-készletek (előzetes verzió) | Igen (csak SDK helyi mód esetén) | Yes | |
Azure Databricks | Igen (csak SDK helyi mód esetén) | Yes | |
Azure Data Lake Analytics | Yes | ||
Azure HDInsight | Yes | ||
Azure Batch | Yes |
Tipp
A számítási példány 120 GB-os operációsrendszer-lemezzel rendelkezik. Ha elfogy a lemezterület, a terminál használatával töröljön legalább 1–2 GB-ot, mielőtt leállítja vagy újraindítja a számítási példányt.
Számítási célok következtetéshez
Következtetés végrehajtásakor az Azure Machine Learning létrehoz egy Docker-tárolót, amely a modell és a használathoz szükséges erőforrásokat tárolja. Ezt a tárolót ezután egy számítási célban használja a rendszer.
A modell üzemeltetéséhez használt számítási cél hatással lesz az üzembe helyezett végpont költségeire és rendelkezésre állására. Ezzel a táblával válasszon ki egy megfelelő számítási célt.
Számítási cél | Alkalmazási cél | GPU-támogatás | Description |
---|---|---|---|
Helyi webszolgáltatás | Tesztelés/hibakeresés | Korlátozott teszteléshez és hibaelhárításhoz használható. A hardveres gyorsítás a kódtárak helyi rendszerben való használatától függ. | |
Azure Machine Learning-végpontok | Valós idejű következtetés Batch-következtetés |
Yes | Teljes körűen felügyelt számítások valós idejű (felügyelt online végpontokhoz) és kötegelt pontozáshoz (kötegelt végpontokhoz) a kiszolgáló nélküli számításban. |
Azure Machine Learning Kubernetes | Valós idejű következtetés Batch-következtetés |
Yes | Következtetési számítási feladatok futtatása helyszíni, felhőbeli és peremhálózati Kubernetes-fürtökön. |
Azure Container Instances (csak SDK/CLI v1 esetén) | Valós idejű következtetés Csak fejlesztési/tesztelési célokra ajánlott. |
Alacsony skálázású, 48 GB RAM-nál kevesebb memóriát igénylő processzoralapú számítási feladatokhoz használható. Nem igényel fürtöt. A tervező támogatja. |
Megjegyzés
Fürt termékváltozatának kiválasztásakor először vertikális felskálázást, majd vertikális felskálázást kell végezni. Kezdje egy olyan géppel, amely a modell által igényelt RAM 150%-át használja, profillal adja meg az eredményt, és keressen egy olyan gépet, amely rendelkezik a szükséges teljesítménnyel. Miután ezt megtudta, növelje a gépek számát, hogy megfeleljen az egyidejű következtetési igénynek.
Megjegyzés
A tárolópéldányokhoz az SDK vagy a CLI v1 szükséges, és csak az 1 GB-nál kisebb méretű kis modellekhez alkalmasak.
Megtudhatja, hol és hogyan helyezheti üzembe a modellt egy számítási célon.
Azure Machine Learning-számítás (felügyelt)
A felügyelt számítási erőforrásokat az Azure Machine Learning hozza létre és felügyeli. Ez a számítás gépi tanulási számítási feladatokhoz van optimalizálva. Az Azure Machine Learning számítási fürtjei és számítási példányai az egyetlen felügyelt számítás.
Azure Machine Learning számítási példányokat vagy számítási fürtöket az alábbiakból hozhat létre:
- Azure Machine Learning stúdió.
- A Python SDK és az Azure CLI:
- Egy Azure Resource Manager-sablon. Példasablonért lásd: Azure Machine Learning számítási fürt létrehozása.
Létrehozásukkor ezek a számítási erőforrások automatikusan a munkaterület részei lesznek, más számítási céloktól eltérően.
Képesség | Számítási fürt | Számítási példány |
---|---|---|
Egy- vagy többcsomópontos fürt | ✓ | Egycsomópontos fürt |
Automatikus skálázás minden feladat elküldésekor | ✓ | |
Automatikus fürtkezelés és feladatütemezés | ✓ | ✓ |
Cpu- és GPU-erőforrások támogatása | ✓ | ✓ |
Megjegyzés
A díjak elkerülése, ha a számítás tétlen:
- Számítási fürt esetén ellenőrizze, hogy a csomópontok minimális száma 0-ra van-e állítva.
- Számítási példány esetén engedélyezze az üresjárati leállítást.
Támogatott virtuálisgép-sorozatok és -méretek
Megjegyzés
A H sorozatú virtuálisgép-sorozat 2022. augusztus 31-én megszűnik. Számítási példányok és számítási fürtök létrehozása alternatív virtuálisgép-méretekkel. A H sorozatú virtuális gépekkel rendelkező meglévő számítási példányok és fürtök 2022. augusztus 31. után nem fognak működni.
Amikor kiválaszt egy csomópontméretet egy felügyelt számítási erőforráshoz az Azure Machine Learningben, választhat az Azure-ban elérhető virtuálisgép-méretek közül. Az Azure számos méretet kínál Linux és Windows rendszeren a különböző számítási feladatokhoz. További információ: Virtuálisgép-típusok és -méretek.
A virtuálisgép-méret kiválasztásának néhány kivétele és korlátozása van:
- Egyes virtuálisgép-sorozatok nem támogatottak az Azure Machine Learningben.
- Vannak olyan virtuálisgép-sorozatok, például GPU-k és egyéb speciális termékváltozatok, amelyek kezdetben nem jelennek meg az elérhető virtuális gépek listájában. A kvótamódosítás kérése után azonban továbbra is használhatja őket. További információ a kvóták kéréséről: Kvótanövelés kérése. A támogatott sorozatokkal kapcsolatos további információkért tekintse meg az alábbi táblázatot.
Támogatott virtuálisgép-sorozat | Kategória | Támogatja: |
---|---|---|
DDSv4 | Általános célú | Számítási fürtök és példányok |
Dv2 | Általános célú | Számítási fürtök és példányok |
Dv3 | Általános célú | Számítási fürtök és példányok |
DSv2 | Általános célú | Számítási fürtök és példányok |
DSv3 | Általános célú | Számítási fürtök és példányok |
EAv4 | Memóriaoptimalizált | Számítási fürtök és példányok |
Ev3 | Memóriaoptimalizált | Számítási fürtök és példányok |
ESv3 | Memóriaoptimalizált | Számítási fürtök és példányok |
FSv2 | Számításra optimalizált | Számítási fürtök és példányok |
FX | Számításra optimalizált | Számítási fürtök |
H | Nagy teljesítményű számítás | Számítási fürtök és példányok |
HB | Nagy teljesítményű számítás | Számítási fürtök és példányok |
HBv2 | Nagy teljesítményű számítás | Számítási fürtök és példányok |
HBv3 | Nagy teljesítményű számítás | Számítási fürtök és példányok |
HC | Nagy teljesítményű számítás | Számítási fürtök és példányok |
LSv2 | Tárolásra optimalizált | Számítási fürtök és példányok |
M | Memóriaoptimalizált | Számítási fürtök és példányok |
NC | GPU | Számítási fürtök és példányok |
NC Promo | GPU | Számítási fürtök és példányok |
NCv2 | GPU | Számítási fürtök és példányok |
NCv3 | GPU | Számítási fürtök és példányok |
ND | GPU | Számítási fürtök és példányok |
NDv2 | GPU | Számítási fürtök és példányok |
NV | GPU | Számítási fürtök és példányok |
NVv3 | GPU | Számítási fürtök és példányok |
NCasT4_v3 | GPU | Számítási fürtök és példányok |
NDasrA100_v4 | GPU | Számítási fürtök és példányok |
Bár az Azure Machine Learning támogatja ezeket a virtuálisgép-sorozatokat, előfordulhat, hogy nem minden Azure-régióban érhetők el. A virtuálisgép-sorozatok elérhetőségének ellenőrzéséhez tekintse meg a régiónként elérhető termékeket ismertető cikket.
Megjegyzés
Az Azure Machine Learning nem támogatja az Azure Compute által támogatott összes virtuálisgép-méretet. Az elérhető virtuálisgép-méretek listázásához használja az alábbi módszerek egyikét:
Ha GPU-kompatibilis számítási célokat használ, fontos gondoskodni arról, hogy a megfelelő CUDA-illesztőprogramok legyenek telepítve a betanítási környezetben. A megfelelő CUDA-verzió meghatározásához használja az alábbi táblázatot:
GPU-architektúra | Azure-beli virtuálisgép-sorozat | Támogatott CUDA-verziók |
---|---|---|
Ampere | NDA100_v4 | 11.0+ |
Turing | NCT4_v3 | 10.0+ |
Volta | NCv3, NDv2 | 9.0+ |
Pascal | NCv2, ND | 9.0+ |
Maxwell | NV, NVv3 | 9.0+ |
Kepler | NC, NC Promo | 9.0+ |
A CUDA-verzió és a hardver kompatibilitásának biztosítása mellett győződjön meg arról is, hogy a CUDA-verzió kompatibilis az Ön által használt gépi tanulási keretrendszer verziójával:
- A PyTorch esetében a kompatibilitás ellenőrzéséhez látogasson el a Pytorch korábbi verzióinak oldalára.
- A Tensorflow esetében a kompatibilitás ellenőrzéséhez látogasson el a Tensorflow forrásoldaláról készült buildre.
Számításelkülönítés
Az Azure Machine Learning Compute olyan virtuálisgép-méreteket kínál, amelyek egy adott hardvertípushoz vannak elkülönítve, és egyetlen ügyfélnek vannak kiállítva. Az izolált virtuálisgép-méretek olyan számítási feladatokhoz ideálisak, amelyek nagy fokú elkülönítést igényelnek más ügyfelek számítási feladataitól a megfelelőségi és szabályozási követelmények teljesítését is magában foglaló okokból. Az elkülönített méret használata garantálja, hogy a virtuális gép lesz az egyetlen, amely az adott kiszolgálópéldányon fut.
Az aktuális izolált virtuálisgép-ajánlatok a következők:
- Standard_M128ms
- Standard_F72s_v2
- Standard_NC24s_v3
- Standard_NC24rs_v3*
*RDMA-kompatibilis
További információ az elkülönítésről: Elkülönítés az Azure nyilvános felhőben.
Nem felügyelt számítás
A nem felügyelt számítási célokat az Azure Machine Learning nem kezeli. Ezt a számítási célt az Azure Machine Learningen kívül hozza létre, majd csatolja a munkaterülethez. A nem felügyelt számítási erőforrásokhoz további lépésekre lehet szükség a gépi tanulási számítási feladatok teljesítményének fenntartásához vagy javításához.
Az Azure Machine Learning a következő nem felügyelt számítási típusokat támogatja:
Távoli virtuális gépek
Azure HDInsight
Azure Databricks
Azure Data Lake Analytics
Azure Synapse Spark-készlet (előzetes verzió)
Tipp
Ehhez jelenleg az Azure Machine Learning SDK v1 szükséges.
További információ: Számítási erőforrások kezelése.
Következő lépések
Az alábbiak végrehajtásának módját ismerheti meg: