Mi az az Azure Machine Learning-munkaterület?
A munkaterületek olyan helyek, ahol a munkatársakkal együttműködve gépi tanulási összetevőket hozhatnak létre és csoporthoz kapcsolódó munkát hozhatnak létre. Kísérletek, feladatok, adathalmazok, modellek, összetevők és következtetési végpontok. Ez a cikk a munkaterületeket, a hozzájuk való hozzáférés kezelését és a munka rendszerezésére való használatát ismerteti.
Készen áll a kezdésre? Munkaterület létrehozása.
Munkaterületen végzett feladatok
A gépi tanulási csapatok számára a munkaterület a munkájuk rendszerezésének helye. Íme néhány, a munkaterületről indítható feladat:
- Feladatok létrehozása – A feladatok olyan betanítási futtatások, amelyeket a modellek létrehozásához használ. A metrikák összehasonlítása érdekében a feladatokat kísérletekbe csoportosíthatja.
- Szerzői folyamatok – A folyamatok újrahasználható munkafolyamatok a modell betanításához és újratanításához.
- Adategységek regisztrálása – Az adategységek segítséget nyújtnak a modell betanításához és a folyamatok létrehozásához használt adatok kezeléséhez.
- Modellek regisztrálása – Ha már rendelkezik egy üzembe helyezni kívánt modellel, létre kell hoznia egy regisztrált modellt.
- Online végpontok létrehozása – Egy regisztrált modell és egy pontozószkript használatával hozhat létre online végpontot.
- Modell üzembe helyezése – Modell üzembe helyezéséhez használja a regisztrált modellt és a pontozószkriptet.
A gépi tanulási eredmények csoportosítása mellett a munkaterületek erőforrás-konfigurációkat is üzemeltetnek:
- A számítási célok a kísérletek futtatására szolgálnak.
- Az adattárak meghatározzák , hogyan csatlakozhat ön és mások az adatforrásokhoz adategységek használatakor.
- Biztonsági beállítások – Hálózatkezelés, identitás- és hozzáférés-vezérlés, valamint titkosítási beállítások.
Munkaterületek rendszerezése
A gépi tanulási csapat vezetői és rendszergazdái számára a munkaterületek tárolókként szolgálnak a hozzáférés-kezeléshez, a költségkezeléshez és az adatelkülönítéshez. Íme néhány tipp a munkaterületek rendszerezéséhez:
- Felhasználói szerepkörök használata a felhasználók közötti munkaterület engedélykezeléséhez. Adatelemző, gépi tanulási mérnök vagy rendszergazda.
- Hozzáférés hozzárendelése felhasználói csoportokhoz: A Microsoft Entra felhasználói csoportok használatával nem kell egyéni felhasználókat hozzáadnia az egyes munkaterületekhez, és más olyan erőforrásokhoz, amelyekhez ugyanaz a felhasználócsoport hozzáférést igényel.
- Munkaterület létrehozása projektenként: Bár egy munkaterület több projekthez is használható, munkaterületenként egy projektre korlátozva lehetővé teszi a projektszintű költségjelentést. Emellett lehetővé teszi az olyan konfigurációk kezelését is, mint az adattárak az egyes projektek hatókörében.
- Azure-erőforrások megosztása: A munkaterületeken több társított erőforrást is létre kell hoznia. Ezeket az erőforrásokat megoszthatja a munkaterületek között az ismétlődő beállítási lépések mentéséhez.
- Önkiszolgáló szolgáltatás engedélyezése: A társított erőforrások előzetes létrehozása és biztonságossá tétele rendszergazdaként, valamint felhasználói szerepkörök használata, amelyekkel az adatelemzők önállóan hozhatnak létre munkaterületeket.
- Eszközök megosztása: Az azure Machine Learning-regisztrációs adatbázisok használatával megoszthatja az eszközöket a munkaterületek között.
Hogyan tárolja a tartalmat egy munkaterület?
A munkaterület megőrzi az összes betanítási futtatás előzményeit, naplókkal, metrikákkal, kimenettel, az életút metaadataival és a szkriptek pillanatképével. Amikor feladatokat végez az Azure Machine Learningben, az összetevők létrejönnek. A metaadatok és az adatok a munkaterületen és a hozzá tartozó erőforrásokon vannak tárolva.
Társított erőforrások
Amikor új munkaterületet hoz létre, más Azure-erőforrásokat is be kell hoznia az adatok tárolásához. Ha ön nem adja meg, ezeket az erőforrásokat az Azure Machine Learning automatikusan létrehozza.
Egy Azure Storage-fiók. Gépi tanulási összetevőket, például feladatnaplókat tárol. Alapértelmezés szerint ezt a tárfiókot használja a rendszer, amikor adatokat tölt fel a munkaterületre. Az Azure Machine Learning számítási példányaival használt Jupyter-jegyzetfüzetek is itt vannak tárolva.
Fontos
Meglévő Azure Storage-fiók nem használható, ha az a következő:
- BlobStorage típusú fiók
- Prémium szintű fiók (Premium_LRS és Premium_GRS)
- Hierarchikus névtérrel rendelkező fiók (az Azure Data Lake Storage Gen2-vel használatos).
A prémium szintű tárolót vagy a hierarchikus névteret további tárolóként használhatja egy adattár létrehozásával.
Ne engedélyezze a hierarchikus névteret a tárolófiókon az általános célú v2-re történő frissítés után.
Ha egy meglévő általános célú v1-tárfiókot hoz létre, a munkaterület létrehozása után ezt frissítheti általános célú v2-re .
Azure Container Registry (ACR). Az áruházak docker-tárolókat hoztak létre, amikor egyéni környezeteket hoz létre az Azure Machine Learning használatával. Az AutoML-modellek és adatprofilok üzembe helyezése egyéni környezetek létrehozását is elindítja.
A munkaterületek az ACR nélkül is létrehozhatók függőségként, ha nincs szükség egyéni Docker-tárolók létrehozására. Az Azure Machine Learning képes olvasni a külső tárolóregisztrációs adatbázisokból.
Az ACR automatikusan ki lesz építve egyéni Docker-rendszerképek létrehozásakor. Az Azure szerepköralapú hozzáférés-vezérlés (Azure RBAC) használatával megakadályozhatja az ügyfél Docker-tárolóinak kiépítését.
Fontos
Ha az előfizetési beállításhoz címkéket kell hozzáadnia az erőforrásokhoz, az Azure Machine Learning által létrehozott ACR sikertelen lesz, mivel nem állíthatunk be címkéket az ACR-be.
Azure-alkalmazás Insights. Segít a diagnosztikai adatok figyelésében és gyűjtésében a következtetési végpontokból.
További információ: Online végpontok figyelése.
Azure Key Vault. A számítási célok által használt titkos kulcsokat és a munkaterülethez szükséges egyéb bizalmas információkat tárolja.
Munkaterület létrehozása
Több módon is létrehozhat munkaterületet. Első lépésként használja az alábbi lehetőségek egyikét:
- Az Azure Machine Learning Studio segítségével gyorsan létrehozhat egy alapértelmezett beállításokkal rendelkező munkaterületet.
- Az Azure Portalon több biztonsági lehetőséggel rendelkező pont- és kattintási felületet használhat.
- Használja a VS Code bővítményt , ha a Visual Studio Code-ban dolgozik.
A munkaterületek létrehozásának automatizálása az előnyben részesített biztonsági beállítások használatával:
- Az Azure Resource Manager/Bicep-sablonok deklaratív szintaxist biztosítanak az Azure-erőforrások üzembe helyezéséhez. Egy másik lehetőség a Terraform használata. Lásd még a Bicep-sablont vagy a Terraform-sablont.
- Az Azure Machine Learning CLI vagy a Pythonhoz készült Azure Machine Learning SDK használata prototípus-készítéshez és az MLOps-munkafolyamatok részeként.
- Az Azure Machine Learning CLI vagy a Pythonhoz készült Azure Machine Learning SDK használata prototípus-készítéshez és az MLOps-munkafolyamatok részeként.
- A REST API-kat közvetlenül szkriptelési környezetben, platformintegrációhoz vagy MLOps-munkafolyamatokhoz használhatja.
Eszközök a munkaterületek interakcióihoz és felügyeletéhez
A munkaterület beállítása után a következő módokon kezelheti:
- Bármely Python-környezetben az Azure Machine Learning SDK-val.
- A parancssorban az Azure Machine Learning CLI 2-es bővítményének használatával
- Bármely Python-környezetben az Azure Machine Learning SDK-val
- A parancssorban az Azure Machine Learning CLI 1-es bővítményének használatával
Az egyes felületeken az alábbi munkaterület-kezelési feladatok érhetők el.
Munkaterület-kezelési feladat | Portál | Studio | Python SDK | Azure CLI | VS Code |
---|---|---|---|---|---|
Munkaterület létrehozása | ✓ | ✓ | ✓ | ✓ | ✓ |
Munkaterület hozzáférésének kezelése | ✓ | ✓ | |||
Számítási erőforrások létrehozása és kezelése | ✓ | ✓ | ✓ | ✓ | ✓ |
Számítási példány létrehozása | ✓ | ✓ | ✓ | ✓ |
Figyelmeztetés
Az Azure Machine Learning-munkaterület áthelyezése egy másik előfizetésbe vagy a tulajdonosi előfizetés áthelyezése új bérlőre nem támogatott. Ha így tesz, az hibákat okozhat.
Alerőforrások
Amikor számítási fürtöket és számítási példányokat hoz létre az Azure Machine Learningben, a rendszer alerőforrásokat hoz létre.
- Virtuális gépek: számítási teljesítményt biztosítanak számítási példányokhoz és számítási fürtökhöz, amelyeket feladatok futtatásához használ.
- Load Balancer: minden számítási példányhoz és számítási fürthöz létrejön egy hálózati terheléselosztó, amely a forgalmat akkor is kezeli, ha a számítási példány/fürt leáll.
- Virtuális hálózat: ezek segítenek az Azure-erőforrásoknak kommunikálni egymással, az internettel és más helyszíni hálózatokkal.
- Sávszélesség: magában foglalja az összes kimenő adatátvitelt a régiók között.
Következő lépések
Ha többet szeretne tudni a munkaterület szervezet igényeinek megfelelő tervezéséről, olvassa el az Azure Machine Learning rendszerezését és beállítását ismertető témakört.
Az Azure Machine Learning használatának megkezdéséhez lásd: