Azure Machine Tanulás szószedet

Az Azure Machine Tanulás szószedet a Machine Tanulás platform terminológiájának rövid szótára. Az Azure általános terminológiája:

Összetevő

A gépi Tanulás összetevő egy önálló kódrészlet, amely egy lépést hajt végre egy gépi tanulási folyamatban. Az összetevők a fejlett gépi tanulási folyamatok építőelemei. Az összetevők olyan feladatokat végezhetnek, mint az adatfeldolgozás, a modell betanítása és a modell pontozása. Az összetevők egy függvényhez hasonlóak. Névvel és paraméterekkel rendelkezik, bemenetet vár, és kimenetet ad vissza.

Compute

A számítás egy kijelölt számítási erőforrás, ahol futtatja a feladatot, vagy üzemelteti a végpontot. A gépi Tanulás a következő számítási típusokat támogatja:

  • Számítási fürt: Felügyelt számítási infrastruktúra, amellyel egyszerűen hozhat létre cpu- vagy GPU-számítási csomópontokat tartalmazó fürtöt a felhőben.

    Feljegyzés

    Számítási fürt létrehozása helyett használjon kiszolgáló nélküli számítást a számítási életciklus-felügyelet Azure Machine-Tanulás való kiszervezéséhez.

  • Számítási példány: Teljes mértékben konfigurált és felügyelt fejlesztési környezet a felhőben. A példányt a fejlesztéshez és teszteléshez használhatja betanítási vagy következtetési számításként. Hasonló a felhőben lévő virtuális gépekhez.

  • Kubernetes-fürt: Betanított gépi tanulási modellek üzembe helyezésére szolgál az Azure Kubernetes Service-ben (AKS). Létrehozhat egy AKS-fürtöt a Machine Tanulás munkaterületről, vagy csatolhat egy meglévő AKS-fürtöt.

  • Csatolt számítás: Saját számítási erőforrásokat csatolhat a munkaterülethez, és betanításra és következtetésre használhatja őket.

Adatok

A gépi Tanulás különböző típusú adatokkal dolgozhat:

  • URI-k (helyi vagy felhőbeli tárolóhely):
    • uri_folder
    • uri_file
  • Táblák (táblázatos adat absztrakció):
    • mltable
  • Primitívek:
    • string
    • boolean
    • number

A legtöbb forgatókönyv esetében az URI-k (uri_folder és uri_file) használatával azonosíthatja a tárterület azon helyét, amely egyszerűen leképezhető egy számítási csomópont fájlrendszerére egy feladatban a tároló csatlakoztatásával vagy a csomópontra való letöltésével.

A mltable paraméter absztrakció az automatizált gépi tanulási (AutoML) feladatokhoz, párhuzamos feladatokhoz és néhány speciális forgatókönyvhöz használt táblázatos adatokhoz. Ha elkezdi használni a Machine Tanulás, és nem használja az AutoML-t, határozottan javasoljuk, hogy kezdjen URI-kkal.

Adattár

A gépi Tanulás adattárak biztonságosan őrzik meg a kapcsolati adatokat az Azure-beli adattárhoz, hogy ne kelljen a szkriptekben kódokat megadnia. Regisztrálhat és létrehozhat egy adattárat, amellyel egyszerűen csatlakozhat a tárfiókhoz, és hozzáférhet a mögöttes tárolási szolgáltatásban lévő adatokhoz. Az Azure Machine Tanulás CLI v2 és SDK v2 a következő felhőalapú tárolási szolgáltatásokat támogatja:

  • Azure Blob Storage-tároló
  • Azure Files-megosztás
  • Azure Data Lake Storage
  • Azure Data Lake Storage Gen2

Környezet

A gépi Tanulás környezetek annak a környezetnek a beágyazása, amelyben a gépi tanulási feladat történik. Megadják a betanítási és pontozási szkriptek körüli szoftvercsomagokat, környezeti változókat és szoftverbeállításokat. A környezetek felügyelt és verziószámozott entitások a Gép Tanulás munkaterületen belül. A környezetek lehetővé teszik a reprodukálható, naplózható és hordozható gépi tanulási munkafolyamatokat a különböző számításokban.

Környezettípusok

A gépi Tanulás kétféle környezetet támogat: válogatott és egyéni.

A válogatott környezeteket a Machine Tanulás biztosítja, és alapértelmezés szerint elérhetők a munkaterületen. A rendeltetésük az, hogy a megszokott módon használják őket. Python-csomagokat és beállításokat tartalmazó gyűjteményeket tartalmaznak, amelyek segítenek a különböző gépi tanulási keretrendszerek használatának megkezdésében. Ezek az előre létrehozott környezetek gyorsabb üzembe helyezési időt is lehetővé teszik. Az elérhető környezetek teljes listájának lekéréséhez tekintse meg az Azure Machine Tanulás környezeteket a CLI &SDK (v2) használatával.

Egyéni környezetekben ön a felelős a környezet beállításáért. Győződjön meg arról, hogy telepíti a betanítási vagy pontozási szkript által igényelt csomagokat és egyéb függőségeket a számításhoz. A gépi Tanulás lehetővé teszi saját környezet létrehozását a következő használatával:

  • Docker-rendszerkép.
  • Egy alap Docker-rendszerkép conda YAML-sel a további testreszabáshoz.
  • Docker-buildkörnyezet.

Modell

A gépi Tanulás modellek olyan bináris fájlokból állnak, amelyek egy gépi tanulási modellt és a kapcsolódó metaadatokat jelölik. Modelleket helyi vagy távoli fájlból vagy könyvtárból hozhat létre. A távoli helyek esetében httpsa , wasbsés azureml a helyek támogatottak. A létrehozott modell nyomon követhető a munkaterületen a megadott név és verzió alatt. A gépi Tanulás háromféle tárolási formátumot támogat a modellekhez:

  • custom_model
  • mlflow_model
  • triton_model

Munkaterület

A munkaterület a gépi Tanulás legfelső szintű erőforrása. Központi helyet biztosít a gépi Tanulás használatakor létrehozott összes összetevővel való munkához. A munkaterület megőrzi az összes feladat előzményeit, beleértve a naplókat, metrikákat, kimeneteket és a szkriptek pillanatképét. A munkaterület olyan erőforrásokra mutató hivatkozásokat tárol, mint az adattárak és a számítás. Emellett minden olyan objektumot tartalmaz, mint a modellek, a környezetek, az összetevők és az adategységek.

Következő lépések

Mi az Azure Machine Learning?