Megosztás a következőn keresztül:


Adatok gyűjtése éles modellekből

ÉRVÉNYES:Python SDK azureml v1

Ez a cikk bemutatja, hogyan gyűjthet adatokat egy Azure Kubernetes Service-fürtön üzembe helyezett Azure Machine Learning-modellből. Az összegyűjtött adatok ezután az Azure Blob Storage-ban lesznek tárolva.

A gyűjtemény engedélyezése után az összegyűjtött adatok a következőkben segítenek:

Korlátozások

  • A modell adatgyűjtési funkciója csak az Ubuntu 18.04-rendszerképekkel használható.

Fontos

2023. 03. 10-én az Ubuntu 18.04 kép elavult. Az Ubuntu 18.04-es rendszerképek támogatása 2023. januártól megszűnik, amikor 2023. április 30-án eléri az EOL-t.

Az MDC funkció nem kompatibilis az Ubuntu 18.04-nél más képpel, amely az Ubuntu 18.04-rendszerkép elavultsága után nem érhető el.

mTovábbi információ, amelyre hivatkozhat:

Feljegyzés

Az adatgyűjtési funkció jelenleg előzetes verzióban érhető el, az éles számítási feladatokhoz nem ajánlott előzetes verziójú funkciók használata.

Az összegyűjtött adatok és azok helye

A következő adatok gyűjthetők:

  • Egy AKS-fürtben üzembe helyezett webszolgáltatások bemeneti adatainak modellezése. A rendszer nem gyűjt hangokat, képeket és videókat.

  • Modell-előrejelzések éles bemeneti adatokkal.

Feljegyzés

Ezen adatok előaggregációja és előszámításai jelenleg nem részei a gyűjtési szolgáltatásnak.

A kimenet a Blob Storage-ba lesz mentve. Mivel az adatok hozzáadva lesznek a Blob Storage-hoz, kiválaszthatja a kedvenc eszközét az elemzés futtatásához.

A blob kimeneti adatainak elérési útja a következő szintaxist követi:

/modeldata/<subscriptionid>/<resourcegroup>/<workspace>/<webservice>/<model>/<version>/<designation>/<year>/<month>/<day>/data.csv
# example: /modeldata/1a2b3c4d-5e6f-7g8h-9i10-j11k12l13m14/myresourcegrp/myWorkspace/aks-w-collv9/best_model/10/inputs/2018/12/31/data.csv

Feljegyzés

A PythonHoz készült Azure Machine Learning SDK 0.1.0a16-osnál korábbi verzióiban az designation argumentum neve identifier. Ha a kódot egy korábbi verzióval fejlesztette ki, ennek megfelelően frissítenie kell.

Előfeltételek

Az adatgyűjtés engedélyezése

Az adatgyűjtést az Azure Machine Learningben vagy más eszközökkel üzembe helyezhető modelltől függetlenül engedélyezheti.

Az adatgyűjtés engedélyezéséhez a következőkre van szükség:

  1. Nyissa meg a pontozófájlt.

  2. Adja hozzá a következő kódot a fájl tetején:

    from azureml.monitoring import ModelDataCollector
    
  3. Az adatgyűjtési változók deklarálása a init függvényben:

    global inputs_dc, prediction_dc
    inputs_dc = ModelDataCollector("best_model", designation="inputs", feature_names=["feat1", "feat2", "feat3", "feat4", "feat5", "feat6"])
    prediction_dc = ModelDataCollector("best_model", designation="predictions", feature_names=["prediction1", "prediction2"])
    

    A CorrelationId nem kötelező paraméter. Nem kell használnia, ha a modell nem igényli. A CorrelationId használata megkönnyíti a más adatok, például a LoanNumber vagy a CustomerId leképezését.

    Az Azonosító paramétert később a blob mappastruktúrájának létrehozásához használják. Használatával megkülönböztetheti a nyers adatokat a feldolgozott adatoktól.

  4. Adja hozzá a következő kódsorokat a run(input_df) függvényhez:

    data = np.array(data)
    result = model.predict(data)
    inputs_dc.collect(data) #this call is saving our input data into Azure Blob
    prediction_dc.collect(result) #this call is saving our prediction data into Azure Blob
    
  5. Az adatgyűjtés nem lesz automatikusan igaz, amikor egy szolgáltatást helyez üzembe az AKS-ben. Frissítse a konfigurációs fájlt az alábbi példához hasonlóan:

    aks_config = AksWebservice.deploy_configuration(collect_model_data=True)
    

    A konfiguráció módosításával az Application Insights szolgáltatásfigyelési funkcióját is engedélyezheti:

    aks_config = AksWebservice.deploy_configuration(collect_model_data=True, enable_app_insights=True)
    
  6. Új rendszerkép létrehozásához és a gépi tanulási modell üzembe helyezéséhez lásd : Gépi tanulási modellek üzembe helyezése az Azure-ban.

  7. Adja hozzá az "Azure-Monitoring" pipcsomagot a webszolgáltatás-környezet conda-függőségeihez:

  env = Environment('webserviceenv')
  env.python.conda_dependencies = CondaDependencies.create(conda_packages=['numpy'],pip_packages=['azureml-defaults','azureml-monitoring','inference-schema[numpy-support]'])

Adatgyűjtés letiltása

Az adatok gyűjtését bármikor megszüntetheti. Python-kóddal tiltsa le az adatgyűjtést.

## replace <service_name> with the name of the web service
<service_name>.update(collect_model_data=False)

Adatok ellenőrzése és elemzése

Kiválaszthatja a kívánt eszközt a Blob Storage-ban gyűjtött adatok elemzéséhez.

Blobadatok gyors elérése

  1. Jelentkezzen be az Azure portálra.

  2. Nyissa meg a munkaterületet.

  3. Válassza a Storage lehetőséget.

    Válassza a Tárolás lehetőséget

  4. Kövesse a blob kimeneti adatainak elérési útját az alábbi szintaxissal:

    /modeldata/<subscriptionid>/<resourcegroup>/<workspace>/<webservice>/<model>/<version>/<designation>/<year>/<month>/<day>/data.csv
    # example: /modeldata/1a2b3c4d-5e6f-7g8h-9i10-j11k12l13m14/myresourcegrp/myWorkspace/aks-w-collv9/best_model/10/inputs/2018/12/31/data.csv
    

Modelladatok elemzése a Power BI használatával

  1. Töltse le és nyissa meg a Power BI Desktopot.

  2. Válassza az Adatok lekérése, majd az Azure Blob Storage lehetőséget.

    Power BI-blobok beállítása

  3. Adja meg a tárfiók nevét, és adja meg a tárkulcsot. Ezeket az információkat a Blob Beállítások>hozzáférési kulcsai lehetőséget választva találja meg.

  4. Válassza ki a modell adattárolót , és válassza a Szerkesztés lehetőséget.

    Power BI Kezelő

  5. A lekérdezésszerkesztőben kattintson a Név oszlop alatt, és adja hozzá a tárfiókot.

  6. Adja meg a modell elérési útját a szűrőbe. Ha csak egy adott év vagy hónap fájljait szeretné megvizsgálni, bontsa ki a szűrő elérési útját. Ha például csak a márciusi adatokat szeretné megvizsgálni, használja ezt a szűrőútvonalat:

    /modeldata/<subscriptionid>/<resourcegroupname/<workspacename>>/<webservicename>/<modelname>/<modelversion>/<designation>/<year>/3

  7. A névértékek alapján szűrheti az Ön számára releváns adatokat. Ha előrejelzéseket és bemeneteket tárolt, mindegyikhez létre kell hoznia egy lekérdezést.

  8. A fájlok kombinálásához válassza a Tartalom oszlopfejléc melletti lefelé mutató dupla nyilakat.

    Power BI-tartalom

  9. Kattintson az OK gombra. Az adatok előre betöltődnek.

    Power BI – Fájlok egyesítése

  10. Válassza a Bezárás és alkalmazás lehetőséget.

  11. Ha bemeneteket és előrejelzéseket adott hozzá, a rendszer automatikusan a RequestId értékek alapján rendezi a táblákat.

  12. Kezdje el az egyéni jelentések készítését a modelladatokon.

Modelladatok elemzése az Azure Databricks használatával

  1. Azure Databricks-munkaterület létrehozása.

  2. Lépjen a Databricks-munkaterületre.

  3. A Databricks-munkaterületen válassza az Adatok feltöltése lehetőséget.

    A Databricks Adatok feltöltése lehetőség kiválasztása

  4. Válassza az Új tábla létrehozása lehetőséget, és válassza az Egyéb adatforrások>Azure Blob Storage>Tábla létrehozása jegyzetfüzetben lehetőséget.

    Databricks-tábla létrehozása

  5. Frissítse az adatok helyét. Egy példa:

    file_location = "wasbs://mycontainer@storageaccountname.blob.core.windows.net/modeldata/1a2b3c4d-5e6f-7g8h-9i10-j11k12l13m14/myresourcegrp/myWorkspace/aks-w-collv9/best_model/10/inputs/2018/*/*/data.csv" 
    file_type = "csv"
    

    A Databricks beállítása

  6. Az adatok megtekintéséhez és elemzéséhez kövesse a sablon lépéseit.

Következő lépések

Észleli az összegyűjtött adatok adateltolódását .