Megosztás a következőn keresztül:


A Microsoft Cognitive Toolkit mélytanulási modell használata az Azure HDInsight Spark-fürttel

Ebben a cikkben a következő lépéseket kell elvégeznie.

  1. Futtasson egy egyéni szkriptet a Microsoft Cognitive Toolkit Azure HDInsight Spark-fürtön való telepítéséhez.

  2. Töltsön fel egy Jupyter-jegyzetfüzetet az Apache Spark-fürtbe , és ismerje meg, hogyan alkalmazhat betanított Microsoft Cognitive Toolkit mélytanulási modellt egy Azure Blob Storage-fiók fájljaira a Spark Python API (PySpark) használatával.

Előfeltételek

Hogyan halad ez a megoldás?

Ez a megoldás a cikk és a cikk részeként feltöltött Jupyter Notebook között oszlik meg. Ebben a cikkben a következő lépéseket hajtja végre:

  • Futtasson egy szkriptműveletet egy HDInsight Spark-fürtön a Microsoft Cognitive Toolkit és Python-csomagok telepítéséhez.
  • Töltse fel a megoldást futtató Jupyter Notebookot a HDInsight Spark-fürtre.

A jupyter notebook a következő további lépéseket ismerteti.

  • Mintaképek betöltése sparkos rugalmas elosztott adatkészletbe vagy RDD-be.
    • Modulok betöltése és előre beállított beállítások definiálása.
    • Töltse le az adathalmazt helyileg a Spark-fürtön.
    • Konvertálja az adathalmazt RDD-vé.
  • A képek pontszáma betanított Cognitive Toolkit-modellel.
    • Töltse le a betanított Cognitive Toolkit-modellt a Spark-fürtre.
    • Definiálja a feldolgozó csomópontok által használandó függvényeket.
    • A munkavégző csomópontokon lévő képek pontszáma.
    • Modell pontosságának kiértékelése.

A Microsoft Cognitive Toolkit telepítése

A Microsoft Cognitive Toolkit szkriptművelettel telepíthető Spark-fürtökre. A szkriptművelet egyéni szkriptekkel telepíti az alapértelmezés szerint nem elérhető összetevőket a fürtre. Az egyéni szkriptet az Azure Portalról, a HDInsight .NET SDK-val vagy az Azure PowerShell használatával használhatja. A szkripttel telepítheti az eszközkészletet a fürtlétrehozás részeként, vagy a fürt üzembe helyezése után is.

Ebben a cikkben a portál használatával telepítjük az eszközkészletet a fürt létrehozása után. Az egyéni szkript futtatásának egyéb módjai: HDInsight-fürtök testreszabása szkriptművelettel.

Az Azure Portal használatával

A szkriptműveletek futtatásához az Azure Portal használatával kapcsolatos útmutatásért lásd : HDInsight-fürtök testreszabása szkriptművelettel. Győződjön meg arról, hogy a Microsoft Cognitive Toolkit telepítéséhez a következő bemeneteket adja meg. A szkriptművelethez használja a következő értékeket:

Tulajdonság Érték
Szkript típusa -Egyéni
Név Az MCT telepítése
Bash-szkript URI https://raw.githubusercontent.com/Azure-Samples/hdinsight-pyspark-cntk-integration/master/cntk-install.sh
Csomópont típusa(i): Vezető, feldolgozó
Paraméterek Egyik sem

A Jupyter Notebook feltöltése az Azure HDInsight Spark-fürtbe

A Microsoft Cognitive Toolkit azure HDInsight Spark-fürttel való használatához be kell töltenie a Jupyter Notebook CNTK_model_scoring_on_Spark_walkthrough.ipynb-t az Azure HDInsight Spark-fürtbe. Ez a jegyzetfüzet a GitHubon érhető el a következő címen https://github.com/Azure-Samples/hdinsight-pyspark-cntk-integration: .

  1. Töltse le és bontsa https://github.com/Azure-Samples/hdinsight-pyspark-cntk-integrationki a fájlt.

  2. Egy webböngészőben keresse meg https://CLUSTERNAME.azurehdinsight.net/jupyterCLUSTERNAME a fürt nevét.

  3. A Jupyter Notebookban válassza a Feltöltés lehetőséget a jobb felső sarokban, majd lépjen a letöltéshez, és válassza ki a fájltCNTK_model_scoring_on_Spark_walkthrough.ipynb.

    Upload Jupyter Notebook to Azure HDInsight Spark cluster.

  4. Válassza ismét a Feltöltés lehetőséget.

  5. A jegyzetfüzet feltöltése után kattintson a jegyzetfüzet nevére, majd kövesse a jegyzetfüzetben található utasításokat az adatkészlet betöltésére és a cikk végrehajtására vonatkozóan.

Lásd még

Forgatókönyvek

Alkalmazások létrehozása és futtatása

Eszközök és bővítmények

Erőforrások kezelése