Share via


Adatelemzés Windows Data Science Virtual Machine

A Windows Data Science Virtual Machine (DSVM) egy hatékony adatelemzési fejlesztési környezet, ahol adatfeltárási és modellezési feladatokat végezhet. A környezet már számos népszerű adatelemzési eszközzel rendelkezik, amelyek megkönnyítik a helyszíni, felhőbeli vagy hibrid üzemelő példányok elemzésének megkezdését.

A DSVM szorosan együttműködik az Azure-szolgáltatásokkal. Képes az Azure-ban már tárolt adatok olvasására és feldolgozására a Azure Synapse (korábbi nevén SQL DW), az Azure Data Lake, az Azure Storage vagy az Azure Cosmos DB-ben. Más elemzési eszközöket is használhat, például az Azure Machine Learninget.

Ebből a cikkből megtudhatja, hogyan használhatja a DSVM-et adatelemzési feladatok végrehajtására és más Azure-szolgáltatásokkal való interakcióra. Íme néhány dolog, amit a DSVM-en elvégezhet:

  • A Python 2, a Python 3 és a Microsoft R használatával Jupyter Notebook kísérletezhet az adatokkal egy böngészőben. (A Microsoft R az R nagyvállalati használatra kész verziója, amelyet teljesítményre terveztek.)

  • Az adatok megismerése és modellek helyi fejlesztése a DSVM-en a Microsoft Machine Learning Server és a Python használatával.

  • Az Azure-erőforrások felügyelete a Azure Portal vagy a PowerShell használatával.

  • Bővítse ki a tárterületet, és ossza meg a nagy léptékű adathalmazokat/kódot a teljes csapatban, ha egy Azure Files megosztást hoz létre csatlakoztatható meghajtóként a DSVM-en.

  • Kódot oszthat meg a csapatával a GitHub használatával. Az adattár eléréséhez használja az előre telepített Git-ügyfeleket: a Git Basht és a Git GUI-t.

  • Olyan Azure-adat- és elemzési szolgáltatásokhoz férhet hozzá, mint az Azure Blob Storage, az Azure Cosmos DB, a Azure Synapse (korábbi nevén SQL DW) és a Azure SQL Database.

  • Jelentéseket és irányítópultot hozhat létre a DSVM-en előre telepített Power BI Desktop-példány használatával, és üzembe helyezheti őket a felhőben.

  • Telepítsen további eszközöket a virtuális gépre.

Megjegyzés

Az ebben a cikkben felsorolt adattárolási és elemzési szolgáltatásokra további használati díjak vonatkoznak. A részletekért tekintse meg az Azure díjszabását ismertető oldalt.

Előfeltételek

Megjegyzés

Javasoljuk, hogy az Azure Az PowerShell-modult használja az Azure-ral való kommunikációhoz. Az első lépésekhez tekintse meg az Azure PowerShell telepítését ismertető szakaszt. Az Az PowerShell-modulra történő migrálás részleteiről lásd: Az Azure PowerShell migrálása az AzureRM modulból az Az modulba.

A Jupyter-notebookok használata

A Jupyter Notebook böngészőalapú IDE-t biztosít az adatfeltáráshoz és modellezéshez. A Python 2, Python 3 vagy R Jupyter Notebook is használható.

A Jupyter Notebook elindításához válassza a start menüben vagy az asztalon található Jupyter Notebook ikont. A DSVM parancssorában futtathatja azt a parancsot jupyter notebook is a könyvtárból, ahol meglévő jegyzetfüzetek vannak, vagy ahol új jegyzetfüzeteket szeretne létrehozni.

A Jupyter elindítása után keresse meg a /notebooks könyvtárat, például a DSVM-be előre csomagolt jegyzetfüzeteket. Ezután:

  • Válassza ki a jegyzetfüzetet a kód megtekintéséhez.
  • Futtassa az egyes cellákat a Shift+Enter billentyűkombinációval.
  • Futtassa a teljes jegyzetfüzetet aCellafuttatás> lehetőség kiválasztásával.
  • Hozzon létre egy új jegyzetfüzetet a Jupyter ikonra (a bal felső sarokban), válassza a jobb oldalon az Új gombot, majd válassza ki a jegyzetfüzet nyelvét (más néven kerneleket).

Megjegyzés

Jelenleg a Python 2.7, Python 3.6, R, Julia és PySpark kernelek támogatottak a Jupyterben. Az R kernel támogatja a programozást a nyílt forráskódú R-ben és a Microsoft R-ben is.

Amikor a jegyzetfüzetben van, felfedezheti az adatokat, létrehozhatja a modellt, és tesztelheti a modellt a választott kódtárak használatával.

Az adatok megismerése és modellek fejlesztése a Microsoft Machine Learning Server

Megjegyzés

A különálló Machine Learning Server támogatása 2021. július 1-jére megszűnik. Június 30. után eltávolítjuk a DSVM-rendszerképekből. A meglévő üzemelő példányok továbbra is hozzáférhetnek a szoftverhez, de az elért támogatási befejezési dátum miatt 2021. július 1. után nem lesz támogatás.

Az R és a Python nyelvekkel közvetlenül a DSVM-en végezheti el az adatelemzést.

Az R-hez használhatja az R Tools for Visual Studiót. A Microsoft további kódtárakat biztosított a nyílt forráskódú CRAN R mellett, hogy lehetővé tegye a skálázható elemzéseket, és lehetővé tegye a párhuzamos adattömb-elemzésekben engedélyezett memóriaméretnél nagyobb adatok elemzését.

Python esetén használhat egy IDE-t, például Visual Studio Community Editiont, amely előre telepítette a Python Tools for Visual Studio (PTVS) bővítményt. Alapértelmezés szerint csak a Python 3.6, a Conda gyökérkörnyezete van konfigurálva a PTVS-en. Az Anaconda Python 2.7 engedélyezéséhez hajtsa végre a következő lépéseket:

  1. Hozzon létre egyéni környezeteket az egyes verziókhoz az Eszközök>Python-eszközök>Python-környezetek területen, majd válassza az + Egyéni lehetőséget Visual Studio Community Edition kiadásban.
  2. Adjon meg egy leírást, és állítsa be a környezeti előtag elérési útját c:\anaconda\envs\python2 formátumban az Anaconda Python 2.7-hez.
  3. A környezet mentéséhez válassza az Automatikus észlelés>alkalmazás lehetőséget.

A Python-környezetek létrehozásával kapcsolatos további részletekért tekintse meg a PTVS dokumentációját .

Most egy új Python-projekt létrehozására van beállítva. Nyissa meg a File New ProjectPython (Új>projekt> Python fájlja>) lehetőséget, és válassza ki az éppen létrehozott Python-alkalmazás típusát. Az aktuális projekt Python-környezetét beállíthatja a kívánt verzióra (Python 2.7 vagy 3.6), ha a jobb gombbal a Python-környezetekre kattint, majd kiválasztja a Python-környezetek hozzáadása/eltávolítása lehetőséget. A PTVS használatával kapcsolatos további információkat a termékdokumentációban talál.

Azure-erőforrások kezelése

A DSVM nem csak lehetővé teszi az elemzési megoldás helyi összeállítását a virtuális gépen. Emellett lehetővé teszi az Azure-felhőplatform szolgáltatásainak elérését is. Az Azure számos olyan számítási, tárolási, adatelemzési és egyéb szolgáltatást biztosít, amelyeket a DSVM-ből felügyelhet és érhet el.

Az Azure-előfizetés és a felhőerőforrások felügyeletéhez két lehetősége van:

Tárterület bővítése megosztott fájlrendszerek használatával

Az adatelemzők nagy méretű adathalmazokat, kódot vagy más erőforrásokat oszthatnak meg a csapaton belül. A DSVM körülbelül 45 GB szabad területtel rendelkezik. A tárterület bővítéséhez használhatja a Azure Files, és csatlakoztathatja egy vagy több DSVM-példányhoz, vagy egy REST API-n keresztül érheti el. A Azure Portal vagy a Azure PowerShell használatával további dedikált adatlemezeket is hozzáadhat.

Megjegyzés

A Azure Files megosztás maximális területe 5 TB. Az egyes fájlok méretkorlátja 1 TB.

Ezt a szkriptet a Azure PowerShell használhatja egy Azure Files-megosztás létrehozásához:

# Authenticate to Azure.
Connect-AzAccount
# Select your subscription
Get-AzSubscription –SubscriptionName "<your subscription name>" | Select-AzSubscription
# Create a new resource group.
New-AzResourceGroup -Name <dsvmdatarg>
# Create a new storage account. You can reuse existing storage account if you want.
New-AzStorageAccount -Name <mydatadisk> -ResourceGroupName <dsvmdatarg> -Location "<Azure Data Center Name For eg. South Central US>" -Type "Standard_LRS"
# Set your current working storage account
Set-AzCurrentStorageAccount –ResourceGroupName "<dsvmdatarg>" –StorageAccountName <mydatadisk>

# Create an Azure Files share
$s = New-AzStorageShare <<teamsharename>>
# Create a directory under the file share. You can give it any name
New-AzStorageDirectory -Share $s -Path <directory name>
# List the share to confirm that everything worked
Get-AzStorageFile -Share $s

Most, hogy létrehozott egy Azure Files megosztást, csatlakoztathatja azt bármely Azure-beli virtuális géphez. Javasoljuk, hogy a késés és az adatátviteli díjak elkerülése érdekében helyezze a virtuális gépet ugyanabban az Azure-adatközpontban, mint a tárfiók. Az alábbi Azure PowerShell parancsokkal csatlakoztathatja a meghajtót a DSVM-hez:

# Get the storage key of the storage account that has the Azure Files share from the Azure portal. Store it securely on the VM to avoid being prompted in the next command.
cmdkey /add:<<mydatadisk>>.file.core.windows.net /user:<<mydatadisk>> /pass:<storage key>

# Mount the Azure Files share as drive Z on the VM. You can choose another drive letter if you want.
net use z:  \\<mydatadisk>.file.core.windows.net\<<teamsharename>>

Most már ugyanúgy elérheti ezt a meghajtót, mint bármely normál meghajtót a virtuális gépen.

Kód megosztása a GitHubon

A GitHub egy kódtár, ahol a fejlesztői közösség által megosztott technológiák használatával különböző eszközökhöz találhat kódmintákat és forrásokat. A Gitet használja a kódfájlok verzióinak nyomon követésére és tárolására. A GitHub egy platform is, ahol létrehozhatja saját adattárát a csapat megosztott kódjának és dokumentációjának tárolásához, a verziókövetés implementálásához, valamint a kód megtekintéséhez és hozzájárulásához hozzáféréssel rendelkező felhasználók számára.

A Git használatával kapcsolatos további információkért látogasson el a GitHub súgóoldalaira . A GitHubot a csapattal való együttműködés egyik módjaként használhatja, használhatja a közösség által fejlesztett kódot, és kódot adhat vissza a közösségnek.

A DSVM ügyféleszközökkel van betöltve a parancssorban és a grafikus felhasználói felületen a GitHub-adattár eléréséhez. A Git és a GitHub használatával működő parancssori eszköz neve Git Bash. A Visual Studio telepítve van a DSVM-en, és a Git-bővítményekkel rendelkezik. Ezekhez az eszközökhöz ikonokat a Start menüben és az asztalon talál.

Ha egy GitHub-adattárból szeretne kódot letölteni, használja a git clone parancsot. Ha például le szeretné tölteni a Microsoft által közzétett adatelemzési adattárat az aktuális könyvtárba, futtassa a következő parancsot a Git Bashben:

git clone https://github.com/Azure/DataScienceVM.git

A Visual Studióban ugyanezt a klónozási műveletet végezheti el. Az alábbi képernyőkép bemutatja, hogyan érheti el a Git- és GitHub-eszközöket a Visual Studióban:

Képernyőkép a Visual Studióról a GitHub-kapcsolat megjelenítésével

Az github.com elérhető erőforrásokból további információt talál arról, hogy a Git használatával használhatja a GitHub-adattárat. A csalilap hasznos referencia.

Azure-beli adat- és elemzési szolgáltatások elérése

Azure Blob Storage

Az Azure Blob Storage egy megbízható, gazdaságos felhőtárolási szolgáltatás, amely nagy méretű és kisméretű adatok tárolására szolgál. Ez a szakasz azt ismerteti, hogyan helyezhet át adatokat a Blob Storage-ba, és hogyan férhet hozzá az Azure-blobokban tárolt adatokhoz.

Előfeltételek

  • Hozza létre Azure Blob Storage-fiókját a Azure Portal.

    Képernyőkép a tárfiók létrehozásának folyamatáról a Azure Portal

  • Győződjön meg arról, hogy a parancssori AzCopy eszköz előre telepítve van: C:\Program Files (x86)\Microsoft SDKs\Azure\AzCopy\azcopy.exe. A azcopy.exe tartalmazó könyvtár már szerepel a PATH környezeti változóban, így az eszköz futtatásakor elkerülheti a teljes parancsútvonal beírását. Az AzCopy eszközzel kapcsolatos további információkért tekintse meg az AzCopy dokumentációját.

  • Indítsa el a Azure Storage Explorer eszközt. A Storage Explorer weblapról töltheti le.

    Képernyőkép Azure Storage Explorer tárfiók eléréséről

Adatok áthelyezése virtuális gépről Azure-blobba: AzCopy

Ha adatokat szeretne áthelyezni a helyi fájlok és a Blob Storage között, használhatja az AzCopyt a parancssorban vagy a PowerShellben:

AzCopy /Source:C:\myfolder /Dest:https://<mystorageaccount>.blob.core.windows.net/<mycontainer> /DestKey:<storage account key> /Pattern:abc.txt

Cserélje le a C:\myfolder elemet a fájl tárolási útvonalára, a mystorageaccount értékét a Blob Storage-fiók nevére, a mycontainert a tárolónévre, a tárfiókkulcsot pedig a Blob Storage hozzáférési kulcsára. A tárfiók hitelesítő adatait a Azure Portal találja.

Futtassa az AzCopy parancsot a PowerShellben vagy egy parancssorból. Íme néhány példa az AzCopy parancs használatára:

# Copy *.sql from a local machine to an Azure blob
"C:\Program Files (x86)\Microsoft SDKs\Azure\AzCopy\azcopy" /Source:"c:\Aaqs\Data Science Scripts" /Dest:https://[ENTER STORAGE ACCOUNT].blob.core.windows.net/[ENTER CONTAINER] /DestKey:[ENTER STORAGE KEY] /S /Pattern:*.sql

# Copy back all files from an Azure blob container to a local machine

"C:\Program Files (x86)\Microsoft SDKs\Azure\AzCopy\azcopy" /Dest:"c:\Aaqs\Data Science Scripts\temp" /Source:https://[ENTER STORAGE ACCOUNT].blob.core.windows.net/[ENTER CONTAINER] /SourceKey:[ENTER STORAGE KEY] /S

Miután futtatta az AzCopy parancsot egy Azure-blobba való másoláshoz, a fájl megjelenik Azure Storage Explorer.

A tárfiók képernyőképe a feltöltött CSV-fájl megjelenítésével

Adatok áthelyezése virtuális gépről Azure-blobba: Azure Storage Explorer

A virtuális gép helyi fájljából is feltölthet adatokat a Azure Storage Explorer használatával:

  • Ha adatokat szeretne feltölteni egy tárolóba, válassza ki a céltárolót, és válassza a Feltöltés gombot. Képernyőkép a feltöltés gombról a Azure Storage Explorer
  • Válassza a Fájlok mezőtől jobbra található három pontot (...), jelöljön ki egy vagy több feltöltendő fájlt a fájlrendszerből, majd válassza a Feltöltés lehetőséget a fájlok feltöltésének megkezdéséhez. Képernyőkép a Fájlok feltöltése párbeszédpanelről

Adatok olvasása Azure-blobból: Python ODBC

A BlobService kódtár használatával közvetlenül egy Jupyter Notebook vagy Python-programban lévő blobból olvashat adatokat.

Először importálja a szükséges csomagokat:

import pandas as pd
from pandas import Series, DataFrame
import numpy as np
import matplotlib.pyplot as plt
from time import time
import pyodbc
import os
from azure.storage.blob import BlobService
import tables
import time
import zipfile
import random

Ezután csatlakoztassa a Blob Storage-fiók hitelesítő adatait, és olvassa el az adatokat a blobból:

CONTAINERNAME = 'xxx'
STORAGEACCOUNTNAME = 'xxxx'
STORAGEACCOUNTKEY = 'xxxxxxxxxxxxxxxx'
BLOBNAME = 'nyctaxidataset/nyctaxitrip/trip_data_1.csv'
localfilename = 'trip_data_1.csv'
LOCALDIRECTORY = os.getcwd()
LOCALFILE =  os.path.join(LOCALDIRECTORY, localfilename)

#download from blob
t1 = time.time()
blob_service = BlobService(account_name=STORAGEACCOUNTNAME,account_key=STORAGEACCOUNTKEY)
blob_service.get_blob_to_path(CONTAINERNAME,BLOBNAME,LOCALFILE)
t2 = time.time()
print(("It takes %s seconds to download "+BLOBNAME) % (t2 - t1))

#unzip downloaded files if needed
#with zipfile.ZipFile(ZIPPEDLOCALFILE, "r") as z:
#    z.extractall(LOCALDIRECTORY)

df1 = pd.read_csv(LOCALFILE, header=0)
df1.columns = ['medallion','hack_license','vendor_id','rate_code','store_and_fwd_flag','pickup_datetime','dropoff_datetime','passenger_count','trip_time_in_secs','trip_distance','pickup_longitude','pickup_latitude','dropoff_longitude','dropoff_latitude']
print 'the size of the data is: %d rows and  %d columns' % df1.shape

Az adatok adatkeretként lesznek beolvasva:

Képernyőkép az első 10 adatsorról

Azure Synapse Analytics és adatbázisok

Azure Synapse Analytics egy rugalmas adattárház szolgáltatásként, nagyvállalati szintű SQL Server tapasztalattal.

Az Azure Synapse Analytics kiépítéséhez kövesse az ebben a cikkben található utasításokat. A Azure Synapse Analytics kiépítése után ezt az útmutatót használhatja az adatok feltöltéséhez, feltárásához és modellezéséhez az Azure Synapse Analyticsben lévő adatok használatával.

Azure Cosmos DB

Az Azure Cosmos DB egy NoSQL-adatbázis a felhőben. Használhatja a JSON-hoz hasonló dokumentumokkal való együttműködésre, valamint a dokumentumok tárolására és lekérdezésére.

Az Azure Cosmos DB DSVM-ből való eléréséhez kövesse az alábbi előfeltételeket:

  1. Az Azure Cosmos DB Python SDK már telepítve van a DSVM-en. Frissítéséhez futtassa pip install pydocumentdb --upgrade a parancsot egy parancssorból.

  2. Hozzon létre egy Azure Cosmos DB-fiókot és -adatbázist a Azure Portal.

  3. Töltse le az Azure Cosmos DB adatmigrálási eszközt a Microsoft letöltőközpontból , és bontsa ki egy tetszőleges könyvtárba.

  4. Importálja a nyilvános blobban tárolt JSON-adatokat (vulkánadatokat) az Azure Cosmos DB-be az alábbi parancsparaméterekkel a migrálási eszközbe. (Használjon dtui.exe abból a könyvtárból, ahol az Azure Cosmos DB adatmigrálási eszközt telepítette.) Adja meg a forrás- és célhelyet az alábbi paraméterekkel:

    /s:JsonFile /s.Files:https://data.humdata.org/dataset/a60ac839-920d-435a-bf7d-25855602699d/resource/7234d067-2d74-449a-9c61-22ae6d98d928/download/volcano.json /t:DocumentDBBulk /t.ConnectionString:AccountEndpoint=https://[DocDBAccountName].documents.azure.com:443/;AccountKey=[[KEY];Database=volcano /t.Collection:volcano1

Az adatok importálása után megnyithatja a Jupytert, és megnyithatja a DocumentDBSample nevű jegyzetfüzetet. Python-kódot tartalmaz az Azure Cosmos DB eléréséhez és néhány alapszintű lekérdezéshez. Az Azure Cosmos DB-ről a szolgáltatás dokumentációs oldalán talál további információt.

Power BI-jelentések és -irányítópultok használata

A Volcano JSON-fájlt az előző Azure Cosmos DB-példából vizualizálhatja a Power BI Desktop, hogy vizuális betekintést nyerjen az adatokba. A részletes lépések a Power BI-cikkben érhetők el. Íme a magas szintű lépések:

  1. Indítsa el a Power BI Desktopot, majd válassza az Adatok beolvasása lehetőséget. Adja meg az URL-címet a következőként: https://cahandson.blob.core.windows.net/samples/volcano.json.
  2. A listaként importált JSON-rekordoknak meg kell jelennie. Alakítsa át a listát táblázattá, hogy a Power BI működjön vele.
  3. Bontsa ki az oszlopokat a kibontás (nyíl) ikonra kattintva.
  4. Figyelje meg, hogy a hely egy Rekord mező. Bontsa ki a rekordot, és csak a koordinátákat válassza ki. A koordináta egy listaoszlop.
  5. Adjon hozzá egy új oszlopot a listakoordináta-oszlop vesszővel tagolt LatLong-oszlopmá alakításához. Fűzze össze a koordinátalista mező két elemét a képlet Text.From([coordinates]{1})&","&Text.From([coordinates]{0})használatával.
  6. Konvertálja a Magasság oszlopot decimálissá, és válassza a Bezárás és alkalmazás gombot.

Az előző lépések helyett beillesztheti a következő kódot. A power BI Speciális szerkesztő az adatátalakítások lekérdezési nyelven történő írásához használt lépéseket írja le.

let
    Source = Json.Document(Web.Contents("https://cahandson.blob.core.windows.net/samples/volcano.json")),
    #"Converted to Table" = Table.FromList(Source, Splitter.SplitByNothing(), null, null, ExtraValues.Error),
    #"Expanded Column1" = Table.ExpandRecordColumn(#"Converted to Table", "Column1", {"Volcano Name", "Country", "Region", "Location", "Elevation", "Type", "Status", "Last Known Eruption", "id"}, {"Volcano Name", "Country", "Region", "Location", "Elevation", "Type", "Status", "Last Known Eruption", "id"}),
    #"Expanded Location" = Table.ExpandRecordColumn(#"Expanded Column1", "Location", {"coordinates"}, {"coordinates"}),
    #"Added Custom" = Table.AddColumn(#"Expanded Location", "LatLong", each Text.From([coordinates]{1})&","&Text.From([coordinates]{0})),
    #"Changed Type" = Table.TransformColumnTypes(#"Added Custom",{{"Elevation", type number}})
in
    #"Changed Type"

Most már rendelkezik az adatokkal a Power BI-adatmodellben. A Power BI Desktop példánynak a következőképpen kell megjelennie:

Power BI Desktop

Az adatmodell használatával megkezdheti a jelentések és vizualizációk készítését. A power BI-cikk lépéseit követve létrehozhat egy jelentést.

A DSVM dinamikus skálázása

A DSVM vertikális fel- és leskálázható a projekt igényeinek megfelelően. Ha este vagy hétvégén nem kell használnia a virtuális gépet, a virtuális gépet a Azure Portal is leállíthatja.

Megjegyzés

Számítási költségek merülnek fel, ha csak a leállítás gombot használja a virtuális gép operációs rendszeréhez. Ehelyett a DSVM-et a Azure Portal vagy Cloud Shell kell felszabadítani.

Előfordulhat, hogy nagy léptékű elemzést kell kezelnie, és több processzor-, memória- vagy lemezkapacitásra van szüksége. Ha igen, választhat a virtuálisgép-méretek közül a processzormagok, a GPU-alapú példányok a mély tanuláshoz, a memóriakapacitáshoz és a lemeztípusokhoz (beleértve a szilárdtest-meghajtókat is), amelyek megfelelnek a számítási és költségvetési igényeknek. A virtuális gépek teljes listája és az óránkénti számítási díjszabásuk az Azure Virtual Machines díjszabási oldalán érhető el.

További eszközök hozzáadása

A DSVM-be előre összeállított eszközök számos gyakori adatelemzési igény kielégítésére képesek. Ez időt takarít meg, mert nem kell egyenként telepítenie és konfigurálnia a környezeteket. Emellett pénzt takarít meg, mivel csak az Ön által használt erőforrásokért fizet.

Az ebben a cikkben profilozott egyéb Azure-adat- és elemzési szolgáltatások segítségével javíthatja az elemzési környezetet. Bizonyos esetekben további eszközökre is szükség lehet, például néhány saját fejlesztésű partnereszközre. A virtuális gépen teljes körű rendszergazdai hozzáféréssel rendelkezik a szükséges új eszközök telepítéséhez. További olyan csomagokat is telepíthet a Pythonban és az R-ben, amelyek nincsenek előre telepítve. Python esetén a vagy pipa parancsot használhatjaconda. R esetén használhatja install.packages() az R konzolt, vagy használhatja az IDE-t, és válassza a Csomagok>telepítése csomagok lehetőséget.

Deep learning

A keretrendszeralapú minták mellett a DSVM-en érvényesített átfogó útmutatókat is beszerezhet. Ezek az útmutatók segítenek a mélytanulási alkalmazások fejlesztésének megkezdésében olyan tartományokban, mint a kép- és szöveg-/nyelvfelismerés.

Összefoglalás

Ez a cikk a Microsoft Data Science Virtual Machine néhány műveletet ismertet. A DSVM-et még sok más műveletet is elvégezhet, hogy hatékony elemzési környezetet alakítson ki.