Datové vědy s virtuálním počítačem s Windows Datová Věda

Článek
06/13/2024

Virtuální počítač s Windows Datová Věda (DSVM) je výkonné vývojové prostředí pro datové vědy, které podporuje úlohy zkoumání a modelování dat. Prostředí je předem připravené a předem připravené s několika oblíbenými nástroji pro analýzu dat, které usnadňují spuštění analýzy místních, cloudových nebo hybridních nasazení.

DSVM úzce spolupracuje se službami Azure. Může číst a zpracovávat data, která už jsou uložená v Azure, v Azure Synapse (dříve SQL DW), Azure Data Lake, Azure Storage nebo Azure Cosmos DB. Může také využívat další analytické nástroje, jako je Azure Machine Learning.

V tomto článku se dozvíte, jak pomocí dsVM zpracovávat úlohy datových věd a pracovat s dalšími službami Azure. Toto je ukázka úloh, které může DSVM pokrýt:

Pomocí aplikace Jupyter Notebook můžete experimentovat s daty v prohlížeči pomocí Pythonu 2, Pythonu 3 a Microsoft R. (Microsoft R je verze R připravená pro podniky navržená pro vysoký výkon.)
Prozkoumejte data a vyvíjejte modely místně na DSVM pomocí Microsoft Machine Learning Serveru a Pythonu.
Správa prostředků Azure pomocí webu Azure Portal nebo PowerShellu
Rozšiřte prostor úložiště a sdílejte rozsáhlé datové sady a kód napříč celým týmem s využitím sdílené složky Azure Files jako přípojné jednotky na dsVM.
Sdílejte kód s týmem pomocí GitHubu. Získejte přístup k úložišti pomocí předinstalovaných klientů Git: Git Bash a grafické uživatelské rozhraní Git.
Přístup k datovým a analytickým službám Azure:
- Azure Blob Storage
- Azure Cosmos DB
- Azure Synapse (dříve SQL DW)
- Azure SQL Database
Sestavte sestavy a řídicí panel s instancí Power BI Desktopu – předinstalovaný na DSVM – a nasaďte je v cloudu.
Nainstalujte na virtuální počítač další nástroje.

Poznámka:

Další poplatky za využití platí pro řadu služeb úložiště a analýz dat uvedených v tomto článku. Další informace najdete na stránce s cenami Azure.

Požadavky

Předplatné Azure. Pokud ještě nemáte předplatné Azure, vytvořte si napřed bezplatný účet.
Zřízený DSVM na webu Azure Portal. Další informace najdete v části Vytvoření prostředku virtuálního počítače .

Poznámka:

Při práci s Azure doporučujeme používat modul Azure Az PowerShellu. Pokud chcete začít, přečtěte si téma Instalace Azure PowerShellu. Informace o tom, jak migrovat na modul Az PowerShell, najdete v tématu Migrace Azure PowerShellu z AzureRM na Az.

Použití Jupyter Notebooks

Jupyter Notebook poskytuje integrované vývojové prostředí (IDE) založené na prohlížeči pro zkoumání a modelování dat. V poznámkovém bloku Jupyter můžete použít Python 2, Python 3 nebo R.

Pokud chcete spustit Jupyter Notebook, vyberte ikonu Jupyter Notebook v nabídce Start nebo na ploše. Na příkazovém řádku DSVM můžete také spustit příkaz jupyter notebook z adresáře, který je hostitelem existujících poznámkových bloků nebo kde chcete vytvořit nové poznámkové bloky.

Po spuštění Jupyter přejděte do /notebooks adresáře. Tento adresář hostuje ukázkové poznámkové bloky, které jsou předem zabalené do DSVM. Můžete provádět následující akce:

Výběrem poznámkového bloku zobrazíte kód.
Výběrem klávesy Shift+Enter spustíte každou buňku.
Výběrem možnosti Spustit buňku>spusťte celý poznámkový blok.
Vytvoření nového poznámkového bloku; vyberte ikonu Jupyter (v levém horním rohu), vyberte tlačítko Nový a pak zvolte jazyk poznámkového bloku (označovaný také jako jádra).

Poznámka:

V tuto chvíli se podporují jádra Python 2.7, Python 3.6, R, Julia a PySpark v Jupyteru. Jádro R podporuje programování v opensourcovém R i Microsoft R. V poznámkovém bloku můžete zkoumat data, sestavovat model a testovat ho podle svého výběru knihoven.

Prozkoumání dat a vývoj modelů pomocí Microsoft Machine Learning Serveru

Poznámka:

Podpora pro samostatnou službu Machine Learning Server skončila 1. července 2021. Odebrali jsme ji z imagí DSVM po 30. červnu 2021. Stávající nasazení mají stále přístup k softwaru, ale podpora skončila po 1. červenci 2021.

R a Python můžete použít pro analýzu dat přímo na DSVM.

Pro R můžete použít Nástroje R pro Visual Studio. Kromě opensourcového prostředku CRAN R poskytuje Microsoft další knihovny. Tyto knihovny umožňují škálovatelnou analýzu i schopnost analyzovat objemy dat, které překračují omezení velikosti paměti paralelní analýzy bloků dat.

Pro Python můžete použít integrované vývojové prostředí (IDE), například Visual Studio Community Edition, které má předinstalované rozšíření Python Tools for Visual Studio (PTVS). Ve výchozím nastavení se pro PTVS konfiguruje pouze Python 3.6, kořenové prostředí Conda. Povolení Anaconda Pythonu 2.7:

Vytvořte vlastní prostředí pro každou verzi. Vyberte Nástroje Python>Tools>Python Environment a pak vyberte + Vlastní v sadě Visual Studio Community Edition.
Zadejte popis a nastavte cestu předpony prostředí jako c:\anaconda\envs\python2 pro Anaconda Python 2.7.
Výběrem možnosti Automaticky rozpoznat>použít uložte prostředí.

Další informace o vytváření prostředí Pythonu najdete v dokumentaci k dokumentace PTVS.

Teď můžete vytvořit nový projekt Pythonu. Vyberte Soubor>nový>projekt>Python a vyberte typ aplikace Pythonu, kterou chcete sestavit. Prostředí Pythonu pro aktuální projekt můžete nastavit na požadovanou verzi (Python 2.7 nebo 3.6) tak, že kliknete pravým tlačítkem na prostředí Pythonu a pak vyberete Přidat nebo odebrat prostředí Pythonu. Další informace o práci s PTVS najdete v dokumentaci k produktu.

Správa prostředků Azure

DsVM umožňuje sestavit analytické řešení místně na virtuálním počítači. Umožňuje také přístup ke službám na cloudové platformě Azure. Azure poskytuje několik služeb, včetně výpočetních prostředků, úložiště, analýzy dat a dalších, které můžete spravovat a přistupovat z dsVM.

Máte dvě dostupné možnosti pro správu předplatného Azure a cloudových prostředků:

Navštivte web Azure Portal v prohlížeči.
Použijte skripty PowerShellu. Spusťte Azure PowerShell z zástupce na ploše nebo z nabídky Start . Další informace najdete v dokumentaci k Microsoft Azure PowerShellu.

Rozšíření úložiště pomocí sdílených systémů souborů

Datoví vědci můžou sdílet velké datové sady, kód nebo jiné prostředky v rámci týmu. DsVM má přibližně 45 GB volného místa. Pokud chcete rozšířit úložiště, můžete použít Azure Files a připojit ho buď k jedné nebo více instancím DSVM, nebo k němu přistupovat pomocí rozhraní REST API. Můžete také použít Azure Portal nebo pomocí Azure PowerShellu přidat další vyhrazené datové disky.

Poznámka:

Maximální prostor ve sdílené složce Azure je 5 TB. Každý soubor má limit velikosti 1 TB.

Tento skript Azure PowerShellu vytvoří sdílenou složku Azure Files:

# Authenticate to Azure.
Connect-AzAccount
# Select your subscription
Get-AzSubscription –SubscriptionName "<your subscription name>" | Select-AzSubscription
# Create a new resource group.
New-AzResourceGroup -Name <dsvmdatarg>
# Create a new storage account. You can reuse existing storage account if you want.
New-AzStorageAccount -Name <mydatadisk> -ResourceGroupName <dsvmdatarg> -Location "<Azure Data Center Name For eg. South Central US>" -Type "Standard_LRS"
# Set your current working storage account
Set-AzCurrentStorageAccount –ResourceGroupName "<dsvmdatarg>" –StorageAccountName <mydatadisk>

# Create an Azure Files share
$s = New-AzStorageShare <<teamsharename>>
# Create a directory under the file share. You can give it any name
New-AzStorageDirectory -Share $s -Path <directory name>
# List the share to confirm that everything worked
Get-AzStorageFile -Share $s

Sdílenou složku Azure Files můžete připojit na libovolném virtuálním počítači v Azure. Doporučujeme umístit virtuální počítač a účet úložiště do stejného datového centra Azure, abyste se vyhnuli poplatkům za latenci a přenos dat. Tyto příkazy Azure PowerShellu připojují jednotku na DSVM:

# Get the storage key of the storage account that has the Azure Files share from the Azure portal. Store it securely on the VM to avoid being prompted in the next command.
cmdkey /add:<<mydatadisk>>.file.core.windows.net /user:<<mydatadisk>> /pass:<storage key>

# Mount the Azure Files share as drive Z on the VM. You can choose another drive letter if you want.
net use z:  \\<mydatadisk>.file.core.windows.net\<<teamsharename>>

K této jednotce můžete přistupovat stejně jako k jakékoli normální jednotce na virtuálním počítači.

Úložiště kódu GitHub hostuje ukázky kódu a zdroje kódu pro mnoho nástrojů, které sdílí komunita vývojářů. Používá Git jako technologii ke sledování a ukládání verzí souborů kódu. GitHub slouží také jako platforma pro vytvoření vlastního úložiště. Vlastní úložiště může ukládat sdílený kód a dokumentaci vašeho týmu, implementovat správu verzí a řídit přístupová oprávnění pro zúčastněné strany, kteří chtějí zobrazit a přispívat kódem. GitHub podporuje spolupráci ve vašem týmu, použití kódu vyvinutého komunitou a příspěvky kódu zpět do komunity. Další informace o Gitu najdete na stránkách nápovědy GitHubu.

DsVM se načte s klientskými nástroji na příkazovém řádku a v grafickém uživatelském rozhraní pro přístup k úložišti GitHub. Nástroj příkazového řádku Git Bash funguje s Gitem a GitHubem. Visual Studio je nainstalované na DSVM a má rozšíření Git. V nabídce Start i na ploše jsou pro tyto nástroje ikony.

git clone Pomocí příkazu stáhněte kód z úložiště GitHub. Pokud chcete stáhnout úložiště datových věd publikované Microsoftem do aktuálního adresáře, spusťte například tento příkaz v Git Bash:

git clone https://github.com/Azure/DataScienceVM.git

Visual Studio dokáže zpracovat stejnou operaci klonování. Tento snímek obrazovky ukazuje, jak získat přístup k nástrojům Gitu a GitHubu v sadě Visual Studio:

V úložišti GitHub můžete pracovat s dostupnými github.com prostředky. Další informace najdete v taháku GitHubu.

Přístup k datům a analytickým službám Azure

Azure Blob Storage

Azure Blob Storage je spolehlivá a ekonomická cloudová služba úložiště pro velké i malé datové prostředky. Tato část popisuje, jak přesunout data do úložiště objektů blob a přistupovat k datům uloženým v objektu blob Azure.

Požadavky

Účet služby Azure Blob Storage vytvořený na webu Azure Portal.
Pomocí tohoto příkazu ověřte, že je předinstalovaný nástroj AzCopy příkazového řádku:

C:\Program Files (x86)\Microsoft SDKs\Azure\AzCopy\azcopy.exe

Adresář, který je hostitelem azcopy.exe, už je ve vaší proměnné prostředí PATH, takže při spuštění tohoto nástroje nebudete moct zadávat úplnou cestu k příkazu. Další informace o nástroji AzCopy najdete v dokumentaci k nástroji AzCopy.
Spusťte nástroj Průzkumník služby Azure Storage. Můžete si ho stáhnout z webové stránky Průzkumník služby Storage.

Přesun dat z virtuálního počítače do objektu blob Azure: AzCopy

Pokud chcete přesouvat data mezi místními soubory a úložištěm objektů blob, můžete použít AzCopy na příkazovém řádku nebo v PowerShellu:

AzCopy /Source:C:\myfolder /Dest:https://<mystorageaccount>.blob.core.windows.net/<mycontainer> /DestKey:<storage account key> /Pattern:abc.txt

Nahraďte C:\myfolder cestou k adresáři, která je hostitelem vašeho souboru.
Nahraďte mystorageaccount názvem účtu úložiště objektů blob.
Nahraďte mycontainer názvem kontejneru.
Nahraďte klíč účtu úložiště přístupovým klíčem služby Blob Storage.

Přihlašovací údaje k účtu úložiště najdete na webu Azure Portal.

Spusťte příkaz AzCopy v PowerShellu nebo z příkazového řádku. Tady jsou příklady příkazů AzCopy:

# Copy *.sql from a local machine to an Azure blob
"C:\Program Files (x86)\Microsoft SDKs\Azure\AzCopy\azcopy" /Source:"c:\Aaqs\Data Science Scripts" /Dest:https://[ENTER STORAGE ACCOUNT].blob.core.windows.net/[ENTER CONTAINER] /DestKey:[ENTER STORAGE KEY] /S /Pattern:*.sql

# Copy back all files from an Azure blob container to a local machine

"C:\Program Files (x86)\Microsoft SDKs\Azure\AzCopy\azcopy" /Dest:"c:\Aaqs\Data Science Scripts\temp" /Source:https://[ENTER STORAGE ACCOUNT].blob.core.windows.net/[ENTER CONTAINER] /SourceKey:[ENTER STORAGE KEY] /S

Po spuštění příkazu AzCopy pro zkopírování souboru do objektu blob Azure se soubor zobrazí v Průzkumník služby Azure Storage.

Přesun dat z virtuálního počítače do objektu blob Azure: Průzkumník služby Azure Storage

Data z místního souboru na virtuálním počítači můžete nahrát také pomocí Průzkumník služby Azure Storage:

Pokud chcete nahrát data do kontejneru, vyberte cílový kontejner a vyberte tlačítko Nahrát .
Napravo od pole Soubory vyberte tři tečky (...), vyberte jeden nebo více souborů, které chcete nahrát ze systému souborů, a výběrem možnosti Nahrát zahájíte nahrávání souborů.

Čtení dat z objektu blob Azure: Python ODBC

Knihovna BlobService může číst data přímo z objektu blob umístěného v poznámkovém bloku Jupyter nebo v programu Pythonu. Nejprve naimportujte požadované balíčky:

import pandas as pd
from pandas import Series, DataFrame
import numpy as np
import matplotlib.pyplot as plt
from time import time
import pyodbc
import os
from azure.storage.blob import BlobService
import tables
import time
import zipfile
import random

Připojte přihlašovací údaje účtu služby Blob Storage a načtěte data z objektu blob:

CONTAINERNAME = 'xxx'
STORAGEACCOUNTNAME = 'xxxx'
STORAGEACCOUNTKEY = 'xxxxxxxxxxxxxxxx'
BLOBNAME = 'nyctaxidataset/nyctaxitrip/trip_data_1.csv'
localfilename = 'trip_data_1.csv'
LOCALDIRECTORY = os.getcwd()
LOCALFILE =  os.path.join(LOCALDIRECTORY, localfilename)

#download from blob
t1 = time.time()
blob_service = BlobService(account_name=STORAGEACCOUNTNAME,account_key=STORAGEACCOUNTKEY)
blob_service.get_blob_to_path(CONTAINERNAME,BLOBNAME,LOCALFILE)
t2 = time.time()
print(("It takes %s seconds to download "+BLOBNAME) % (t2 - t1))

#unzip downloaded files if needed
#with zipfile.ZipFile(ZIPPEDLOCALFILE, "r") as z:
#    z.extractall(LOCALDIRECTORY)

df1 = pd.read_csv(LOCALFILE, header=0)
df1.columns = ['medallion','hack_license','vendor_id','rate_code','store_and_fwd_flag','pickup_datetime','dropoff_datetime','passenger_count','trip_time_in_secs','trip_distance','pickup_longitude','pickup_latitude','dropoff_longitude','dropoff_latitude']
print 'the size of the data is: %d rows and  %d columns' % df1.shape

Data se čtou jako datový rámec:

Azure Synapse Analytics a databáze

Azure Synapse Analytics je elastický datový sklad jako služba s prostředím SQL Serveru na podnikové úrovni. Tento prostředek popisuje, jak zřídit Azure Synapse Analytics. Po zřízení služby Azure Synapse Analytics tento názorný postup vysvětluje, jak zpracovávat nahrávání, zkoumání a modelování dat pomocí dat ve službě Azure Synapse Analytics.

Azure Cosmos DB

Azure Cosmos DB je cloudová databáze NoSQL. Může zpracovávat například dokumenty JSON a může dokumenty ukládat a dotazovat se na ně. Tento ukázkový postup ukazuje, jak získat přístup ke službě Azure Cosmos DB z DSVM:

Sada Python SDK služby Azure Cosmos DB je už nainstalovaná na DSVM. Pokud ho chcete aktualizovat, spusťte pip install pydocumentdb --upgrade ho z příkazového řádku.
Vytvořte účet a databázi Azure Cosmos DB z webu Azure Portal.
Stáhněte si nástroj pro migraci dat azure Cosmos DB z webu Microsoft Download Center a extrahujte ho do libovolného adresáře.
Importujte data JSON (data sopek) uložená ve veřejném objektu blob do služby Azure Cosmos DB s následujícími parametry příkazu do nástroje pro migraci. (Použijte dtui.exe z adresáře, do kterého jste nainstalovali nástroj pro migraci dat služby Azure Cosmos DB.) Zadejte zdrojové a cílové umístění s těmito parametry:

/s:JsonFile /s.Files:https://data.humdata.org/dataset/a60ac839-920d-435a-bf7d-25855602699d/resource/7234d067-2d74-449a-9c61-22ae6d98d928/download/volcano.json /t:DocumentDBBulk /t.ConnectionString:AccountEndpoint=https://[DocDBAccountName].documents.azure.com:443/;AccountKey=[[KEY];Database=volcano /t.Collection:volcano1

Po importu dat můžete přejít do Jupyteru a otevřít poznámkový blok s názvem DocumentDBSample. Obsahuje kód Pythonu pro přístup ke službě Azure Cosmos DB a zpracování některých základních dotazů. Další informace o službě Azure Cosmos DB najdete na stránce dokumentace ke službě Azure Cosmos DB.

Použití sestav a řídicích panelů Power BI

Pro vizuální přehledy o samotných datech můžete vizualizovat soubor JSON v předchozím příkladu služby Azure Cosmos DB v Power BI Desktopu. Tento článek o Power BI nabízí podrobné kroky. Toto jsou kroky na vysoké úrovni:

Otevřete Power BI Desktop a vyberte Získat data. Zadejte tuto adresu URL: https://cahandson.blob.core.windows.net/samples/volcano.json.
Záznamy JSON, importované jako seznam, by se měly zobrazit. Převeďte seznam na tabulku, aby s ní mohl Power BI pracovat.
Výběrem ikony rozbalení (šipka) rozbalte sloupce.
Umístění je pole Záznam . Rozbalte záznam a vyberte pouze souřadnice. Souřadnice je sloupec seznamu.
Přidejte nový sloupec, který převede sloupec souřadnice seznamu na sloupec oddělený čárkami. Pomocí vzorce Text.From([coordinates]{1})&","&Text.From([coordinates]{0}) zřetězení dvou prvků v poli seznamu souřadnic.
Převeďte sloupec Zvýšení úrovně na desetinné číslo a vyberte tlačítka Zavřít a Použít.

Následující kód můžete použít jako alternativu k předchozím krokům. Skriptuje kroky použité v Rozšířený editor v Power BI k zápisu transformací dat v dotazovacím jazyce:

let
    Source = Json.Document(Web.Contents("https://cahandson.blob.core.windows.net/samples/volcano.json")),
    #"Converted to Table" = Table.FromList(Source, Splitter.SplitByNothing(), null, null, ExtraValues.Error),
    #"Expanded Column1" = Table.ExpandRecordColumn(#"Converted to Table", "Column1", {"Volcano Name", "Country", "Region", "Location", "Elevation", "Type", "Status", "Last Known Eruption", "id"}, {"Volcano Name", "Country", "Region", "Location", "Elevation", "Type", "Status", "Last Known Eruption", "id"}),
    #"Expanded Location" = Table.ExpandRecordColumn(#"Expanded Column1", "Location", {"coordinates"}, {"coordinates"}),
    #"Added Custom" = Table.AddColumn(#"Expanded Location", "LatLong", each Text.From([coordinates]{1})&","&Text.From([coordinates]{0})),
    #"Changed Type" = Table.TransformColumnTypes(#"Added Custom",{{"Elevation", type number}})
in
    #"Changed Type"

Teď máte data v datovém modelu Power BI. Instance Power BI Desktopu by se měla zobrazit takto:

Pomocí datového modelu můžete začít vytvářet sestavy a vizualizace. Tento článek Power BI vysvětluje, jak vytvořit sestavu.

Dynamické škálování DSVM

Virtuální počítač pro datové vědy (DSVM) můžete vertikálně navýšit nebo snížit tak, aby vyhovoval potřebám vašeho projektu. Pokud virtuální počítač nepotřebujete používat večer nebo o víkendech, můžete virtuální počítač vypnout z webu Azure Portal.

Poznámka:

Poplatky za výpočetní prostředky se účtují jenom v případě, že pro operační systém na virtuálním počítači použijete tlačítko vypnutí. Místo toho byste měli uvolnit dsVM pomocí webu Azure Portal nebo Cloud Shellu.

U rozsáhlého projektu analýzy možná budete potřebovat větší kapacitu procesoru, paměti nebo disku. Pokud ano, můžete najít virtuální počítače s různým počtem jader procesoru, kapacity paměti, typů disků (včetně jednotek SSD) a instancí založených na GPU pro hluboké učení, které vyhovují vašim výpočetním a rozpočtovým potřebám. Na stránce s cenami služby Azure Virtual Machines se zobrazuje úplný seznam virtuálních počítačů spolu s hodinovými cenami výpočetních prostředků.

Přidání dalších nástrojů

DsVM nabízí předem připravené nástroje, které můžou řešit řadu běžných potřeb analýzy dat. Šetří čas, protože nemusíte instalovat a konfigurovat prostředí jednotlivě. Ušetří vám také peníze, protože platíte jenom za prostředky, které používáte.

K vylepšení analytického prostředí můžete použít další datové a analytické služby Azure profilované v tomto článku. V některých případech můžete potřebovat další nástroje, včetně konkrétních proprietárních partnerských nástrojů. K instalaci potřebných nástrojů máte na virtuálním počítači úplný přístup pro správu. Můžete také nainstalovat další balíčky v Pythonu a R, které nejsou předinstalované. Pro Python můžete použít buď conda nebo pip. V případě jazyka R můžete použít install.packages() konzolu R nebo použít integrované vývojové prostředí (IDE) a vybrat Balíčky> instalace balíčků.

Hluboké učení

Kromě ukázek založených na architektuře můžete získat sadu komplexních návodů, které byly ověřeny na DSVM. Tyto názorné postupy vám pomůžou začít s vývojem aplikací hlubokého učení v doménách pro analýzu obrázků a textu a jazyků.

Spouštění neurálních sítí napříč různými architekturami: Tento návod ukazuje, jak migrovat kód z jedné architektury do jiné. Ukazuje také, jak porovnat modely a výkon modulu runtime napříč architekturami.
Průvodce vytvořením komplexního řešení pro detekci produktů v obrázcích: Technika detekce obrázků dokáže vyhledat a klasifikovat objekty v obrázcích. Tato technologie má potenciál přinést obrovské odměny v mnoha reálných obchodních oblastech. Například maloobchodní prodejci můžou tuto techniku použít k identifikaci produktu, který zákazník vyzvedl z police. Tyto informace pomáhají maloobchodním obchodům spravovat inventář produktů.
Hluboké učení pro zvuk: V tomto kurzu se dozvíte, jak trénovat model hlubokého učení pro detekci zvukových událostí v datové sadě městského zvuku. Poskytuje také přehled o tom, jak pracovat se zvukovými daty.
Klasifikace textových dokumentů: Tento názorný postup ukazuje, jak sestavit a trénovat dvě architektury neurální sítě: Síť hierarchické pozornosti a síť LSTM (Hierarchical Attention Network) a dlouhodobé krátkodobé paměti (LSTM). Tyto neurální sítě používají rozhraní Keras API pro hluboké učení ke klasifikaci textových dokumentů.

Shrnutí

Tento článek popisuje některé z věcí, které můžete dělat na virtuálním počítači Microsoft Datová Věda. Existuje mnoho dalších věcí, které můžete udělat, aby DSVM byl efektivním analytickým prostředím.

Sdílet prostřednictvím

Datové vědy s virtuálním počítačem s Windows Datová Věda

Požadavky

Použití Jupyter Notebooks

Prozkoumání dat a vývoj modelů pomocí Microsoft Machine Learning Serveru

Správa prostředků Azure

Rozšíření úložiště pomocí sdílených systémů souborů

Přístup k datům a analytickým službám Azure

Azure Blob Storage

Požadavky

Přesun dat z virtuálního počítače do objektu blob Azure: AzCopy

Přesun dat z virtuálního počítače do objektu blob Azure: Průzkumník služby Azure Storage

Čtení dat z objektu blob Azure: Python ODBC

Azure Synapse Analytics a databáze

Azure Cosmos DB

Použití sestav a řídicích panelů Power BI

Dynamické škálování DSVM

Přidání dalších nástrojů

Hluboké učení

Shrnutí

Váš názor

Váš názor

Další materiály

Sdílet prostřednictvím

Datové vědy s virtuálním počítačem s Windows Datová Věda

Požadavky

Použití Jupyter Notebooks

Prozkoumání dat a vývoj modelů pomocí Microsoft Machine Learning Serveru

Správa prostředků Azure

Rozšíření úložiště pomocí sdílených systémů souborů

Sdílení kódu na GitHubu

Přístup k datům a analytickým službám Azure

Azure Blob Storage

Požadavky

Přesun dat z virtuálního počítače do objektu blob Azure: AzCopy

Přesun dat z virtuálního počítače do objektu blob Azure: Průzkumník služby Azure Storage

Čtení dat z objektu blob Azure: Python ODBC

Azure Synapse Analytics a databáze

Azure Cosmos DB

Použití sestav a řídicích panelů Power BI

Dynamické škálování DSVM

Přidání dalších nástrojů

Hluboké učení

Shrnutí

Váš názor

Váš názor

Další materiály