Een Python-ontwikkelomgeving instellen voor Azure Machine Learning (v1)
VAN TOEPASSING OP: Python SDK azureml v1
Meer informatie over het configureren van een Python-ontwikkelomgeving voor Azure Machine Learning.
In de volgende tabel ziet u elke ontwikkelomgeving die in dit artikel wordt behandeld, samen met voor- en nadelen.
Omgeving | Voordelen | Nadelen |
---|---|---|
Lokale omgeving | Volledige controle over uw ontwikkelomgeving en afhankelijkheden. Voer uit met elk buildhulpprogramma, elke omgeving of een IDE van uw keuze. | Het duurt langer om aan de slag te gaan. De benodigde SDK-pakketten moeten worden geïnstalleerd en er moet ook een omgeving worden geïnstalleerd als u er nog geen hebt. |
De Datawetenschap virtuele machine (DSVM) | Net als bij het rekenproces in de cloud (Python en de SDK zijn vooraf geïnstalleerd), maar met andere populaire data science- en machine learning-hulpprogramma's vooraf geïnstalleerd. Eenvoudig te schalen en te combineren met andere aangepaste hulpprogramma's en werkstromen. | Een tragere aan de slag-ervaring vergeleken met het rekenproces in de cloud. |
Azure Machine Learning-rekenproces | Eenvoudigste manier om aan de slag te gaan. De volledige SDK is al geïnstalleerd op uw werkruimte-VM en notebookzelfstudies zijn vooraf gekloond en klaar om te worden uitgevoerd. | Gebrek aan controle over uw ontwikkelomgeving en afhankelijkheden. Extra kosten die zijn gemaakt voor een Virtuele Linux-machine (VM kan worden gestopt wanneer deze niet in gebruik is om kosten te voorkomen). Bekijk de prijsinformatie. |
Azure Databricks | Ideaal voor het uitvoeren van grootschalige intensieve machine learning-werkstromen op het schaalbare Apache Spark-platform. | Overkill voor experimentele machine learning of experimenten en werkstromen op kleinere schaal. Extra kosten voor Azure Databricks. Bekijk de prijsinformatie. |
Dit artikel bevat ook gebruikstips voor de volgende hulpprogramma's:
Jupyter Notebooks: als u al Jupyter Notebooks gebruikt, bevat de SDK enkele extra's die u moet installeren.
Visual Studio Code: Als u Visual Studio Code gebruikt, bevat de Azure Machine Learning-extensie uitgebreide taalondersteuning voor Python en functies om het werken met Azure Machine Learning veel handiger en productiever te maken.
Vereisten
- Azure Machine Learning-werkruimte. Als u er nog geen hebt, kunt u een Azure Machine Learning-werkruimte maken via Azure Portal, Azure CLI en Azure Resource Manager-sjablonen.
Alleen lokaal en DSVM: een configuratiebestand voor een werkruimte maken
Het configuratiebestand van de werkruimte is een JSON-bestand dat aangeeft hoe de SDK moet communiceren met uw Azure Machine Learning-werkruimte. Het bestand heeft de naam config.json en heeft de volgende indeling:
{
"subscription_id": "<subscription-id>",
"resource_group": "<resource-group>",
"workspace_name": "<workspace-name>"
}
Dit JSON-bestand moet zich in de mapstructuur bevinden die uw Python-scripts of Jupyter Notebooks bevat. Deze kan zich in dezelfde map, een submap met de naam .azureml
of in een bovenliggende map bevinden.
Als u dit bestand uit uw code wilt gebruiken, gebruikt u de Workspace.from_config
methode. Met deze code worden de gegevens uit het bestand geladen en wordt er verbinding gemaakt met uw werkruimte.
Maak een configuratiebestand voor een werkruimte op een van de volgende manieren:
Azure Portal
Download het bestand: selecteer in Azure Portal config.json downloaden in de sectie Overzicht van uw werkruimte.
Python SDK voor Azure Machine Learning
Maak een script om verbinding te maken met uw Azure Machine Learning-werkruimte en gebruik de
write_config
methode om uw bestand te genereren en op te slaan als .azureml/config.json. Zorg ervoor dat u en door uw eigen vervangersubscription_id
resource_group
workspace_name
vervangt.VAN TOEPASSING OP: Python SDK azureml v1
from azureml.core import Workspace subscription_id = '<subscription-id>' resource_group = '<resource-group>' workspace_name = '<workspace-name>' try: ws = Workspace(subscription_id = subscription_id, resource_group = resource_group, workspace_name = workspace_name) ws.write_config() print('Library configuration succeeded') except: print('Workspace not found')
Lokale computer of externe VM-omgeving
U kunt een omgeving instellen op een lokale computer of externe virtuele machine, zoals een Azure Machine Learning-rekenproces of Datawetenschap VM.
Een lokale ontwikkelomgeving of externe VM configureren:
Maak een virtuele Python-omgeving (virtualenv, conda).
Notitie
Hoewel dit niet vereist is, wordt u aangeraden Anaconda of Miniconda te gebruiken om virtuele Python-omgevingen te beheren en pakketten te installeren.
Belangrijk
Als u linux of macOS gebruikt en een andere shell dan bash gebruikt (bijvoorbeeld zsh), ontvangt u mogelijk fouten wanneer u een aantal opdrachten uitvoert. Als u dit probleem wilt omzeilen, gebruikt u de
bash
opdracht om een nieuwe bash-shell te starten en de opdrachten daar uit te voeren.Activeer uw zojuist gemaakte virtuele Python-omgeving.
Installeer de Azure Machine Learning Python SDK.
Als u uw lokale omgeving wilt configureren voor het gebruik van uw Azure Machine Learning-werkruimte, maakt u een configuratiebestand voor de werkruimte of gebruikt u een bestaand configuratiebestand .
Nu u uw lokale omgeving hebt ingesteld, kunt u aan de slag met Azure Machine Learning. Raadpleeg de aan de slag-handleiding voor Azure Machine Learning Python om aan de slag te gaan.
Jupyter Notebooks
Wanneer u een lokale Jupyter Notebook-server uitvoert, is het raadzaam om een IPython-kernel te maken voor uw virtuele Python-omgeving. Dit helpt ervoor te zorgen dat de verwachte kernel- en pakketimportgedrag worden uitgevoerd.
Omgevingsspecifieke IPython-kernels inschakelen
conda install notebook ipykernel
Maak een kernel voor uw virtuele Python-omgeving. Zorg ervoor dat u vervangt door
<myenv>
de naam van uw virtuele Python-omgeving.ipython kernel install --user --name <myenv> --display-name "Python (myenv)"
De Jupyter Notebook-server starten
Zie de opslagplaats voor Azure Machine Learning-notebooks om aan de slag te gaan met Azure Machine Learning en Jupyter Notebooks. Zie ook de communitygestuurde opslagplaats, AzureML-Examples.
Visual Studio Code
Visual Studio Code gebruiken voor ontwikkeling:
Installeer Visual Studio Code.
Installeer de Azure Machine Learning Visual Studio Code-extensie (preview).
Belangrijk
Deze functie is momenteel beschikbaar als openbare preview-versie. Deze preview-versie wordt geleverd zonder een service level agreement en we raden deze niet aan voor productieworkloads. Misschien worden bepaalde functies niet ondersteund of zijn de mogelijkheden ervan beperkt.
Zie Aanvullende gebruiksvoorwaarden voor Microsoft Azure-previews voor meer informatie.
Nadat u de Visual Studio Code-extensie hebt geïnstalleerd, gebruikt u deze om:
- Uw Azure Machine Learning-resources beheren
- Visual Studio Code extern starten die is verbonden met een rekenproces (preview)
- Experimenten uitvoeren en fouten opsporen
- Getrainde modellen (CLI v2) implementeren.
Azure Machine Learning-rekeninstantie
Het Azure Machine Learning-rekenproces is een veilig, in de cloud gebaseerd Azure-werkstation dat gegevenswetenschappers een Jupyter Notebook-server, JupyterLab en een volledig beheerde machine learning-omgeving biedt.
Er is niets te installeren of te configureren voor een rekenproces.
Maak er een op elk gewenst moment vanuit uw Azure Machine Learning-werkruimte. Geef alleen een naam op en geef een Azure VM-type op. Probeer het nu met Resources maken om aan de slag te gaan.
Zie Een Azure Machine Learning-rekenproces maken en beheren voor meer informatie over rekeninstanties, waaronder het installeren van pakketten.
Tip
Als u wilt voorkomen dat er kosten in rekening worden gebracht voor een ongebruikt rekenproces, stopt u het rekenproces. Of schakel inactief afsluiten in voor het rekenproces.
Naast een Jupyter Notebook-server en JupyterLab kunt u rekeninstanties gebruiken in de geïntegreerde notebookfunctie in Azure Machine Learning-studio.
U kunt ook de Azure Machine Learning Visual Studio Code-extensie gebruiken om verbinding te maken met een extern rekenproces met behulp van VS Code.
Data Science Virtual Machine
De Datawetenschap VM is een aangepaste VM-installatiekopieën (virtuele machine) die u als ontwikkelomgeving kunt gebruiken. Het is ontworpen voor data science-werk dat vooraf geconfigureerde hulpprogramma's en software is, zoals:
- Pakketten zoals TensorFlow, PyTorch, Scikit-learn, XGBoost en de Azure Machine Learning SDK
- Populaire data science-hulpprogramma's zoals Zelfstandige spark- en Drill-hulpprogramma's
- Azure-hulpprogramma's zoals de Azure CLI, AzCopy en Storage Explorer
- Geïntegreerde ontwikkelomgevingen (IDE's), zoals Visual Studio Code en PyCharm
- Jupyter Notebook Server
Zie de handleiding Datawetenschap VM-hulpprogramma's voor een uitgebreidere lijst met hulpprogramma's.
Belangrijk
Als u van plan bent om de Datawetenschap VM te gebruiken als rekendoel voor uw trainings- of deductietaken, wordt alleen Ubuntu ondersteund.
De Datawetenschap-VM gebruiken als een ontwikkelomgeving:
Maak een Datawetenschap VM met behulp van een van de volgende methoden:
Gebruik Azure Portal om een Ubuntu - of Windows DSVM te maken.
De Azure CLI gebruiken
Gebruik de volgende opdracht om een Ubuntu-Datawetenschap-VM te maken:
# create a Ubuntu Data Science VM in your resource group # note you need to be at least a contributor to the resource group in order to execute this command successfully # If you need to create a new resource group use: "az group create --name YOUR-RESOURCE-GROUP-NAME --location YOUR-REGION (For example: westus2)" az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:linux-data-science-vm-ubuntu:linuxdsvmubuntu:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --generate-ssh-keys --authentication-type password
Gebruik de volgende opdracht om een Windows DSVM te maken:
# create a Windows Server 2016 DSVM in your resource group # note you need to be at least a contributor to the resource group in order to execute this command successfully az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:dsvm-windows:server-2016:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --authentication-type password
Activeer de Conda-omgeving met de Azure Machine Learning SDK.
Voor Ubuntu Datawetenschap VM:
conda activate py36
Voor Windows Datawetenschap VM:
conda activate AzureML
Als u de Datawetenschap VM wilt configureren voor het gebruik van uw Azure Machine Learning-werkruimte, maakt u een configuratiebestand voor de werkruimte of gebruikt u een bestaand configuratiebestand.
Net als bij lokale omgevingen kunt u Visual Studio Code en de Azure Machine Learning Visual Studio Code-extensie gebruiken om te communiceren met Azure Machine Learning.
Zie Datawetenschap Virtual Machines voor meer informatie.
Volgende stappen
- Train en implementeer een model in Azure Machine Learning met de MNIST-gegevensset.
- Raadpleeg de Naslaginformatie over de Azure Machine Learning-SDK voor Python.