Delen via


Azure Container voor PyTorch (ACPT)

Azure Container voor PyTorch is een lichtgewicht, zelfstandige omgeving die onderdelen bevat die nodig zijn om geoptimaliseerde training effectief uit te voeren voor grote modellen in Azure Machine Learning. De gecureerde Azure Machine Learning-omgevingen zijn standaard beschikbaar in de werkruimte van de gebruiker en worden ondersteund door Docker-installatiekopieën in de cache die gebruikmaken van de nieuwste versie van de Azure Machine Learning SDK. Het helpt bij het verlagen van de voorbereidingskosten en snellere implementatietijd. ACPT kan worden gebruikt om snel aan de slag te gaan met verschillende deep learning-taken met PyTorch in Azure.

Notitie

Gebruik de Python SDK, CLI of Azure Machine Learning Studio om de volledige lijst met omgevingen en hun afhankelijkheden op te halen. Zie het artikel over omgevingen voor meer informatie.

Waarom moet ik ACPT gebruiken?

  • Flexibiliteit: Gebruik as-is met vooraf geïnstalleerde pakketten of bouw op basis van de gecureerde omgeving.
  • Gebruiksgemak: Alle onderdelen worden geïnstalleerd en gevalideerd tegen tientallen Microsoft-workloads om de installatiekosten te verlagen en de waarde van de waarde te versnellen.
  • Efficiëntie: Vermijd onnodige builds van installatiekopieën en hebben alleen vereiste afhankelijkheden die rechtstreeks in de installatiekopie/container toegankelijk zijn.
  • Geoptimaliseerd trainingsframework: PyTorch-modellen instellen, ontwikkelen en versnellen op grote workloads en het succespercentage van training en implementatie verbeteren.
  • Up-to-date stack: toegang tot de nieuwste compatibele versies van Ubuntu, Python, PyTorch, CUDA/RocM, enzovoort.
  • Nieuwste technologieën voor trainingsoptimalisatie: Maak gebruik van ONNX Runtime , DeepSpeed, MSCCL en meer.
  • Integratie met Azure Machine Learning: houd uw PyTorch-experimenten bij op Azure Machine Learning-studio of met behulp van de SDK. De klantondersteuning van Azure vermindert ook de latentie van training en implementatie.
  • Beschikbaarheid als DSVM: De installatiekopieën zijn ook beschikbaar als een Datawetenschap Virtual Machine (DSVM). Zie de DSVM-overzichtsdocumentatie voor meer informatie over Datawetenschap Virtual Machines.

Belangrijk

Ga naar het tabblad Omgevingen in Azure Machine Learning Studio voor meer informatie over gecureerde omgevingspakketten en -versies.

Ondersteunde configuraties voor Azure Container voor PyTorch (ACPT)

Beschrijving: De Gecureerde Azure-omgeving voor PyTorch is onze nieuwste gecureerde PyTorch-omgeving. Het is geoptimaliseerd voor grote, gedistribueerde Deep Learning-workloads en wordt vooraf verpakt met het beste van Microsoft-technologieën voor versnelde training (bijvoorbeeld Onnx Runtime Training (ORT), DeepSpeed, MSCCL, enzovoort).

De volgende configuraties worden ondersteund:

Omgevingsnaam Besturingssysteem GPU-versie Python-versie PyTorch-versie ORT-training versie DeepSpeed-versie torch-ort-versie Nenevelversie
acpt-pytorch-2.2-cuda12.1 Ubuntu 20.04 cu121 3.10 2.2.2 1.17.3 0.13.1 1.17.3 0.16.11
acpt-pytorch-2.1-cuda12.1 Ubuntu 20.04 cu121 3.10 2.1.2 1.17.3 0.13.1 1.17.3 0.16.11
acpt-pytorch-2.0-cuda11.7 Ubuntu 20.04 cu117 3.10 2.0.1 1.17.3 0.13.1 1.17.3 0.16.11
acpt-pytorch-1.13-cuda11.7 Ubuntu 20.04 cu117 3.10 1.13.1 1.17.3 0.13.1 1.17.3 0.16.11

Andere pakketten zoals fairscale, horovod, msccl, protobuf, pyspark, pytest, pytorch-lightning, tensorboard, NebulaML, torchvision en torchmetrics worden aangeboden ter ondersteuning van alle trainingsbehoeften.

Zie Aangepaste DOOR ACPT samengestelde omgevingen maken voor meer informatie.

Ondersteuning

Versie-updates voor ondersteunde omgevingen, inclusief de basisinstallatiekopieën waarnaar ze verwijzen, worden elke twee weken uitgebracht om beveiligingsproblemen op te lossen die niet ouder zijn dan 30 dagen. Op basis van gebruik kunnen sommige omgevingen worden afgeschaft (verborgen voor het product maar bruikbaar) om meer algemene machine learning-scenario's te ondersteunen.