Aprendizagem profunda

Artigo
03/01/2024

Este artigo fornece uma breve introdução ao uso do PyTorch, Tensorflow e treinamento distribuído para desenvolver e ajustar modelos de aprendizado profundo no Azure Databricks. Ele também inclui links para páginas com blocos de anotações de exemplo ilustrando como usar essas ferramentas.

Para obter diretrizes gerais sobre como otimizar fluxos de trabalho de aprendizagem profunda no Azure Databricks, consulte Práticas recomendadas para aprendizado profundo no Azure Databricks.
Para obter informações sobre como trabalhar com modelos de linguagem grandes e IA generativa no Azure Databricks, consulte:
- Modelos de linguagem grande (LLMs) em Databricks.
- IA generativa e modelos de linguagem grande (LLMs) no Azure Databricks.

PyTorch

O PyTorch está incluído no Databricks Runtime ML e fornece computação tensor acelerada por GPU e funcionalidades de alto nível para a construção de redes de aprendizagem profunda. Você pode realizar treinamento de nó único ou treinamento distribuído com o PyTorch no Databricks. Veja PyTorch.

TensorFlow

O Databricks Runtime ML inclui TensorFlow e TensorBoard, portanto, você pode usar essas bibliotecas sem instalar nenhum pacote. O TensorFlow suporta aprendizagem profunda e cálculos numéricos gerais em CPUs, GPUs e clusters de GPUs. O TensorBoard fornece ferramentas de visualização para ajudá-lo a depurar e otimizar fluxos de trabalho de aprendizado de máquina e aprendizado profundo. Consulte TensorFlow para obter exemplos de treinamento distribuído e de nó único.

Preparação distribuída

Como os modelos de aprendizagem profunda são intensivos em dados e computação, o treinamento distribuído pode ser importante. Para obter exemplos de aprendizagem profunda distribuída usando integrações com Horovod, , TorchDistributor e DeepSpeed, spark-tensorflow-distributorconsulte Treinamento distribuído.

Acompanhe o desenvolvimento de modelos de aprendizagem profunda

O rastreamento continua sendo uma pedra angular do ecossistema MLflow e é especialmente vital para a natureza iterativa do deep learning. O Databricks usa o MLflow para rastrear execuções de treinamento de aprendizado profundo e desenvolvimento de modelos. Consulte Acompanhar o desenvolvimento de modelos usando MLflow.

Aprendizagem profunda

PyTorch

TensorFlow

Preparação distribuída

Acompanhe o desenvolvimento de modelos de aprendizagem profunda

Recursos adicionais