Aprendizagem profunda
Este artigo fornece uma breve introdução ao uso do PyTorch, Tensorflow e treinamento distribuído para desenvolver e ajustar modelos de aprendizado profundo no Azure Databricks. Ele também inclui links para páginas com blocos de anotações de exemplo ilustrando como usar essas ferramentas.
- Para obter diretrizes gerais sobre como otimizar fluxos de trabalho de aprendizagem profunda no Azure Databricks, consulte Práticas recomendadas para aprendizado profundo no Azure Databricks.
- Para obter informações sobre como trabalhar com modelos de linguagem grandes e IA generativa no Azure Databricks, consulte:
PyTorch
O PyTorch está incluído no Databricks Runtime ML e fornece computação tensor acelerada por GPU e funcionalidades de alto nível para a construção de redes de aprendizagem profunda. Você pode realizar treinamento de nó único ou treinamento distribuído com o PyTorch no Databricks. Veja PyTorch.
TensorFlow
O Databricks Runtime ML inclui TensorFlow e TensorBoard, portanto, você pode usar essas bibliotecas sem instalar nenhum pacote. O TensorFlow suporta aprendizagem profunda e cálculos numéricos gerais em CPUs, GPUs e clusters de GPUs. O TensorBoard fornece ferramentas de visualização para ajudá-lo a depurar e otimizar fluxos de trabalho de aprendizado de máquina e aprendizado profundo. Consulte TensorFlow para obter exemplos de treinamento distribuído e de nó único.
Preparação distribuída
Como os modelos de aprendizagem profunda são intensivos em dados e computação, o treinamento distribuído pode ser importante. Para obter exemplos de aprendizagem profunda distribuída usando integrações com Ray, TorchDistribution e DeepSpeed, consulte Treinamento distribuído.
Acompanhe o desenvolvimento de modelos de aprendizagem profunda
O rastreamento continua sendo uma pedra angular do ecossistema MLflow e é especialmente vital para a natureza iterativa do deep learning. O Databricks usa o MLflow para rastrear execuções de treinamento de aprendizado profundo e desenvolvimento de modelos. Consulte Acompanhar o desenvolvimento de modelos usando MLflow.