Nota
L'accés a aquesta pàgina requereix autorització. Pots provar d'iniciar sessió o canviar de directori.
L'accés a aquesta pàgina requereix autorització. Pots provar de canviar directoris.
En este artículo se proporciona una breve introducción al uso de PyTorch, TensorFlow y el entrenamiento distribuido para desarrollar y ajustar modelos de aprendizaje profundo en Azure Databricks. También incluye vínculos a páginas con cuadernos de ejemplo que ilustran cómo usar esas herramientas.
- Para obtener instrucciones generales sobre la optimización de flujos de trabajo de aprendizaje profundo en Azure Databricks, consulte Procedimientos recomendados para el aprendizaje profundo en Azure Databricks.
- Para obtener información sobre cómo trabajar con modelos de lenguaje grandes e inteligencia artificial generativa en Azure Databricks, consulte:
- Para obtener información e instrucciones sobre cómo usar el proceso de GPU sin servidor para cargas de trabajo de aprendizaje profundo de un solo nodo y varios nodos, consulte Proceso de GPU sin servidor.
PyTorch
PyTorch se incluye en Databricks Runtime ML y proporciona cálculos tensor acelerados por GPU y funcionalidades de alto nivel para crear redes de aprendizaje profundo. Puede realizar el entrenamiento de un solo nodo o el entrenamiento distribuido con PyTorch en Databricks. Vea PyTorch. Para ver un cuaderno de tutorial de un extremo a otro mediante PyTorch y MLflow, consulte Tutorial: Modelos de aprendizaje profundo de un extremo a otro en Azure Databricks.
TensorFlow
Databricks Runtime ML incluye TensorFlow y TensorBoard, por lo que puede usar estas bibliotecas sin instalar ningún paquete. TensorFlow admite cálculos numéricos generales y de aprendizaje profundo en CPU, GPU y clústeres de GPU. TensorBoard proporciona herramientas de visualización para ayudarle a depurar y optimizar los flujos de trabajo de aprendizaje automático y de aprendizaje profundo. Consulte TensorFlow para obtener ejemplos de entrenamiento distribuido y de nodo único.
Entrenamiento distribuido
Dado que los modelos de aprendizaje profundo requieren muchos datos y cálculos, el entrenamiento distribuido puede ser importante. Para obtener ejemplos de aprendizaje profundo distribuido mediante integraciones con Ray, TorchDistributor y DeepSpeed, consulte Entrenamiento distribuido.
Seguimiento del desarrollo de modelos de aprendizaje profundo
El seguimiento sigue siendo una pieza clave del ecosistema de MLflow y es especialmente vital para la naturaleza iterativa del aprendizaje profundo. Databricks usa MLflow para realizar un seguimiento de las ejecuciones de entrenamiento de aprendizaje profundo y el desarrollo de modelos. Consulte Seguimiento del desarrollo de modelos mediante MLflow.