Oharra
Baimena behar duzu orria atzitzeko. Direktorioetan saioa has dezakezu edo haiek alda ditzakezu.
Baimena behar duzu orria atzitzeko. Direktorioak alda ditzakezu.
En este artículo se proporciona una breve introducción al uso de PyTorch, TensorFlow y el entrenamiento distribuido para desarrollar y ajustar modelos de aprendizaje profundo en Azure Databricks. También incluye vínculos a páginas con cuadernos de ejemplo que ilustran cómo usar esas herramientas.
- Para obtener instrucciones generales sobre la optimización de flujos de trabajo de aprendizaje profundo en Azure Databricks, consulte Procedimientos recomendados para el aprendizaje profundo en Azure Databricks.
- Para obtener información sobre cómo trabajar con modelos de lenguaje grandes e inteligencia artificial generativa en Azure Databricks, consulte:
- Para obtener información e instrucciones sobre el uso de GPU sin servidor con AI Runtime para cargas de trabajo de aprendizaje profundo de un solo nodo y varios nodos, consulte Ai Runtime.
PyTorch
PyTorch se incluye en Databricks Runtime ML y proporciona cálculos tensor acelerados por GPU y funcionalidades de alto nivel para crear redes de aprendizaje profundo. Puede realizar el entrenamiento de un solo nodo o el entrenamiento distribuido con PyTorch en Databricks. Vea PyTorch. Para ver un cuaderno de tutorial de un extremo a otro mediante PyTorch y MLflow, consulte Tutorial: Modelos de aprendizaje profundo de un extremo a otro en Azure Databricks.
TensorFlow
Databricks Runtime ML incluye TensorFlow y TensorBoard, por lo que puede usar estas bibliotecas sin instalar ningún paquete. TensorFlow admite cálculos numéricos generales y de aprendizaje profundo en CPU, GPU y clústeres de GPU. TensorBoard proporciona herramientas de visualización para ayudarle a depurar y optimizar los flujos de trabajo de aprendizaje automático y de aprendizaje profundo. Consulte TensorFlow para obtener ejemplos de entrenamiento distribuido y de nodo único.
Entrenamiento distribuido
Dado que los modelos de aprendizaje profundo requieren muchos datos y cálculos, el entrenamiento distribuido puede ser importante. Para obtener ejemplos de aprendizaje profundo distribuido mediante integraciones con Ray, TorchDistributor y DeepSpeed, consulte Entrenamiento distribuido.
Seguimiento del desarrollo de modelos de aprendizaje profundo
El seguimiento sigue siendo una pieza clave del ecosistema de MLflow y es especialmente vital para la naturaleza iterativa del aprendizaje profundo. Databricks usa MLflow para realizar un seguimiento de las ejecuciones de entrenamiento de aprendizaje profundo y el desarrollo de modelos. Consulte Seguimiento del desarrollo de modelos mediante MLflow.