¿Qué es AutoML?
Databricks AutoML le ayuda a aplicar automáticamente el aprendizaje automático a un conjunto de datos. Proporcione el conjunto de datos e identifique el destino de predicción, mientras AutoML prepara el conjunto de datos para el entrenamiento del modelo. Después, AutoML realiza y registra un conjunto de pruebas que crea, ajusta y evalúa varios modelos. Después de la evaluación de modelos, AutoML muestra los resultados y proporciona un cuaderno de Python con el código fuente de cada ejecución de prueba para que pueda revisar, reproducir y modificar el código. AutoML también calcula las estadísticas de resumen del conjunto de datos y guarda esta información en un cuaderno que podrá revisar más adelante.
Puede usar Databricks AutoML para problemas de regresión, clasificación y previsión. Obtenga más información sobre cómo funciona AutoML de Azure Databricks.
Requisitos
- Databricks Runtime 9.1 ML o posterior. Para la versión de disponibilidad general (GA), Databricks Runtime 10.4 LTS ML o superior.
- Para la previsión de series temporales, Databricks Runtime 10.0 ML o posterior.
- Con Databricks Runtime 9.1 LTS ML y posteriores, AutoML depende del paquete
databricks-automl-runtime
, que contiene componentes que son útiles fuera de AutoML, y también ayuda a simplificar los cuadernos generados por el entrenamiento de AutoML.databricks-automl-runtime
está disponible en PyPI.
- No se deben instalar bibliotecas adicionales en el clúster, más allá de las que están instaladas previamente en Databricks Runtime para Machine Learning.
- Cualquier modificación (eliminación, actualización o degradación) a las versiones de biblioteca existentes produce errores de ejecución debido a la incompatibilidad.
- AutoML no es compatible con clústeres de modo de acceso compartido.
- Para usar Unity Catalog con AutoML, el modo de acceso del clúster debe ser Usuario único y usted debe ser el usuario único designado del clúster.