Voorbeelden van modeltraining
Deze sectie bevat voorbeelden van het trainen van machine learning-modellen in Azure Databricks met behulp van veel populaire opensource-bibliotheken.
U kunt ook AutoML gebruiken, waarmee automatisch een gegevensset wordt voorbereid voor modeltraining, een reeks proefversies wordt uitgevoerd met behulp van opensource-bibliotheken, zoals scikit-learn en XGBoost, en een Python-notebook wordt gemaakt met de broncode voor elke proefuitvoering, zodat u de code kunt bekijken, reproduceren en wijzigen.
Zie Machine Learning-modellen trainen en registreren bij Unity Catalog voor een voorbeeld van een notebook waarin wordt getoond hoe u een machine learning-model traint dat gebruikmaakt van gegevens in Unity Catalog en voorspellingen schrijft naar Unity Catalog.
Voorbeelden van machine learning
Pakket | Notebook(s) | Functies |
---|---|---|
scikit-learn | Zelfstudie over machine learning | Classificatiemodel, MLflow, geautomatiseerde afstemming van hyperparameters met Hyperopt en MLflow |
scikit-learn | End-to-end-voorbeeld | Classificatiemodel, MLflow, geautomatiseerde afstemming van hyperparameters met Hyperopt en MLflow, XGBoost, modelregister, modelverdiening |
MLlib | Voorbeelden van MLlib | Binaire classificatie, beslissingsstructuren, GBT-regressie, Gestructureerd streamen, aangepaste transformator |
xgboost | XGBoost-voorbeelden | Python, PySpark en Scala, workloads met één knooppunt en gedistribueerde training |
Voorbeelden van hyperparameterafstemming
Zie Hyperparameter-afstemming voor algemene informatie over het afstemmen van hyperparameters in Azure Databricks.
Pakket | Notebook | Functies |
---|---|---|
Hyperopt | Gedistribueerde hyperopt | Gedistribueerde hyperopt, scikit-learn, MLflow |
Hyperopt | Modellen vergelijken | Gedistribueerde hyperopt gebruiken om hyperparameterruimte voor verschillende modeltypen tegelijk te doorzoeken |
Hyperopt | Gedistribueerde trainingsalgoritmen en hyperopt | Hyperopt, MLlib |
Hyperopt | Best practices voor Hyperopt | Aanbevolen procedures voor gegevenssets met verschillende grootten |