Databricks Runtime 6.3 voor ML (niet ondersteund)

Databricks heeft deze afbeelding uitgebracht in januari 2020.

Databricks Runtime 6.3 voor Machine Learning biedt een kant-en-klare omgeving voor machine learning en gegevenswetenschap op basis van Databricks Runtime 6.3 (niet ondersteund). Databricks Runtime ML bevat veel populaire machine learning-bibliotheken, waaronder TensorFlow, PyTorch, Keras en XGBoost. Het biedt ook ondersteuning voor gedistribueerde deep learning-training met behulp van Horovod.

Zie AI en Machine Learning op Databricks voor meer informatie, waaronder instructies voor het maken van een Databricks Runtime ML-cluster.

Nieuwe functies

Databricks Runtime 6.3 ML is gebouwd op Databricks Runtime 6.3. Zie de releaseopmerkingen van Databricks Runtime 6.3 (niet-ondersteund) voor meer informatie over wat er nieuw is in Databricks Runtime 6.3.


Bijgewerkte machine learning-bibliotheken

  • PyTorch: 1.3.0 tot 1.3.1
  • torchvision: 0.4.1 tot 0.4.2 - bevat een geoptimaliseerde back-end voor videolezers
  • MLflow: 1.4.0 tot 1.5.0
    • Bevat ondersteuning voor LightGBM-, XGBoost- en Gluon-smaken.
    • Er is een fout opgelost waarbij MLflow-projecten niet konden worden uitgevoerd op Databricks Runtime ML-clusters.
    • Zie de MLflow 1.5.0-release voor meer informatie.
  • Hyperopt: 0.2.1 tot 0.2.2 - Updates zijn:
    • Er is een fout opgelost in ATPE (Adaptiv-TPE), waarbij het algoritme niet goed werkte en hp.choicehp.randint.

    • Er zijn enkele fouten opgelost in het gebruik van tqdm, een Python-module voor het rapporteren van de voortgang. De voortgangsbalk was bijvoorbeeld soms onjuist bij het uitvoeren van parallelle fmin()uitvoering.

    • Waarschuwt nu voor nieuwe pogingen voor Spark-taken voor langdurige proefversies. Wanneer nieuwe pogingen zijn ingeschakeld en proefuitvoeringen trage voortgang boeken, wordt dit bericht afgedrukt:

      SparkTrials found that the Spark conf 'spark.task.maxFailures' is set to 4, which will make trials re-run automatically if they fail.
      If failures can occur from bad hyperparameter settings, or if trials are very long-running, then retries may not be a good idea.
      Consider setting spark.conf.set('spark.task.maxFailures', '1') to prevent retries.
    • Andere kleine oplossingen. Zie de release hyperopt 0.2.2 voor meer informatie.


Er is een probleem opgelost waardoor er metrische clustergegevens ontbreken. Dit gebeurt vaak op GPU-clusters met meerdere GPU-knooppunten.


De systeemomgeving in Databricks Runtime 6.3 ML verschilt als volgt van Databricks Runtime 6.3:


In de volgende secties worden de bibliotheken vermeld die zijn opgenomen in Databricks Runtime 6.3 ML die verschillen van de bibliotheken die zijn opgenomen in Databricks Runtime 6.3.

In deze sectie:

Bibliotheken met de hoogste laag

Databricks Runtime 6.3 ML bevat de volgende bibliotheken met de hoogste laag:


Databricks Runtime 6.3 ML maakt gebruik van Conda voor Python-pakketbeheer en bevat veel populaire ML-pakketten. In de volgende sectie wordt de Conda-omgeving voor Databricks Runtime 6.3 ML beschreven.

Python op CPU-clusters

Python op GPU-clusters

Spark-pakketten met Python-modules

Spark-pakket Python-module Versie
graphframes graphframes 0.7.0-db1-spark2.4
spark-deep learning sparkdl 1.5.0-db12-spark2.4
tensorframes tensorframes 0.8.2-s_2.11


De R-bibliotheken zijn identiek aan de R-bibliotheken in Databricks Runtime 6.3.

Java- en Scala-bibliotheken (Scala 2.11-cluster)

Naast Java- en Scala-bibliotheken in Databricks Runtime 6.3 bevat Databricks Runtime 6.3 ML de volgende JAR's:

Groeps-id Artefact-id Versie
com.databricks spark-deep learning 1.5.0-db12-spark2.4
com.typesafe.akka akka-actor_2.11 2.3.11
ml.combust.mleap mleap-databricks-runtime_2.11 0.15.0
ml.dmlc xgboost4j 0.90
ml.dmlc xgboost4j-spark 0.90
org.graphframes graphframes_2.11 0.7.0-db1-spark2.4
org.mlflow mlflow-client 1.4.0
org.tensorflow libtensorflow 1.15.0
org.tensorflow libtensorflow_jni 1.15.0
org.tensorflow spark-tensorflow-connector_2.11 1.15.0
org.tensorflow tensorflow 1.15.0
org.tensorframes tensorframes 0.8.2-s_2.11