Partager via


Databricks Runtime 11.3 LTS pour Machine Learning (EoS)

Note

La prise en charge de cette version databricks Runtime a pris fin. Pour connaître la date de fin de support, consultez l’historique de fin de support. Pour toutes les versions prises en charge de Databricks Runtime, consultez Notes de publication sur les versions et la compatibilité de Databricks Runtime.

Databricks Runtime 11.3 LTS pour le machine learning fournit un environnement clé en main pour le machine learning et la science des données basés sur Databricks Runtime 11.3 LTS (EoS). Databricks Runtime ML contient de nombreuses bibliothèques populaires de Machine Learning, notamment TensorFlow, PyTorch et XGBoost. Databricks Runtime ML comprend AutoML, un outil permettant d’effectuer l’apprentissage automatique des pipelines Machine Learning. Databricks Runtime ML prend également en charge l'apprentissage profond distribué à l'aide d'Horovod.

Note

LTS (Long Term Support) signifie que cette version bénéficie d’un support à long terme. Consultez Cycle de vie de la version de Databricks Runtime LTS.

Pour plus d’informations, y compris les instructions relatives à la création d’un cluster Databricks Runtime ML, consultez IA et machine learning sur Databricks.

Nouvelles fonctionnalités et améliorations

Databricks Runtime 11.3 LTS ML est basé sur Databricks Runtime 11.3 LTS. Pour plus d’informations sur les nouveautés de Databricks Runtime 11.3 LTS, notamment Apache Spark MLlib et SparkR, consultez les notes de publication de Databricks Runtime 11.3 LTS (EoS).

Améliorations apportées à AutoML

AutoML prend désormais en charge l’utilisation des tables de fonctionnalités existantes du Magasin de fonctionnalités dans vos expériences AutoML. Pour plus d’informations, consultez l’intégration du Magasin de fonctionnalités AutoML.

Les notebooks d’évaluation générés par AutoML contiennent désormais des extraits de code qui permettent aux utilisateurs de réexécuter le réglage des hyperparamètres.

AutoML prend désormais en charge les DecimalType fonctionnalités.

Corrections de bugs

Databricks Runtime 11.3 LTS ML inclut une version mise à niveau de sparkdl.xgboost. Les versions précédentes de sparkdl.xgboost contiennent des bogues corrigés dans cette version. Databricks recommande donc aux utilisateurs de la mise à niveau de la bibliothèque vers Databricks Runtime 11.3 LTS ML.

Préparer les versions futures

Une prochaine version de Databricks Runtime ML inclura sklearn la version 1.0. Consultez la sklearndocumentation pour plus d’informations sur la préparation de cette modification.

Databricks Runtime ML contient deux openblas packages. Le /opt/OpenBLAS package est déconseillé dans Databricks Runtime 11.3 LTS ML et sera supprimé dans une prochaine version.

Environnement du système

L’environnement système dans Databricks Runtime 11.3 LTS ML diffère de Databricks Runtime 11.3 LTS comme suit :

Databricks Runtime 11.3 LTS ML inclut XGBoost 1.6.1, qui ne prend pas en charge les clusters GPU avec la capacité de calcul 5.2 et les versions ultérieures.

Libraries

Les sections suivantes répertorient les bibliothèques incluses dans Databricks Runtime 11.3 LTS ML qui diffèrent de celles incluses dans Databricks Runtime 11.3 LTS.

Dans cette section :

Bibliothèques de niveau supérieur

Databricks Runtime 11.3 LTS ML inclut les bibliothèques de niveau supérieur suivantes :

Bibliothèques Python

Databricks Runtime 11.3 LTS ML utilise Virtualenv pour la gestion des packages Python et inclut de nombreux packages ML populaires.

Outre les packages spécifiés dans les sections suivantes, Databricks Runtime 11.3 LTS ML inclut également les packages suivants :

  • hyperopt 0.2.7.db1
  • sparkdl 2.3.0-db3
  • feature_store 0.7.0
  • automl 1.13.2

Pour reproduire l’environnement Python Ml Databricks Runtime dans votre environnement virtuel Python local, téléchargez le fichier requirements-11.3.txt et exécutez pip install -r requirements-11.3.txt. Cette commande installe toutes les bibliothèques open source que Databricks Runtime ML utilise, mais n’installe pas les bibliothèques développées par Databricks, telles que databricks-automl, databricks-feature-store ou le fork Databricks de hyperopt.

Bibliothèques Python sur les clusters de processeurs

Bibliothèque Version Bibliothèque Version Bibliothèque Version
absl-py 1.0.0 argon2-cffi 20.1.0 Astor 0.8.1
astunparse 1.6.3 générateur asynchrone 1,10 attributs 21.2.0
azure-core 1.22.1 azure-cosmos 4.2.0 appel de retour 0.2.0
backports.entry-points-selectable 1.1.1 bcrypt 4.0.0 black 22.3.0
bleach 4.0.0 félicité 0.7.8 boto3 1.21.18
botocore 1.24.18 cachetools 5.2.0 catalogue 2.0.8
certifi 2021.10.8 cffi 1.14.6 chardet 4.0.0
charset-normalizer 2.0.4 cliquez 8.0.3 cloudpickle 2.0.0
cmdstanpy 0.9.68 confection 0.0.1 configparser 5.2.0
convertdate 2.4.0 cryptographie 3.4.8 cycliste 0.10.0
cymem 2.0.6 Cython 0.29.24 databricks-automl-runtime 0.2.11
databricks-cli 0.17.3 dbl-tempo 0.1.12 dbus-python 1.2.16
debugpy 1.4.1 décorateur 5.1.0 defusedxml 0.7.1
aneth 0.3.4 cache de disque 5.4.0 distlib 0.3.6
points d’entrée 0,3 ephem 4.1.3 aperçu des facettes 1.0.0
fasttext 0.9.2 verrou de fichier 3.3.1 Flask 1.1.2
flatbuffers 1.12 fsspec 2021.8.1 futur 0.18.2
gast 0.4.0 gitdb 4.0.9 GitPython 3.1.27
google-auth 2.6.0 google-auth-oauthlib 0.4.6 google-pasta 0.2.0
grpcio 1.44.0 gunicorn 20.1.0 gviz-api 1.10.0
h5py 3.3.0 hijri-converter 2.2.4 vacances 0.15
horovod 0.25.0 htmlmin 0.1.12 huggingface-hub 0.9.1
IDNA 3.2 ImageHash 4.3.0 imbalanced-learn 0.8.1
importlib-metadata 4.8.1 ipykernel 6.12.1 ipython 7.32.0
ipython-genutils 0.2.0 ipywidgets 7.7.0 isodate 0.6.1
c'est dangereux 2.0.1 Jedi 0.18.0 Jinja2 2.11.3
jmespath 0.10.0 joblib 1.0.1 joblibspark 0.5.0
jsonschema 3.2.0 jupyter-client 6.1.12 jupyter-core 4.8.1
jupyterlab-pygments 0.1.2 jupyterlab-widgets (widgets pour JupyterLab) 1.0.0 keras 2.9.0
Keras-Preprocessing 1.1.2 kiwisolver 1.3.1 calendrier lunaire coréen 0.3.1
codes de langue 3.3.0 libclang 14.0.6 lightgbm 3.3.2
llvmlite 0.37.0 Calendrier lunaire 0.0.9 Mako 1.2.0
Markdown 3.3.6 MarkupSafe 2.0.1 matplotlib 3.4.3
matplotlib-inline 0.1.2 missingno 0.5.1 mistune 0.8.4
mleap 0.20.0 mlflow-skinny (version légère de mlflow) 1.29.0 multiméthode 1,9
murmurhash 1.0.8 mypy-extensions 0.4.3 nbclient 0.5.3
nbconvert 6.1.0 nbformat 5.1.3 nest-asyncio 1.5.1
networkx 2.6.3 nltk 3.6.5 notebook 6.4.5
numba 0.54.1 numpy 1.20.3 oauthlib 3.2.0
opt-einsum 3.3.0 empaquetage 21,0 Pandas 1.3.4
pandas-profilage 3.1.0 pandocfilters 1.4.3 paramiko 2.9.2
parso 0.8.2 pathspec 0.9.0 Pathy 0.6.2
patsy 0.5.2 Petastorm 0.11.4 pexpect 4.8.0
phik 0.12.2 pickleshare 0.7.5 Oreiller 8.4.0
pip 21.2.4 platformdirs 2.5.2 plotly 5.9.0
pmdarima 1.8.5 prétraité 3.0.7 prometheus-client 0.11.0
prompt-toolkit 3.0.20 prophète 1.0.1 protobuf 3.19.4
psutil 5.8.0 psycopg2 2.9.3 ptyprocess 0.7.0
pyarrow 7.0.0 pyasn1 0.4.8 pyasn1-modules 0.2.8
pybind11 2.10.0 pycparser 2.20 pydantic 1.9.2
Pygments 2.10.0 PyGObject 3.36.0 PyJWT 2.5.0
PyMeeus 0.5.11 PyNaCl 1.5.0 pyodbc 4.0.31
pyparsing 3.0.4 pyrsistent 0.18.0 pystan 2.19.1.1
python-dateutil 2.8.2 éditeur de Python 1.0.4 pytz 2021.3
PyWavelets 1.1.1 PyYAML 6,0 pyzmq 22.2.1
regex 3 août 2021 requests 2.26.0 requests-oauthlib 1.3.1
requests-unixsocket 0.2.0 Rsa 4,9 s3transfer 0.5.2
scikit-learn 0.24.2 scipy (bibliothèque Python pour le calcul scientifique) 1.7.1 seaborn 0.11.3
Send2Trash 1.8.0 setuptools 58.0.4 setuptools-git 1.2
forme 0.41.0 simplejson 3.17.6 six 1.16.0
segment 0.0.7 ouverture intelligente 5.2.1 smmap 5.0.0
spacy 3.4.1 spacy-legacy 3.0.10 spacy-loggers 1.0.3
spark-tensorflow-distributor 1.0.0 sqlparse 0.4.2 srsly 2.4.4
ssh-import-id 5.10 statsmodels, une bibliothèque Python pour la modélisation statistique 0.12.2 tabulate 0.8.9
emmêlé-up-in-unicode 0.1.0 ténacité 8.0.1 TensorBoard (outil de visualisation pour le machine learning) 2.9.1
serveur de données TensorBoard 0.6.1 tensorboard-plugin-profile 2.8.0 tensorboard-plugin-wit 1.8.1
tensorflow-cpu 2.9.1 estimateur TensorFlow 2.9.0 tensorflow-io-gcs-filesystem 0.27.0
termcolor 2.0.1 terminé 0.9.4 chemin de test 0.5.0
Thinc 8.1.2 threadpoolctl 2.2.0 tokenize-rt 4.2.1
générateurs de jetons 0.12.1 tomli 2.0.1 torche 1.12.1+cpu
torchvision 0.13.1+cpu tornade 6.1 tqdm 4.62.3
Traitlets 5.1.0 Transformateurs 4.21.2 Typer 0.4.2
extensions de typage 3.10.0.2 ujson 4.0.2 unattended-upgrades 0.1
urllib3 1.26.7 virtualenv 20.8.0 visions 0.7.4
wasabi 0.10.1 wcwidth 0.2.5 webencodings 0.5.1
websocket-client 1.3.1 Outil 2.0.2 roue 0.37.0
widgetsnbextension 3.6.0 enveloppé 1.12.1 xgboost 1.6.2
zipp 3.6.0

Bibliothèques Python sur des clusters GPU

Bibliothèque Version Bibliothèque Version Bibliothèque Version
absl-py 1.0.0 argon2-cffi 20.1.0 Astor 0.8.1
astunparse 1.6.3 générateur asynchrone 1,10 attributs 21.2.0
azure-core 1.22.1 azure-cosmos 4.2.0 appel de retour 0.2.0
backports.entry-points-selectable 1.1.1 bcrypt 4.0.0 black 22.3.0
bleach 4.0.0 félicité 0.7.8 boto3 1.21.18
botocore 1.24.18 cachetools 5.2.0 catalogue 2.0.8
certifi 2021.10.8 cffi 1.14.6 chardet 4.0.0
charset-normalizer 2.0.4 cliquez 8.0.3 cloudpickle 2.0.0
cmdstanpy 0.9.68 confection 0.0.1 configparser 5.2.0
convertdate 2.4.0 cryptographie 3.4.8 cycliste 0.10.0
cymem 2.0.6 Cython 0.29.24 databricks-automl-runtime 0.2.11
databricks-cli 0.17.3 dbl-tempo 0.1.12 dbus-python 1.2.16
debugpy 1.4.1 décorateur 5.1.0 defusedxml 0.7.1
aneth 0.3.4 cache de disque 5.4.0 distlib 0.3.6
points d’entrée 0,3 ephem 4.1.3 aperçu des facettes 1.0.0
fasttext 0.9.2 verrou de fichier 3.3.1 Flask 1.1.2
flatbuffers 1.12 fsspec 2021.8.1 futur 0.18.2
gast 0.4.0 gitdb 4.0.9 GitPython 3.1.27
google-auth 2.6.0 google-auth-oauthlib 0.4.6 google-pasta 0.2.0
grpcio 1.44.0 gunicorn 20.1.0 gviz-api 1.10.0
h5py 3.3.0 hijri-converter 2.2.4 vacances 0.15
horovod 0.25.0 htmlmin 0.1.12 huggingface-hub 0.9.1
IDNA 3.2 ImageHash 4.3.0 imbalanced-learn 0.8.1
importlib-metadata 4.8.1 ipykernel 6.12.1 ipython 7.32.0
ipython-genutils 0.2.0 ipywidgets 7.7.0 isodate 0.6.1
c'est dangereux 2.0.1 Jedi 0.18.0 Jinja2 2.11.3
jmespath 0.10.0 joblib 1.0.1 joblibspark 0.5.0
jsonschema 3.2.0 jupyter-client 6.1.12 jupyter-core 4.8.1
jupyterlab-pygments 0.1.2 jupyterlab-widgets (widgets pour JupyterLab) 1.0.0 keras 2.9.0
Keras-Preprocessing 1.1.2 kiwisolver 1.3.1 calendrier lunaire coréen 0.3.1
codes de langue 3.3.0 libclang 14.0.6 lightgbm 3.3.2
llvmlite 0.37.0 Calendrier lunaire 0.0.9 Mako 1.2.0
Markdown 3.3.6 MarkupSafe 2.0.1 matplotlib 3.4.3
matplotlib-inline 0.1.2 missingno 0.5.1 mistune 0.8.4
mleap 0.20.0 mlflow-skinny (version légère de mlflow) 1.29.0 multiméthode 1,9
murmurhash 1.0.8 mypy-extensions 0.4.3 nbclient 0.5.3
nbconvert 6.1.0 nbformat 5.1.3 nest-asyncio 1.5.1
networkx 2.6.3 nltk 3.6.5 notebook 6.4.5
numba 0.54.1 numpy 1.20.3 oauthlib 3.2.0
opt-einsum 3.3.0 empaquetage 21,0 Pandas 1.3.4
pandas-profilage 3.1.0 pandocfilters 1.4.3 paramiko 2.9.2
parso 0.8.2 pathspec 0.9.0 Pathy 0.6.2
patsy 0.5.2 Petastorm 0.11.4 pexpect 4.8.0
phik 0.12.2 pickleshare 0.7.5 Oreiller 8.4.0
pip 21.2.4 platformdirs 2.5.2 plotly 5.9.0
pmdarima 1.8.5 prétraité 3.0.7 prompt-toolkit 3.0.20
prophète 1.0.1 protobuf 3.19.4 psutil 5.8.0
psycopg2 2.9.3 ptyprocess 0.7.0 pyarrow 7.0.0
pyasn1 0.4.8 pyasn1-modules 0.2.8 pybind11 2.10.0
pycparser 2.20 pydantic 1.9.2 Pygments 2.10.0
PyGObject 3.36.0 PyJWT 2.5.0 PyMeeus 0.5.11
PyNaCl 1.5.0 pyodbc 4.0.31 pyparsing 3.0.4
pyrsistent 0.18.0 pystan 2.19.1.1 python-dateutil 2.8.2
éditeur de Python 1.0.4 pytz 2021.3 PyWavelets 1.1.1
PyYAML 6,0 pyzmq 22.2.1 regex 3 août 2021
requests 2.26.0 requests-oauthlib 1.3.1 requests-unixsocket 0.2.0
Rsa 4,9 s3transfer 0.5.2 scikit-learn 0.24.2
scipy (bibliothèque Python pour le calcul scientifique) 1.7.1 seaborn 0.11.3 Send2Trash 1.8.0
setuptools 58.0.4 setuptools-git 1.2 forme 0.41.0
simplejson 3.17.6 six 1.16.0 segment 0.0.7
ouverture intelligente 5.2.1 smmap 5.0.0 spacy 3.4.1
spacy-legacy 3.0.10 spacy-loggers 1.0.3 spark-tensorflow-distributor 1.0.0
sqlparse 0.4.2 srsly 2.4.4 ssh-import-id 5.10
statsmodels, une bibliothèque Python pour la modélisation statistique 0.12.2 tabulate 0.8.9 emmêlé-up-in-unicode 0.1.0
ténacité 8.0.1 TensorBoard (outil de visualisation pour le machine learning) 2.9.1 serveur de données TensorBoard 0.6.1
tensorboard-plugin-profile 2.8.0 tensorboard-plugin-wit 1.8.1 tensorflow 2.9.1
estimateur TensorFlow 2.9.0 tensorflow-io-gcs-filesystem 0.27.0 termcolor 2.0.1
terminé 0.9.4 chemin de test 0.5.0 Thinc 8.1.2
threadpoolctl 2.2.0 tokenize-rt 4.2.1 générateurs de jetons 0.12.1
tomli 2.0.1 torche 1.12.1+cu113 torchvision 0.13.1+cu113
tornade 6.1 tqdm 4.62.3 Traitlets 5.1.0
Transformateurs 4.21.2 Typer 0.4.2 extensions de typage 3.10.0.2
ujson 4.0.2 unattended-upgrades 0.1 urllib3 1.26.7
virtualenv 20.8.0 visions 0.7.4 wasabi 0.10.1
wcwidth 0.2.5 webencodings 0.5.1 websocket-client 1.3.1
Outil 2.0.2 roue 0.37.0 widgetsnbextension 3.6.0
enveloppé 1.12.1 xgboost 1.6.2 zipp 3.6.0

Bibliothèques R

Les bibliothèques R sont identiques aux bibliothèques R dans Databricks Runtime 11.3 LTS.

Bibliothèques Java et Scala (cluster Scala 2.12)

Outre les bibliothèques Java et Scala dans Databricks Runtime 11.3 LTS, Databricks Runtime 11.3 LTS ML contient les JAR suivants :

Clusters de CPU

ID de groupe ID d’artefact Version
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 v0.20.0-db1
ml.dmlc xgboost4j-spark_2.12 1.6.2
ml.dmlc xgboost4j_2.12 1.6.2
org.graphframes graphframes_2.12 0.8.2-db1-spark3.2
org.mlflow mlflow-client 1.29.0
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0

Clusters de GPU

ID de groupe ID d’artefact Version
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 v0.20.0-db1
ml.dmlc xgboost4j-gpu_2.12 1.6.2
ml.dmlc xgboost4j-spark-gpu_2.12 1.6.2
org.graphframes graphframes_2.12 0.8.2-db1-spark3.2
org.mlflow mlflow-client 1.29.0
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0