Databricks Runtime 12.1 för Machine Learning (stöds inte)

Databricks Runtime 12.1 för Machine Learning ger en färdig miljö för maskininlärning och datavetenskap baserat på Databricks Runtime 12.1 (stöds inte). Databricks Runtime ML innehåller många populära maskininlärningsbibliotek, inklusive TensorFlow, PyTorch och XGBoost. Databricks Runtime ML innehåller AutoML, ett verktyg för att automatiskt träna maskininlärningspipelines. Databricks Runtime ML stöder även distribuerad djupinlärningsträning med Horovod.

Mer information, inklusive instruktioner för att skapa ett Databricks Runtime ML-kluster, finns i AI och Machine Learning på Databricks.

Nya funktioner och förbättringar

Databricks Runtime 12.1 ML bygger på Databricks Runtime 12.1. Information om nyheter i Databricks Runtime 12.1, inklusive Apache Spark MLlib och SparkR, finns i viktig information om Databricks Runtime 12.1 (stöds inte).

Databricks AutoML

Från och med Databricks Runtime 12.1 ML kan du med AutoML Python API ange ett anpassat namn för experimentet som genereras av AutoML. Använd parametern experiment_name.

Mer information om Databricks AutoML finns i Vad är AutoML?.

Systemmiljö

Systemmiljön i Databricks Runtime 12.1 ML skiljer sig från Databricks Runtime 12.1 på följande sätt:

Databricks Runtime 12.1 ML innehåller XGBoost 1.7.2, som inte stöder GPU-kluster med beräkningskapacitet 5.2 och lägre.

Bibliotek

I följande avsnitt visas de bibliotek som ingår i Databricks Runtime 12.1 ML som skiljer sig från de som ingår i Databricks Runtime 12.1.

I detta avsnitt:

Bibliotek på den översta nivån

Databricks Runtime 12.1 ML innehåller följande bibliotek på den översta nivån:

Python-bibliotek

Databricks Runtime 12.1 ML använder Virtualenv för Python-pakethantering och innehåller många populära ML-paket.

Förutom de paket som anges i följande avsnitt innehåller Även Databricks Runtime 12.1 ML följande paket:

  • hyperopt 0.2.7.db1
  • sparkdl 2.3.0-db3
  • automl 1.15.0

Om du vill återskapa Databricks Runtime ML Python-miljön i din lokala virtuella Python-miljö laddar du ned filen requirements-12.1.txt och kör pip install -r requirements-12.1.txt. Det här kommandot installerar alla öppen källkod bibliotek som Databricks Runtime ML använder, men installerar inte bibliotek som utvecklats av Databricks, till exempel databricks-automl, databricks-feature-storeeller Databricks-förgreningen för hyperopt.

Python-bibliotek i CPU-kluster

Bibliotek Version Bibliotek Version Bibliotek Version
absl-py 1.0.0 argon2-cffi 21.3.0 argon2-cffi-bindningar 21.2.0
Astor 0.8.1 asttokens 2.0.5 astunparse 1.6.3
attrs 21.4.0 azure-core 1.26.1 azure-cosmos 4.2.0
backcall 0.2.0 backports.entry-points-selectable 1.2.0 Bcrypt 3.2.0
beautifulsoup4 4.11.1 svart 22.3.0 Blekmedel 4.1.0
blis 0.7.9 boto3 1.21.32 botocore 1.24.32
cachetools 4.2.2 Katalog 2.0.8 kategorikodare 2.5.1.post0
Certifi 2021.10.8 Cffi 1.15.0 Chardet 4.0.0
charset-normalizer 2.0.4 klicka 8.0.4 cloudpickle 2.0.0
cmdstanpy 1.0.8 Konfekt 0.0.3 configparser 5.2.0
konvertera 2.4.0 Kryptografi 3.4.8 Apparat 0.11.0
cymem 2.0.7 Cython 0.29.28 databricks-automl-runtime 0.2.14
databricks-cli 0.17.4 databricks-feature-store 0.9.0 dbl-tempo 0.1.12
dbus-python 1.2.16 felsökning 1.5.1 Dekoratör 5.1.1
defusedxml 0.7.1 Dill 0.3.4 diskcache 5.4.0
distlib 0.3.6 docstring-to-markdown 0,11 entrypoints 0,4
efem 4.1.4 Verkställande 0.8.3 facets-overview 1.0.0
fastjsonschema 2.16.2 snabbtext 0.9.2 filelock 3.6.0
Flask 1.1.2 flatbuffers 22.12.6 Fonttools 4.25.0
fsspec 2022.2.0 Framtiden 0.18.2 Gast 0.4.0
gitdb 4.0.10 GitPython 3.1.27 google-auth 1.33.0
google-auth-oauthlib 0.4.6 google-pasta 0.2.0 grpcio 1.42.0
gunicorn 20.1.0 gviz-api 1.10.0 h5py 3.6.0
hijri-converter 2.2.4 Semester 0.17.2 horovod 0.26.1
htmlmin 0.1.12 huggingface-hub 0.11.1 idna 3.3
ImageHash 4.3.1 obalanserad inlärning 0.8.1 importlib-metadata 4.11.3
ipykernel 6.15.3 Ipython 8.5.0 ipython-genutils 0.2.0
ipywidgets 7.7.2 isodate 0.6.1 itsdangerous 2.0.1
Jedi 0.18.1 Jinja2 2.11.3 jmespath 0.10.0
joblib 1.1.0 joblibspark 0.5.0 jsonschema 4.4.0
jupyter-client 6.1.12 jupyter_core 4.11.2 jupyterlab-pygments 0.1.2
jupyterlab-widgets 1.0.0 keras 2.10.0 Keras-förbearbetning 1.1.2
kiwisolver 1.3.2 korean-lunar-calendar 0.3.1 langcodes 3.3.0
libclang 14.0.6 lightgbm 3.3.3 llvmlite 0.38.0
LunarCalendar 0.0.9 Mako 1.2.0 Markdown 3.3.4
Markering Valv 2.0.1 matplotlib 3.5.1 matplotlib-inline 0.1.2
Mccabe 0.7.0 mistune 0.8.4 mleap 0.20.0
mlflow-skinny 2.1.1 multimethod 1.9.1 murmurhash 1.0.9
mypy-extensions 0.4.3 nbclient 0.5.13 nbconvert 6.4.4
nbformat 5.3.0 nest-asyncio 1.5.5 Networkx 2.7.1
nltk 3.7 nodeenv 1.7.0 notebook-fil 6.4.8
numba 0.55.1 Numpy 1.21.5 oauthlib 3.2.0
opt-einsum 3.3.0 Förpackning 21,3 Pandas 1.4.2
pandas-profilering 3.5.0 pandocfilter 1.5.0 Paramiko 2.9.2
parso 0.8.3 pathspec 0.9.0 Pati 0.6.1
Patsy 0.5.2 petastorm 0.12.0 Pexpect 4.8.0
phik 0.12.3 pickleshare 0.7.5 Kudde 9.0.1
Pip 21.2.4 platformdirs 2.6.0 plotly 5.6.0
pluggy 1.0.0 pmdarima 2.0.2 fördefinierad 3.0.8
prometheus-client 0.13.1 prompt-toolkit 3.0.20 Profeten 1.1.1
protobuf 3.19.4 Psutil 5.8.0 psycopg2 2.9.3
ptyprocess 0.7.0 pure-eval 0.2.2 pyarrow 7.0.0
pyasn1 0.4.8 pyasn1-modules 0.2.8 pybind11 2.10.1
pycparser 2.21 pydantisk 1.10.2 Pyflakes 2.5.0
Pygments 2.11.2 Pygobject 3.36.0 PyJWT 2.6.0
PyMeeus 0.5.12 PyNaCl 1.5.0 pyodbc 4.0.32
Pyparsing 3.0.4 pyright 1.1.283 pyrsistent 0.18.0
python-dateutil 2.8.2 python-editor 1.0.4 python-lsp-jsonrpc 1.0.0
python-lsp-server 1.6.0 pytz 2021.3 PyWavelets 1.3.0
PyYAML 6,0 pyzmq 22.3.0 Regex 2022.3.15
begäranden 2.27.1 requests-oauthlib 1.3.1 requests-unixsocket 0.2.0
Rep 0.22.0 Rsa 4.7.2 s3transfer 0.5.0
scikit-learn 1.0.2 Scipy 1.7.3 seaborn 0.11.2
Send2Trash 1.8.0 Setuptools 61.2.0 setuptools-git 1.2
Shap 0.41.0 Simplejson 3.17.6 Sex 1.16.0
Slicer 0.0.7 smart-open 5.1.0 smmap 5.0.0
soupsieve 2.3.1 spacy 3.4.3 spacy-legacy 3.0.10
spacy-loggers 1.0.4 spark-tensorflow-distributor 1.0.0 sqlparse 0.4.2
srsly 2.4.5 ssh-import-id 5,10 stack-data 0.2.0
statsmodels 0.13.2 Tabellform 0.8.9 trasslig upp-i-unicode 0.2.0
Uthållighet 8.0.1 tensorboard 2.10.0 tensorboard-data-server 0.6.1
tensorboard-plugin-profile 2.8.0 tensorboard-plugin-wit 1.8.1 tensorflow-cpu 2.10.0
tensorflow-estimator 2.10.0 tensorflow-io-gcs-filesystem 0.29.0 termcolor 2.1.1
terminado 0.13.1 testpath 0.5.0 thinc 8.1.6
threadpoolctl 2.2.0 tokenize-rt 4.2.1 tokenizers 0.13.2
tomli 1.2.2 Fackla 1.13.0+cpu torchvision 0.14.0+cpu
Tornado 6.1 tqdm 4.64.0 traitlets 5.1.1
Transformatorer 4.25.1 typeguard 2.13.3 typer 0.7.0
typing_extensions 4.1.1 ujson 5.1.0 obevakade uppgraderingar 0,1
urllib3 1.26.9 Virtualenv 20.8.0 Visioner 0.7.5
Wasabi 0.10.1 wcwidth 0.2.5 webencodings 0.5.1
websocket-client 0.58.0 Werkzeug 2.0.3 whatthepatch 1.0.3
Hjul 0.37.1 widgetsnbextension 3.6.1 wrapt 1.12.1
xgboost 1.7.2 yapf 0.31.0 Zipp 3.7.0

Python-bibliotek i GPU-kluster

Bibliotek Version Bibliotek Version Bibliotek Version
absl-py 1.0.0 argon2-cffi 21.3.0 argon2-cffi-bindningar 21.2.0
Astor 0.8.1 asttokens 2.0.5 astunparse 1.6.3
attrs 21.4.0 azure-core 1.26.1 azure-cosmos 4.2.0
backcall 0.2.0 backports.entry-points-selectable 1.2.0 Bcrypt 3.2.0
beautifulsoup4 4.11.1 svart 22.3.0 Blekmedel 4.1.0
blis 0.7.9 boto3 1.21.32 botocore 1.24.32
cachetools 4.2.2 Katalog 2.0.8 kategorikodare 2.5.1.post0
Certifi 2021.10.8 Cffi 1.15.0 Chardet 4.0.0
charset-normalizer 2.0.4 klicka 8.0.4 cloudpickle 2.0.0
cmdstanpy 1.0.8 Konfekt 0.0.3 configparser 5.2.0
konvertera 2.4.0 Kryptografi 3.4.8 Apparat 0.11.0
cymem 2.0.7 Cython 0.29.28 databricks-automl-runtime 0.2.14
databricks-cli 0.17.4 databricks-feature-store 0.9.0 dbl-tempo 0.1.12
dbus-python 1.2.16 felsökning 1.5.1 Dekoratör 5.1.1
defusedxml 0.7.1 Dill 0.3.4 diskcache 5.4.0
distlib 0.3.6 docstring-to-markdown 0,11 entrypoints 0,4
efem 4.1.4 Verkställande 0.8.3 facets-overview 1.0.0
fastjsonschema 2.16.2 snabbtext 0.9.2 filelock 3.6.0
Flask 1.1.2 flatbuffers 22.12.6 Fonttools 4.25.0
fsspec 2022.2.0 Framtiden 0.18.2 Gast 0.4.0
gitdb 4.0.10 GitPython 3.1.27 google-auth 1.33.0
google-auth-oauthlib 0.4.6 google-pasta 0.2.0 grpcio 1.42.0
gunicorn 20.1.0 gviz-api 1.10.0 h5py 3.6.0
hijri-converter 2.2.4 Semester 0.17.2 horovod 0.26.1
htmlmin 0.1.12 huggingface-hub 0.11.1 idna 3.3
ImageHash 4.3.1 obalanserad inlärning 0.8.1 importlib-metadata 4.11.3
ipykernel 6.15.3 Ipython 8.5.0 ipython-genutils 0.2.0
ipywidgets 7.7.2 isodate 0.6.1 itsdangerous 2.0.1
Jedi 0.18.1 Jinja2 2.11.3 jmespath 0.10.0
joblib 1.1.0 joblibspark 0.5.0 jsonschema 4.4.0
jupyter-client 6.1.12 jupyter_core 4.11.2 jupyterlab-pygments 0.1.2
jupyterlab-widgets 1.0.0 keras 2.10.0 Keras-förbearbetning 1.1.2
kiwisolver 1.3.2 korean-lunar-calendar 0.3.1 langcodes 3.3.0
libclang 14.0.6 lightgbm 3.3.3 llvmlite 0.38.0
LunarCalendar 0.0.9 Mako 1.2.0 Markdown 3.3.4
Markering Valv 2.0.1 matplotlib 3.5.1 matplotlib-inline 0.1.2
Mccabe 0.7.0 mistune 0.8.4 mleap 0.20.0
mlflow-skinny 2.1.1 multimethod 1.9.1 murmurhash 1.0.9
mypy-extensions 0.4.3 nbclient 0.5.13 nbconvert 6.4.4
nbformat 5.3.0 nest-asyncio 1.5.5 Networkx 2.7.1
nltk 3.7 nodeenv 1.7.0 notebook-fil 6.4.8
numba 0.55.1 Numpy 1.21.5 oauthlib 3.2.0
opt-einsum 3.3.0 Förpackning 21,3 Pandas 1.4.2
pandas-profilering 3.5.0 pandocfilter 1.5.0 Paramiko 2.9.2
parso 0.8.3 pathspec 0.9.0 Pati 0.6.1
Patsy 0.5.2 petastorm 0.12.0 Pexpect 4.8.0
phik 0.12.3 pickleshare 0.7.5 Kudde 9.0.1
Pip 21.2.4 platformdirs 2.6.0 plotly 5.6.0
pluggy 1.0.0 pmdarima 2.0.2 fördefinierad 3.0.8
prompt-toolkit 3.0.20 Profeten 1.1.1 protobuf 3.19.4
Psutil 5.8.0 psycopg2 2.9.3 ptyprocess 0.7.0
pure-eval 0.2.2 pyarrow 7.0.0 pyasn1 0.4.8
pyasn1-modules 0.2.8 pybind11 2.10.1 pycparser 2.21
pydantisk 1.10.2 Pyflakes 2.5.0 Pygments 2.11.2
Pygobject 3.36.0 PyJWT 2.6.0 PyMeeus 0.5.12
PyNaCl 1.5.0 pyodbc 4.0.32 Pyparsing 3.0.4
pyright 1.1.283 pyrsistent 0.18.0 python-dateutil 2.8.2
python-editor 1.0.4 python-lsp-jsonrpc 1.0.0 python-lsp-server 1.6.0
pytz 2021.3 PyWavelets 1.3.0 PyYAML 6,0
pyzmq 22.3.0 Regex 2022.3.15 begäranden 2.27.1
requests-oauthlib 1.3.1 requests-unixsocket 0.2.0 Rep 0.22.0
Rsa 4.7.2 s3transfer 0.5.0 scikit-learn 1.0.2
Scipy 1.7.3 seaborn 0.11.2 Send2Trash 1.8.0
Setuptools 61.2.0 setuptools-git 1.2 Shap 0.41.0
Simplejson 3.17.6 Sex 1.16.0 Slicer 0.0.7
smart-open 5.1.0 smmap 5.0.0 soupsieve 2.3.1
spacy 3.4.3 spacy-legacy 3.0.10 spacy-loggers 1.0.4
spark-tensorflow-distributor 1.0.0 sqlparse 0.4.2 srsly 2.4.5
ssh-import-id 5,10 stack-data 0.2.0 statsmodels 0.13.2
Tabellform 0.8.9 trasslig upp-i-unicode 0.2.0 Uthållighet 8.0.1
tensorboard 2.10.0 tensorboard-data-server 0.6.1 tensorboard-plugin-profile 2.8.0
tensorboard-plugin-wit 1.8.1 tensorflow 2.10.0 tensorflow-estimator 2.10.0
tensorflow-io-gcs-filesystem 0.29.0 termcolor 2.1.1 terminado 0.13.1
testpath 0.5.0 thinc 8.1.6 threadpoolctl 2.2.0
tokenize-rt 4.2.1 tokenizers 0.13.2 tomli 1.2.2
Fackla 1.13.0+cu117 torchvision 0.14.0+cu117 Tornado 6.1
tqdm 4.64.0 traitlets 5.1.1 Transformatorer 4.25.1
typeguard 2.13.3 typer 0.7.0 typing_extensions 4.1.1
ujson 5.1.0 obevakade uppgraderingar 0,1 urllib3 1.26.9
Virtualenv 20.8.0 Visioner 0.7.5 Wasabi 0.10.1
wcwidth 0.2.5 webencodings 0.5.1 websocket-client 0.58.0
Werkzeug 2.0.3 whatthepatch 1.0.3 Hjul 0.37.1
widgetsnbextension 3.6.1 wrapt 1.12.1 xgboost 1.7.2
yapf 0.31.0 Zipp 3.7.0

R-bibliotek

R-biblioteken är identiska med R-biblioteken i Databricks Runtime 12.1.

Java- och Scala-bibliotek (Scala 2.12-kluster)

Förutom Java- och Scala-bibliotek i Databricks Runtime 12.1 innehåller Databricks Runtime 12.1 ML följande JAR:er:

CPU-kluster

Grupp-ID Artefakt-ID Version
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 v0.20.0-db1
ml.dmlc xgboost4j-spark_2.12 1.6.2
ml.dmlc xgboost4j_2.12 1.6.2
org.graphframes graphframes_2.12 0.8.2-db1-spark3.2
org.mlflow mlflow-client 2.0.1
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0

GPU-kluster

Grupp-ID Artefakt-ID Version
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 v0.20.0-db1
ml.dmlc xgboost4j-gpu_2.12 1.6.2
ml.dmlc xgboost4j-spark-gpu_2.12 1.6.2
org.graphframes graphframes_2.12 0.8.2-db1-spark3.2
org.mlflow mlflow-client 2.0.1
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0