Databricks Runtime 11.3 LTS gépi Tanulás

A Databricks Runtime 11.3 LTS for Machine Tanulás a Databricks Runtime 11.3 LTS-en alapuló, használatra kész környezetet biztosít a gépi tanuláshoz és az adatelemzéshez. A Databricks Runtime ML számos népszerű gépi tanulási kódtárat tartalmaz, köztük a TensorFlow-t, a PyTorch-ot és az XGBoost-t. A Databricks Runtime ML tartalmazza az AutoML-t, amely a gépi tanulási folyamatok automatikus betanítására szolgáló eszköz. A Databricks Runtime ML támogatja az elosztott mélytanulási képzést a Horovod használatával.

Feljegyzés

Az LTS azt jelenti, hogy ez a verzió hosszú távú támogatás alatt áll. Lásd: Databricks Runtime LTS-verzió életciklusa.

További információkért, beleértve a Databricks Runtime ML-fürt létrehozásának utasításait, tekintse meg a Databricks migrálási és gépi Tanulás.

Új funkciók és fejlesztések

A Databricks Runtime 11.3 LTS ML a Databricks Runtime 11.3 LTS-en alapul. A Databricks Runtime 11.3 LTS újdonságairól, beleértve az Apache Spark MLlib-et és a SparkR-t, tekintse meg a Databricks Runtime 11.3 LTS kibocsátási megjegyzéseit.

A Databricks AutoML fejlesztései

A Databricks AutoML mostantól támogatja a funkciótár funkciótábláinak használatát az AutoML-kísérletekben. További részletekért lásd a Feature Store integrációját.

Az AutoML által létrehozott próbaverziós jegyzetfüzetek mostantól kódrészleteket tartalmaznak, amelyek lehetővé teszik a felhasználók számára a hiperparaméterek hangolásának újrafuttatását.

Az AutoML mostantól támogatja a DecimalType funkciókat.

Hibajavítások

A Databricks Runtime 11.3 LTS ML a .sparkdl.xgboost A korábbi verziók sparkdl.xgboost a jelen kiadásban kijavított hibákat tartalmaznak, ezért a Databricks azt javasolja, hogy a könyvtár felhasználói frissítsenek a Databricks Runtime 11.3 LTS ML-re.

Felkészülés a jövőbeli kiadásokra

A Databricks Runtime ML közelgő kiadása az 1.0-s verziót tartalmazza sklearn . A módosítás előkészítéséről a sklearndokumentációban tájékozódhat.

A Databricks Runtime ML két openblas csomagot tartalmaz. A /opt/OpenBLAS csomag elavult a Databricks Runtime 11.3 LTS ML-ben, és egy hamarosan megjelenő kiadásban el lesz távolítva.

Rendszerkörnyezet

A Databricks Runtime 11.3 LTS ML rendszerkörnyezete eltér a Databricks Runtime 11.3 LTS-től az alábbiak szerint:

A Databricks Runtime 11.3 LTS ML tartalmazza az XGBoost 1.6.1-et, amely nem támogatja az 5.2-es és újabb számítási képességgel rendelkező GPU-fürtöket.

Kódtárak

Az alábbi szakaszok a Databricks Runtime 11.3 LTS ML-ben található kódtárakat sorolják fel, amelyek eltérnek a Databricks Runtime 11.3 LTS-ben található kódtáraktól.

Ebben a szakaszban:

Felső szintű kódtárak

A Databricks Runtime 11.3 LTS ML a következő legfelső szintű kódtárakat tartalmazza:

Python-kódtárak

A Databricks Runtime 11.3 LTS ML a Virtualenv-t használja a Python-csomagkezeléshez, és számos népszerű ML-csomagot tartalmaz.

A következő szakaszokban megadott csomagok mellett a Databricks Runtime 11.3 LTS ML a következő csomagokat is tartalmazza:

  • hyperopt 0.2.7.db1
  • sparkdl 2.3.0-db3
  • feature_store 0.7.0
  • automl 1.13.2

A Databricks Runtime ML Python-környezet helyi Python virtuális környezetben való reprodukálásához töltse le a requirements-11.3.txt fájlt, és futtassa pip install -r requirements-11.3.txt. Ez a parancs telepíti a Databricks Runtime ML által használt összes nyílt forráskód kódtárat, de nem telepíti a Databricks által fejlesztett kódtárakat, például databricks-automla databricks-feature-storeDatabricks elágazásáthyperopt.

Python-kódtárak CPU-fürtökön

Könyvtár Verzió Könyvtár Verzió Könyvtár Verzió
absl-py 1.0.0 argon2-cffi 20.1.0 Astor 0.8.1
astunparse 1.6.3 aszinkron generátor 1.10 attrs 21.2.0
azure-core 1.22.1 azure-cosmos 4.2.0 backcall 0.2.0
backports.entry-points-selectable 1.1.1 bcrypt 4.0.0 Fekete 22.3.0
Fehérítő 4.0.0 blis 0.7.8 boto3 1.21.18
botocore 1.24.18 cachetools 5.2.0 Katalógus 2.0.8
minősítés 2021.10.8 cffi 1.14.6 karakterkészlet 4.0.0
charset-normalizer 2.0.4 kattintás 8.0.3 cloudpickle 2.0.0
cmdstanpy 0.9.68 édesség 0.0.1 configparser 5.2.0
konvertálás 2.4.0 Titkosítás 3.4.8 cycler 0.10.0
cymem 2.0.6 Cython 0.29.24 databricks-automl-runtime 0.2.11
databricks-cli 0.17.3 dbl-tempo 0.1.12 dbus-python 1.2.16
hibakeresés 1.4.1 Dekoratőr 5.1.0 defusedxml 0.7.1
Kapros 0.3.4 diskcache 5.4.0 distlib 0.3.6
belépési pontok 0.3 ephem 4.1.3 aspektusok áttekintése 1.0.0
gyorsszöveg 0.9.2 filelock 3.3.1 Flask 1.1.2
flatbuffers 1.12 fsspec 2021.8.1 Jövőben 0.18.2
Gast 0.4.0 gitdb 4.0.9 GitPython 3.1.27
google-hitelesítés 2.6.0 google-auth-oauthlib 0.4.6 google-pasta 0.2.0
grpcio 1.44.0 gunicorn 20.1.0 gviz-api 1.10.0
h5py 3.3.0 hijri-konverter 2.2.4 Ünnepek 0,15
horovod 0.25.0 htmlmin 0.1.12 huggingface-hub 0.9.1
idna 3.2 ImageHash 4.3.0 kiegyensúlyozatlan tanulás 0.8.1
importlib-metadata 4.8.1 ipykernel 6.12.1 ipython 7.32.0
ipython-genutils 0.2.0 ipywidgets 7.7.0 isodate 0.6.1
itsdangerous 2.0.1 Jedi 0.18.0 Jinja2 2.11.3
jmespath 0.10.0 joblib 1.0.1 joblibspark 0.5.0
jsonschema 3.2.0 jupyter-client 6.1.12 jupyter-core 4.8.1
jupyterlab-pygments 0.1.2 jupyterlab-widgetek 1.0.0 keras 2.9.0
Keras-Előfeldolgozás 1.1.2 kiwisolver 1.3.1 koreai-holdnaptár 0.3.1
langcode-k 3.3.0 libclang 14.0.6 lightgbm 3.3.2
llvmlite 0.37.0 LunarCalendar 0.0.9 Makó 1.2.0
Markdown 3.3.6 Korrektúra Széf 2.0.1 matplotlib 3.4.3
matplotlib-inline 0.1.2 missingno 0.5.1 mistune 0.8.4
mleap 0.20.0 mlflow-skinny 1.29.0 multimethod 1,9
murmurhash 1.0.8 mypy-extensions 0.4.3 nbclient 0.5.3
nbconvert 6.1.0 nbformat 5.1.3 nest-asyncio 1.5.1
networkx 2.6.3 nltk 3.6.5 jegyzetfüzet 6.4.5
numba 0.54.1 numpy 1.20.3 oauthlib 3.2.0
opt-einsum 3.3.0 Csomagolás 21,0 pandas 1.3.4
pandas-profilkészítés 3.1.0 pandocfilters 1.4.3 paramiko 2.9.2
parso 0.8.2 pathspec 0.9.0 pathy 0.6.2
Patsy 0.5.2 petastorm 0.11.4 pexpect 4.8.0
phik 0.12.2 pickleshare 0.7.5 Párna 8.4.0
Pip 21.2.4 platformdirs 2.5.2 ábrázolás 5.9.0
pmdarima 1.8.5 előre meg van nyitható 3.0.7 prometheus-client 0.11.0
prompt-toolkit 3.0.20 Próféta 1.0.1 protobuf 3.19.4
psutil 5.8.0 psycopg2 2.9.3 ptyprocess 0.7.0
pyarrow 7.0.0 pyasn1 0.4.8 pyasn1-modules 0.2.8
pybind11 2.10.0 pycparser 2,20 pydantic 1.9.2
Pygments 2.10.0 PyGObject 3.36.0 PyJWT 2.5.0
PyMeeus 0.5.11 PyNaCl 1.5.0 pyodbc 4.0.31
pyparsing 3.0.4 pyrsistent 0.18.0 pystan 2.19.1.1
python-dateutil 2.8.2 python-editor 1.0.4 pytz 2021.3
PyWavelets 1.1.1 PyYAML 6,0 pyzmq 22.2.1
Regex 2021.8.3 kérelmek 2.26.0 requests-oauthlib 1.3.1
requests-unixsocket 0.2.0 Rsa 4.9 s3transfer 0.5.2
scikit-learn 0.24.2 scipy 1.7.1 tengeri 0.11.3
Send2Trash 1.8.0 setuptools 58.0.4 setuptools-git 1,2
shap 0.41.0 simplejson 3.17.6 Hat 1.16.0
Szeletelő 0.0.7 smart-open 5.2.1 smmap 5.0.0
spacy 3.4.1 spacy-legacy 3.0.10 spacy-loggers 1.0.3
spark-tensorflow-distributor 1.0.0 sqlparse 0.4.2 srsly 2.4.4
ssh-import-id 5.10 statsmodels 0.12.2 táblázatos 0.8.9
tangled-up-in-unicode 0.1.0 Kitartás 8.0.1 tensorboard 2.9.1
tensorboard-data-server 0.6.1 tensorboard-plugin-profile 2.8.0 tensorboard-plugin-wit 1.8.1
tensorflow-cpu 2.9.1 tensorflow-estimator 2.9.0 tensorflow-io-gcs-fájlrendszer 0.27.0
termcolor 2.0.1 terminado 0.9.4 testpath 0.5.0
thinc 8.1.2 threadpoolctl 2.2.0 tokenize-rt 4.2.1
tokenizers 0.12.1 tomli 2.0.1 Fáklya 1.12.1+cpu
torchvision 0.13.1+cpu Tornádó 6.1 tqdm 4.62.3
árulók 5.1.0 Transformers 4.21.2 Typer 0.4.2
gépelés-bővítmények 3.10.0.2 ujson 4.0.2 felügyelet nélküli frissítések 0,1
urllib3 1.26.7 virtualenv 20.8.0 Látomások 0.7.4
Wasabi 0.10.1 wcwidth 0.2.5 webencodings 0.5.1
websocket-client 1.3.1 Werkzeug 2.0.2 Kerék 0.37.0
widgetsnbextension 3.6.0 wrapt 1.12.1 xgboost 1.6.2
zipp 3.6.0

Python-kódtárak GPU-fürtökön

Könyvtár Verzió Könyvtár Verzió Könyvtár Verzió
absl-py 1.0.0 argon2-cffi 20.1.0 Astor 0.8.1
astunparse 1.6.3 aszinkron generátor 1.10 attrs 21.2.0
azure-core 1.22.1 azure-cosmos 4.2.0 backcall 0.2.0
backports.entry-points-selectable 1.1.1 bcrypt 4.0.0 Fekete 22.3.0
Fehérítő 4.0.0 blis 0.7.8 boto3 1.21.18
botocore 1.24.18 cachetools 5.2.0 Katalógus 2.0.8
minősítés 2021.10.8 cffi 1.14.6 karakterkészlet 4.0.0
charset-normalizer 2.0.4 kattintás 8.0.3 cloudpickle 2.0.0
cmdstanpy 0.9.68 édesség 0.0.1 configparser 5.2.0
konvertálás 2.4.0 Titkosítás 3.4.8 cycler 0.10.0
cymem 2.0.6 Cython 0.29.24 databricks-automl-runtime 0.2.11
databricks-cli 0.17.3 dbl-tempo 0.1.12 dbus-python 1.2.16
hibakeresés 1.4.1 Dekoratőr 5.1.0 defusedxml 0.7.1
Kapros 0.3.4 diskcache 5.4.0 distlib 0.3.6
belépési pontok 0.3 ephem 4.1.3 aspektusok áttekintése 1.0.0
gyorsszöveg 0.9.2 filelock 3.3.1 Flask 1.1.2
flatbuffers 1.12 fsspec 2021.8.1 Jövőben 0.18.2
Gast 0.4.0 gitdb 4.0.9 GitPython 3.1.27
google-hitelesítés 2.6.0 google-auth-oauthlib 0.4.6 google-pasta 0.2.0
grpcio 1.44.0 gunicorn 20.1.0 gviz-api 1.10.0
h5py 3.3.0 hijri-konverter 2.2.4 Ünnepek 0,15
horovod 0.25.0 htmlmin 0.1.12 huggingface-hub 0.9.1
idna 3.2 ImageHash 4.3.0 kiegyensúlyozatlan tanulás 0.8.1
importlib-metadata 4.8.1 ipykernel 6.12.1 ipython 7.32.0
ipython-genutils 0.2.0 ipywidgets 7.7.0 isodate 0.6.1
itsdangerous 2.0.1 Jedi 0.18.0 Jinja2 2.11.3
jmespath 0.10.0 joblib 1.0.1 joblibspark 0.5.0
jsonschema 3.2.0 jupyter-client 6.1.12 jupyter-core 4.8.1
jupyterlab-pygments 0.1.2 jupyterlab-widgetek 1.0.0 keras 2.9.0
Keras-Előfeldolgozás 1.1.2 kiwisolver 1.3.1 koreai-holdnaptár 0.3.1
langcode-k 3.3.0 libclang 14.0.6 lightgbm 3.3.2
llvmlite 0.37.0 LunarCalendar 0.0.9 Makó 1.2.0
Markdown 3.3.6 Korrektúra Széf 2.0.1 matplotlib 3.4.3
matplotlib-inline 0.1.2 missingno 0.5.1 mistune 0.8.4
mleap 0.20.0 mlflow-skinny 1.29.0 multimethod 1,9
murmurhash 1.0.8 mypy-extensions 0.4.3 nbclient 0.5.3
nbconvert 6.1.0 nbformat 5.1.3 nest-asyncio 1.5.1
networkx 2.6.3 nltk 3.6.5 jegyzetfüzet 6.4.5
numba 0.54.1 numpy 1.20.3 oauthlib 3.2.0
opt-einsum 3.3.0 Csomagolás 21,0 pandas 1.3.4
pandas-profilkészítés 3.1.0 pandocfilters 1.4.3 paramiko 2.9.2
parso 0.8.2 pathspec 0.9.0 pathy 0.6.2
Patsy 0.5.2 petastorm 0.11.4 pexpect 4.8.0
phik 0.12.2 pickleshare 0.7.5 Párna 8.4.0
Pip 21.2.4 platformdirs 2.5.2 ábrázolás 5.9.0
pmdarima 1.8.5 előre meg van nyitható 3.0.7 prompt-toolkit 3.0.20
Próféta 1.0.1 protobuf 3.19.4 psutil 5.8.0
psycopg2 2.9.3 ptyprocess 0.7.0 pyarrow 7.0.0
pyasn1 0.4.8 pyasn1-modules 0.2.8 pybind11 2.10.0
pycparser 2,20 pydantic 1.9.2 Pygments 2.10.0
PyGObject 3.36.0 PyJWT 2.5.0 PyMeeus 0.5.11
PyNaCl 1.5.0 pyodbc 4.0.31 pyparsing 3.0.4
pyrsistent 0.18.0 pystan 2.19.1.1 python-dateutil 2.8.2
python-editor 1.0.4 pytz 2021.3 PyWavelets 1.1.1
PyYAML 6,0 pyzmq 22.2.1 Regex 2021.8.3
kérelmek 2.26.0 requests-oauthlib 1.3.1 requests-unixsocket 0.2.0
Rsa 4.9 s3transfer 0.5.2 scikit-learn 0.24.2
scipy 1.7.1 tengeri 0.11.3 Send2Trash 1.8.0
setuptools 58.0.4 setuptools-git 1,2 shap 0.41.0
simplejson 3.17.6 Hat 1.16.0 Szeletelő 0.0.7
smart-open 5.2.1 smmap 5.0.0 spacy 3.4.1
spacy-legacy 3.0.10 spacy-loggers 1.0.3 spark-tensorflow-distributor 1.0.0
sqlparse 0.4.2 srsly 2.4.4 ssh-import-id 5.10
statsmodels 0.12.2 táblázatos 0.8.9 tangled-up-in-unicode 0.1.0
Kitartás 8.0.1 tensorboard 2.9.1 tensorboard-data-server 0.6.1
tensorboard-plugin-profile 2.8.0 tensorboard-plugin-wit 1.8.1 tensorflow 2.9.1
tensorflow-estimator 2.9.0 tensorflow-io-gcs-fájlrendszer 0.27.0 termcolor 2.0.1
terminado 0.9.4 testpath 0.5.0 thinc 8.1.2
threadpoolctl 2.2.0 tokenize-rt 4.2.1 tokenizers 0.12.1
tomli 2.0.1 Fáklya 1.12.1+cu113 torchvision 0.13.1+cu113
Tornádó 6.1 tqdm 4.62.3 árulók 5.1.0
Transformers 4.21.2 Typer 0.4.2 gépelés-bővítmények 3.10.0.2
ujson 4.0.2 felügyelet nélküli frissítések 0,1 urllib3 1.26.7
virtualenv 20.8.0 Látomások 0.7.4 Wasabi 0.10.1
wcwidth 0.2.5 webencodings 0.5.1 websocket-client 1.3.1
Werkzeug 2.0.2 Kerék 0.37.0 widgetsnbextension 3.6.0
wrapt 1.12.1 xgboost 1.6.2 zipp 3.6.0

R-kódtárak

Az R-kódtárak megegyeznek a Databricks Runtime 11.3 LTS R-kódtárával .

Java- és Scala-kódtárak (Scala 2.12-fürt)

A Databricks Runtime 11.3 LTS Java- és Scala-kódtárak mellett a Databricks Runtime 11.3 LTS ML a következő JAR-eket tartalmazza:

CPU-fürtök

Csoportazonosító Összetevő azonosítója Verzió
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 v0.20.0-db1
ml.dmlc xgboost4j-spark_2.12 1.6.2
ml.dmlc xgboost4j_2.12 1.6.2
org.graphframes graphframes_2.12 0.8.2-db1-spark3.2
org.mlflow mlflow-client 1.29.0
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0

GPU-fürtök

Csoportazonosító Összetevő azonosítója Verzió
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 v0.20.0-db1
ml.dmlc xgboost4j-gpu_2.12 1.6.2
ml.dmlc xgboost4j-spark-gpu_2.12 1.6.2
org.graphframes graphframes_2.12 0.8.2-db1-spark3.2
org.mlflow mlflow-client 1.29.0
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0