Databricks Runtime 11.1 for Machine Tanulás (nem támogatott)

A Databricks Runtime 11.1 for Machine Tanulás a Databricks Runtime 11.1-en (nem támogatott) alapuló, használatra kész környezetet biztosít a gépi tanuláshoz és az adatelemzéshez. A Databricks Runtime ML számos népszerű gépi tanulási kódtárat tartalmaz, köztük a TensorFlow-t, a PyTorch-ot és az XGBoost-t. A Databricks Runtime ML tartalmazza az AutoML-t, amely a gépi tanulási folyamatok automatikus betanítására szolgáló eszköz. A Databricks Runtime ML támogatja az elosztott mélytanulási képzést a Horovod használatával.

További információkért, beleértve a Databricks Runtime ML-fürt létrehozásának utasításait, tekintse meg a Databricks migrálási és gépi Tanulás.

Új funkciók és fejlesztések

A Databricks Runtime 11.1 ML a Databricks Runtime 11.1-es verziójára épül. A Databricks Runtime 11.1 újdonságairól , beleértve az Apache Spark MLlib és a SparkR újdonságait, tekintse meg a Databricks Runtime 11.1 (nem támogatott) kibocsátási megjegyzéseit.

A Databricks AutoML fejlesztései

A Databricks AutoML-ben az alábbi fejlesztések történtek.

  • Ha az AutoML azt észleli, hogy egy besorolási probléma bináris, bináris besorolási metrikákat számít ki, és a probléma pozitív osztályára következtet. A pozitív osztályt egy új pos_label paraméterrel is megadhatja. További információ: Besorolási és regressziós paraméterek.
  • Az előrejelzési problémák esetén az AutoML mostantól képes kezelni azt a forgatókönyvet, amelyben a horizont a betanítási adatok időtartományához képest hosszú.

A Databricks szolgáltatástároló fejlesztései

A Databricks feature Store-ban az alábbi fejlesztések történtek.

Rendszerkörnyezet

A Databricks Runtime 11.1 ML rendszerkörnyezete az alábbiak szerint különbözik a Databricks Runtime 11.1-től:

Kódtárak

Az alábbi szakaszok a Databricks Runtime 11.1 ML-ben található kódtárakat sorolják fel, amelyek eltérnek a Databricks Runtime 11.1-ben szereplő kódtáraktól.

Ebben a szakaszban:

Felső szintű kódtárak

A Databricks Runtime 11.1 ML a következő legfelső szintű kódtárakat tartalmazza:

Python-kódtárak

A Databricks Runtime 11.1 ML a Virtualenv-t használja a Python-csomagkezeléshez, és számos népszerű ML-csomagot tartalmaz.

A következő szakaszokban megadott csomagok mellett a Databricks Runtime 11.1 ML a következő csomagokat is tartalmazza:

  • hyperopt 0.2.7.db1
  • sparkdl 2.2.0-db6
  • feature_store 0.5.0
  • automl 1.11.0

Python-kódtárak CPU-fürtökön

Könyvtár Verzió Könyvtár Verzió Könyvtár Verzió
absl-py 1.0.0 Antergos Linux 2015.10 (ISO-rolling) argon2-cffi 20.1.0
Astor 0.8.1 astunparse 1.6.3 aszinkron generátor 1.10
attrs 21.2.0 azure-core 1.22.1 azure-cosmos 4.2.0
backcall 0.2.0 backports.entry-points-selectable 1.1.1 bcrypt 3.2.2
Fehérítő 4.0.0 blis 0.7.8 boto3 1.21.18
botocore 1.24.18 cachetools 5.2.0 Katalógus 2.0.7
minősítés 2021.10.8 cffi 1.14.6 karakterkészlet 4.0.0
charset-normalizer 2.0.4 kattintás 8.0.3 cloudpickle 2.0.0
cmdstanpy 0.9.68 configparser 5.2.0 konvertálás 2.4.0
Titkosítás 3.4.8 cycler 0.10.0 cymem 2.0.6
Cython 0.29.24 databricks-automl-runtime 0.2.9.1 databricks-cli 0.16.8
dbl-tempo 0.1.12 dbus-python 1.2.16 hibakeresés 1.4.1
Dekoratőr 5.1.0 defusedxml 0.7.1 Kapros 0.3.4
diskcache 5.4.0 distlib 0.3.4 distro-info 0,23ubuntu1
belépési pontok 0.3 ephem 4.1.3 aspektusok áttekintése 1.0.0
gyorsszöveg 0.9.2 filelock 3.3.1 Flask 1.1.2
flatbuffers 1.12 fsspec 2021.8.1 Jövőben 0.18.2
Gast 0.4.0 gitdb 4.0.9 GitPython 3.1.27
google-hitelesítés 2.6.0 google-auth-oauthlib 0.4.6 google-pasta 0.2.0
grpcio 1.44.0 gunicorn 20.1.0 gviz-api 1.10.0
h5py 3.3.0 hijri-konverter 2.2.4 Ünnepek 0.14.2
horovod 0.24.3 htmlmin 0.1.12 huggingface-hub 0.8.1
idna 3.2 ImageHash 4.2.1 kiegyensúlyozatlan tanulás 0.8.1
importlib-metadata 4.8.1 ipykernel 6.12.1 ipython 7.32.0
ipython-genutils 0.2.0 ipywidgets 7.7.0 isodate 0.6.1
itsdangerous 2.0.1 Jedi 0.18.0 Jinja2 2.11.3
jmespath 0.10.0 joblib 1.0.1 joblibspark 0.5.0
jsonschema 3.2.0 jupyter-client 6.1.12 jupyter-core 4.8.1
jupyterlab-pygments 0.1.2 jupyterlab-widgetek 1.0.0 keras 2.9.0
Keras-Előfeldolgozás 1.1.2 kiwisolver 1.3.1 koreai-holdnaptár 0.2.1
langcode-k 3.3.0 libclang 14.0.1 lightgbm 3.3.2
llvmlite 0.38.1 LunarCalendar 0.0.9 Makó 1.2.0
Markdown 3.3.6 Korrektúra Széf 2.0.1 matplotlib 3.4.3
matplotlib-inline 0.1.2 missingno 0.5.1 mistune 0.8.4
mleap 0.20.0 mlflow-skinny 1.27.0 multimethod 1.8
murmurhash 1.0.7 nbclient 0.5.3 nbconvert 6.1.0
nbformat 5.1.3 nest-asyncio 1.5.1 networkx 2.6.3
nltk 3.6.5 jegyzetfüzet 6.4.5 numba 0.55.2
numpy 1.20.3 oauthlib 3.2.0 opt-einsum 3.3.0
Csomagolás 21,0 pandas 1.3.4 pandas-profilkészítés 3.1.0
pandocfilters 1.4.3 paramiko 2.9.2 parso 0.8.2
pathy 0.6.2 Patsy 0.5.2 petastorm 0.11.4
pexpect 4.8.0 phik 0.12.2 pickleshare 0.7.5
Párna 8.4.0 Pip 21.2.4 platformdirs 2.5.2
ábrázolás 5.8.2 pmdarima 1.8.5 előre meg van nyitható 3.0.6
prometheus-client 0.11.0 prompt-toolkit 3.0.20 Próféta 1.0.1
protobuf 3.19.4 psutil 5.8.0 psycopg2 2.9.3
ptyprocess 0.7.0 pyarrow 7.0.0 pyasn1 0.4.8
pyasn1-modules 0.2.8 pybind11 2.9.2 pycparser 2,20
pydantic 1.8.2 Pygments 2.10.0 PyGObject 3.36.0
PyJWT 2.4.0 PyMeeus 0.5.11 PyNaCl 1.5.0
pyodbc 4.0.31 pyparsing 3.0.4 pyrsistent 0.18.0
pystan 2.19.1.1 python-apt 2.0.0+ubuntu0.20.4.7 python-dateutil 2.8.2
python-editor 1.0.4 pytz 2021.3 PyWavelets 1.1.1
PyYAML 6,0 pyzmq 22.2.1 Regex 2021.8.3
kérelmek 2.26.0 requests-oauthlib 1.3.1 requests-unixsocket 0.2.0
Rsa 4.8 s3transfer 0.5.2 scikit-learn 0.24.2
scipy 1.7.1 tengeri 0.11.2 Send2Trash 1.8.0
setuptools 58.0.4 setuptools-git 1,2 shap 0.40.0
simplejson 3.17.6 Hat 1.16.0 Szeletelő 0.0.7
smart-open 5.2.1 smmap 5.0.0 spacy 3.3.1
spacy-legacy 3.0.9 spacy-loggers 1.0.2 spark-tensorflow-distributor 1.0.0
sqlparse 0.4.2 srsly 2.4.3 ssh-import-id 5.10
statsmodels 0.12.2 táblázatos 0.8.9 tangled-up-in-unicode 0.1.0
Kitartás 8.0.1 tensorboard 2.9.1 tensorboard-data-server 0.6.1
tensorboard-plugin-profile 2.8.0 tensorboard-plugin-wit 1.8.1 tensorflow-cpu 2.9.1
tensorflow-estimator 2.9.0 tensorflow-io-gcs-fájlrendszer 0.26.0 termcolor 1.1.0
terminado 0.9.4 testpath 0.5.0 thinc 8.0.17
threadpoolctl 2.2.0 tokenizers 0.12.1 Fáklya 1.11.0+cpu
torchvision 0.12.0+cpu Tornádó 6.1 tqdm 4.62.3
árulók 5.1.0 Transformers 4.20.0 Typer 0.4.2
gépelés-bővítmények 3.10.0.2 ujson 4.0.2 felügyelet nélküli frissítések 0,1
urllib3 1.26.7 virtualenv 20.8.0 Látomások 0.7.4
Wasabi 0.9.1 wcwidth 0.2.5 webencodings 0.5.1
websocket-client 1.3.1 Werkzeug 2.0.2 Kerék 0.37.0
widgetsnbextension 3.6.0 wrapt 1.12.1 xgboost 1.5.2
zipp 3.6.0

Python-kódtárak GPU-fürtökön

Könyvtár Verzió Könyvtár Verzió Könyvtár Verzió
absl-py 1.0.0 Antergos Linux 2015.10 (ISO-rolling) argon2-cffi 20.1.0
Astor 0.8.1 astunparse 1.6.3 aszinkron generátor 1.10
attrs 21.2.0 azure-core 1.22.1 azure-cosmos 4.2.0
backcall 0.2.0 backports.entry-points-selectable 1.1.1 bcrypt 3.2.2
Fehérítő 4.0.0 blis 0.7.8 boto3 1.21.18
botocore 1.24.18 cachetools 5.2.0 Katalógus 2.0.7
minősítés 2021.10.8 cffi 1.14.6 karakterkészlet 4.0.0
charset-normalizer 2.0.4 kattintás 8.0.3 cloudpickle 2.0.0
cmdstanpy 0.9.68 configparser 5.2.0 konvertálás 2.4.0
Titkosítás 3.4.8 cycler 0.10.0 cymem 2.0.6
Cython 0.29.24 databricks-automl-runtime 0.2.9.1 databricks-cli 0.16.8
dbl-tempo 0.1.12 dbus-python 1.2.16 hibakeresés 1.4.1
Dekoratőr 5.1.0 defusedxml 0.7.1 Kapros 0.3.4
diskcache 5.4.0 distlib 0.3.4 distro-info 0,23ubuntu1
belépési pontok 0.3 ephem 4.1.3 aspektusok áttekintése 1.0.0
gyorsszöveg 0.9.2 filelock 3.3.1 Flask 1.1.2
flatbuffers 1.12 fsspec 2021.8.1 Jövőben 0.18.2
Gast 0.4.0 gitdb 4.0.9 GitPython 3.1.27
google-hitelesítés 2.6.0 google-auth-oauthlib 0.4.6 google-pasta 0.2.0
grpcio 1.44.0 gunicorn 20.1.0 gviz-api 1.10.0
h5py 3.3.0 hijri-konverter 2.2.4 Ünnepek 0.14.2
horovod 0.24.3 htmlmin 0.1.12 huggingface-hub 0.8.1
idna 3.2 ImageHash 4.2.1 kiegyensúlyozatlan tanulás 0.8.1
importlib-metadata 4.8.1 ipykernel 6.12.1 ipython 7.32.0
ipython-genutils 0.2.0 ipywidgets 7.7.0 isodate 0.6.1
itsdangerous 2.0.1 Jedi 0.18.0 Jinja2 2.11.3
jmespath 0.10.0 joblib 1.0.1 joblibspark 0.5.0
jsonschema 3.2.0 jupyter-client 6.1.12 jupyter-core 4.8.1
jupyterlab-pygments 0.1.2 jupyterlab-widgetek 1.0.0 keras 2.9.0
Keras-Előfeldolgozás 1.1.2 kiwisolver 1.3.1 koreai-holdnaptár 0.2.1
langcode-k 3.3.0 libclang 14.0.1 lightgbm 3.3.2
llvmlite 0.38.1 LunarCalendar 0.0.9 Makó 1.2.0
Markdown 3.3.6 Korrektúra Széf 2.0.1 matplotlib 3.4.3
matplotlib-inline 0.1.2 missingno 0.5.1 mistune 0.8.4
mleap 0.20.0 mlflow-skinny 1.27.0 multimethod 1.8
murmurhash 1.0.7 nbclient 0.5.3 nbconvert 6.1.0
nbformat 5.1.3 nest-asyncio 1.5.1 networkx 2.6.3
nltk 3.6.5 jegyzetfüzet 6.4.5 numba 0.55.2
numpy 1.20.3 oauthlib 3.2.0 opt-einsum 3.3.0
Csomagolás 21,0 pandas 1.3.4 pandas-profilkészítés 3.1.0
pandocfilters 1.4.3 paramiko 2.9.2 parso 0.8.2
pathy 0.6.2 Patsy 0.5.2 petastorm 0.11.4
pexpect 4.8.0 phik 0.12.2 pickleshare 0.7.5
Párna 8.4.0 Pip 21.2.4 platformdirs 2.5.2
ábrázolás 5.8.2 pmdarima 1.8.5 előre meg van nyitható 3.0.6
prompt-toolkit 3.0.20 Próféta 1.0.1 protobuf 3.19.4
psutil 5.8.0 psycopg2 2.9.3 ptyprocess 0.7.0
pyarrow 7.0.0 pyasn1 0.4.8 pyasn1-modules 0.2.8
pybind11 2.9.2 pycparser 2,20 pydantic 1.8.2
Pygments 2.10.0 PyGObject 3.36.0 PyJWT 2.4.0
PyMeeus 0.5.11 PyNaCl 1.5.0 pyodbc 4.0.31
pyparsing 3.0.4 pyrsistent 0.18.0 pystan 2.19.1.1
python-apt 2.0.0+ubuntu0.20.4.7 python-dateutil 2.8.2 python-editor 1.0.4
pytz 2021.3 PyWavelets 1.1.1 PyYAML 6,0
pyzmq 22.2.1 Regex 2021.8.3 kérelmek 2.26.0
requests-oauthlib 1.3.1 requests-unixsocket 0.2.0 Rsa 4.8
s3transfer 0.5.2 scikit-learn 0.24.2 scipy 1.7.1
tengeri 0.11.2 Send2Trash 1.8.0 setuptools 58.0.4
setuptools-git 1,2 shap 0.40.0 simplejson 3.17.6
Hat 1.16.0 Szeletelő 0.0.7 smart-open 5.2.1
smmap 5.0.0 spacy 3.3.1 spacy-legacy 3.0.9
spacy-loggers 1.0.2 spark-tensorflow-distributor 1.0.0 sqlparse 0.4.2
srsly 2.4.3 ssh-import-id 5.10 statsmodels 0.12.2
táblázatos 0.8.9 tangled-up-in-unicode 0.1.0 Kitartás 8.0.1
tensorboard 2.9.1 tensorboard-data-server 0.6.1 tensorboard-plugin-profile 2.8.0
tensorboard-plugin-wit 1.8.1 tensorflow 2.9.1 tensorflow-estimator 2.9.0
tensorflow-io-gcs-fájlrendszer 0.26.0 termcolor 1.1.0 terminado 0.9.4
testpath 0.5.0 thinc 8.0.17 threadpoolctl 2.2.0
tokenizers 0.12.1 Fáklya 1.11.0+cu113 torchvision 0.12.0+cu113
Tornádó 6.1 tqdm 4.62.3 árulók 5.1.0
Transformers 4.20.0 Typer 0.4.2 gépelés-bővítmények 3.10.0.2
ujson 4.0.2 felügyelet nélküli frissítések 0,1 urllib3 1.26.7
virtualenv 20.8.0 Látomások 0.7.4 Wasabi 0.9.1
wcwidth 0.2.5 webencodings 0.5.1 websocket-client 1.3.1
Werkzeug 2.0.2 Kerék 0.37.0 widgetsnbextension 3.6.0
wrapt 1.12.1 xgboost 1.5.2 zipp 3.6.0

Python-modulokat tartalmazó Spark-csomagok

Spark-csomag Python-modul Verzió
gráfkeretek gráfkeretek 0.8.2-db1-spark3.2

R-kódtárak

Az R-kódtárak megegyeznek a Databricks Runtime 11.1 R-kódtárával .

Java- és Scala-kódtárak (Scala 2.12-fürt)

A Databricks Runtime 11.1 Java- és Scala-kódtárai mellett a Databricks Runtime 11.1 ML a következő JAR-eket tartalmazza:

CPU-fürtök

Csoportazonosító Összetevő azonosítója Verzió
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 0.20.0-db1
ml.dmlc xgboost4j-spark_2.12 1.5.2
ml.dmlc xgboost4j_2.12 1.5.2
org.graphframes graphframes_2.12 0.8.2-db1-spark3.2
org.mlflow mlflow-client 1.27.0
org.mlflow mlflow-spark 1.27.0
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0

GPU-fürtök

Csoportazonosító Összetevő azonosítója Verzió
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 0.20.0-db1
ml.dmlc xgboost4j-spark_2.12 1.5.2
ml.dmlc xgboost4j_2.12 1.5.2
org.graphframes graphframes_2.12 0.8.2-db1-spark3.2
org.mlflow mlflow-client 1.27.0
org.mlflow mlflow-spark 1.27.0
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0