Share via


ML için Databricks Runtime 10.0 (desteklenmiyor)

Machine Learning için Databricks Runtime 10.0, Databricks Runtime 10.0 (desteklenmeyen) tabanlı makine öğrenmesi ve veri bilimi için kullanıma hazır bir ortam sağlar. Databricks Runtime ML, TensorFlow, PyTorch ve XGBoost gibi birçok popüler makine öğrenmesi kitaplığı içerir. Horovod kullanarak dağıtılmış derin öğrenme eğitimini de destekler.

Databricks Runtime ML kümesi oluşturma yönergeleri de dahil olmak üzere daha fazla bilgi için bkz . Databricks'te AI ve Machine Learning.

Yeni özellikler ve geliştirmeler

Databricks Runtime 10.0 ML, Databricks Runtime 10.0'ın üzerine kurulmuştur. Apache Spark MLlib ve SparkR dahil olmak üzere Databricks Runtime 10.0'daki yenilikler hakkında bilgi için bkz . Databricks Runtime 10.0 (desteklenmeyen) sürüm notları.

AutoML ile zaman serisi tahmini

AutoML artık zaman serisi tahminini destekliyor. Daha fazla bilgi için bkz . AutoML Belgeleri.

Databricks Runtime ML Python ortamında önemli değişiklikler

Python paketleri eklendi

  • databricks-automl-runtime 0.1.0
  • dengesiz-öğrenme 0.8.0
  • transformatörler 4.9.2

Sistem ortamı

RStudio Server Açık Kaynak'ın dahil edilen sürümünü v1.4 sürümüne güncelleştirdik.

Databricks Runtime 10.0 ML'deki sistem ortamı, Databricks Runtime 10.0'dan aşağıdaki gibi farklıdır:

  • DBUtils: Databricks Runtime ML, Kitaplık yardımcı programını (dbutils.library) (eski) içermez. Bunun yerine komutları kullanın %pip . Bkz. Not defteri kapsamlı Python kitaplıkları.
  • GPU kümeleri için Databricks Runtime ML aşağıdaki NVIDIA GPU kitaplıklarını içerir:
    • CUDA 11.0
    • cuDNN 8.0.5.39
    • NCCL 2.10.3
    • TensorRT 7.2.2

Kitaplıklar

Aşağıdaki bölümlerde Databricks Runtime 10.0 ML'de bulunan ve Databricks Runtime 10.0'daki kitaplıklardan farklı kitaplıklar listelenmiştir.

Bu bölümde:

Üst katman kitaplıkları

Databricks Runtime 10.0 ML aşağıdaki üst katman kitaplıklarını içerir:

Python kitaplıkları

Databricks Runtime 10.0 ML, Python paket yönetimi için Virtualenv kullanır ve birçok popüler ML paketi içerir.

Databricks Runtime 10.0 ML, aşağıdaki bölümlerde belirtilen paketlere ek olarak aşağıdaki paketleri de içerir:

  • hyperopt 0.2.5.db2
  • sparkdl 2.2.0_db3
  • feature_store 0.3.4
  • automl 1.3.1

CPU kümelerinde Python kitaplıkları

Kitaplık Sürüm Kitaplık Sürüm Kitaplık Sürüm
absl-py 0.11.0 Antergos Linux 2015.10 (ISO-Rolling) appdirs 1.4.4
argon2-cffi 20.1.0 Astor 0.8.1 astunparse 1.6.3
async-generator 1.10 attrs 20.3.0 geri arama 0.2.0
bcrypt 3.2.0 Çamaşır suyu 3.3.0 Blıs 0.7.4
boto3 1.16.7 botocore 1.19.7 Darboğaz 1.3.2
önbellek araçları 4.2.2 Katalog 2.0.6 sertifikalı 2020.12.5
cffi 1.14.5 chardet 4.0.0 clang 5.0
tıklama 7.1.2 cloudpickle 1.6.0 cmdstanpy 0.9.68
yapılandırmaparser 5.0.1 dönüştürme tarihi 2.3.2 Şifreleme 3.4.7
Cycler 0.10.0 cymem 2.0.5 Cython 0.29.23
databricks-automl-runtime 0.1.0 databricks-cli 0.14.3 dbus-python 1.2.16
Dekoratör 5.0.6 defusedxml 0.7.1 Dereotu 0.3.2
diskcache 5.2.1 daistlib 0.3.2 distro-info 0.23ubuntu1
Entrypoints 0.3 ephem 4.0.0.2 modellere genel bakış 1.0.0
dosya kilidi 3.0.12 Flask 1.1.2 flatbuffers 1.12
fsspec 0.9.0 Gelecek 0.18.2 Gast 0.4.0
gitdb 4.0.7 GitPython 3.1.12 google-auth 1.22.1
google-auth-oauthlib 0.4.2 google-pasta 0.2.0 grpcio 1.39.0
gunicorn 20.0.4 h5py 3.1.0 hijri-converter 2.2.1
Tatil 0.11.2 horovod 0.22.1 htmlmin 0.1.12
huggingface-hub 0.0.12 ıdna 2.10 ImageHash 4.2.1
dengesiz-öğrenme 0.8.0 importlib-metadata 3.10.0 ipykernel 5.3.4
ipython 7.22.0 ipython-genutils 0.2.0 ipywidgets 7.6.3
izodat 0.6.0 itsdangerous 1.1.0 Jedi 0.17.2
Jinja2 2.11.3 jmespath 0.10.0 joblib 1.0.1
joblibspark 0.3.0 jsonschema 3.2.0 jupyter-client 6.1.12
jupyter-core 4.7.1 jupyterlab-pygments 0.1.2 jupyterlab pencere öğeleri 1.0.0
keras 2.6.0 Keras-Preprocessing 1.1.2 kiwisolver 1.3.1
Koala 1.8.1 korece-ay takvimi 0.2.1 lightgbm 3.1.1
llvmlite 0.37.0 LunarCalendar 0.0.9 Mako 1.1.3
Markdown 3.3.3 İşaretlemeyi Kasa 1.1.1 matplotlib 3.4.2
missingno 0.5.0 yanlış 0.8.4 mleap 0.17.0
mlflow-skinny 1.20.2 multimethod 1.4 murmurhash 1.0.5
nbclient 0.5.3 nbconvert 6.0.7 nbformat 5.1.3
nest-asyncio 1.5.1 networkx 2.5 nltk 3.6.1
not defteri 6.3.0 numba 0.54.0 numpy 1.19.2
oauthlib 3.1.0 opt-einsum 3.3.0 Ambalaj 20.9
pandas 1.2.4 pandas profili oluşturma 3.0.0 pandocfilters 1.4.3
paramiko 2.7.2 parso 0.7.0 pathy 0.6.0
Patsy 0.5.1 petastorm 0.11.2 pexpect 4.8.0
phik 0.12.0 pickleshare 0.7.5 Yastık 8.2.0
Pip 21.0.1 çizim 5.1.0 önceden gösterilmiş 3.0.5
prometheus-client 0.10.1 prompt-toolkit 3.0.17 Peygamber 1.0.1
protobuf 3.17.2 psutil 5.8.0 psycopg2 2.8.5
ptyprocess 0.7.0 serçe 4.0.0 pyasn1 0.4.8
pyasn1-modules 0.2.8 pycparser 2.20 pydantic 1.8.2
Pygments 2.8.1 PyGObject 3.36.0 PyMeeus 0.5.11
PyNaCl 1.3.0 pyodbc 4.0.30 pyparsing 2.4.7
pirsistent 0.17.3 pystan 2.19.1.1 python-apt 2.0.0+ubuntu0.20.4.6
python-dateutil 2.8.1 python düzenleyicisi 1.0.4 pytz 2020.5
PyWavelets 1.1.1 PyYAML 5.4.1 pyzmq 20.0.0
Regex 2021.4.4 istekler 2.25.1 requests-oauthlib 1.3.0
requests-unixsocket 0.2.0 rsa 4.7.2 s3transfer 0.3.7
sacremoses 0.0.45 scikit-learn 0.24.1 scipy 1.6.2
Sinan 0.11.1 Send2Trash 1.5.0 kurulum araçları 52.0.0
setuptools-git 1.2 Shap 0.39.0 simplejson 3.17.2
Altı 1.15.0 Dilimleyici 0.0.7 akıllı açma 5.2.0
smmap 3.0.5 spacy 3.1.2 spacy-legacy 3.0.8
spark-tensorflow-distributor 1.0.0 sqlparse 0.4.1 srsly 2.4.1
ssh-import-id 5.10 statsmodeller 0.12.2 sekmeli 0.8.7
unicode'da karışık 0.1.0 Azim 6.2.0 tensorboard 2.6.0
tensorboard-data-server 0.6.1 tensorboard-plugin-wit 1.8.0 tensorflow-cpu 2.6.0
tensorflow-estimator 2.6.0 termcolor 1.1.0 terminado 0.9.4
test yolu 0.4.4 thinc 8.0.8 threadpoolctl 2.1.0
belirteç oluşturucular 0.10.3 Meşale 1.9.0+cpu torchvision 0.10.0+cpu
Kasırga 6.1 tqdm 4.59.0 traitlets 5.0.5
Transformers 4.9.2 Typer 0.3.2 yazma uzantıları 3.7.4.3
ujson 4.0.2 katılımsız yükseltmeler 0,1 urllib3 1.25.11
virtualenv 20.4.1 Vizyon 0.7.1 Wasabi 0.8.2
wcwidth 0.2.5 webencodings 0.5.1 websocket-client 0.57.0
Werkzeug 1.0.1 Tekerlek 0.36.2 widgetsnbextension 3.5.1
kaydırma 1.12.1 xgboost 1.4.2 zipp 3.4.1

GPU kümelerinde Python kitaplıkları

Kitaplık Sürüm Kitaplık Sürüm Kitaplık Sürüm
absl-py 0.11.0 Antergos Linux 2015.10 (ISO-Rolling) appdirs 1.4.4
argon2-cffi 20.1.0 Astor 0.8.1 astunparse 1.6.3
async-generator 1.10 attrs 20.3.0 geri arama 0.2.0
bcrypt 3.2.0 Çamaşır suyu 3.3.0 Blıs 0.7.4
boto3 1.16.7 botocore 1.19.7 Darboğaz 1.3.2
önbellek araçları 4.2.2 Katalog 2.0.6 sertifikalı 2020.12.5
cffi 1.14.5 chardet 4.0.0 clang 5.0
tıklama 7.1.2 cloudpickle 1.6.0 cmdstanpy 0.9.68
yapılandırmaparser 5.0.1 dönüştürme tarihi 2.3.2 Şifreleme 3.4.7
Cycler 0.10.0 cymem 2.0.5 Cython 0.29.23
databricks-automl-runtime 0.1.0 databricks-cli 0.14.3 dbus-python 1.2.16
Dekoratör 5.0.6 defusedxml 0.7.1 Dereotu 0.3.2
diskcache 5.2.1 daistlib 0.3.2 distro-info 0.23ubuntu1
Entrypoints 0.3 ephem 4.0.0.2 modellere genel bakış 1.0.0
dosya kilidi 3.0.12 Flask 1.1.2 flatbuffers 1.12
fsspec 0.9.0 Gelecek 0.18.2 Gast 0.4.0
gitdb 4.0.7 GitPython 3.1.12 google-auth 1.22.1
google-auth-oauthlib 0.4.2 google-pasta 0.2.0 grpcio 1.39.0
gunicorn 20.0.4 h5py 3.1.0 hijri-converter 2.2.1
Tatil 0.11.2 horovod 0.22.1 htmlmin 0.1.12
huggingface-hub 0.0.12 ıdna 2.10 ImageHash 4.2.1
dengesiz-öğrenme 0.8.0 importlib-metadata 3.10.0 ipykernel 5.3.4
ipython 7.22.0 ipython-genutils 0.2.0 ipywidgets 7.6.3
izodat 0.6.0 itsdangerous 1.1.0 Jedi 0.17.2
Jinja2 2.11.3 jmespath 0.10.0 joblib 1.0.1
joblibspark 0.3.0 jsonschema 3.2.0 jupyter-client 6.1.12
jupyter-core 4.7.1 jupyterlab-pygments 0.1.2 jupyterlab pencere öğeleri 1.0.0
keras 2.6.0 Keras-Preprocessing 1.1.2 kiwisolver 1.3.1
Koala 1.8.1 korece-ay takvimi 0.2.1 lightgbm 3.1.1
llvmlite 0.37.0 LunarCalendar 0.0.9 Mako 1.1.3
Markdown 3.3.3 İşaretlemeyi Kasa 1.1.1 matplotlib 3.4.2
missingno 0.5.0 yanlış 0.8.4 mleap 0.17.0
mlflow-skinny 1.20.2 multimethod 1.4 murmurhash 1.0.5
nbclient 0.5.3 nbconvert 6.0.7 nbformat 5.1.3
nest-asyncio 1.5.1 networkx 2.5 nltk 3.6.1
not defteri 6.3.0 numba 0.54.0 numpy 1.19.2
oauthlib 3.1.0 opt-einsum 3.3.0 Ambalaj 20.9
pandas 1.2.4 pandas profili oluşturma 3.0.0 pandocfilters 1.4.3
paramiko 2.7.2 parso 0.7.0 pathy 0.6.0
Patsy 0.5.1 petastorm 0.11.2 pexpect 4.8.0
phik 0.12.0 pickleshare 0.7.5 Yastık 8.2.0
Pip 21.0.1 çizim 5.1.0 önceden gösterilmiş 3.0.5
prompt-toolkit 3.0.17 Peygamber 1.0.1 protobuf 3.17.2
psutil 5.8.0 psycopg2 2.8.5 ptyprocess 0.7.0
serçe 4.0.0 pyasn1 0.4.8 pyasn1-modules 0.2.8
pycparser 2.20 pydantic 1.8.2 Pygments 2.8.1
PyGObject 3.36.0 PyMeeus 0.5.11 PyNaCl 1.3.0
pyodbc 4.0.30 pyparsing 2.4.7 pirsistent 0.17.3
pystan 2.19.1.1 python-apt 2.0.0+ubuntu0.20.4.6 python-dateutil 2.8.1
python düzenleyicisi 1.0.4 pytz 2020.5 PyWavelets 1.1.1
PyYAML 5.4.1 pyzmq 20.0.0 Regex 2021.4.4
istekler 2.25.1 requests-oauthlib 1.3.0 requests-unixsocket 0.2.0
rsa 4.7.2 s3transfer 0.3.7 sacremoses 0.0.45
scikit-learn 0.24.1 scipy 1.6.2 Sinan 0.11.1
Send2Trash 1.5.0 kurulum araçları 52.0.0 setuptools-git 1.2
Shap 0.39.0 simplejson 3.17.2 Altı 1.15.0
Dilimleyici 0.0.7 akıllı açma 5.2.0 smmap 3.0.5
spacy 3.1.2 spacy-legacy 3.0.8 spark-tensorflow-distributor 1.0.0
sqlparse 0.4.1 srsly 2.4.1 ssh-import-id 5.10
statsmodeller 0.12.2 sekmeli 0.8.7 unicode'da karışık 0.1.0
Azim 6.2.0 tensorboard 2.6.0 tensorboard-data-server 0.6.1
tensorboard-plugin-wit 1.8.0 tensorflow 2.6.0 tensorflow-estimator 2.6.0
termcolor 1.1.0 terminado 0.9.4 test yolu 0.4.4
thinc 8.0.8 threadpoolctl 2.1.0 belirteç oluşturucular 0.10.3
Meşale 1.9.0+cu111 torchvision 0.10.0+cu111 Kasırga 6.1
tqdm 4.59.0 traitlets 5.0.5 Transformers 4.9.2
Typer 0.3.2 yazma uzantıları 3.7.4.3 ujson 4.0.2
katılımsız yükseltmeler 0,1 urllib3 1.25.11 virtualenv 20.4.1
Vizyon 0.7.1 Wasabi 0.8.2 wcwidth 0.2.5
webencodings 0.5.1 websocket-client 0.57.0 Werkzeug 1.0.1
Tekerlek 0.36.2 widgetsnbextension 3.5.1 kaydırma 1.12.1
xgboost 1.4.2 zipp 3.4.1

Python modülleri içeren Spark paketleri

Spark Paketi Python Modülü Sürüm
graf çerçeveleri graf çerçeveleri 0.8.1-db6-spark3.2

R kitaplıkları

R kitaplıkları Databricks Runtime 10.0'daki R Kitaplıklarıyla aynıdır.

Java ve Scala kitaplıkları (Scala 2.12 kümesi)

Databricks Runtime 10.0'daki Java ve Scala kitaplıklarına ek olarak, Databricks Runtime 10.0 ML aşağıdaki JAR'leri içerir:

CPU kümeleri

Grup Kimliği Yapıt Kimliği Sürüm
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 0.17.0-4882dc3
ml.dmlc xgboost4j-spark_2.12 1.4.1
ml.dmlc xgboost4j_2.12 1.4.1
org.graphframes graphframes_2.12 0.8.1-db6-spark3.2
org.mlflow mlflow-client 1.20.2
org.mlflow mlflow-spark 1.20.2
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0

GPU kümeleri

Grup Kimliği Yapıt Kimliği Sürüm
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 0.17.0-4882dc3
ml.dmlc xgboost4j-gpu_2.12 1.4.1
ml.dmlc xgboost4j-spark-gpu_2.12 1.4.1
org.graphframes graphframes_2.12 0.8.1-db6-spark3.2
org.mlflow mlflow-client 1.20.2
org.mlflow mlflow-spark 1.20.2
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0