Aracılığıyla paylaş


Databricks Runtime 5.2 ML

Databricks bu görüntüyü Ocak 2019'da yayımladı.

Databricks Runtime 5.2 ML, Databricks Runtime 5.2 'yi (desteklenmeyen) temel alan makine öğrenmesi ve veri bilimi için kullanıma hazır bir ortam sağlar. ML için Databricks Runtime TensorFlow, PyTorch, Keras ve XGBoost gibi birçok popüler makine öğrenmesi kitaplığı içerir. Horovod kullanarak dağıtılmış TensorFlow eğitimini de destekler.

Databricks Runtime ML kümesi oluşturma yönergeleri de dahil olmak üzere daha fazla bilgi için bkz . Databricks'te AI ve Machine Learning.

Yeni özellikler

Databricks Runtime 5.2 ML, Databricks Runtime 5.2'nin üzerine kurulmuştur. Databricks Runtime 5.2'deki yenilikler hakkında bilgi için bkz . Databricks Runtime 5.2 (desteklenmeyen) sürüm notları. Databricks Runtime 5.2 ML, kitaplık güncelleştirmelerine ek olarak aşağıdaki yeni özellikleri de sunar:

  • GraphFrames artık Databricks'in performans iyileştirmeleri ile Pregel API'sini (Python) destekliyor.
  • HorovodRunner ekler:
    • Bir GPU kümesinde eğitim işlemleri, çok GPU'lu örnek türlerinin desteğini basitleştirmek için çalışan düğümleri yerine GPU'lara eşlenir. Bu yerleşik destek, özel kod olmadan çok GPU'lu bir makinedeki tüm GPU'lara dağıtmanıza olanak tanır.
    • HorovodRunner.run() şimdi ilk eğitim işleminden döndürülen değeri döndürür.

Not

Databricks Runtime ML sürümleri, temel Databricks Runtime sürümündeki tüm bakım güncelleştirmelerini alır. Tüm bakım güncelleştirmelerinin listesi için bkz . Databricks Runtime için bakım güncelleştirmeleri (arşivlenmiş).

Sistem ortamı

Databricks Runtime 5.2 ML'deki sistem ortamı Databricks Runtime 5.2'den aşağıdaki gibi farklıdır:

  • Python: Python 2 kümeleri için 2.7.15 ve Python 3 kümeleri için 3.6.5.
  • DBUtils: Databricks Runtime 5.2 ML, Kitaplık yardımcı programı (dbutils.library) (eski) içermez.
  • GPU kümeleri için aşağıdaki NVIDIA GPU kitaplıkları:
    • Tesla sürücüsü 396.44
    • CUDA 9.2
    • CUDNN 7.2.1

Kitaplık

Aşağıdaki bölümlerde Databricks Runtime 5.2 ML'de bulunan ve Databricks Runtime 5.2'de bulunan kitaplıklardan farklı kitaplıklar listelenmiştir.

Python kitaplıkları

Databricks Runtime 5.2 ML, Python paket yönetimi için Conda kullanır. Sonuç olarak, Databricks Runtime ile karşılaştırıldığında önceden yüklenmiş Python kitaplıklarında önemli farklılıklar vardır. Conda paket yöneticisi kullanılarak yüklenen sağlanan Python paketlerinin ve sürümlerinin tam listesi aşağıda verilmiştir.

Kitaplık Sürüm Kitaplık Sürüm Kitaplık Sürüm
absl-py 0.6.1 argparse 1.4.0 asn1crypto 0.24.0
Astor 0.7.1 backports-abc 0,5 backports.functools-lru-cache 1.5
backports.weakref 1.0.post1 bcrypt 3.1.5 Çamaşır suyu 2.1.3
Boto 2.48.0 boto3 1.7.62 botocore 1.10.62
sertifikalı 2018.04.16 cffi 1.11.5 chardet 3.0.4
cloudpickle 0.5.3 colorama 0.3.9 yapılandırmaparser 3.5.0
Şifreleme 2.2.2 Cycler 0.10.0 Cython 0.28.2
Dekoratör 4.3.0 docutils 0,14 Entrypoints 0.2.3
enum34 1.1.6 et-xmlfile 1.0.1 funcsigs 1.0.2
functools32 3.2.3-2 fusepy 2.0.4 Vadeli 3.2.0
Gast 0.2.0 grpcio 1.12.1 h5py 2.8.0
horovod 0.15.2 html5lib 1.0.1 ıdna 2,6
ıpaddress 1.0.22 ipython 5.7.0 ipython_genutils 0.2.0
jdcal 1.4 Jinja2 2.10 jmespath 0.9.3
jsonschema 2.6.0 jupyter-client 5.2.3 jupyter-core 4.4.0
Keras 2.2.4 Keras Uygulamaları 1.0.6 Keras-Preprocessing 1.0.5
kiwisolver 1.0.1 linecache2 1.0.0 llvmlite 0.23.1
lxml 4.2.1 Markdown 3.0.1 İşaretlemeyi Kasa 1.0
matplotlib 2.2.2 yanlış 0.8.3 mleap 0.8.1
Sahte 2.0.0 msgpack 0.5.6 nbconvert 5.3.1
nbformat 4.4.0 Burun 1.3.7 burun dışlama 0.5.0
numba 0.38.0+0.g2a2b772fc.dirty numpy 1.14.3 olefile 0.45.1
openpyxl 2.5.3 pandas 0.23.0 pandocfilters 1.4.2
paramiko 2.4.1 pathlib2 2.3.2 Patsy 0.5.0
pbr 5.1.1 pexpect 4.5.0 pickleshare 0.7.4
Yastık 5.1.0 Pip 10.0.1 Kat 3.11
prompt-toolkit 1.0.15 protobuf 3.6.1 psycopg2 2.7.5
ptyprocess 0.5.2 serçe 0.8.0 pyasn1 0.4.4
pycparser 2.18 Pygments 2.2.0 PyNaCl 1.3.0
pyOpenSSL 18.0.0 pyparsing 2.2.0 PySocks 1.6.8
Python 2.7.15 python-dateutil 2.7.3 pytz 2018.4
PyYAML 3.12 pyzmq 17.0.0 istekler 2.18.4
s3transfer 0.1.13 scandir 1.7 scikit-learn 0.19.1
scipy 1.1.0 Sinan 0.8.1 kurulum araçları 39.1.0
simplegeneric 0.8.1 singledispatch 3.4.0.3 Altı 1.11.0
statsmodeller 0.9.0 altişlem32 3.5.3 tensorboard 1.12.2
tensorboardX 1.4 tensorflow 1.12.0 termcolor 1.1.0
test yolu 0.3.1 Meşale 0.4.1 torchvision 0.2.1
Kasırga 5.0.2 traceback2 1.4.0 traitlets 4.3.2
unittest2 1.1.0 urllib3 1.22 virtualenv 16.0.0
wcwidth 0.1.7 webencodings 0.5.1 Werkzeug 0.14.1
Tekerlek 0.31.1 kaydırma 1.10.11 wsgiref 0.1.2

Ayrıca, aşağıdaki Spark paketleri Python modüllerini içerir:

Spark Paketi Python Modülü Sürüm
graf çerçeveleri graf çerçeveleri 0.7.0-db1-spark2.4
spark-deep-learning sparkdl 1.5.0-db1-spark2.4
tensorframes tensorframes 0.6.0-s_2.11

R kitaplıkları

R kitaplıkları, Databricks Runtime 5.2'deki R Kitaplıklarıyla aynıdır.

Java ve Scala kitaplıkları (Scala 2.11 kümesi)

Databricks Runtime 5.2'deki Java ve Scala kitaplıklarına ek olarak, Databricks Runtime 5.2 ML aşağıdaki JAR'leri içerir:

Grup Kimliği Yapıt Kimliği Sürüm
com.databricks spark-deep-learning 1.5.0-db1-spark2.4
com.typesafe.akka akka-actor_2.11 2.3.11
ml.combust.mleap mleap-databricks-runtime_2.11 0.13.0
ml.dmlc xgboost4j 0,81
ml.dmlc xgboost4j-spark 0,81
org.graphframes graphframes_2.11 0.7.0-db1-spark2.4
org.tensorflow libtensorflow 1.12.0
org.tensorflow libtensorflow_jni 1.12.0
org.tensorflow spark-tensorflow-connector_2.11 1.12.0
org.tensorflow tensorflow 1.12.0
org.tensorframes tensorframes 0.6.0-s_2.11