Megosztás a következőn keresztül:


Databricks Runtime 5.2 ML

A Databricks 2019 januárjában adta ki ezt a verziót.

A Databricks Runtime 5.2 ML használatra kész környezetet biztosít a Databricks Runtime 5.2 (EoS) alapú gépi tanuláshoz és adatelemzéshez. Az ML-hez készült Databricks Runtime számos népszerű gépi tanulási kódtárat tartalmaz, köztük a TensorFlow- és PyTorch-, Keras- és XGBoost-kódtárakat. Támogatja az elosztott TensorFlow betanítást a Horovod használatával.

További információkért, beleértve a Databricks Runtime ML-fürt létrehozásának utasításait, tekintse meg a Databricks AI-jét és gépi tanulását.

Új funkciók

A Databricks Runtime 5.2 ML a Databricks Runtime 5.2-es verziójára épül. A Databricks Runtime 5.2 újdonságairól a Databricks Runtime 5.2 (EoS) kibocsátási megjegyzéseiben olvashat. A könyvtárfrissítések mellett a Databricks Runtime 5.2 ML a következő új funkciókat mutatja be:

  • A GraphFrames mostantól támogatja a Pregel API-t (Python) a Databricks teljesítményoptimalizálásával.
  • A HorovodRunner a következőt adja hozzá:
    • GPU-fürtökön a betanítási folyamatok gpu-kra vannak leképezve feldolgozó csomópontok helyett a több GPU-példány típusok támogatásának egyszerűsítése érdekében. Ez a beépített támogatás lehetővé teszi, hogy egyéni kód nélkül osztja el az összes GPU-t egy több GPU-s gépen.
    • HorovodRunner.run() most az első betanítási folyamat visszatérési értékét adja vissza.

Feljegyzés

A Databricks Runtime ML-kiadások az alap Databricks Runtime kiadás összes karbantartási frissítését átveszik. Az összes karbantartási frissítés listáját a Databricks Runtime karbantartási frissítései (archiválva) című témakörben találja.

Rendszerkörnyezet

A Databricks Runtime 5.2 ML rendszerkörnyezete az alábbiak szerint különbözik a Databricks Runtime 5.2-től:

Könyvtárak

Az alábbi szakaszok a Databricks Runtime 5.2 ML-ben található kódtárakat sorolják fel, amelyek eltérnek a Databricks Runtime 5.2-ben szereplő kódtáraktól.

Python-kódtárak

A Databricks Runtime 5.2 ML a Condát használja a Python-csomagkezeléshez. Ennek eredményeképpen az előre telepített Python-kódtárakban jelentős különbségek vannak a Databricks Runtime-hoz képest. Az alábbiakban a Conda csomagkezelővel telepített Python-csomagok és -verziók teljes listája látható.

Könyvtár Verzió Könyvtár Verzió Könyvtár Verzió
absl-py 0.6.1 argparse 1.4.0 asn1crypto 0.24.0
Astor 0.7.1 backports-abc 0,5 backports.functools-lru-cache 1,5
backports.weakref 1.0.post1 bcrypt 3.1.5 fehérítő 2.1.3
boto 2.48.0 boto3 1.7.62 botocore 1.10.62
minősítés 2018.04.16 cffi 1.11.5 karakterkészlet 3.0.4
cloudpickle 0.5.3 colorama 0.3.9 configparser 3.5.0
kriptográfia 2.2.2 biciklista 0.10.0 Cython 0.28.2
lakberendező 4.3.0 docutils 0,14 belépési pontok 0.2.3
enum34 1.1.6 et-xmlfile 1.0.1 funcsigs 1.0.2
functools32 3.2.3-2 fusepy 2.0.4 határidőügylet 3.2.0
Gast 0.2.0 grpcio 1.12.1 h5py 2.8.0
horovod 0.15.2 html5lib 1.0.1 idna 2.6
ipaddress 1.0.22 ipython 5.7.0 ipython_genutils 0.2.0
jdcal 1.4 Jinja2 2.10 jmespath 0.9.3
jsonschema 2.6.0 jupyter-client 5.2.3 jupyter-core 4.4.0
Keras 2.2.4 Keras-Applications 1.0.6 Keras-Előfeldolgozás 1.0.5
kiwisolver 1.0.1 linecache2 1.0.0 llvmlite 0.23.1
lxml 4.2.1 Markdown 3.0.1 MarkupSafe 1.0
matplotlib 2.2.2 mistune 0.8.3 mleap 0.8.1
ál 2.0.0 msgpack 0.5.6 nbconvert 5.3.1
nbformat 4.4.0 orr 1.3.7 orr-kizárás 0.5.0
numba 0.38.0+0.g2a2b772fc.dirty numpy 1.14.3 olefile 0.45.1
openpyxl 2.5.3 pandas 0.23.0 pandocfilters 1.4.2
paramiko 2.4.1 pathlib2 2.3.2 Patsy 0.5.0
pbr 5.1.1 pexpect 4.5.0 pickleshare 0.7.4
Párna 5.1.0 mag 10.0.1 réteg 3.11
prompt-toolkit 1.0.15 protobuf 3.6.1 psycopg2 2.7.5
ptyprocess 0.5.2 pyarrow 0.8.0 pyasn1 0.4.4
pycparser 2.18 Pygments 2.2.0 PyNaCl 1.3.0
pyOpenSSL 18.0.0 pyparsing 2.2.0 PySocks 1.6.8
Python 2.7.15 python-dateutil 2.7.3 pytz 2018.4
PyYAML 3.12 pyzmq 17.0.0 kérelmek 2.18.4
s3transfer 0.1.13 scandir 1,7 scikit-learn 0.19.1
scipy 1.1.0 tengeri 0.8.1 setuptools 39.1.0
simplegeneric 0.8.1 singledispatch 3.4.0.3 Hat 1.11.0
statsmodels 0.9.0 subprocess32 3.5.3 tensorboard 1.12.2
tensorboardX 1.4 tensorflow 1.12.0 termcolor 1.1.0
testpath 0.3.1 fáklya 0.4.1 torchvision 0.2.1
tornádó 5.0.2 traceback2 1.4.0 árulók 4.3.2
unittest2 1.1.0 urllib3 1,22 virtualenv 16.0.0
wcwidth 0.1.7 webencodings 0.5.1 Werkzeug 0.14.1
kerék 0.31.1 wrapt 1.10.11 wsgiref 0.1.2

Emellett a következő Spark-csomagok Python-modulokat is tartalmaznak:

Spark-csomag Python-modul Verzió
gráfkeretek gráfkeretek 0.7.0-db1-spark2.4
spark-deep-learning sparkdl 1.5.0-db1-spark2.4
tensorframes tensorframes 0.6.0-s_2.11

R-kódtárak

Az R-kódtárak megegyeznek a Databricks Runtime 5.2 R-kódtáraival.

Java- és Scala-kódtárak (Scala 2.11-fürt)

A Databricks Runtime 5.2 Java- és Scala-kódtárai mellett a Databricks Runtime 5.2 ML a következő JAR-eket tartalmazza:

Csoportazonosító Összetevő azonosítója Verzió
com.databricks spark-deep-learning 1.5.0-db1-spark2.4
com.typesafe.akka akka-actor_2.11 2.3.11
ml.combust.mleap mleap-databricks-runtime_2.11 0.13.0
ml.dmlc xgboost4j 0.81
ml.dmlc xgboost4j-spark 0.81
org.graphframes graphframes_2.11 0.7.0-db1-spark2.4
org.tensorflow libtensorflow 1.12.0
org.tensorflow libtensorflow_jni 1.12.0
org.tensorflow spark-tensorflow-connector_2.11 1.12.0
org.tensorflow tensorflow 1.12.0
org.tensorframes tensorframes 0.6.0-s_2.11