Megosztás a következőn keresztül:


Databricks Runtime 5.3 ML (EoS)

Feljegyzés

A Databricks Runtime-verzió támogatása véget ért. A támogatás megszűnésének dátumáról lásd a támogatási előzményeket. Az összes támogatott Databricks Runtime-verziót lásd : Databricks Runtime release notes versions and compatibility.

A Databricks 2019 áprilisában adta ki ezt a verziót.

A Databricks Runtime 5.3 ML használatra kész környezetet biztosít a Databricks Runtime 5.3 (EoS) alapú gépi tanuláshoz és adatelemzéshez. Az ML-hez készült Databricks Runtime számos népszerű gépi tanulási kódtárat tartalmaz, köztük a TensorFlow- és PyTorch-, Keras- és XGBoost-kódtárakat. Emellett támogatja az elosztott mélytanulási képzést a Horovod használatával.

További információkért, beleértve a Databricks Runtime ML-fürt létrehozásának utasításait, tekintse meg a Databricks AI-jét és gépi tanulását.

Új funkciók

A Databricks Runtime 5.3 ML a Databricks Runtime 5.3-ra épül. A Databricks Runtime 5.3 újdonságairól a Databricks Runtime 5.3 (EoS) kibocsátási megjegyzéseiben olvashat. A könyvtárfrissítések mellett a Databricks Runtime 5.3 ML a következő új funkciókat mutatja be:

  • MLflow + Apache Spark MLlib integráció: A Databricks Runtime 5.3 ML támogatja az MLflow-futtatások automatikus naplózását a PySpark-finomhangolási algoritmusokkal CrossValidator és TrainValidationSplit.

    Fontos

    A funkció privát előzetes verzióban érhető el. Az engedélyezéssel kapcsolatban forduljon az Azure Databricks értékesítési képviselőjéhez.

  • A következő kódtárakat frissíti a legújabb verzióra:

    • PyArrow 0.8.0-tól 0.12.1-ig: BinaryType a Arrow-alapú átalakítás támogatja, és a PandasUDF-ben is használható.
    • Horovod 0.15.2-től 0.16.0-ra.
    • TensorboardX 1,4 és 1,6 között.

A Databricks ML Model Export API elavult. Az Azure Databricks inkább az MLeap használatát javasolja, amely szélesebb körű lefedettséget biztosít az MLlib-modelltípusokról. További információ az MLeap ML-modellexportálásról.

Feljegyzés

A Databricks Runtime 5.3 emellett egy új, adatbetöltésre, modellellenőrzésre és naplózásra optimalizált FUSE-csatlakoztatást is tartalmaz az egyes feldolgozóktól egy megosztott tárolóhelyre file:/dbfs/ml, amely nagy teljesítményű I/O-t biztosít a mélytanulási számítási feladatokhoz. Lásd: Adatok betöltése gépi tanuláshoz és mély tanuláshoz.

Karbantartási frissítések

Lásd: Databricks Runtime 5.4 ML karbantartási frissítések.

Rendszerkörnyezet

A Databricks Runtime 5.3 ML rendszerkörnyezete az alábbiak szerint különbözik a Databricks Runtime 5.3-tól:

Könyvtárak

Az alábbi szakaszok a Databricks Runtime 5.3 ML-ben található kódtárakat sorolják fel, amelyek eltérnek a Databricks Runtime 5.3-ban szereplő kódtáraktól.

Felső szintű kódtárak

A Databricks Runtime 5.3 ML a következő legfelső szintű kódtárakat tartalmazza:

Python-kódtárak

A Databricks Runtime 5.3 ML a Condát használja a Python-csomagkezeléshez. Ennek eredményeképpen az előre telepített Python-kódtárakban jelentős különbségek vannak a Databricks Runtime-hoz képest. Az alábbiakban a Conda csomagkezelővel telepített Python-csomagok és -verziók teljes listája látható.

Könyvtár Verzió Könyvtár Verzió Könyvtár Verzió
absl-py 0.7.0 argparse 1.4.0 asn1crypto 0.24.0
Astor 0.7.1 backports-abc 0,5 backports.functools-lru-cache 1,5
backports.weakref 1.0.post1 bcrypt 3.1.6 fehérítő 2.1.3
boto 2.48.0 boto3 1.7.62 botocore 1.10.62
minősítés 2018.04.16 cffi 1.11.5 karakterkészlet 3.0.4
cloudpickle 0.5.3 colorama 0.3.9 configparser 3.5.0
kriptográfia 2.2.2 biciklista 0.10.0 Cython 0.28.2
lakberendező 4.3.0 docutils 0,14 belépési pontok 0.2.3
enum34 1.1.6 et-xmlfile 1.0.1 funcsigs 1.0.2
functools32 3.2.3-2 fusepy 2.0.4 határidőügylet 3.2.0
Gast 0.2.2 grpcio 1.12.1 h5py 2.8.0
horovod 0.16.0 html5lib 1.0.1 idna 2.6
ipaddress 1.0.22 ipython 5.7.0 ipython_genutils 0.2.0
jdcal 1.4 Jinja2 2.10 jmespath 0.9.3
jsonschema 2.6.0 jupyter-client 5.2.3 jupyter-core 4.4.0
Keras 2.2.4 Keras-Applications 1.0.6 Keras-Előfeldolgozás 1.0.5
kiwisolver 1.0.1 linecache2 1.0.0 llvmlite 0.23.1
lxml 4.2.1 Markdown 3.0.1 MarkupSafe 1.0
matplotlib 2.2.2 mistune 0.8.3 mleap 0.8.1
ál 2.0.0 msgpack 0.5.6 nbconvert 5.3.1
nbformat 4.4.0 orr 1.3.7 orr-kizárás 0.5.0
numba 0.38.0+0.g2a2b772fc.dirty numpy 1.14.3 olefile 0.45.1
openpyxl 2.5.3 pandas 0.23.0 pandocfilters 1.4.2
paramiko 2.4.1 pathlib2 2.3.2 Patsy 0.5.0
pbr 5.1.1 pexpect 4.5.0 pickleshare 0.7.4
Párna 5.1.0 mag 10.0.1 réteg 3.11
prompt-toolkit 1.0.15 protobuf 3.6.1 psutil 5.6.0
psycopg2 2.7.5 ptyprocess 0.5.2 pyarrow 0.12.1
pyasn1 0.4.5 pycparser 2.18 Pygments 2.2.0
PyNaCl 1.3.0 pyOpenSSL 18.0.0 pyparsing 2.2.0
PySocks 1.6.8 Python 2.7.15 python-dateutil 2.7.3
pytz 2018.4 PyYAML 3.12 pyzmq 17.0.0
kérelmek 2.18.4 s3transfer 0.1.13 scandir 1,7
scikit-learn 0.19.1 scipy 1.1.0 tengeri 0.8.1
setuptools 39.1.0 simplegeneric 0.8.1 singledispatch 3.4.0.3
Hat 1.11.0 statsmodels 0.9.0 subprocess32 3.5.3
tensorboard 1.12.2 tensorboardX 1.6 tensorflow 1.12.0
termcolor 1.1.0 testpath 0.3.1 fáklya 0.4.1
torchvision 0.2.1 tornádó 5.0.2 traceback2 1.4.0
árulók 4.3.2 unittest2 1.1.0 urllib3 1,22
virtualenv 16.0.0 wcwidth 0.1.7 webencodings 0.5.1
Werkzeug 0.14.1 kerék 0.31.1 wrapt 1.10.11
wsgiref 0.1.2

Emellett a következő Spark-csomagok Python-modulokat is tartalmaznak:

Spark-csomag Python-modul Verzió
gráfkeretek gráfkeretek 0.7.0-db1-spark2.4
spark-deep-learning sparkdl 1.5.0-db1-spark2.4
tensorframes tensorframes 0.6.0-s_2.11

R-kódtárak

Az R-kódtárak megegyeznek a Databricks Runtime 5.3 R-kódtáraival.

Java- és Scala-kódtárak (Scala 2.11-fürt)

A Databricks Runtime 5.3 Java- és Scala-kódtárai mellett a Databricks Runtime 5.3 ML a következő JAR-eket tartalmazza:

Csoportazonosító Összetevő azonosítója Verzió
com.databricks spark-deep-learning 1.5.0-db1-spark2.4
com.typesafe.akka akka-actor_2.11 2.3.11
ml.combust.mleap mleap-databricks-runtime_2.11 0.13.0
ml.dmlc xgboost4j 0.81
ml.dmlc xgboost4j-spark 0.81
org.graphframes graphframes_2.11 0.7.0-db1-spark2.4
org.tensorflow libtensorflow 1.12.0
org.tensorflow libtensorflow_jni 1.12.0
org.tensorflow spark-tensorflow-connector_2.11 1.12.0
org.tensorflow tensorflow 1.12.0
org.tensorframes tensorframes 0.6.0-s_2.11