Megosztás a következőn keresztül:


Databricks Runtime 5.4 for ML (EoS)

Feljegyzés

A Databricks Runtime-verzió támogatása véget ért. A támogatás megszűnésének dátumáról lásd a támogatási előzményeket. Az összes támogatott Databricks Runtime-verziót lásd : Databricks Runtime release notes versions and compatibility.

A Databricks 2019 júniusában adta ki ezt a verziót.

A Databricks Runtime 5.4 for Machine Learning egy használatra kész környezetet biztosít a gépi tanuláshoz és az adatelemzéshez a Databricks Runtime 5.4 (EoS) alapján. A Databricks Runtime ML számos népszerű gépi tanulási kódtárat tartalmaz, köztük a TensorFlow- és PyTorch-, Keras- és XGBoost-kódtárakat. Emellett támogatja az elosztott mélytanulási képzést a Horovod használatával.

További információkért, beleértve a Databricks Runtime ML-fürt létrehozásának utasításait, tekintse meg a Databricks AI-jét és gépi tanulását.

Új funkciók

A Databricks Runtime 5.4 ML a Databricks Runtime 5.4-es verziójára épül. A Databricks Runtime 5.4 újdonságairól a Databricks Runtime 5.4 (EoS) kibocsátási megjegyzéseiben olvashat.

A könyvtárfrissítések mellett a Databricks Runtime 5.4 ML a következő új funkciókat mutatja be:

Elosztott Hyperopt + automatizált MLflow-nyomkövetés

A Databricks Runtime 5.4 ML az Apache Spark által üzemeltetett Hyperopt új implementációját mutatja be a hiperparaméter-finomhangolás skálázása és egyszerűsítése érdekében. Egy új Trials osztály SparkTrials implementálva van a Hyperopt-próbafuttatások több gép és csomópont közötti elosztásához az Apache Spark használatával. Emellett a hangolási kísérletek, valamint a finomhangolt hiperparaméterek és a célzott metrikák automatikusan naplózva lesznek az MLflow-futtatásokba. Lásd: Hyperopt hiperparaméter-hangolás párhuzamosítása.

Fontos

Ez a funkció a nyilvános előzetes verzióban érhető el.

Apache Spark MLlib + automatizált MLflow-nyomkövetés

A Databricks Runtime 5.4 ML támogatja az MLflow-futtatások automatikus naplózását a PySpark-finomhangolási algoritmusokkal CrossValidator és TrainValidationSplit. Lásd: Apache Spark MLlib és automatizált MLflow-nyomkövetés. Ez a funkció alapértelmezés szerint be van kapcsolva a Databricks Runtime 5.4 ML-ben, de alapértelmezés szerint ki volt kapcsolva a Databricks Runtime 5.3 ML-ben.

Fontos

Ez a funkció a nyilvános előzetes verzióban érhető el.

A HorovodRunner fejlesztése

A Horovodból a Spark-illesztőcsomópontra küldött kimenet mostantól látható a jegyzetfüzetcellákban.

XGBoost Python-csomagfrissítés

Az XGBoost Python 0.80 csomag telepítve van.

Rendszerkörnyezet

A Databricks Runtime 5.4 ML rendszerkörnyezete az alábbiak szerint különbözik a Databricks Runtime 5.4-től:

Könyvtárak

Az alábbi szakaszok a Databricks Runtime 5.4 ML-ben található kódtárakat sorolják fel, amelyek eltérnek a Databricks Runtime 5.4-ben szereplő kódtáraktól.

Felső szintű kódtárak

A Databricks Runtime 5.4 ML a következő felső szintű kódtárakat tartalmazza:

Python-kódtárak

A Databricks Runtime 5.4 ML a Condát használja a Python-csomagkezeléshez. Ennek eredményeképpen a telepített Python-kódtárakban jelentős különbségek vannak a Databricks Runtime-hoz képest. Az alábbiakban a Conda csomagkezelővel telepített Python-csomagok és -verziók teljes listája látható.

Könyvtár Verzió Könyvtár Verzió Könyvtár Verzió
absl-py 0.7.1 argparse 1.4.0 asn1crypto 0.24.0
Astor 0.7.1 backports-abc 0,5 backports.functools-lru-cache 1,5
backports.weakref 1.0.post1 bcrypt 3.1.6 fehérítő 2.1.3
boto 2.48.0 boto3 1.7.62 botocore 1.10.62
minősítés 2018.04.16 cffi 1.11.5 karakterkészlet 3.0.4
cloudpickle 0.5.3 colorama 0.3.9 configparser 3.5.0
kriptográfia 2.2.2 biciklista 0.10.0 Cython 0.28.2
lakberendező 4.3.0 docutils 0,14 belépési pontok 0.2.3
enum34 1.1.6 et-xmlfile 1.0.1 funcsigs 1.0.2
functools32 3.2.3-2 fusepy 2.0.4 jövő 0.17.1
határidőügylet 3.2.0 Gast 0.2.2 grpcio 1.12.1
h5py 2.8.0 horovod 0.16.0 html5lib 1.0.1
hyperopt 0.1.2.db4 idna 2.6 ipaddress 1.0.22
ipython 5.7.0 ipython_genutils 0.2.0 jdcal 1.4
Jinja2 2.10 jmespath 0.9.4 jsonschema 2.6.0
jupyter-client 5.2.3 jupyter-core 4.4.0 Keras 2.2.4
Keras-Applications 1.0.7 Keras-Előfeldolgozás 1.0.9 kiwisolver 1.1.0
linecache2 1.0.0 llvmlite 0.23.1 lxml 4.2.1
Markdown 3.1.1 MarkupSafe 1.0 matplotlib 2.2.2
mistune 0.8.3 mkl-fft 1.0.0 mkl-random 1.0.1
mleap 0.8.1 ál 2.0.0 msgpack 0.5.6
nbconvert 5.3.1 nbformat 4.4.0 networkx 2,2
orr 1.3.7 orr-kizárás 0.5.0 numba 0.38.0+0.g2a2b772fc.dirty
numpy 1.14.3 olefile 0.45.1 openpyxl 2.5.3
pandas 0.23.0 pandocfilters 1.4.2 paramiko 2.4.1
pathlib2 2.3.2 Patsy 0.5.0 pbr 5.1.3
pexpect 4.5.0 pickleshare 0.7.4 Párna 5.1.0
mag 10.0.1 réteg 3.11 prompt-toolkit 1.0.15
protobuf 3.7.1 psutil 5.6.2 psycopg2 2.7.5
ptyprocess 0.5.2 pyarrow 0.12.1 pyasn1 0.4.5
pycparser 2.18 Pygments 2.2.0 pymongo 3.8.0
PyNaCl 1.3.0 pyOpenSSL 18.0.0 pyparsing 2.2.0
PySocks 1.6.8 Python 2.7.15 python-dateutil 2.7.3
pytz 2018.4 PyYAML 5,1 pyzmq 17.0.0
kérelmek 2.18.4 s3transfer 0.1.13 scandir 1,7
scikit-learn 0.19.1 scipy 1.1.0 tengeri 0.8.1
setuptools 39.1.0 simplegeneric 0.8.1 singledispatch 3.4.0.3
Hat 1.11.0 statsmodels 0.9.0 subprocess32 3.5.4
tensorboard 1.12.2 tensorboardX 1.6 tensorflow 1.12.0
termcolor 1.1.0 testpath 0.3.1 fáklya 0.4.1
torchvision 0.2.1 tornádó 5.0.2 tqdm 4.32.1
traceback2 1.4.0 árulók 4.3.2 unittest2 1.1.0
urllib3 1,22 virtualenv 16.0.0 wcwidth 0.1.7
webencodings 0.5.1 Werkzeug 0.14.1 kerék 0.31.1
wrapt 1.10.11 wsgiref 0.1.2

Emellett a következő Spark-csomagok Python-modulokat is tartalmaznak:

Spark-csomag Python-modul Verzió
gráfkeretek gráfkeretek 0.7.0-db1-spark2.4
spark-deep-learning sparkdl 1.5.0-db3-spark2.4
tensorframes tensorframes 0.6.0-s_2.11

R-kódtárak

Az R-kódtárak megegyeznek a Databricks Runtime 5.4 R-kódtáraival.

Java- és Scala-kódtárak (Scala 2.11-fürt)

A Databricks Runtime 5.4 Java- és Scala-kódtárai mellett a Databricks Runtime 5.4 ML a következő JAR-eket tartalmazza:

Csoportazonosító Összetevő azonosítója Verzió
com.databricks spark-deep-learning 1.5.0-db3-spark2.4
com.typesafe.akka akka-actor_2.11 2.3.11
ml.combust.mleap mleap-databricks-runtime_2.11 0.13.0
ml.dmlc xgboost4j 0.81
ml.dmlc xgboost4j-spark 0.81
org.graphframes graphframes_2.11 0.7.0-db1-spark2.4
org.tensorflow libtensorflow 1.12.0
org.tensorflow libtensorflow_jni 1.12.0
org.tensorflow spark-tensorflow-connector_2.11 1.12.0
org.tensorflow tensorflow 1.12.0
org.tensorframes tensorframes 0.6.0-s_2.11