Databricks Runtime 5.4 for ML (EoS)
Feljegyzés
A Databricks Runtime-verzió támogatása véget ért. A támogatás megszűnésének dátumáról lásd a támogatási előzményeket. Az összes támogatott Databricks Runtime-verziót lásd : Databricks Runtime release notes versions and compatibility.
A Databricks 2019 júniusában adta ki ezt a verziót.
A Databricks Runtime 5.4 for Machine Learning egy használatra kész környezetet biztosít a gépi tanuláshoz és az adatelemzéshez a Databricks Runtime 5.4 (EoS) alapján. A Databricks Runtime ML számos népszerű gépi tanulási kódtárat tartalmaz, köztük a TensorFlow- és PyTorch-, Keras- és XGBoost-kódtárakat. Emellett támogatja az elosztott mélytanulási képzést a Horovod használatával.
További információkért, beleértve a Databricks Runtime ML-fürt létrehozásának utasításait, tekintse meg a Databricks AI-jét és gépi tanulását.
Új funkciók
A Databricks Runtime 5.4 ML a Databricks Runtime 5.4-es verziójára épül. A Databricks Runtime 5.4 újdonságairól a Databricks Runtime 5.4 (EoS) kibocsátási megjegyzéseiben olvashat.
A könyvtárfrissítések mellett a Databricks Runtime 5.4 ML a következő új funkciókat mutatja be:
Elosztott Hyperopt + automatizált MLflow-nyomkövetés
A Databricks Runtime 5.4 ML az Apache Spark által üzemeltetett Hyperopt új implementációját mutatja be a hiperparaméter-finomhangolás skálázása és egyszerűsítése érdekében. Egy új Trials
osztály SparkTrials
implementálva van a Hyperopt-próbafuttatások több gép és csomópont közötti elosztásához az Apache Spark használatával. Emellett a hangolási kísérletek, valamint a finomhangolt hiperparaméterek és a célzott metrikák automatikusan naplózva lesznek az MLflow-futtatásokba. Lásd: Hyperopt hiperparaméter-hangolás párhuzamosítása.
Fontos
Ez a funkció a nyilvános előzetes verzióban érhető el.
Apache Spark MLlib + automatizált MLflow-nyomkövetés
A Databricks Runtime 5.4 ML támogatja az MLflow-futtatások automatikus naplózását a PySpark-finomhangolási algoritmusokkal CrossValidator
és TrainValidationSplit
. Lásd: Apache Spark MLlib és automatizált MLflow-nyomkövetés. Ez a funkció alapértelmezés szerint be van kapcsolva a Databricks Runtime 5.4 ML-ben, de alapértelmezés szerint ki volt kapcsolva a Databricks Runtime 5.3 ML-ben.
Fontos
Ez a funkció a nyilvános előzetes verzióban érhető el.
A HorovodRunner fejlesztése
A Horovodból a Spark-illesztőcsomópontra küldött kimenet mostantól látható a jegyzetfüzetcellákban.
XGBoost Python-csomagfrissítés
Az XGBoost Python 0.80 csomag telepítve van.
Rendszerkörnyezet
A Databricks Runtime 5.4 ML rendszerkörnyezete az alábbiak szerint különbözik a Databricks Runtime 5.4-től:
- Python: 2.7.15 Python 2-fürtökhöz és 3.6.5 Python 3-fürtökhöz.
- DBUtils: A Databricks Runtime 5.4 ML nem tartalmaz Könyvtár segédprogramot (dbutils.library) (örökölt).
- GPU-fürtök esetén a következő NVIDIA GPU-kódtárak:
- Tesla driver 396.44
- CUDA 9.2
- CUDNN 7.2.1
Könyvtárak
Az alábbi szakaszok a Databricks Runtime 5.4 ML-ben található kódtárakat sorolják fel, amelyek eltérnek a Databricks Runtime 5.4-ben szereplő kódtáraktól.
Felső szintű kódtárak
A Databricks Runtime 5.4 ML a következő felső szintű kódtárakat tartalmazza:
Python-kódtárak
A Databricks Runtime 5.4 ML a Condát használja a Python-csomagkezeléshez. Ennek eredményeképpen a telepített Python-kódtárakban jelentős különbségek vannak a Databricks Runtime-hoz képest. Az alábbiakban a Conda csomagkezelővel telepített Python-csomagok és -verziók teljes listája látható.
Könyvtár | Verzió | Könyvtár | Verzió | Könyvtár | Verzió |
---|---|---|---|---|---|
absl-py | 0.7.1 | argparse | 1.4.0 | asn1crypto | 0.24.0 |
Astor | 0.7.1 | backports-abc | 0,5 | backports.functools-lru-cache | 1,5 |
backports.weakref | 1.0.post1 | bcrypt | 3.1.6 | fehérítő | 2.1.3 |
boto | 2.48.0 | boto3 | 1.7.62 | botocore | 1.10.62 |
minősítés | 2018.04.16 | cffi | 1.11.5 | karakterkészlet | 3.0.4 |
cloudpickle | 0.5.3 | colorama | 0.3.9 | configparser | 3.5.0 |
kriptográfia | 2.2.2 | biciklista | 0.10.0 | Cython | 0.28.2 |
lakberendező | 4.3.0 | docutils | 0,14 | belépési pontok | 0.2.3 |
enum34 | 1.1.6 | et-xmlfile | 1.0.1 | funcsigs | 1.0.2 |
functools32 | 3.2.3-2 | fusepy | 2.0.4 | jövő | 0.17.1 |
határidőügylet | 3.2.0 | Gast | 0.2.2 | grpcio | 1.12.1 |
h5py | 2.8.0 | horovod | 0.16.0 | html5lib | 1.0.1 |
hyperopt | 0.1.2.db4 | idna | 2.6 | ipaddress | 1.0.22 |
ipython | 5.7.0 | ipython_genutils | 0.2.0 | jdcal | 1.4 |
Jinja2 | 2.10 | jmespath | 0.9.4 | jsonschema | 2.6.0 |
jupyter-client | 5.2.3 | jupyter-core | 4.4.0 | Keras | 2.2.4 |
Keras-Applications | 1.0.7 | Keras-Előfeldolgozás | 1.0.9 | kiwisolver | 1.1.0 |
linecache2 | 1.0.0 | llvmlite | 0.23.1 | lxml | 4.2.1 |
Markdown | 3.1.1 | MarkupSafe | 1.0 | matplotlib | 2.2.2 |
mistune | 0.8.3 | mkl-fft | 1.0.0 | mkl-random | 1.0.1 |
mleap | 0.8.1 | ál | 2.0.0 | msgpack | 0.5.6 |
nbconvert | 5.3.1 | nbformat | 4.4.0 | networkx | 2,2 |
orr | 1.3.7 | orr-kizárás | 0.5.0 | numba | 0.38.0+0.g2a2b772fc.dirty |
numpy | 1.14.3 | olefile | 0.45.1 | openpyxl | 2.5.3 |
pandas | 0.23.0 | pandocfilters | 1.4.2 | paramiko | 2.4.1 |
pathlib2 | 2.3.2 | Patsy | 0.5.0 | pbr | 5.1.3 |
pexpect | 4.5.0 | pickleshare | 0.7.4 | Párna | 5.1.0 |
mag | 10.0.1 | réteg | 3.11 | prompt-toolkit | 1.0.15 |
protobuf | 3.7.1 | psutil | 5.6.2 | psycopg2 | 2.7.5 |
ptyprocess | 0.5.2 | pyarrow | 0.12.1 | pyasn1 | 0.4.5 |
pycparser | 2.18 | Pygments | 2.2.0 | pymongo | 3.8.0 |
PyNaCl | 1.3.0 | pyOpenSSL | 18.0.0 | pyparsing | 2.2.0 |
PySocks | 1.6.8 | Python | 2.7.15 | python-dateutil | 2.7.3 |
pytz | 2018.4 | PyYAML | 5,1 | pyzmq | 17.0.0 |
kérelmek | 2.18.4 | s3transfer | 0.1.13 | scandir | 1,7 |
scikit-learn | 0.19.1 | scipy | 1.1.0 | tengeri | 0.8.1 |
setuptools | 39.1.0 | simplegeneric | 0.8.1 | singledispatch | 3.4.0.3 |
Hat | 1.11.0 | statsmodels | 0.9.0 | subprocess32 | 3.5.4 |
tensorboard | 1.12.2 | tensorboardX | 1.6 | tensorflow | 1.12.0 |
termcolor | 1.1.0 | testpath | 0.3.1 | fáklya | 0.4.1 |
torchvision | 0.2.1 | tornádó | 5.0.2 | tqdm | 4.32.1 |
traceback2 | 1.4.0 | árulók | 4.3.2 | unittest2 | 1.1.0 |
urllib3 | 1,22 | virtualenv | 16.0.0 | wcwidth | 0.1.7 |
webencodings | 0.5.1 | Werkzeug | 0.14.1 | kerék | 0.31.1 |
wrapt | 1.10.11 | wsgiref | 0.1.2 |
Emellett a következő Spark-csomagok Python-modulokat is tartalmaznak:
Spark-csomag | Python-modul | Verzió |
---|---|---|
gráfkeretek | gráfkeretek | 0.7.0-db1-spark2.4 |
spark-deep-learning | sparkdl | 1.5.0-db3-spark2.4 |
tensorframes | tensorframes | 0.6.0-s_2.11 |
R-kódtárak
Az R-kódtárak megegyeznek a Databricks Runtime 5.4 R-kódtáraival.
Java- és Scala-kódtárak (Scala 2.11-fürt)
A Databricks Runtime 5.4 Java- és Scala-kódtárai mellett a Databricks Runtime 5.4 ML a következő JAR-eket tartalmazza:
Csoportazonosító | Összetevő azonosítója | Verzió |
---|---|---|
com.databricks | spark-deep-learning | 1.5.0-db3-spark2.4 |
com.typesafe.akka | akka-actor_2.11 | 2.3.11 |
ml.combust.mleap | mleap-databricks-runtime_2.11 | 0.13.0 |
ml.dmlc | xgboost4j | 0.81 |
ml.dmlc | xgboost4j-spark | 0.81 |
org.graphframes | graphframes_2.11 | 0.7.0-db1-spark2.4 |
org.tensorflow | libtensorflow | 1.12.0 |
org.tensorflow | libtensorflow_jni | 1.12.0 |
org.tensorflow | spark-tensorflow-connector_2.11 | 1.12.0 |
org.tensorflow | tensorflow | 1.12.0 |
org.tensorframes | tensorframes | 0.6.0-s_2.11 |