Databricks Runtime 5.0 ML (EoS)
Poznámka:
Podpora této verze Databricks Runtime skončila. Datum ukončení podpory najdete v tématu Historie ukončení podpory. Všechny podporované verze databricks Runtime najdete v poznámkách k verzi Databricks Runtime a kompatibilitu.
Databricks vydala tuto verzi v listopadu 2018.
Databricks Runtime 5.0 ML poskytuje připravené prostředí pro strojové učení a datové vědy. Obsahuje mnoho oblíbených knihoven, včetně TensorFlow, Keras a XGBoost. Podporuje také distribuované trénování TensorFlow pomocí Horovodu.
Další informace, včetně pokynů k vytvoření clusteru Databricks Runtime ML, najdete v tématu AI a strojové učení v Databricks.
Nové funkce
Databricks Runtime 5.0 ML je postaven na Databricks Runtime 5.0. Informace o novinkách v Databricks Runtime 5.0 najdete ve zprávě k vydání verze Databricks Runtime 5.0 (EoS ). Kromě nových funkcí v Databricks Runtime 5.0 zahrnuje Databricks Runtime 5.0 ML následující nové funkce:
- HorovodRunner pro spouštění distribuovaných trénovacích úloh hlubokého učení pomocí Horovodu
- Podpora Conda pro správu balíčků
- Integrace MLeap
- Integrace GraphFrames
Poznámka:
Verze Databricks Runtime ML vyzvednou všechny aktualizace údržby základní verze Databricks Runtime. Seznam všech aktualizací údržby najdete v tématu Aktualizace údržby pro Databricks Runtime (archivováno).
Prostředí systému
Rozdíl v systémovém prostředí v Databricks Runtime 5.0 a v Databricks Runtime 5.0 ML je:
- Python: 2.7.15 pro clustery Python 2 a 3.6.5 pro clustery Python 3.
- Pro clustery GPU následující knihovny NVIDIA GPU:
- Ovladač Tesla 396.44
- CUDA 9.2
- CUDNN 7.2.1
Knihovny
Rozdíly v knihovnách zahrnutých v Databricks Runtime 5.0 a ty, které jsou součástí Databricks Runtime 5.0 ML, jsou uvedeny v této části.
Knihovny Pythonu
Databricks Runtime 5.0 ML používá Ke správě balíčků Pythonu Conda. Následuje úplný seznam poskytnutých balíčků a verzí Pythonu nainstalovaných pomocí Správce balíčků Conda.
Knihovna | Verze | Knihovna | Verze | Knihovna | Verze |
---|---|---|---|---|---|
absl-py | 0.6.1 | argparse | 1.4.0 | asn1crypto | 0.24.0 |
Astor | 0.7.1 | backports-abc | 0.5 | backports.functools-lru-cache | 1.5 |
backports.weakref | 1.0.post1 | šifra | 3.1.4 | bělit | 2.1.3 |
boto | 2.48.0 | boto3 | 1.7.62 | botocore | 1.10.62 |
certifi | 2018.04.16 | cffi | 1.11.5 | chardet | 3.0.4 |
cloudpickle | 0.5.3 | colorama | 0.3.9 | configparser | 3.5.0 |
kryptografie | 2.2.2 | cyklista | 0.10.0 | Cython | 0.28.2 |
dekoratér | 4.3.0 | docutils | 0,14 | vstupní body | 0.2.3 |
enum34 | 1.1.6 | et-xmlfile | 1.0.1 | funcsigs | 1.0.2 |
functools32 | 3.2.3-2 | fusepy | 2.0.4 | budoucnosti | 3.2.0 |
Gast | 0.2.0 | grpcio | 1.12.1 | h5py | 2.8.0 |
horovod | 0.15.0 | html5lib | 1.0.1 | idna | 2.6 |
ipaddress | 1.0.22 | ipython | 5.7.0 | ipython_genutils | 0.2.0 |
jdcal | 1.4 | Jinja2 | 2.10 | jmespath | 0.9.3 |
jsonschema | 2.6.0 | jupyter-client | 5.2.3 | jupyter-core | 4.4.0 |
Keras | 2.2.4 | Keras-Applications | 1.0.6 | Předběžné zpracování Kerasu | 1.0.5 |
verizonsolver | 1.0.1 | linecache2 | 1.0.0 | llvmlite | 0.23.1 |
lxml | 4.2.1 | Markdown | 3.0.1 | MarkupSafe | 1.0 |
matplotlib | 2.2.2 | špatně zamyšlení | 0.8.3 | mleap | 0.8.1 |
zesměšňovat | 2.0.0 | msgpack | 0.5.6 | nbconvert | 5.3.1 |
nbformat | 4.4.0 | nos | 1.3.7 | vyloučení nosu | 0.5.0 |
numba | 0.38.0+0.g2a2b772fc.dirty | numpy | 1.14.3 | olefile | 0.45.1 |
openpyxl | 2.5.3 | pandas | 0.23.0 | pandocfilters | 1.4.2 |
paramiko | 2.4.1 | pathlib2 | 2.3.2 | bábovka | 0.5.0 |
pbr | 5.1.0 | pexpect | 4.5.0 | pickleshare | 0.7.4 |
Polštář | 5.1.0 | jádro | 10.0.1 | dýha | 3.11 |
prompt-toolkit | 1.0.15 | protobuf | 3.6.1 | psycopg2 | 2.7.5 |
ptyprocess | 0.5.2 | pyarrow | 0.8.0 | pyasn1 | 0.4.4 |
pycparser | 2.18 | Pygments | 2.2.0 | PyNaCl | 1.3.0 |
pyOpenSSL | 18.0.0 | pyparsing | 2.2.0 | PySocks | 1.6.8 |
Python | 2.7.15 | python-dateutil | 2.7.3 | pytz | 2018.4 |
PyYAML | 3.12 | pyzmq | 17.0.0 | žádosti | 2.18.4 |
s3transfer | 0.1.13 | scandir | 1,7 | scikit-learn | 0.19.1 |
scipy | 1.1.0 | seaborn | 0.8.1 | setuptools | 39.1.0 |
simplegeneric | 0.8.1 | singledispatch | 3.4.0.3 | Šest | 1.11.0 |
statsmodels | 0.9.0 | podproces32 | 3.5.3 | tensorboard | 1.10.0 |
tensorflow | 1.10.0 | termcolor | 1.1.0 | testpath | 0.3.1 |
tornádo | 5.0.2 | traceback2 | 1.4.0 | vlastnosti | 4.3.2 |
unittest2 | 1.1.0 | urllib3 | 1.22 | virtualenv | 16.0.0 |
wcwidth | 0.1.7 | webencodings | 0.5.1 | Werkzeug | 0.14.1 |
kolo | 0.31.1 | wrapt | 1.10.11 | wsgiref | 0.1.2 |
Kromě toho následující balíčky Sparku zahrnují moduly Pythonu:
Balíček Spark | Modul Pythonu | Verze |
---|---|---|
tensorframes | tensorframes | 0.5.0-s_2.11 |
graphframes | graphframes | 0.6.0-db3-spark2.4 |
spark-deep-learning | Sparkdl | 1.3.0-db2-spark2.4 |
Knihovny jazyka R
Knihovny jazyka R jsou stejné jako knihovny R v Databricks Runtime 5.0.
Knihovny Java a Scala (cluster Scala 2.11)
Kromě knihoven Java a Scala v Databricks Runtime 5.0 obsahuje Databricks Runtime 5.0 ML následující jary:
ID skupiny | ID artefaktu | Verze |
---|---|---|
com.databricks | spark-deep-learning | 1.3.0-db2-spark2.4 |
org.tensorframes | tensorframes | 0.5.0-s_2.11 |
org.graphframes | graphframes_2.11 | 0.6.0-db3-spark2.4 |
org.tensorflow | libtensorflow | 1.10.0 |
org.tensorflow | libtensorflow_jni | 1.10.0 |
org.tensorflow | spark-tensorflow-connector_2.11 | 1.10.0-spark2.4-001 |
org.tensorflow | tensorflow | 1.10.0 |
ml.dmlc | xgboost4j | 0.80 |
ml.dmlc | xgboost4j-spark | 0.80 |
ml.combust.mleap | mleap-databricks-runtime_2.11 | 0.13.0-SNAPSHOT |