Databricks Runtime 11.3 LTS gépi tanuláshoz
A Databricks Runtime 11.3 LTS for Machine Learning használatra kész környezetet biztosít a Databricks Runtime 11.3 LTS-en alapuló gépi tanuláshoz és adatelemzéshez. A Databricks Runtime ML számos népszerű gépi tanulási kódtárat tartalmaz, köztük a TensorFlow-t, a PyTorch-ot és az XGBoost-t. A Databricks Runtime ML tartalmazza az AutoML-t, amely a gépi tanulási folyamatok automatikus betanítására szolgáló eszköz. A Databricks Runtime ML támogatja az elosztott mélytanulási képzést a Horovod használatával.
Feljegyzés
Az LTS azt jelenti, hogy ez a verzió hosszú távú támogatás alatt áll. Lásd: Databricks Runtime LTS-verzió életciklusa.
További információkért, beleértve a Databricks Runtime ML-fürt létrehozásának utasításait, tekintse meg a Databricks AI-jét és gépi tanulását.
Tipp.
A támogatás megszűnését (EoS) elérő Databricks Runtime-verziók kibocsátási megjegyzéseit a databricks runtime kiadási megjegyzéseiben találhatja meg. Az EoS Databricks Runtime-verziók ki lettek állítva, és előfordulhat, hogy nem frissülnek.
Új funkciók és fejlesztések
A Databricks Runtime 11.3 LTS ML a Databricks Runtime 11.3 LTS-en alapul. A Databricks Runtime 11.3 LTS újdonságairól, beleértve az Apache Spark MLlib-et és a SparkR-t, tekintse meg a Databricks Runtime 11.3 LTS kibocsátási megjegyzéseit.
A Mozaik AutoML fejlesztései
A Mozaik AutoML mostantól támogatja a meglévő Funkciótár funkciótáblák használatát az AutoML-kísérletekben. További részletekért lásd a Feature Store integrációját.
Az AutoML által létrehozott próbaverziós jegyzetfüzetek mostantól kódrészleteket tartalmaznak, amelyek lehetővé teszik a felhasználók számára a hiperparaméterek hangolásának újrafuttatását.
Az AutoML mostantól támogatja a DecimalType
funkciókat.
Hibajavítások
A Databricks Runtime 11.3 LTS ML a .sparkdl.xgboost
A korábbi verziók sparkdl.xgboost
a jelen kiadásban kijavított hibákat tartalmaznak, ezért a Databricks azt javasolja, hogy a könyvtár felhasználói frissítsenek a Databricks Runtime 11.3 LTS ML-re.
Felkészülés a jövőbeli kiadásokra
A Databricks Runtime ML közelgő kiadása az 1.0-s verziót tartalmazza sklearn
. A módosítás előkészítéséről a sklearn
dokumentációban tájékozódhat.
A Databricks Runtime ML két openblas
csomagot tartalmaz. A /opt/OpenBLAS
csomag elavult a Databricks Runtime 11.3 LTS ML-ben, és egy hamarosan megjelenő kiadásban el lesz távolítva.
Rendszerkörnyezet
A Databricks Runtime 11.3 LTS ML rendszerkörnyezete eltér a Databricks Runtime 11.3 LTS-től az alábbiak szerint:
- DBUtils: A Databricks Runtime ML nem tartalmazza a Library segédprogramot (dbutils.library) (örökölt).
Használjon
%pip
inkább parancsokat. Lásd: Jegyzetfüzet-hatókörön belüli Python-kódtárak. - GPU-fürtök esetén a Databricks Runtime ML a következő NVIDIA GPU-kódtárakat tartalmazza:
- CUDA 11.3
- cuDNN 8.0.5.39
- NCCL 2.9.9
- TensorRT 7.2.2
A Databricks Runtime 11.3 LTS ML tartalmazza az XGBoost 1.6.1-et, amely nem támogatja az 5.2-es és újabb számítási képességgel rendelkező GPU-fürtöket.
Kódtárak
Az alábbi szakaszok a Databricks Runtime 11.3 LTS ML-ben található kódtárakat sorolják fel, amelyek eltérnek a Databricks Runtime 11.3 LTS-ben található kódtáraktól.
Ebben a szakaszban:
Felső szintű kódtárak
A Databricks Runtime 11.3 LTS ML a következő legfelső szintű kódtárakat tartalmazza:
- GraphFrames
- Horovod és HorovodRunner
- MLflow
- PyTorch
- spark-tensorflow-connector
- TensorFlow
- TensorBoard
- Scikit-learn
Python-kódtárak
A Databricks Runtime 11.3 LTS ML a Virtualenv-t használja a Python-csomagkezeléshez, és számos népszerű ML-csomagot tartalmaz.
A következő szakaszokban megadott csomagok mellett a Databricks Runtime 11.3 LTS ML a következő csomagokat is tartalmazza:
- hyperopt 0.2.7.db1
- sparkdl 2.3.0-db3
- feature_store 0.7.0
- automl 1.13.2
A Databricks Runtime ML Python-környezet helyi Python virtuális környezetben való reprodukálásához töltse le a requirements-11.3.txt fájlt, és futtassa pip install -r requirements-11.3.txt
. Ez a parancs telepíti a Databricks Runtime ML által használt összes nyílt forráskód kódtárat, de nem telepíti a Databricks által fejlesztett kódtárakat, például databricks-automl
a databricks-feature-store
Databricks elágazásáthyperopt
.
Python-kódtárak CPU-fürtökön
Könyvtár | Verzió | Könyvtár | Verzió | Könyvtár | Verzió |
---|---|---|---|---|---|
absl-py | 1.0.0 | argon2-cffi | 20.1.0 | Astor | 0.8.1 |
astunparse | 1.6.3 | aszinkron generátor | 1.10 | attrs | 21.2.0 |
azure-core | 1.22.1 | azure-cosmos | 4.2.0 | backcall | 0.2.0 |
backports.entry-points-selectable | 1.1.1 | bcrypt | 4.0.0 | fekete | 22.3.0 |
fehérítő | 4.0.0 | blis | 0.7.8 | boto3 | 1.21.18 |
botocore | 1.24.18 | cachetools | 5.2.0 | katalógus | 2.0.8 |
minősítés | 2021.10.8 | cffi | 1.14.6 | karakterkészlet | 4.0.0 |
charset-normalizer | 2.0.4 | kattintás | 8.0.3 | cloudpickle | 2.0.0 |
cmdstanpy | 0.9.68 | édesség | 0.0.1 | configparser | 5.2.0 |
konvertálás | 2.4.0 | kriptográfia | 3.4.8 | biciklista | 0.10.0 |
cymem | 2.0.6 | Cython | 0.29.24 | databricks-automl-runtime | 0.2.11 |
databricks-cli | 0.17.3 | dbl-tempo | 0.1.12 | dbus-python | 1.2.16 |
hibakeresés | 1.4.1 | lakberendező | 5.1.0 | defusedxml | 0.7.1 |
kapor | 0.3.4 | diskcache | 5.4.0 | distlib | 0.3.6 |
belépési pontok | 0.3 | ephem | 4.1.3 | aspektusok áttekintése | 1.0.0 |
gyorsszöveg | 0.9.2 | filelock | 3.3.1 | Flask | 1.1.2 |
flatbuffers | 1.12 | fsspec | 2021.8.1 | jövő | 0.18.2 |
Gast | 0.4.0 | gitdb | 4.0.9 | GitPython | 3.1.27 |
google-hitelesítés | 2.6.0 | google-auth-oauthlib | 0.4.6 | google-pasta | 0.2.0 |
grpcio | 1.44.0 | gunicorn | 20.1.0 | gviz-api | 1.10.0 |
h5py | 3.3.0 | hijri-konverter | 2.2.4 | szünidő | 0,15 |
horovod | 0.25.0 | htmlmin | 0.1.12 | huggingface-hub | 0.9.1 |
idna | 3.2 | ImageHash | 4.3.0 | kiegyensúlyozatlan tanulás | 0.8.1 |
importlib-metadata | 4.8.1 | ipykernel | 6.12.1 | ipython | 7.32.0 |
ipython-genutils | 0.2.0 | ipywidgets | 7.7.0 | isodate | 0.6.1 |
itsdangerous | 2.0.1 | jedi | 0.18.0 | Jinja2 | 2.11.3 |
jmespath | 0.10.0 | joblib | 1.0.1 | joblibspark | 0.5.0 |
jsonschema | 3.2.0 | jupyter-client | 6.1.12 | jupyter-core | 4.8.1 |
jupyterlab-pygments | 0.1.2 | jupyterlab-widgetek | 1.0.0 | keras | 2.9.0 |
Keras-Előfeldolgozás | 1.1.2 | kiwisolver | 1.3.1 | koreai-holdnaptár | 0.3.1 |
langcode-k | 3.3.0 | libclang | 14.0.6 | lightgbm | 3.3.2 |
llvmlite | 0.37.0 | LunarCalendar | 0.0.9 | Makó | 1.2.0 |
Markdown | 3.3.6 | MarkupSafe | 2.0.1 | matplotlib | 3.4.3 |
matplotlib-inline | 0.1.2 | missingno | 0.5.1 | mistune | 0.8.4 |
mleap | 0.20.0 | mlflow-skinny | 1.29.0 | multimethod | 1,9 |
murmurhash | 1.0.8 | mypy-extensions | 0.4.3 | nbclient | 0.5.3 |
nbconvert | 6.1.0 | nbformat | 5.1.3 | nest-asyncio | 1.5.1 |
networkx | 2.6.3 | nltk | 3.6.5 | jegyzetfüzet | 6.4.5 |
numba | 0.54.1 | numpy | 1.20.3 | oauthlib | 3.2.0 |
opt-einsum | 3.3.0 | csomagolás | 21,0 | pandas | 1.3.4 |
pandas-profilkészítés | 3.1.0 | pandocfilters | 1.4.3 | paramiko | 2.9.2 |
parso | 0.8.2 | pathspec | 0.9.0 | pathy | 0.6.2 |
Patsy | 0.5.2 | petastorm | 0.11.4 | pexpect | 4.8.0 |
phik | 0.12.2 | pickleshare | 0.7.5 | Párna | 8.4.0 |
mag | 21.2.4 | platformdirs | 2.5.2 | ábrázolás | 5.9.0 |
pmdarima | 1.8.5 | előre meg van nyitható | 3.0.7 | prometheus-client | 0.11.0 |
prompt-toolkit | 3.0.20 | próféta | 1.0.1 | protobuf | 3.19.4 |
psutil | 5.8.0 | psycopg2 | 2.9.3 | ptyprocess | 0.7.0 |
pyarrow | 7.0.0 | pyasn1 | 0.4.8 | pyasn1-modules | 0.2.8 |
pybind11 | 2.10.0 | pycparser | 2,20 | pydantic | 1.9.2 |
Pygments | 2.10.0 | PyGObject | 3.36.0 | PyJWT | 2.5.0 |
PyMeeus | 0.5.11 | PyNaCl | 1.5.0 | pyodbc | 4.0.31 |
pyparsing | 3.0.4 | pyrsistent | 0.18.0 | pystan | 2.19.1.1 |
python-dateutil | 2.8.2 | python-editor | 1.0.4 | pytz | 2021.3 |
PyWavelets | 1.1.1 | PyYAML | 6,0 | pyzmq | 22.2.1 |
regex | 2021.8.3 | kérelmek | 2.26.0 | requests-oauthlib | 1.3.1 |
requests-unixsocket | 0.2.0 | Rsa | 4.9 | s3transfer | 0.5.2 |
scikit-learn | 0.24.2 | scipy | 1.7.1 | tengeri | 0.11.3 |
Send2Trash | 1.8.0 | setuptools | 58.0.4 | setuptools-git | 1,2 |
shap | 0.41.0 | simplejson | 3.17.6 | Hat | 1.16.0 |
uborkaszeletelő | 0.0.7 | smart-open | 5.2.1 | smmap | 5.0.0 |
spacy | 3.4.1 | spacy-legacy | 3.0.10 | spacy-loggers | 1.0.3 |
spark-tensorflow-distributor | 1.0.0 | sqlparse | 0.4.2 | srsly | 2.4.4 |
ssh-import-id | 5.10 | statsmodels | 0.12.2 | táblázatos | 0.8.9 |
tangled-up-in-unicode | 0.1.0 | Kitartás | 8.0.1 | tensorboard | 2.9.1 |
tensorboard-data-server | 0.6.1 | tensorboard-plugin-profile | 2.8.0 | tensorboard-plugin-wit | 1.8.1 |
tensorflow-cpu | 2.9.1 | tensorflow-estimator | 2.9.0 | tensorflow-io-gcs-fájlrendszer | 0.27.0 |
termcolor | 2.0.1 | terminado | 0.9.4 | testpath | 0.5.0 |
thinc | 8.1.2 | threadpoolctl | 2.2.0 | tokenize-rt | 4.2.1 |
tokenizers | 0.12.1 | tomli | 2.0.1 | fáklya | 1.12.1+cpu |
torchvision | 0.13.1+cpu | tornádó | 6.1 | tqdm | 4.62.3 |
árulók | 5.1.0 | Transformers | 4.21.2 | Typer | 0.4.2 |
gépelés-bővítmények | 3.10.0.2 | ujson | 4.0.2 | felügyelet nélküli frissítések | 0,1 |
urllib3 | 1.26.7 | virtualenv | 20.8.0 | Látomások | 0.7.4 |
Wasabi | 0.10.1 | wcwidth | 0.2.5 | webencodings | 0.5.1 |
websocket-client | 1.3.1 | Werkzeug | 2.0.2 | kerék | 0.37.0 |
widgetsnbextension | 3.6.0 | wrapt | 1.12.1 | xgboost | 1.6.2 |
zipp | 3.6.0 |
Python-kódtárak GPU-fürtökön
Könyvtár | Verzió | Könyvtár | Verzió | Könyvtár | Verzió |
---|---|---|---|---|---|
absl-py | 1.0.0 | argon2-cffi | 20.1.0 | Astor | 0.8.1 |
astunparse | 1.6.3 | aszinkron generátor | 1.10 | attrs | 21.2.0 |
azure-core | 1.22.1 | azure-cosmos | 4.2.0 | backcall | 0.2.0 |
backports.entry-points-selectable | 1.1.1 | bcrypt | 4.0.0 | fekete | 22.3.0 |
fehérítő | 4.0.0 | blis | 0.7.8 | boto3 | 1.21.18 |
botocore | 1.24.18 | cachetools | 5.2.0 | katalógus | 2.0.8 |
minősítés | 2021.10.8 | cffi | 1.14.6 | karakterkészlet | 4.0.0 |
charset-normalizer | 2.0.4 | kattintás | 8.0.3 | cloudpickle | 2.0.0 |
cmdstanpy | 0.9.68 | édesség | 0.0.1 | configparser | 5.2.0 |
konvertálás | 2.4.0 | kriptográfia | 3.4.8 | biciklista | 0.10.0 |
cymem | 2.0.6 | Cython | 0.29.24 | databricks-automl-runtime | 0.2.11 |
databricks-cli | 0.17.3 | dbl-tempo | 0.1.12 | dbus-python | 1.2.16 |
hibakeresés | 1.4.1 | lakberendező | 5.1.0 | defusedxml | 0.7.1 |
kapor | 0.3.4 | diskcache | 5.4.0 | distlib | 0.3.6 |
belépési pontok | 0.3 | ephem | 4.1.3 | aspektusok áttekintése | 1.0.0 |
gyorsszöveg | 0.9.2 | filelock | 3.3.1 | Flask | 1.1.2 |
flatbuffers | 1.12 | fsspec | 2021.8.1 | jövő | 0.18.2 |
Gast | 0.4.0 | gitdb | 4.0.9 | GitPython | 3.1.27 |
google-hitelesítés | 2.6.0 | google-auth-oauthlib | 0.4.6 | google-pasta | 0.2.0 |
grpcio | 1.44.0 | gunicorn | 20.1.0 | gviz-api | 1.10.0 |
h5py | 3.3.0 | hijri-konverter | 2.2.4 | szünidő | 0,15 |
horovod | 0.25.0 | htmlmin | 0.1.12 | huggingface-hub | 0.9.1 |
idna | 3.2 | ImageHash | 4.3.0 | kiegyensúlyozatlan tanulás | 0.8.1 |
importlib-metadata | 4.8.1 | ipykernel | 6.12.1 | ipython | 7.32.0 |
ipython-genutils | 0.2.0 | ipywidgets | 7.7.0 | isodate | 0.6.1 |
itsdangerous | 2.0.1 | jedi | 0.18.0 | Jinja2 | 2.11.3 |
jmespath | 0.10.0 | joblib | 1.0.1 | joblibspark | 0.5.0 |
jsonschema | 3.2.0 | jupyter-client | 6.1.12 | jupyter-core | 4.8.1 |
jupyterlab-pygments | 0.1.2 | jupyterlab-widgetek | 1.0.0 | keras | 2.9.0 |
Keras-Előfeldolgozás | 1.1.2 | kiwisolver | 1.3.1 | koreai-holdnaptár | 0.3.1 |
langcode-k | 3.3.0 | libclang | 14.0.6 | lightgbm | 3.3.2 |
llvmlite | 0.37.0 | LunarCalendar | 0.0.9 | Makó | 1.2.0 |
Markdown | 3.3.6 | MarkupSafe | 2.0.1 | matplotlib | 3.4.3 |
matplotlib-inline | 0.1.2 | missingno | 0.5.1 | mistune | 0.8.4 |
mleap | 0.20.0 | mlflow-skinny | 1.29.0 | multimethod | 1,9 |
murmurhash | 1.0.8 | mypy-extensions | 0.4.3 | nbclient | 0.5.3 |
nbconvert | 6.1.0 | nbformat | 5.1.3 | nest-asyncio | 1.5.1 |
networkx | 2.6.3 | nltk | 3.6.5 | jegyzetfüzet | 6.4.5 |
numba | 0.54.1 | numpy | 1.20.3 | oauthlib | 3.2.0 |
opt-einsum | 3.3.0 | csomagolás | 21,0 | pandas | 1.3.4 |
pandas-profilkészítés | 3.1.0 | pandocfilters | 1.4.3 | paramiko | 2.9.2 |
parso | 0.8.2 | pathspec | 0.9.0 | pathy | 0.6.2 |
Patsy | 0.5.2 | petastorm | 0.11.4 | pexpect | 4.8.0 |
phik | 0.12.2 | pickleshare | 0.7.5 | Párna | 8.4.0 |
mag | 21.2.4 | platformdirs | 2.5.2 | ábrázolás | 5.9.0 |
pmdarima | 1.8.5 | előre meg van nyitható | 3.0.7 | prompt-toolkit | 3.0.20 |
próféta | 1.0.1 | protobuf | 3.19.4 | psutil | 5.8.0 |
psycopg2 | 2.9.3 | ptyprocess | 0.7.0 | pyarrow | 7.0.0 |
pyasn1 | 0.4.8 | pyasn1-modules | 0.2.8 | pybind11 | 2.10.0 |
pycparser | 2,20 | pydantic | 1.9.2 | Pygments | 2.10.0 |
PyGObject | 3.36.0 | PyJWT | 2.5.0 | PyMeeus | 0.5.11 |
PyNaCl | 1.5.0 | pyodbc | 4.0.31 | pyparsing | 3.0.4 |
pyrsistent | 0.18.0 | pystan | 2.19.1.1 | python-dateutil | 2.8.2 |
python-editor | 1.0.4 | pytz | 2021.3 | PyWavelets | 1.1.1 |
PyYAML | 6,0 | pyzmq | 22.2.1 | regex | 2021.8.3 |
kérelmek | 2.26.0 | requests-oauthlib | 1.3.1 | requests-unixsocket | 0.2.0 |
Rsa | 4.9 | s3transfer | 0.5.2 | scikit-learn | 0.24.2 |
scipy | 1.7.1 | tengeri | 0.11.3 | Send2Trash | 1.8.0 |
setuptools | 58.0.4 | setuptools-git | 1,2 | shap | 0.41.0 |
simplejson | 3.17.6 | Hat | 1.16.0 | uborkaszeletelő | 0.0.7 |
smart-open | 5.2.1 | smmap | 5.0.0 | spacy | 3.4.1 |
spacy-legacy | 3.0.10 | spacy-loggers | 1.0.3 | spark-tensorflow-distributor | 1.0.0 |
sqlparse | 0.4.2 | srsly | 2.4.4 | ssh-import-id | 5.10 |
statsmodels | 0.12.2 | táblázatos | 0.8.9 | tangled-up-in-unicode | 0.1.0 |
Kitartás | 8.0.1 | tensorboard | 2.9.1 | tensorboard-data-server | 0.6.1 |
tensorboard-plugin-profile | 2.8.0 | tensorboard-plugin-wit | 1.8.1 | tensorflow | 2.9.1 |
tensorflow-estimator | 2.9.0 | tensorflow-io-gcs-fájlrendszer | 0.27.0 | termcolor | 2.0.1 |
terminado | 0.9.4 | testpath | 0.5.0 | thinc | 8.1.2 |
threadpoolctl | 2.2.0 | tokenize-rt | 4.2.1 | tokenizers | 0.12.1 |
tomli | 2.0.1 | fáklya | 1.12.1+cu113 | torchvision | 0.13.1+cu113 |
tornádó | 6.1 | tqdm | 4.62.3 | árulók | 5.1.0 |
Transformers | 4.21.2 | Typer | 0.4.2 | gépelés-bővítmények | 3.10.0.2 |
ujson | 4.0.2 | felügyelet nélküli frissítések | 0,1 | urllib3 | 1.26.7 |
virtualenv | 20.8.0 | Látomások | 0.7.4 | Wasabi | 0.10.1 |
wcwidth | 0.2.5 | webencodings | 0.5.1 | websocket-client | 1.3.1 |
Werkzeug | 2.0.2 | kerék | 0.37.0 | widgetsnbextension | 3.6.0 |
wrapt | 1.12.1 | xgboost | 1.6.2 | zipp | 3.6.0 |
R-kódtárak
Az R-kódtárak megegyeznek a Databricks Runtime 11.3 LTS R-kódtárával .
Java- és Scala-kódtárak (Scala 2.12-fürt)
A Databricks Runtime 11.3 LTS Java- és Scala-kódtárak mellett a Databricks Runtime 11.3 LTS ML a következő JAR-eket tartalmazza:
CPU-fürtök
Csoportazonosító | Összetevő azonosítója | Verzió |
---|---|---|
com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
ml.combust.mleap | mleap-databricks-runtime_2.12 | v0.20.0-db1 |
ml.dmlc | xgboost4j-spark_2.12 | 1.6.2 |
ml.dmlc | xgboost4j_2.12 | 1.6.2 |
org.graphframes | graphframes_2.12 | 0.8.2-db1-spark3.2 |
org.mlflow | mlflow-client | 1.29.0 |
org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |
GPU-fürtök
Csoportazonosító | Összetevő azonosítója | Verzió |
---|---|---|
com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
ml.combust.mleap | mleap-databricks-runtime_2.12 | v0.20.0-db1 |
ml.dmlc | xgboost4j-gpu_2.12 | 1.6.2 |
ml.dmlc | xgboost4j-spark-gpu_2.12 | 1.6.2 |
org.graphframes | graphframes_2.12 | 0.8.2-db1-spark3.2 |
org.mlflow | mlflow-client | 1.29.0 |
org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |