Megosztás a következőn keresztül:


Databricks Runtime 10.3 for ML (EoS)

Feljegyzés

A Databricks Runtime-verzió támogatása véget ért. A támogatás megszűnésének dátumáról lásd a támogatási előzményeket. Az összes támogatott Databricks Runtime-verziót lásd : Databricks Runtime release notes versions and compatibility.

A Databricks Runtime 10.3 for Machine Learning használatra kész környezetet biztosít a gépi tanuláshoz és az adatelemzéshez a Databricks Runtime 10.3 (EoS) alapján. A Databricks Runtime ML számos népszerű gépi tanulási kódtárat tartalmaz, köztük a TensorFlow-t, a PyTorch-ot és az XGBoost-t. A Databricks Runtime ML tartalmazza az AutoML-t, amely a gépi tanulási folyamatok automatikus betanítására szolgáló eszköz. A Databricks Runtime ML támogatja az elosztott mélytanulási képzést a Horovod használatával.

További információkért, beleértve a Databricks Runtime ML-fürt létrehozásának utasításait, tekintse meg a Databricks AI-jét és gépi tanulását.

Új funkciók és fejlesztések

A Databricks Runtime 10.3 ML a Databricks Runtime 10.3-ra épül. A Databricks Runtime 10.3 újdonságairól , beleértve az Apache Spark MLlib és a SparkR újdonságait, tekintse meg a Databricks Runtime 10.3 (EoS) kibocsátási megjegyzéseit.

A Mozaik AutoML fejlesztései

Az alábbi fejlesztések a Mozaik AutoML-ben történtek.

A Mozaik AutoML mostantól támogatja az ARIMA-modellt az előrejelzéshez

A Prophet mellett az AutoML mostantól ARIMA-modelleket hoz létre és értékel ki a problémák előrejelzéséhez.

Oszlopok kizárása az adathalmazból

A Mozaik AutoML API használatakor megadhatja azokat az oszlopokat, amelyeket az AutoML-nek figyelmen kívül kell hagynia a számítások során. Ez csak besorolási és regressziós problémák esetén érhető el. Részletekért tekintse meg a Mozaik AutoML Python API-referenciát .

Algoritmus-keretrendszerek kizárása Mozaik AutoML-futtatásból

Megadhatja az olyan algoritmus-keretrendszereket, mint például a scikit-learn, amelyeket az AutoML nem érdemes figyelembe venni a modellek fejlesztése során. Részletekért tekintse meg a Speciális konfigurációkat és a Mozaik AutoML Python API-referenciáját .

max_trials elavult

A max_trials paraméter elavult, és a következő nagyobb Databricks Runtime ML-kiadásban el lesz távolítva. A Mozaik AutoML-futtatás időtartamának szabályozására használható timeout_minutes . Emellett a Databricks Runtime 10.1 ML és újabb verziókban az AutoML a korai leállást is magában foglalja; leállítja a modellek betanítását és finomhangolását, ha az érvényesítési metrika már nem javul.

A Databricks szolgáltatástároló fejlesztései

Mostantól idősoralapú kereséseket alkalmazhat az idősorok funkciótábláira. Részletekért tekintse meg az idősoros funkciótáblák használatát az időponthoz kötött támogatásban.

Databricks autologging (GA)

A Databricks Autologging mostantól általánosan elérhető a Databricks Runtime 10.3 ML-ben. A Databricks Autologging egy kód nélküli megoldás, amely automatikus kísérletkövetést biztosít az Azure Databricks gépi tanulási betanítási munkameneteihez. A Databricks autologging funkciójával a modellparaméterek, a metrikák, a fájlok és az életút adatai automatikusan rögzítésre kerülnek, amikor modelleket tanít be számos népszerű gépi tanulási kódtárból. A betanítási munkamenetek MLflow-nyomkövetési futtatásokként vannak rögzítve. A modellfájlok is nyomon követhetők, így egyszerűen naplózhatja őket az MLflow modellregisztrációs adatbázisában, és valós idejű pontozás céljából üzembe helyezheti őket az MLflow modellkiszolgálóval.

További információ: Databricks Autologging .

Rendszerkörnyezet

A Databricks Runtime 10.3 ML rendszerkörnyezete az alábbiak szerint különbözik a Databricks Runtime 10.3-tól:

Kódtárak

Az alábbi szakaszok a Databricks Runtime 10.3 ML-ben található kódtárakat sorolják fel, amelyek eltérnek a Databricks Runtime 10.3-ban találhatóaktól.

Ebben a szakaszban:

Felső szintű kódtárak

A Databricks Runtime 10.3 ML a következő felső szintű kódtárakat tartalmazza:

Python-kódtárak

A Databricks Runtime 10.3 ML a Virtualenv-t használja a Python-csomagkezeléshez, és számos népszerű ML-csomagot tartalmaz.

A következő szakaszokban megadott csomagok mellett a Databricks Runtime 10.3 ML a következő csomagokat is tartalmazza:

  • hyperopt 0.2.7.db1
  • sparkdl 2.2.0-db5
  • feature_store 0.3.7
  • automl 1.6.0

Python-kódtárak CPU-fürtökön

Könyvtár Verzió Könyvtár Verzió Könyvtár Verzió
absl-py 0.11.0 Antergos Linux 2015.10 (ISO-rolling) appdirs 1.4.4
argon2-cffi 20.1.0 Astor 0.8.1 astunparse 1.6.3
aszinkron generátor 1.10 attrs 20.3.0 backcall 0.2.0
bcrypt 3.2.0 bidict 0.21.4 fehérítő 3.3.0
blis 0.7.4 boto3 1.16.7 botocore 1.19.7
cachetools 4.2.4 katalógus 2.0.6 minősítés 2020.12.5
cffi 1.14.5 karakterkészlet 4.0.0 kattintás 7.1.2
cloudpickle 1.6.0 cmdstanpy 0.9.68 configparser 5.0.1
konvertálás 2.3.2 kriptográfia 3.4.7 biciklista 0.10.0
cymem 2.0.5 Cython 0.29.23 databricks-automl-runtime 0.2.5
databricks-cli 0.16.2 dbl-tempo 0.1.2 dbus-python 1.2.16
lakberendező 5.0.6 defusedxml 0.7.1 kapor 0.3.2
diskcache 5.2.1 distlib 0.3.4 distro-info 0,23ubuntu1
belépési pontok 0.3 ephem 4.1.3 aspektusok áttekintése 1.0.0
gyorsszöveg 0.9.2 filelock 3.0.12 Flask 1.1.2
flatbuffers 2,0 fsspec 0.9.0 jövő 0.18.2
Gast 0.4.0 gitdb 4.0.7 GitPython 3.1.12
google-hitelesítés 1.22.1 google-auth-oauthlib 0.4.2 google-pasta 0.2.0
grpcio 1.39.0 gunicorn 20.0.4 gviz-api 1.10.0
h5py 3.1.0 hijri-konverter 2.2.2 szünidő 0,12
horovod 0.23.0 htmlmin 0.1.12 huggingface-hub 0.1.2
idna 2.10 ImageHash 4.2.1 kiegyensúlyozatlan tanulás 0.8.1
importlib-metadata 3.10.0 ipykernel 5.3.4 ipython 7.22.0
ipython-genutils 0.2.0 ipywidgets 7.6.3 isodate 0.6.0
itsdangerous 1.1.0 jedi 0.17.2 Jinja2 2.11.3
jmespath 0.10.0 joblib 1.0.1 joblibspark 0.3.0
jsonschema 3.2.0 jupyter-client 6.1.12 jupyter-core 4.7.1
jupyterlab-pygments 0.1.2 jupyterlab-widgetek 1.0.0 keras 2.7.0
Keras-Előfeldolgozás 1.1.2 kiwisolver 1.3.1 Koalák 1.8.2
koreai-holdnaptár 0.2.1 langcode-k 3.3.0 libclang 12.0.0
lightgbm 3.3.1 llvmlite 0.38.0 LunarCalendar 0.0.9
Makó 1.1.3 Markdown 3.3.3 MarkupSafe 2.0.1
matplotlib 3.4.2 missingno 0.5.0 mistune 0.8.4
mleap 0.18.1 mlflow-skinny 1.23.0 multimethod 1.6
murmurhash 1.0.5 nbclient 0.5.3 nbconvert 6.0.7
nbformat 5.1.3 nest-asyncio 1.5.1 networkx 2,5
nltk 3.6.1 jegyzetfüzet 6.3.0 numba 0.55.0
numpy 1.20.1 oauthlib 3.1.0 opt-einsum 3.3.0
csomagolás 21,3 pandas 1.2.4 pandas-profilkészítés 3.1.0
pandocfilters 1.4.3 paramiko 2.7.2 parso 0.7.0
pathy 0.6.0 Patsy 0.5.1 petastorm 0.11.3
pexpect 4.8.0 phik 0.12.0 pickleshare 0.7.5
Párna 8.2.0 mag 21.0.1 ábrázolás 5.5.0
pmdarima 1.8.4 előre meg van nyitható 3.0.5 prometheus-client 0.10.1
prompt-toolkit 3.0.17 próféta 1.0.1 protobuf 3.17.2
psutil 5.8.0 psycopg2 2.8.5 ptyprocess 0.7.0
pyarrow 4.0.0 pyasn1 0.4.8 pyasn1-modules 0.2.8
pybind11 2.9.0 pycparser 2,20 pydantic 1.8.2
Pygments 2.8.1 PyGObject 3.36.0 PyMeeus 0.5.11
PyNaCl 1.4.0 pyodbc 4.0.30 pyparsing 2.4.7
pyrsistent 0.17.3 pystan 2.19.1.1 python-apt 2.0.0+ubuntu0.20.4.6
python-dateutil 2.8.1 python-editor 1.0.4 python-engineio 4.3.0
python-socketio 5.4.1 pytz 2020.5 PyWavelets 1.1.1
PyYAML 5.4.1 pyzmq 20.0.0 regex 2021.4.4
kérelmek 2.25.1 requests-oauthlib 1.3.0 requests-unixsocket 0.2.0
Rsa 4.7.2 s3transfer 0.3.7 sacremoses 0.0.46
scikit-learn 0.24.1 scipy 1.6.2 tengeri 0.11.1
Send2Trash 1.5.0 setuptools 52.0.0 setuptools-git 1,2
shap 0.40.0 simplejson 3.17.2 Hat 1.15.0
uborkaszeletelő 0.0.7 smart-open 5.2.0 smmap 3.0.5
spacy 3.2.1 spacy-legacy 3.0.8 spacy-loggers 1.0.1
spark-tensorflow-distributor 1.0.0 sqlparse 0.4.1 srsly 2.4.1
ssh-import-id 5.10 statsmodels 0.12.2 táblázatos 0.8.7
tangled-up-in-unicode 0.1.0 Kitartás 6.2.0 tensorboard 2.7.0
tensorboard-data-server 0.6.1 tensorboard-plugin-profile 2.5.0 tensorboard-plugin-wit 1.8.1
tensorflow-cpu 2.7.0 tensorflow-estimator 2.7.0 tensorflow-io-gcs-fájlrendszer 0.23.1
termcolor 1.1.0 terminado 0.9.4 testpath 0.4.4
thinc 8.0.12 threadpoolctl 2.1.0 tokenizers 0.10.3
fáklya 1.10.1+cpu torchvision 0.11.2+cpu tornádó 6.1
tqdm 4.59.0 árulók 5.0.5 Transformers 4.15.0
Typer 0.3.2 gépelés-bővítmények 3.7.4.3 ujson 4.0.2
felügyelet nélküli frissítések 0,1 urllib3 1.25.11 virtualenv 20.4.1
Látomások 0.7.4 Wasabi 0.8.2 wcwidth 0.2.5
webencodings 0.5.1 websocket-client 0.57.0 Werkzeug 1.0.1
kerék 0.36.2 widgetsnbextension 3.5.1 wrapt 1.12.1
xgboost 1.5.1 zipp 3.4.1

Python-kódtárak GPU-fürtökön

Könyvtár Verzió Könyvtár Verzió Könyvtár Verzió
absl-py 0.11.0 Antergos Linux 2015.10 (ISO-rolling) appdirs 1.4.4
argon2-cffi 20.1.0 Astor 0.8.1 astunparse 1.6.3
aszinkron generátor 1.10 attrs 20.3.0 backcall 0.2.0
bcrypt 3.2.0 bidict 0.21.4 fehérítő 3.3.0
blis 0.7.4 boto3 1.16.7 botocore 1.19.7
cachetools 4.2.4 katalógus 2.0.6 minősítés 2020.12.5
cffi 1.14.5 karakterkészlet 4.0.0 kattintás 7.1.2
cloudpickle 1.6.0 cmdstanpy 0.9.68 configparser 5.0.1
konvertálás 2.3.2 kriptográfia 3.4.7 biciklista 0.10.0
cymem 2.0.5 Cython 0.29.23 databricks-automl-runtime 0.2.5
databricks-cli 0.16.2 dbl-tempo 0.1.2 dbus-python 1.2.16
lakberendező 5.0.6 defusedxml 0.7.1 kapor 0.3.2
diskcache 5.2.1 distlib 0.3.4 distro-info 0,23ubuntu1
belépési pontok 0.3 ephem 4.1.3 aspektusok áttekintése 1.0.0
gyorsszöveg 0.9.2 filelock 3.0.12 Flask 1.1.2
flatbuffers 2,0 fsspec 0.9.0 jövő 0.18.2
Gast 0.4.0 gitdb 4.0.7 GitPython 3.1.12
google-hitelesítés 1.22.1 google-auth-oauthlib 0.4.2 google-pasta 0.2.0
grpcio 1.39.0 gunicorn 20.0.4 gviz-api 1.10.0
h5py 3.1.0 hijri-konverter 2.2.2 szünidő 0,12
horovod 0.23.0 htmlmin 0.1.12 huggingface-hub 0.1.2
idna 2.10 ImageHash 4.2.1 kiegyensúlyozatlan tanulás 0.8.1
importlib-metadata 3.10.0 ipykernel 5.3.4 ipython 7.22.0
ipython-genutils 0.2.0 ipywidgets 7.6.3 isodate 0.6.0
itsdangerous 1.1.0 jedi 0.17.2 Jinja2 2.11.3
jmespath 0.10.0 joblib 1.0.1 joblibspark 0.3.0
jsonschema 3.2.0 jupyter-client 6.1.12 jupyter-core 4.7.1
jupyterlab-pygments 0.1.2 jupyterlab-widgetek 1.0.0 keras 2.7.0
Keras-Előfeldolgozás 1.1.2 kiwisolver 1.3.1 Koalák 1.8.2
koreai-holdnaptár 0.2.1 langcode-k 3.3.0 libclang 12.0.0
lightgbm 3.3.1 llvmlite 0.38.0 LunarCalendar 0.0.9
Makó 1.1.3 Markdown 3.3.3 MarkupSafe 2.0.1
matplotlib 3.4.2 missingno 0.5.0 mistune 0.8.4
mleap 0.18.1 mlflow-skinny 1.23.0 multimethod 1.6
murmurhash 1.0.5 nbclient 0.5.3 nbconvert 6.0.7
nbformat 5.1.3 nest-asyncio 1.5.1 networkx 2,5
nltk 3.6.1 jegyzetfüzet 6.3.0 numba 0.55.0
numpy 1.20.1 oauthlib 3.1.0 opt-einsum 3.3.0
csomagolás 21,3 pandas 1.2.4 pandas-profilkészítés 3.1.0
pandocfilters 1.4.3 paramiko 2.7.2 parso 0.7.0
pathy 0.6.0 Patsy 0.5.1 petastorm 0.11.3
pexpect 4.8.0 phik 0.12.0 pickleshare 0.7.5
Párna 8.2.0 mag 21.0.1 ábrázolás 5.5.0
pmdarima 1.8.4 előre meg van nyitható 3.0.5 prompt-toolkit 3.0.17
próféta 1.0.1 protobuf 3.17.2 psutil 5.8.0
psycopg2 2.8.5 ptyprocess 0.7.0 pyarrow 4.0.0
pyasn1 0.4.8 pyasn1-modules 0.2.8 pybind11 2.9.0
pycparser 2,20 pydantic 1.8.2 Pygments 2.8.1
PyGObject 3.36.0 PyMeeus 0.5.11 PyNaCl 1.4.0
pyodbc 4.0.30 pyparsing 2.4.7 pyrsistent 0.17.3
pystan 2.19.1.1 python-apt 2.0.0+ubuntu0.20.4.6 python-dateutil 2.8.1
python-editor 1.0.4 python-engineio 4.3.0 python-socketio 5.4.1
pytz 2020.5 PyWavelets 1.1.1 PyYAML 5.4.1
pyzmq 20.0.0 regex 2021.4.4 kérelmek 2.25.1
requests-oauthlib 1.3.0 requests-unixsocket 0.2.0 Rsa 4.7.2
s3transfer 0.3.7 sacremoses 0.0.46 scikit-learn 0.24.1
scipy 1.6.2 tengeri 0.11.1 Send2Trash 1.5.0
setuptools 52.0.0 setuptools-git 1,2 shap 0.40.0
simplejson 3.17.2 Hat 1.15.0 uborkaszeletelő 0.0.7
smart-open 5.2.0 smmap 3.0.5 spacy 3.2.1
spacy-legacy 3.0.8 spacy-loggers 1.0.1 spark-tensorflow-distributor 1.0.0
sqlparse 0.4.1 srsly 2.4.1 ssh-import-id 5.10
statsmodels 0.12.2 táblázatos 0.8.7 tangled-up-in-unicode 0.1.0
Kitartás 6.2.0 tensorboard 2.7.0 tensorboard-data-server 0.6.1
tensorboard-plugin-profile 2.5.0 tensorboard-plugin-wit 1.8.1 tensorflow 2.7.0
tensorflow-estimator 2.7.0 tensorflow-io-gcs-fájlrendszer 0.23.1 termcolor 1.1.0
terminado 0.9.4 testpath 0.4.4 thinc 8.0.12
threadpoolctl 2.1.0 tokenizers 0.10.3 fáklya 1.10.1+cu111
torchvision 0.11.2+cu111 tornádó 6.1 tqdm 4.59.0
árulók 5.0.5 Transformers 4.15.0 Typer 0.3.2
gépelés-bővítmények 3.7.4.3 ujson 4.0.2 felügyelet nélküli frissítések 0,1
urllib3 1.25.11 virtualenv 20.4.1 Látomások 0.7.4
Wasabi 0.8.2 wcwidth 0.2.5 webencodings 0.5.1
websocket-client 0.57.0 Werkzeug 1.0.1 kerék 0.36.2
widgetsnbextension 3.5.1 wrapt 1.12.1 xgboost 1.5.1
zipp 3.4.1

Python-modulokat tartalmazó Spark-csomagok

Spark-csomag Python-modul Verzió
gráfkeretek gráfkeretek 0.8.2-db1-spark3.2

R-kódtárak

Az R-kódtárak megegyeznek a Databricks Runtime 10.3 R-kódtárával .

Java- és Scala-kódtárak (Scala 2.12-fürt)

A Databricks Runtime 10.3 Java- és Scala-kódtárai mellett a Databricks Runtime 10.3 ML a következő JARs-eket tartalmazza:

CPU-fürtök

Csoportazonosító Összetevő azonosítója Verzió
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 0.18.1-23eb1ef
ml.dmlc xgboost4j-spark_2.12 1.5.1
ml.dmlc xgboost4j_2.12 1.5.1
org.graphframes graphframes_2.12 0.8.2-db1-spark3.2
org.mlflow mlflow-client 1.23.0
org.mlflow mlflow-spark 1.23.0
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0

GPU-fürtök

Csoportazonosító Összetevő azonosítója Verzió
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 0.18.1-23eb1ef
ml.dmlc xgboost4j-spark_2.12 1.5.1
ml.dmlc xgboost4j_2.12 1.5.1
org.graphframes graphframes_2.12 0.8.2-db1-spark3.2
org.mlflow mlflow-client 1.23.0
org.mlflow mlflow-spark 1.23.0
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0