Bagikan melalui


Databricks Runtime 12.2 LTS untuk Pembelajaran Mesin

Databricks Runtime 12.2 LTS untuk Pembelajaran Mesin menyediakan lingkungan siap pakai untuk pembelajaran mesin dan ilmu data berdasarkan Databricks Runtime 12.2 LTS. Databricks Runtime ML berisi banyak pustaka pembelajaran mesin populer, termasuk TensorFlow, PyTorch, dan XGBoost. Databricks Runtime ML mencakup AutoML, alat untuk secara otomatis melatih alur pembelajaran mesin. Databricks Runtime ML juga mendukung pelatihan pembelajaran mendalam menggunakan Horovod.

Catatan

LTS berarti versi ini berada di bawah dukungan jangka panjang. Lihat siklus hidup versi LTS Databricks Runtime.

Untuk informasi selengkapnya, termasuk instruksi untuk membuat kluster ML Runtime Databricks, lihat AI dan pembelajaran mesin di Databricks.

Tips

Untuk melihat catatan rilis untuk versi Databricks Runtime yang telah mencapai akhir dukungan (EoS), lihat Catatan rilis akhir dukungan Databricks Runtime. Versi EoS Databricks Runtime telah dihentikan dan mungkin tidak diperbarui.

Fitur dan peningkatan baru

Databricks Runtime 12.2 LTS ML dibangun di atas Databricks Runtime 12.2 LTS. Untuk informasi tentang apa yang baru dalam Databricks Runtime 12.2 LTS, termasuk Apache Spark MLlib dan SparkR, lihat catatan rilis Databricks Runtime 12.2 LTS .

AutoML (Otomatisasi Pembelajaran Mesin)

Anda dapat menggunakan tabel fitur yang ada di Toko Fitur untuk menambah himpunan data input asli untuk permasalahan peramalan AutoML. Untuk informasi lebih lanjut, lihat Integrasi Feature Store AutoML.

Untuk informasi selengkapnya tentang AutoML, lihat Apa itu AutoML?.

Lingkungan sistem

Lingkungan sistem di Databricks Runtime 12.2 LTS ML berbeda dari Databricks Runtime 12.2 LTS sebagai berikut:

Databricks Runtime 12.2 LTS ML mencakup XGBoost 1.7.2, yang tidak mendukung kluster GPU dengan kemampuan komputasi 5.2 ke bawah.

Pustaka

Bagian berikut mencantumkan pustaka yang disertakan dalam Databricks Runtime 12.2 LTS ML yang berbeda dari pustaka yang disertakan dalam Databricks Runtime 12.2 LTS versi standar.

Di bagian ini:

Pustaka tingkat atas

Databricks Runtime 12.2 LTS ML menyertakan pustaka unggulan berikut:

Pustaka Python

Databricks Runtime 12.2 LTS ML menggunakan Virtualenv untuk manajemen paket Python dan mencakup banyak paket ML populer.

Selain paket yang ditentukan di bagian berikut, Databricks Runtime 12.2 LTS ML juga mencakup paket berikut:

  • hyperopt 0.2.7+db3
  • sparkdl 2.3.0-db3
  • automl 1.16.0

Untuk mereproduksi lingkungan Databricks Runtime ML Python di lingkungan virtual Python lokal Anda, unduh file requirements-12.2.txt dan jalankan pip install -r requirements-12.2.txt. Perintah ini menginstal semua pustaka sumber terbuka yang digunakan Databricks Runtime ML, tetapi tidak menginstal pustaka yang dikembangkan oleh Databricks, seperti databricks-automl, , databricks-feature-storeatau fork Databricks dari hyperopt.

Pustaka Python pada kluster CPU

Perpustakaan Versi Perpustakaan Versi Perpustakaan Versi
absl-py 1.0.0 argon2-cffi 21.3.0 Pengikatan Argon2-cffi 21.2.0
Astor 0.8.1 asttoken 2.0.5 astunparse 1.6.3
atribut 21.4.0 azure-core 1.26.3 azure-cosmos 4.2.0
panggilan balik 0.2.0 backports.entry-points-selectable 1.2.0 bcrypt 3.2.0
beautifulsoup4 4.11.1 hitam 22.3.0 pemutih 4.1.0
kebahagiaan 0.7.9 boto3 1.21.32 botocore 1.24.32
cachetools (perangkat untuk caching) 4.2.2 katalog 2.0.8 pengkode kategori (category-encoders) 2.5.1.post0
sertifikat 2021.10.8 cffi 1.15.0 chardet 4.0.0
charset-normalizer 2.0.4 klik 8.0.4 cloudpickle (perpustakaan Python untuk serialisasi objek) 2.0.0
cmdstanpy 1.1.0 konfeksi 0.0.4 configparser 5.2.0
mengonversi tanggal 2.4.0 kriptografi 3.4.8 pengendara sepeda 0.11.0
cymem 2.0.7 Cython 0.29.28 databricks-automl-runtime 0.2.15
databricks-cli 0.17.4 penyimpanan fitur databricks 0.10.0 dbl-tempo 0.1.12
dbus-python 1.2.16 debugpy 1.5.1 dekorator 5.1.1
defusedxml 0.7.1 adas 0.3.4 diskcache 5.4.0
distlib 0.3.6 konversi-docstring-ke-markdown 0.11 titik masuk 0,4
ephem 4.1.4 menjalankan 0.8.3 Ikhtisar Aspek 1.0.0
fastjsonschema 2.16.2 fasttext 0.9.2 filelock 3.6.0
Botol 1.1.2 FlatBuffers 23.1.21 alat pengelola font 4.25.0
fsspec 2022.2.0 masa depan 0.18.2 Gast 0.4.0
gitdb 4.0.10 GitPython 3.1.27 google-auth (autentikasi Google) 1.33.0
google-auth-oauthlib 0.4.6 Google Pasta 0.2.0 grpcio 1.42.0
Gunicorn 20.1.0 gviz-api 1.10.0 h5py 3.6.0
Pengonversi Hijriah 2.2.4 hari libur 0,18 Horovod 0.27.0
htmlmin 0.1.12 huggingface-hub 0.12.0 IDNA 3.3
Hash Gambar 4.3.1 pembelajaran-tidak-seimbang 0.10.1 importlib-metadata 4.11.3
ipykernel 6.15.3 ipython 8.5.0 ipython-genutils 0.2.0
ipywidgets 7.7.2 isodate 0.6.1 itu berbahaya 2.0.1
Jedi 0.18.1 Jinja2 2.11.3 jmespath 0.10.0
joblib 1.1.1 joblibspark 0.5.1 jsonschema 4.4.0
jupyter-client (klien Jupyter) 6.1.12 jupyter_core 4.11.2 jupyterlab-pygments 0.1.2
jupyterlab-widgets 1.0.0 keras 2.11.0 kiwisolver 1.3.2
kalender lunar Korea 0.3.1 kode bahasa 3.3.0 libclang 15.0.6.1
lightgbm 3.3.4 llvmlite 0.38.0 Kalender Lunar 0.0.9
Mako 1.2.0 Markdown 3.3.4 MarkupSafe 2.0.1
matplotlib 3.5.1 matplotlib-inline 0.1.2 Mccabe 0.7.0
penyetelan salah 0.8.4 mleap 0.20.0 mlflow-skinny (versi ringan) 2.1.1
multimetode 1.9.1 Murmur Hash 1.0.9 ekstensi mypy 0.4.3
nbclient 0.5.13 nbconvert 6.4.4 nbformat 5.3.0
nest-asyncio 1.5.5 networkx 2.7.1 nltk 3.7
nodeenv 1.7.0 buku catatan 6.4.8 numba 0.55.1
numpy (perpustakaan Python untuk operasi numerik) 1.21.5 oauthlib 3.2.0 opt-einsum 3.3.0
pengemasan 21.3 Panda 1.4.2 pembuatan profil panda 3.6.2
Pandocfilters 1.5.0 paramiko 2.9.2 pengurai 0.8.3
spesifikasi jalur 0.9.0 keadaan 0.10.1 kambing hitam 0.5.2
Petastorm 0.12.1 pexpect=4.8.0 4.8.0 phik 0.12.3
pickleshare 0.7.5 Bantal 9.0.1 pipa 21.2.4
platformdir 2.6.2 secara plot 5.6.0 pengaya 1.0.0
pmdarima 2.0.2 tanpa informasi tambahan mengenai konteks yang berarti bagi istilah "preshed", mungkin terpikir untuk menggambarkan istilah tersebut sebagai langkah atau proses yang sedang terjadi sebelum sesuatu diselesaikan atau diproses lebih lanjut. 3.0.8 prometheus-client 0.13.1
prompt-toolkit 3.0.20 nabi 1.1.1 protobuf 3.19.4
psutil 5.8.0 psycopg2 2.9.3 ptyprocess 0.7.0
pure-eval 0.2.2 pyarrow 7.0.0 pyasn1 0.4.8
pyasn1-modul 0.2.8 pybind11 2.10.3 pycparser 2.21
pydantic (perpustakaan Python untuk validasi data) 1.10.2 pyflakes 2.5.0 Pygments 2.11.2
PyGObject 3.36.0 PyJWT 2.6.0 PyMeeus 0.5.12
PyNaCl 1.5.0 pyodbc 4.0.32 pyparsing 3.0.4
pyright 1.1.283 pyrsistent 0.18.0 python-dateutil 2.8.2
python-editor 1.0.4 python-lsp-jsonrpc 1.0.0 python-lsp-server 1.6.0
pytz 2021.3 PyWavelets 1.3.0 PyYAML (paket untuk memproses bahasa YAML dalam Python) 6.0
pyzmq 22.3.0 regex 15/03/2022 permintaan 2.27.1
requests-oauthlib 1.3.1 requests-unixsocket 0.2.0 tali 0.22.0
Rsa 4.7.2 s3transfer 0.5.0 scikit-learn 1.0.2
scipy (perpustakaan Python untuk komputasi ilmiah) 1.7.3 Seaborn (perpustakaan Python untuk visualisasi data) 0.11.2 Send2Trash 1.8.0
setuptools 61.2.0 setuptools-git 1.2 bentuk 0.41.0
simplejson 3.17.6 Enam 1.16.0 pemotong 0.0.7
smart-open 5.2.1 smmap 5.0.0 alat penyaring sup 2.3.1
lapang 3.4.4 warisan spasi 3.0.12 pencatat spasi 1.0.4
spark-tensorflow-distributor 1.0.0 sqlparse 0.4.2 Seriusan 2.4.5
ssh-import-id 5.10 stack-data 0.2.0 statsmodels (paket Python untuk pemodelan statistik) 0.13.2
menyusun tabel 0.8.9 terjerat-dalam-unicode 0.2.0 ketekunan 8.0.1
TensorBoard 2.11.2 tensorboard-data-server 0.6.1 Plugin Profil Tensorboard 2.11.1
tensorboard-plugin-wit 1.8.1 tensorflow-cpu 2.11.0 tensorflow-estimator (penghitung dalam TensorFlow) 2.11.0
tensorflow-io-gcs-filesystem 0.30.0 Termcolor 2.2.0 selesai 0.13.1
jalur uji 0.5.0 Thinc 8.1.7 threadpoolctl 2.2.0
Tokenisasi-RT 4.2.1 tokenisasi 0.13.2 tomli 1.2.2
obor 1.13.1+cpu visi obor 0.14.1+cpu Tornado 6.1
tqdm 4.64.0 sifat 5.1.1 Transformer 4.25.1
typeguard (penjaga tipe) 2.13.3 Typer 0.7.0 ekstensi pengetikan (typing_extensions) 4.1.1
ujson 5.1.0 pembaruan otomatis 0.1 urllib3 1.26.9
virtualenv 20.8.0 Visi 0.7.5 wasabi 0.10.1
wcwidth 0.2.5 pengkodean web 0.5.1 websocket-klien 0.58.0
Alat kerja 2.0.3 apa itu patch 1.0.4 wheel 0.37.1
widgetsnbextension 3.6.1 terbalut 1.12.1 xgboost 1.7.2
yapf 0.31.0 zipp 3.7.0

Perpustakaan Python di kluster GPU

Perpustakaan Versi Perpustakaan Versi Perpustakaan Versi
absl-py 1.0.0 argon2-cffi 21.3.0 Pengikatan Argon2-cffi 21.2.0
Astor 0.8.1 asttoken 2.0.5 astunparse 1.6.3
atribut 21.4.0 azure-core 1.26.3 azure-cosmos 4.2.0
panggilan balik 0.2.0 backports.entry-points-selectable 1.2.0 bcrypt 3.2.0
beautifulsoup4 4.11.1 hitam 22.3.0 pemutih 4.1.0
kebahagiaan 0.7.9 boto3 1.21.32 botocore 1.24.32
cachetools (perangkat untuk caching) 4.2.2 katalog 2.0.8 pengkode kategori (category-encoders) 2.5.1.post0
sertifikat 2021.10.8 cffi 1.15.0 chardet 4.0.0
charset-normalizer 2.0.4 klik 8.0.4 cloudpickle (perpustakaan Python untuk serialisasi objek) 2.0.0
cmdstanpy 1.1.0 konfeksi 0.0.4 configparser 5.2.0
mengonversi tanggal 2.4.0 kriptografi 3.4.8 pengendara sepeda 0.11.0
cymem 2.0.7 Cython 0.29.28 databricks-automl-runtime 0.2.15
databricks-cli 0.17.4 penyimpanan fitur databricks 0.10.0 dbl-tempo 0.1.12
dbus-python 1.2.16 debugpy 1.5.1 dekorator 5.1.1
defusedxml 0.7.1 adas 0.3.4 diskcache 5.4.0
distlib 0.3.6 konversi-docstring-ke-markdown 0.11 titik masuk 0,4
ephem 4.1.4 menjalankan 0.8.3 Ikhtisar Aspek 1.0.0
fastjsonschema 2.16.2 fasttext 0.9.2 filelock 3.6.0
Botol 1.1.2 FlatBuffers 23.1.21 alat pengelola font 4.25.0
fsspec 2022.2.0 masa depan 0.18.2 Gast 0.4.0
gitdb 4.0.10 GitPython 3.1.27 google-auth (autentikasi Google) 1.33.0
google-auth-oauthlib 0.4.6 Google Pasta 0.2.0 grpcio 1.42.0
Gunicorn 20.1.0 gviz-api 1.10.0 h5py 3.6.0
Pengonversi Hijriah 2.2.4 hari libur 0,18 Horovod 0.27.0
htmlmin 0.1.12 huggingface-hub 0.12.0 IDNA 3.3
Hash Gambar 4.3.1 pembelajaran-tidak-seimbang 0.10.1 importlib-metadata 4.11.3
ipykernel 6.15.3 ipython 8.5.0 ipython-genutils 0.2.0
ipywidgets 7.7.2 isodate 0.6.1 itu berbahaya 2.0.1
Jedi 0.18.1 Jinja2 2.11.3 jmespath 0.10.0
joblib 1.1.1 joblibspark 0.5.1 jsonschema 4.4.0
jupyter-client (klien Jupyter) 6.1.12 jupyter_core 4.11.2 jupyterlab-pygments 0.1.2
jupyterlab-widgets 1.0.0 keras 2.11.0 kiwisolver 1.3.2
kalender lunar Korea 0.3.1 kode bahasa 3.3.0 libclang 15.0.6.1
lightgbm 3.3.4 llvmlite 0.38.0 Kalender Lunar 0.0.9
Mako 1.2.0 Markdown 3.3.4 MarkupSafe 2.0.1
matplotlib 3.5.1 matplotlib-inline 0.1.2 Mccabe 0.7.0
penyetelan salah 0.8.4 mleap 0.20.0 mlflow-skinny (versi ringan) 2.1.1
multimetode 1.9.1 Murmur Hash 1.0.9 ekstensi mypy 0.4.3
nbclient 0.5.13 nbconvert 6.4.4 nbformat 5.3.0
nest-asyncio 1.5.5 networkx 2.7.1 nltk 3.7
nodeenv 1.7.0 buku catatan 6.4.8 numba 0.55.1
numpy (perpustakaan Python untuk operasi numerik) 1.21.5 oauthlib 3.2.0 opt-einsum 3.3.0
pengemasan 21.3 Panda 1.4.2 pembuatan profil panda 3.6.2
Pandocfilters 1.5.0 paramiko 2.9.2 pengurai 0.8.3
spesifikasi jalur 0.9.0 keadaan 0.10.1 kambing hitam 0.5.2
Petastorm 0.12.1 pexpect=4.8.0 4.8.0 phik 0.12.3
pickleshare 0.7.5 Bantal 9.0.1 pipa 21.2.4
platformdir 2.6.2 secara plot 5.6.0 pengaya 1.0.0
pmdarima 2.0.2 tanpa informasi tambahan mengenai konteks yang berarti bagi istilah "preshed", mungkin terpikir untuk menggambarkan istilah tersebut sebagai langkah atau proses yang sedang terjadi sebelum sesuatu diselesaikan atau diproses lebih lanjut. 3.0.8 prompt-toolkit 3.0.20
nabi 1.1.1 protobuf 3.19.4 psutil 5.8.0
psycopg2 2.9.3 ptyprocess 0.7.0 pure-eval 0.2.2
pyarrow 7.0.0 pyasn1 0.4.8 pyasn1-modul 0.2.8
pybind11 2.10.3 pycparser 2.21 pydantic (perpustakaan Python untuk validasi data) 1.10.2
pyflakes 2.5.0 Pygments 2.11.2 PyGObject 3.36.0
PyJWT 2.6.0 PyMeeus 0.5.12 PyNaCl 1.5.0
pyodbc 4.0.32 pyparsing 3.0.4 pyright 1.1.283
pyrsistent 0.18.0 python-dateutil 2.8.2 python-editor 1.0.4
python-lsp-jsonrpc 1.0.0 python-lsp-server 1.6.0 pytz 2021.3
PyWavelets 1.3.0 PyYAML (paket untuk memproses bahasa YAML dalam Python) 6.0 pyzmq 22.3.0
regex 15/03/2022 permintaan 2.27.1 requests-oauthlib 1.3.1
requests-unixsocket 0.2.0 tali 0.22.0 Rsa 4.7.2
s3transfer 0.5.0 scikit-learn 1.0.2 scipy (perpustakaan Python untuk komputasi ilmiah) 1.7.3
Seaborn (perpustakaan Python untuk visualisasi data) 0.11.2 Send2Trash 1.8.0 setuptools 61.2.0
setuptools-git 1.2 bentuk 0.41.0 simplejson 3.17.6
Enam 1.16.0 pemotong 0.0.7 smart-open 5.2.1
smmap 5.0.0 alat penyaring sup 2.3.1 lapang 3.4.4
warisan spasi 3.0.12 pencatat spasi 1.0.4 spark-tensorflow-distributor 1.0.0
sqlparse 0.4.2 Seriusan 2.4.5 ssh-import-id 5.10
stack-data 0.2.0 statsmodels (paket Python untuk pemodelan statistik) 0.13.2 menyusun tabel 0.8.9
terjerat-dalam-unicode 0.2.0 ketekunan 8.0.1 TensorBoard 2.11.2
tensorboard-data-server 0.6.1 Plugin Profil Tensorboard 2.11.1 tensorboard-plugin-wit 1.8.1
TensorFlow 2.11.0 tensorflow-estimator (penghitung dalam TensorFlow) 2.11.0 tensorflow-io-gcs-filesystem 0.30.0
Termcolor 2.2.0 selesai 0.13.1 jalur uji 0.5.0
Thinc 8.1.7 threadpoolctl 2.2.0 Tokenisasi-RT 4.2.1
tokenisasi 0.13.2 tomli 1.2.2 obor 1.13.1+cu117
visi obor 0.14.1+cu117 Tornado 6.1 tqdm 4.64.0
sifat 5.1.1 Transformer 4.25.1 typeguard (penjaga tipe) 2.13.3
Typer 0.7.0 ekstensi pengetikan (typing_extensions) 4.1.1 ujson 5.1.0
pembaruan otomatis 0.1 urllib3 1.26.9 virtualenv 20.8.0
Visi 0.7.5 wasabi 0.10.1 wcwidth 0.2.5
pengkodean web 0.5.1 websocket-klien 0.58.0 Alat kerja 2.0.3
apa itu patch 1.0.4 wheel 0.37.1 widgetsnbextension 3.6.1
terbalut 1.12.1 xgboost 1.7.2 yapf 0.31.0
zipp 3.7.0

Pustaka R

Pustaka R identik dengan Pustaka R di Databricks Runtime 12.2 LTS.

Pustaka Java dan Scala (Kluster Scala 2.12)

Selain pustaka Java dan Scala di Databricks Runtime 12.2 LTS, Databricks Runtime 12.2 LTS ML berisi JAR berikut:

Kluster CPU

ID Grup ID Artefak Versi
com.typeafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 v0.20.0-db1
ml.dmlc xgboost4j-spark_2.12 1.7.3
ml.dmlc xgboost4j_2.12 1.7.3
org.graphframe graphframes_2.12 0.8.2-db1-spark3.2
org.mlflow mlflow-client 2.1.1
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0

Kluster GPU

ID Grup ID Artefak Versi
com.typeafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 v0.20.0-db1
ml.dmlc xgboost4j-gpu_2.12 1.7.3
ml.dmlc xgboost4j-spark-gpu_2.12 1.7.3
org.graphframe graphframes_2.12 0.8.2-db1-spark3.2
org.mlflow mlflow-client 2.1.1
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0