Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Databricks Runtime 13.3 LTS для машинного обучения предоставляет готовую среду для машинного обучения и науки о данных на основе Databricks Runtime 13.3 LTS. Databricks Runtime ML содержит множество популярных библиотек машинного обучения, включая TensorFlow, PyTorch и XGBoost. Databricks Runtime ML включает AutoML – средство для автоматического обучения конвейеров машинного обучения. Databricks Runtime ML также поддерживает распределенное углубленное обучение с использованием Horovod.
Примечание.
LTS означает, что эта версия находится в долгосрочной поддержке. См. жизненный цикл версии LTS среды выполнения Databricks.
Дополнительные сведения, включая инструкции по созданию кластера Databricks Runtime ML, см. в статье ИИ и машинное обучение в Databricks.
Совет
Для просмотра заметок о выпуске версий Databricks Runtime, которые достигли конца поддержки (EoS), см. заметки о выпуске Databricks Runtime с окончанием поддержки. Версии среды выполнения EoS Databricks устарели и могут не обновляться.
Новые функции и внесенные улучшения
Databricks Runtime 13.3 LTS ML построен на основе Databricks Runtime 13.3 LTS. Сведения о новых возможностях Databricks Runtime 13.3 LTS, включая Apache Spark MLlib и SparkR, см. в заметках о выпуске Databricks Runtime 13.3 LTS .
Изменения в Хранилище компонентов Databricks
- Databricks Runtime 13.3 LTS ML содержит клиент Магазина компонентов версии 0.14.0. С клиентской версией 0.14.0 и выше необходимо указать ключевые столбцы метки времени в аргументе
primary_keys. Ключи метки времени являются частью "первичных ключей", которые однозначно определяют каждую строку в таблице признаков. - Теперь можно исключить значения признаков с метками времени, предшествующими указанному времени, из учебного набора. Дополнительные сведения см. в разделе Установка ограничения времени для значений исторических признаков.
- Функции машинного обучения теперь можно вычислить по запросу во время вывода. Логика вычислений функций, модели и данные управляются каталогом Unity. Это позволяет моделям вычислять признаки, используя входные данные, доступные только во время выполнения, например, текущее местоположение пользователя. Дополнительные сведения см. в разделе вычислений функций по запросу.
Системная среда
Системная среда в Databricks Runtime 13.3 LTS ML отличается от Databricks Runtime 13.3 LTS следующим образом:
-
DBUtils: Databricks Runtime ML не включает служебную программу библиотеки (dbutils.library) (устаревшая версия).
Вместо нее используйте команды
%pip. См. Библиотеки Python для записных книжек. - Для кластеров GPU Databricks Runtime ML включает следующие библиотеки GPU NVIDIA:
- CUDA 11.7
- cuDNN 8.5.0.96-1
- NCCL 2.15.1
- TensorRT 7.2.2
Databricks Runtime 13.3 LTS ML включает XGBoost 1.7.3, который не поддерживает кластеры GPU с возможностями вычислений 5.2 и ниже.
Пакет miniconda был удален из Databricks Runtime 13.0 ML и выше.
Библиотеки
В следующих разделах перечислены библиотеки, включенные в Databricks Runtime 13.3 LTS ML, которые отличаются от библиотек, включенных в Databricks Runtime 13.3 LTS.
В этом разделе рассматриваются следующие вопросы.
- Библиотеки верхнего уровня
- Библиотеки Python
- Библиотеки R
- Библиотеки Java и Scala (кластер Scala 2.12)
Библиотеки верхнего уровня
Databricks Runtime 13.3 LTS ML включает следующие библиотеки верхнего уровня:
- Граффреймы
- Horovod и HorovodRunner
- MLflow
- PyTorch
- spark-tensorflow-connector (соединитель для Spark и TensorFlow)
- TensorFlow
- TensorBoard
- Scikit-learn
Библиотеки Python
Databricks Runtime 13.3 LTS ML использует Virtualenv для управления пакетами Python и включает множество популярных пакетов машинного обучения.
Помимо пакетов, указанных в следующих разделах, Databricks Runtime 13.3 LTS ML также включает следующие пакеты:
- Hyperopt 0.2.7+db3
- sparkdl 3.0.0_db1
- automl 1.20.0
Чтобы воспроизвести среду выполнения Databricks Runtime для Python в вашей локальной виртуальной среде Python, скачайте файл requirements-13.3.txt и выполните команду pip install -r requirements-13.3.txt. Эта команда устанавливает все библиотеки с открытым исходным кодом, которые использует Databricks Runtime ML, но не устанавливает библиотеки, разработанные Databricks, например databricks-automl, databricks-feature-store, или форк Databricks hyperopt.
Библиотеки Python в кластерах CPU
| Библиотека | Версия | Библиотека | Версия | Библиотека | Версия |
|---|---|---|---|---|---|
| absl-py | 1.0.0 | ускорять | 0.20.3 | aiohttp | 3.8.5 |
| aiosignal | 1.3.1 | anyio | 3.5.0 | директории приложений | 1.4.4 |
| argon2-cffi | 21.3.0 | argon2-cffi-связки | 21.2.0 | Астор | 0.8.1 |
| асттокенс | 2.2.1 | астунпарс | 1.6.3 | асинхронный таймаут | 4.0.2 |
| атрибуты | 21.4.0 | аудиочтение | 3.0.0 | azure-core | 1.28.0 |
| azure-cosmos | 4.3.1 | азур-сторадж-блоб | 12.17.0 | система хранения данных Azure (azure-storage-file-datalake) | 12.12.0 |
| обратный вызов | 0.2.0 | bcrypt (алгоритм хеширования паролей) | 3.2.0 | beautifulsoup4 | 4.11.1 |
| чёрный | 22.6.0 | отбеливатель | 4.1.0 | поворотник | 1.4 |
| блаженство | 0.7.10 | boto3 | 1.24.28 | botocore | 1.27.28 |
| инструменты для кэша | 4.2.4 | каталог | 2.0.9 | кодировщики категорий | 2.6.1 |
| сертификат | 2022.9.14 | cffi | 1.15.1 | chardet | 4.0.0 |
| нормализатор кодировки | 2.0.4 | щелчок | 8.0.4 | Клаудпикл | 2.0.0 |
| cmdstanpy | 1.1.0 | сладости | 0.1.0 | конфигпарсер | 5.2.0 |
| преобразовать дату | 2.4.0 | криптография | 37.0.1 | велосипедист | 0.11.0 |
| цимем | 2.0.7 | Cython | 0.29.32 | дацит | 1.8.1 |
| Databricks-AutoML-Runtime | 0.2.17 | Databricks-cli (интерфейс командной строки для работы с Databricks) | 0.17.7 | databricks-feature-store (магазин функций Databricks) | 0.14.0 |
| databricks-sdk | 0.1.6 | dataclasses-json | 0.5.13 | наборы данных | 2.13.1 |
| dbl-tempo | 0.1.23 | dbus-python | 1.2.18 | debugpy | 1.6.0 |
| декоратор | 5.1.1 | defusedxml | 0.7.1 | укроп | 0.3.4 |
| кэш диска | 5.6.1 | Дистлиб | 0.3.7 | docstring-to-markdown (конвертация строк документации в Markdown) | 0,12 |
| точки входа | 0,4 | эфем | 4.1.4 | оценивать | 0.4.0 |
| выполнение | 1.2.0 | Обзор аспектов | 1.0.3 | fastapi | 0.98.0 |
| fastjsonschema | 2.18.0 | FastText | 0.9.2 | блокировка файла | 3.6.0 |
| Фласк | 1.1.2+db1 | флэтбафферы | 26.05.23 | шрифтовые инструменты | 4.25.0 |
| замороженный список | 1.4.0 | fsspec | 2022.7.1 | будущее | 0.18.2 |
| гаст | 0.4.0 | gitdb | 4.0.10 | GitPython | 3.1.27 |
| google-api-core | 2.8.2 | google-auth (аутентификация от Google) | 1.33.0 | google-auth-oauthlib | 0.4.6 |
| google-cloud-core (основной модуль Google Cloud) | 2.3.3 | Хранилище Google Cloud | 2.10.0 | google-crc32c | 1.5.0 |
| гугл-паста | 0.2.0 | гугл-возобновляемые-медиа | 2.5.0 | googleapis-common-protos (общие протоколы googleapis) | 1.56.4 |
| гринлет | 1.1.1 | grpcio | 1.48.1 | grpcio-status | 1.48.1 |
| гуникорн | 20.1.0 | интерфейс программирования приложений gviz | 1.10.0 | h11 | 0.14.0 |
| h5py | 3.7.0 | праздники | 0.27.1 | хоровод | 0.28.1 |
| htmlmin | 0.1.12 | httplib2 | 0.20.2 | инструменты для HTTP | 0.6.0 |
| платформа huggingface-hub | 0.16.4 | IDNA | 3,3 | ImageHash (Хэш изображений) | 4.3.1 |
| imbalanced-learn (библиотека Python для работы с несбалансированными данными) | 0.10.1 | importlib-metadata | 4.11.3 | importlib-resources | 6.0.0 |
| ipykernel | 6.17.1 | ipython | 8.10.0 | ipython-genutils (утилиты для iPython) | 0.2.0 |
| ipywidgets (виджеты для IPython) | 7.7.2 | isodate (стандартная дата ISO) | 0.6.1 | это опасно | 2.0.1 |
| джедай | 0.18.1 | джипни | 0.7.1 | Джинджа2 | 2.11.3 |
| jmespath | 0.10.0 | joblib | 1.2.0 | joblibspark | 0.5.1 |
| jsonschema (JSON-схема) | 4.16.0 | Джупитер-клиент | 7.3.4 | jupyter_core (ядро Jupyter) | 4.11.2 |
| jupyterlab-pygments | 0.1.2 | jupyterlab-мини-приложения | 1.0.0 | Керас | 2.11.0 |
| нажатие клавиш | 23.5.0 | Кивисолвер | 1.4.2 | Лангчейн | 0.0.217 |
| langchainplus-sdk | 0.0.20 | языковые коды | 3.3.0 | launchpadlib | 1.10.16 |
| lazr.restfulclient | 0.14.4 | lazr.uri | 1.0.6 | ленивый загрузчик | 0,3 |
| libclang | 15.0.6.1 | librosa | 0.10.0 | LightGBM (фреймворк для машинного обучения) | 3.3.5 |
| llvmlite | 0.38.0 | Лунный календарь | 0.0.9 | Мако | 1.2.0 |
| Markdown (язык разметки) | 3.3.4 | MarkupSafe | 2.0.1 | зефир | 3.20.1 |
| matplotlib | 3.5.2 | матплотлиб-инлайн | 0.1.6 | Маккейб | 0.7.0 |
| расстроить | 0.8.4 | mleap | 0.20.0 | mlflow-skinny (упрощённая версия пакета mlflow) | 2.5.0 |
| дополнительные итермые инструменты | 8.10.0 | msgpack | 1.0.5 | мультидикт | 6.0.4 |
| мультиметод | 1.9.1 | многопроцессорный | 0.70.12.2 | murmurhash (алгоритм хеширования MurmurHash) | 1.0.9 |
| mypy-extensions (расширения для mypy) | 0.4.3 | nbclient | 0.5.13 | Перекодировщик nbconvert | 6.4.4 |
| nbformat | 5.5.0 | nest-asyncio | 1.5.5 | networkx | 2.8.4 |
| ниндзя | 1.11.1 | nltk (Natural Language Toolkit) | 3,7 | nodeenv | 1.8.0 |
| записная книжка | 6.4.12 | намба | 0.55.1 | numexpr | 2.8.4 |
| numpy (библиотека для работы с массивами и матрицами в Python) | 1.21.5 | OAuthlib | 3.2.0 | openai | 0.27.8 |
| openapi-schema-pydantic | 1.2.4 | opt-einsum | 3.3.0 | упаковка | 21,3 |
| Панды | 1.4.4 | пандокфильтры | 1.5.0 | paramiko | 2.9.2 |
| Парсо | 0.8.3 | спецификация пути | 0.9.0 | Патия | 0.10.2 |
| козел отпущения | 0.5.2 | petastorm | 0.12.1 | pexpect (библиотека Python для автоматизации взаимодействия с приложениями) | 4.8.0 |
| фик | 0.12.3 | Пиклшэр | 0.7.5 | подушка | 9.2.0 |
| пит | 22.2.2 | Platformdirs | 2.5.2 | библиотека Plotly для визуализации данных | 5.9.0 |
| Pluggy | 1.0.0 | pmdarima | 2.0.3 | пёсик | 1.7.0 |
| придавленный | 3.0.8 | prometheus-client | 0.14.1 | prompt-toolkit (инструментарий подсказок) | 3.0.36 |
| пророк | 1.1.4 | protobuf (протобуф) | 3.19.4 | psutil (пакет Python для работы с процессами и системами) | 5.9.0 |
| psycopg2 | 2.9.3 | ptyprocess | 0.7.0 | пьюр-эвэл | 0.2.2 |
| pyarrow | 8.0.0 | pyasn1 | 0.4.8 | pyasn1-modules | 0.2.8 |
| pybind11 | 2.11.1 | pycparser | 2.21 | pydantic (библиотека Python для валидации данных) | 1.10.6 |
| pyflakes (аналитический инструмент для Python) | 3.0.1 | Пигменты | 2.11.2 | PyGObject | 3.42.1 |
| PyJWT | 2.3.0 | PyMeeus | 0.5.12 | PyNaCl | 1.5.0 |
| pyodbc — библиотека Python для работы с базами данных через ODBC | 4.0.32 | pyparsing (библиотека для синтаксического анализа в Python) | 3.0.9 | pyright | 1.1.294 |
| пирсистент | 0.18.0 | pytesseract | 0.3.10 | python-dateutil (библиотека для работы с датами и временем в Python) | 2.8.2 |
| python-dotenv | 1.0.0 | редактор Python | 1.0.4 | python-lsp-jsonrpc | 1.0.0 |
| Сервер Python LSP | 1.7.1 | Pytoolconfig | 1.2.2 | pytz (библиотека Python для работы с часовыми поясами) | 2022.1 |
| PyWavelets | 1.3.0 | PyYAML | 6,0 | pyzmq | 23.2.0 |
| regex | 2022.7.9 | запросы | 2.28.1 | requests-oauthlib | 1.3.1 |
| Ответы | 0.18.0 | верёвка | 1.7.0 | rsa | 4,9 |
| s3transfer | 0.6.0 | безопасные тензоры | 0.3.1 | scikit-learn (библиотека машинного обучения) | 1.1.1 |
| scipy (библиотека Python) | 1.9.1 | мореборн | 0.11.2 | SecretStorage | 3.3.1 |
| Send2Trash | 1.8.0 | sentence-transformers (преобразователи предложений) | 2.2.2 | предложение | 0.1.99 |
| setuptools (пакет для установки и управления Python-пакетами) | 63.4.1 | шап | 0.41.0 | simplejson | 3.17.6 |
| шесть | 1.16.0 | Ломтерезка | 0.0.7 | смарт-оупен | 5.2.1 |
| сммап | 5.0.0 | сниффио | 1.2.0 | звуковой файл | 0.12.1 |
| ситечко для супа | 2.3.1 | soxr | 0.3.5 | пространственный | 3.5.3 |
| spacy-legacy | 3.0.12 | спейси-логгеры | 1.0.4 | spark-tensorflow-distributor (дистрибьютор для TensorFlow на Spark) | 1.0.0 |
| SQLAlchemy | 1.4.39 | sqlparse | 0.4.2 | серьезно | 2.4.7 |
| ssh-import-id (импортировать идентификатор SSH) | 5,11 | стековые данные | 0.6.2 | старлетка | 0.27.0 |
| statsmodels (библиотека Python для статистического моделирования) | 0.13.2 | табулировать | 0.8.10 | запутанный-в-юникоде | 0.2.0 |
| упорство | 8.1.0 | ТензорБорд | 2.11.0 | сервер данных tensorboard | 0.6.1 |
| плагин профилирования для TensorBoard | 2.11.2 | tensorboard-plugin-wit (плагин для TensorBoard) | 1.8.1 | Тензорфлоу-ЦП | 2.11.1 |
| TensorFlow Estimator | 2.11.0 | tensorflow-io-gcs-filesystem (файловая система GCS для Tensorflow IO) | 0.32.0 | термколор | 2.3.0 |
| закончено | 0.13.1 | тестовый путь | 0.6.0 | тонкий | 8.1.10 |
| Threadpoolctl | 2.2.0 | тиктокен | 0.4.0 | токенизация-рт | 4.2.1 |
| токенизаторы | 0.13.3 | томли | 2.0.1 | фонарик | 1.13.1+CPU |
| torchvision (библиотека PyTorch для компьютерного зрения) | 0.14.1+ЦП | торнадо | 6.1 | tqdm | 4.64.1 |
| Трейтлеты | 5.1.1 | Трансформаторы | 4.30.2 | типгард | 2.13.3 |
| машинистка / печатник / типировщик | 0.7.0 | ввод и проверка | 0.9.0 | typing_extensions (расширения для ввода текста) | 4.3.0 |
| ujson | 5.4.0 | автоматические обновления | 0,1 | urllib3 | 1.26.11 |
| uvicorn | 0.23.1 | uvloop | 0.17.0 | virtualenv | 20.16.3 |
| видения | 0.7.5 | wadllib | 1.3.6 | васаби | 1.1.2 |
| watchfiles | 0.19.0 | wcwidth (ширина символа в Unicode) | 0.2.5 | веб-кодировки | 0.5.1 |
| Вебсокет-клиент | 0.58.0 | websockets | 11.0.3 | Инструмент | 2.0.3 |
| чтоэтолатка | 1.0.2 | колесо | 0.37.1 | widgetsnbextension | 3.6.1 |
| облако слов | 1.9.2 | обернутый | 1.14.1 | XGBoost | 1.7.6 |
| xxhash | 3.2.0 | yapf (форматировщик Python кода) | 0.31.0 | ярл | 1.9.2 |
| ydata-profiling | 4.2.0 | ZIPP | 3.8.0 |
Библиотеки Python в кластерах GPU
| Библиотека | Версия | Библиотека | Версия | Библиотека | Версия |
|---|---|---|---|---|---|
| absl-py | 1.0.0 | ускорять | 0.20.3 | aiohttp | 3.8.5 |
| aiosignal | 1.3.1 | anyio | 3.5.0 | директории приложений | 1.4.4 |
| argon2-cffi | 21.3.0 | argon2-cffi-связки | 21.2.0 | Астор | 0.8.1 |
| асттокенс | 2.2.1 | астунпарс | 1.6.3 | асинхронный таймаут | 4.0.2 |
| атрибуты | 21.4.0 | аудиочтение | 3.0.0 | azure-core | 1.28.0 |
| azure-cosmos | 4.3.1 | азур-сторадж-блоб | 12.17.0 | система хранения данных Azure (azure-storage-file-datalake) | 12.12.0 |
| обратный вызов | 0.2.0 | bcrypt (алгоритм хеширования паролей) | 3.2.0 | beautifulsoup4 | 4.11.1 |
| чёрный | 22.6.0 | отбеливатель | 4.1.0 | поворотник | 1.4 |
| блаженство | 0.7.10 | boto3 | 1.24.28 | botocore | 1.27.28 |
| инструменты для кэша | 4.2.4 | каталог | 2.0.9 | кодировщики категорий | 2.6.1 |
| сертификат | 2022.9.14 | cffi | 1.15.1 | chardet | 4.0.0 |
| нормализатор кодировки | 2.0.4 | щелчок | 8.0.4 | Клаудпикл | 2.0.0 |
| cmdstanpy | 1.1.0 | сладости | 0.1.0 | конфигпарсер | 5.2.0 |
| преобразовать дату | 2.4.0 | криптография | 37.0.1 | велосипедист | 0.11.0 |
| цимем | 2.0.7 | Cython | 0.29.32 | дацит | 1.8.1 |
| Databricks-AutoML-Runtime | 0.2.17 | Databricks-cli (интерфейс командной строки для работы с Databricks) | 0.17.7 | databricks-feature-store (магазин функций Databricks) | 0.14.0 |
| databricks-sdk | 0.1.6 | dataclasses-json | 0.5.13 | наборы данных | 2.13.1 |
| dbl-tempo | 0.1.23 | dbus-python | 1.2.18 | debugpy | 1.6.0 |
| декоратор | 5.1.1 | defusedxml | 0.7.1 | укроп | 0.3.4 |
| кэш диска | 5.6.1 | Дистлиб | 0.3.7 | docstring-to-markdown (конвертация строк документации в Markdown) | 0,12 |
| einops | 0.6.1 | точки входа | 0,4 | эфем | 4.1.4 |
| оценивать | 0.4.0 | выполнение | 1.2.0 | Обзор аспектов | 1.0.3 |
| fastapi | 0.98.0 | fastjsonschema | 2.18.0 | FastText | 0.9.2 |
| блокировка файла | 3.6.0 | flash-attn | 1.0.7 | Фласк | 1.1.2+db1 |
| флэтбафферы | 26.05.23 | шрифтовые инструменты | 4.25.0 | замороженный список | 1.4.0 |
| fsspec | 2022.7.1 | будущее | 0.18.2 | гаст | 0.4.0 |
| gitdb | 4.0.10 | GitPython | 3.1.27 | google-api-core | 2.8.2 |
| google-auth (аутентификация от Google) | 1.33.0 | google-auth-oauthlib | 0.4.6 | google-cloud-core (основной модуль Google Cloud) | 2.3.3 |
| Хранилище Google Cloud | 2.10.0 | google-crc32c | 1.5.0 | гугл-паста | 0.2.0 |
| гугл-возобновляемые-медиа | 2.5.0 | googleapis-common-protos (общие протоколы googleapis) | 1.56.4 | гринлет | 1.1.1 |
| grpcio | 1.48.1 | grpcio-status | 1.48.1 | гуникорн | 20.1.0 |
| интерфейс программирования приложений gviz | 1.10.0 | h11 | 0.14.0 | h5py | 3.7.0 |
| праздники | 0.27.1 | хоровод | 0.28.1 | htmlmin | 0.1.12 |
| httplib2 | 0.20.2 | инструменты для HTTP | 0.6.0 | платформа huggingface-hub | 0.16.4 |
| IDNA | 3,3 | ImageHash (Хэш изображений) | 4.3.1 | imbalanced-learn (библиотека Python для работы с несбалансированными данными) | 0.10.1 |
| importlib-metadata | 4.11.3 | importlib-resources | 6.0.0 | ipykernel | 6.17.1 |
| ipython | 8.10.0 | ipython-genutils (утилиты для iPython) | 0.2.0 | ipywidgets (виджеты для IPython) | 7.7.2 |
| isodate (стандартная дата ISO) | 0.6.1 | это опасно | 2.0.1 | джедай | 0.18.1 |
| джипни | 0.7.1 | Джинджа2 | 2.11.3 | jmespath | 0.10.0 |
| joblib | 1.2.0 | joblibspark | 0.5.1 | jsonschema (JSON-схема) | 4.16.0 |
| Джупитер-клиент | 7.3.4 | jupyter_core (ядро Jupyter) | 4.11.2 | jupyterlab-pygments | 0.1.2 |
| jupyterlab-мини-приложения | 1.0.0 | Керас | 2.11.0 | нажатие клавиш | 23.5.0 |
| Кивисолвер | 1.4.2 | Лангчейн | 0.0.217 | langchainplus-sdk | 0.0.20 |
| языковые коды | 3.3.0 | launchpadlib | 1.10.16 | lazr.restfulclient | 0.14.4 |
| lazr.uri | 1.0.6 | ленивый загрузчик | 0,3 | libclang | 15.0.6.1 |
| librosa | 0.10.0 | LightGBM (фреймворк для машинного обучения) | 3.3.5 | llvmlite | 0.38.0 |
| Лунный календарь | 0.0.9 | Мако | 1.2.0 | Markdown (язык разметки) | 3.3.4 |
| MarkupSafe | 2.0.1 | зефир | 3.20.1 | matplotlib | 3.5.2 |
| матплотлиб-инлайн | 0.1.6 | Маккейб | 0.7.0 | расстроить | 0.8.4 |
| mleap | 0.20.0 | mlflow-skinny (упрощённая версия пакета mlflow) | 2.5.0 | дополнительные итермые инструменты | 8.10.0 |
| msgpack | 1.0.5 | мультидикт | 6.0.4 | мультиметод | 1.9.1 |
| многопроцессорный | 0.70.12.2 | murmurhash (алгоритм хеширования MurmurHash) | 1.0.9 | mypy-extensions (расширения для mypy) | 0.4.3 |
| nbclient | 0.5.13 | Перекодировщик nbconvert | 6.4.4 | nbformat | 5.5.0 |
| nest-asyncio | 1.5.5 | networkx | 2.8.4 | ниндзя | 1.11.1 |
| nltk (Natural Language Toolkit) | 3,7 | nodeenv | 1.8.0 | записная книжка | 6.4.12 |
| намба | 0.55.1 | numexpr | 2.8.4 | numpy (библиотека для работы с массивами и матрицами в Python) | 1.21.5 |
| OAuthlib | 3.2.0 | openai | 0.27.8 | openapi-schema-pydantic | 1.2.4 |
| opt-einsum | 3.3.0 | упаковка | 21,3 | Панды | 1.4.4 |
| пандокфильтры | 1.5.0 | paramiko | 2.9.2 | Парсо | 0.8.3 |
| спецификация пути | 0.9.0 | Патия | 0.10.2 | козел отпущения | 0.5.2 |
| petastorm | 0.12.1 | pexpect (библиотека Python для автоматизации взаимодействия с приложениями) | 4.8.0 | фик | 0.12.3 |
| Пиклшэр | 0.7.5 | подушка | 9.2.0 | пит | 22.2.2 |
| Platformdirs | 2.5.2 | библиотека Plotly для визуализации данных | 5.9.0 | Pluggy | 1.0.0 |
| pmdarima | 2.0.3 | пёсик | 1.7.0 | придавленный | 3.0.8 |
| prompt-toolkit (инструментарий подсказок) | 3.0.36 | пророк | 1.1.4 | protobuf (протобуф) | 3.19.4 |
| psutil (пакет Python для работы с процессами и системами) | 5.9.0 | psycopg2 | 2.9.3 | ptyprocess | 0.7.0 |
| пьюр-эвэл | 0.2.2 | pyarrow | 8.0.0 | pyasn1 | 0.4.8 |
| pyasn1-modules | 0.2.8 | pybind11 | 2.11.1 | pycparser | 2.21 |
| pydantic (библиотека Python для валидации данных) | 1.10.6 | pyflakes (аналитический инструмент для Python) | 3.0.1 | Пигменты | 2.11.2 |
| PyGObject | 3.42.1 | PyJWT | 2.3.0 | PyMeeus | 0.5.12 |
| PyNaCl | 1.5.0 | pyodbc — библиотека Python для работы с базами данных через ODBC | 4.0.32 | pyparsing (библиотека для синтаксического анализа в Python) | 3.0.9 |
| pyright | 1.1.294 | пирсистент | 0.18.0 | pytesseract | 0.3.10 |
| python-dateutil (библиотека для работы с датами и временем в Python) | 2.8.2 | python-dotenv | 1.0.0 | редактор Python | 1.0.4 |
| python-lsp-jsonrpc | 1.0.0 | Сервер Python LSP | 1.7.1 | Pytoolconfig | 1.2.2 |
| pytz (библиотека Python для работы с часовыми поясами) | 2022.1 | PyWavelets | 1.3.0 | PyYAML | 6,0 |
| pyzmq | 23.2.0 | regex | 2022.7.9 | запросы | 2.28.1 |
| requests-oauthlib | 1.3.1 | Ответы | 0.18.0 | верёвка | 1.7.0 |
| rsa | 4,9 | s3transfer | 0.6.0 | безопасные тензоры | 0.3.1 |
| scikit-learn (библиотека машинного обучения) | 1.1.1 | scipy (библиотека Python) | 1.9.1 | мореборн | 0.11.2 |
| SecretStorage | 3.3.1 | Send2Trash | 1.8.0 | sentence-transformers (преобразователи предложений) | 2.2.2 |
| предложение | 0.1.99 | setuptools (пакет для установки и управления Python-пакетами) | 63.4.1 | шап | 0.41.0 |
| simplejson | 3.17.6 | шесть | 1.16.0 | Ломтерезка | 0.0.7 |
| смарт-оупен | 5.2.1 | сммап | 5.0.0 | сниффио | 1.2.0 |
| звуковой файл | 0.12.1 | ситечко для супа | 2.3.1 | soxr | 0.3.5 |
| пространственный | 3.5.3 | spacy-legacy | 3.0.12 | спейси-логгеры | 1.0.4 |
| spark-tensorflow-distributor (дистрибьютор для TensorFlow на Spark) | 1.0.0 | SQLAlchemy | 1.4.39 | sqlparse | 0.4.2 |
| серьезно | 2.4.7 | ssh-import-id (импортировать идентификатор SSH) | 5,11 | стековые данные | 0.6.2 |
| старлетка | 0.27.0 | statsmodels (библиотека Python для статистического моделирования) | 0.13.2 | табулировать | 0.8.10 |
| запутанный-в-юникоде | 0.2.0 | упорство | 8.1.0 | ТензорБорд | 2.11.0 |
| сервер данных tensorboard | 0.6.1 | плагин профилирования для TensorBoard | 2.11.2 | tensorboard-plugin-wit (плагин для TensorBoard) | 1.8.1 |
| Tensorflow | 2.11.1 | TensorFlow Estimator | 2.11.0 | tensorflow-io-gcs-filesystem (файловая система GCS для Tensorflow IO) | 0.32.0 |
| термколор | 2.3.0 | закончено | 0.13.1 | тестовый путь | 0.6.0 |
| тонкий | 8.1.10 | Threadpoolctl | 2.2.0 | тиктокен | 0.4.0 |
| токенизация-рт | 4.2.1 | токенизаторы | 0.13.3 | томли | 2.0.1 |
| фонарик | 1.13.1+cu117 | torchvision (библиотека PyTorch для компьютерного зрения) | 0.14.1+cu117 | торнадо | 6.1 |
| tqdm | 4.64.1 | Трейтлеты | 5.1.1 | Трансформаторы | 4.30.2 |
| типгард | 2.13.3 | машинистка / печатник / типировщик | 0.7.0 | ввод и проверка | 0.9.0 |
| typing_extensions (расширения для ввода текста) | 4.3.0 | ujson | 5.4.0 | автоматические обновления | 0,1 |
| urllib3 | 1.26.11 | uvicorn | 0.23.1 | uvloop | 0.17.0 |
| virtualenv | 20.16.3 | видения | 0.7.5 | wadllib | 1.3.6 |
| васаби | 1.1.2 | watchfiles | 0.19.0 | wcwidth (ширина символа в Unicode) | 0.2.5 |
| веб-кодировки | 0.5.1 | Вебсокет-клиент | 0.58.0 | websockets | 11.0.3 |
| Инструмент | 2.0.3 | чтоэтолатка | 1.0.2 | колесо | 0.37.1 |
| widgetsnbextension | 3.6.1 | облако слов | 1.9.2 | обернутый | 1.14.1 |
| XGBoost | 1.7.6 | xxhash | 3.2.0 | yapf (форматировщик Python кода) | 0.31.0 |
| ярл | 1.9.2 | ydata-profiling | 4.2.0 | ZIPP | 3.8.0 |
Библиотеки R
Библиотеки R идентичны библиотекам R в Databricks Runtime 13.3 LTS.
Библиотеки Java и Scala (кластер Scala 2.12)
Помимо библиотек Java и Scala в Databricks Runtime 13.3 LTS, Databricks Runtime 13.3 LTS ml содержит следующие JAR:
Кластеры ЦП
| ИД группы | Идентификатор артефакта | Версия |
|---|---|---|
| com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
| ml.dmlc | xgboost4j-spark_2.12 | 1.7.3 |
| ml.dmlc | xgboost4j_2.12 | 1.7.3 |
| org.graphframes | graphframes_2.12 | 0.8.2-db2-spark3.4 |
| org.mlflow | mlflow-client | 2.5.0 |
| org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
| org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |
Кластеры GPU
| ИД группы | Идентификатор артефакта | Версия |
|---|---|---|
| com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
| ml.dmlc | xgboost4j-gpu_2.12 | 1.7.3 |
| ml.dmlc | xgboost4j-spark-gpu_2.12 | 1.7.3 |
| org.graphframes | graphframes_2.12 | 0.8.2-db2-spark3.4 |
| org.mlflow | mlflow-client | 2.5.0 |
| org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
| org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |