Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Nota
O suporte para esta versão do Databricks Runtime terminou. Para obter a data de fim do suporte, consulte Histórico de fim do suporte. Para todas as versões suportadas do Databricks Runtime, consulte Versões e compatibilidade das notas de versão do Databricks Runtime.
O Databricks Runtime 10.0 for Machine Learning fornece um ambiente pronto para uso para aprendizado de máquina e ciência de dados com base no Databricks Runtime 10.0 (EoS). O Databricks Runtime ML contém muitas bibliotecas populares de aprendizado de máquina, incluindo TensorFlow, PyTorch e XGBoost. Ele também suporta treinamento distribuído de aprendizagem profunda usando Horovod.
Para obter mais informações, incluindo instruções para criar um cluster de ML do Databricks Runtime, consulte IA e aprendizado de máquina no Databricks.
Novos recursos e melhorias
O Databricks Runtime 10.0 ML é construído sobre o Databricks Runtime 10.0. Para obter informações sobre o que há de novo no Databricks Runtime 10.0, incluindo Apache Spark MLlib e SparkR, consulte as notas de versão do Databricks Runtime 10.0 (EoS ).
Previsão de séries cronológicas com AutoML
O AutoML agora suporta previsão de séries temporais. Para obter mais informações, consulte Documentação do AutoML.
Principais alterações no ambiente Python do Databricks Runtime ML
Pacotes Python adicionados
- databricks-automl-runtime 0.1.0
- aprendizagem desequilibrada 0.8.0
- transformadores 4.9.2
Ambiente do sistema
Nós atualizamos a versão incluída do RStudio Server Open Source para v1.4.
O ambiente do sistema no Databricks Runtime 10.0 ML difere do Databricks Runtime 10.0 da seguinte maneira:
-
DBUtils: Databricks Runtime ML não inclui o utilitário Biblioteca (dbutils.library) (legado).
Use, em vez disso, comandos
%pip. Veja Bibliotecas Python específicas para notebooks. - Para clusters de GPU, o Databricks Runtime ML inclui as seguintes bibliotecas de GPU NVIDIA:
- CUDA 11,0
- cuDNN 8.0.5.39
- NCCL 2.10.3
- TensorRT 7.2.2
Bibliotecas
As seções a seguir listam as bibliotecas incluídas no Databricks Runtime 10.0 ML que diferem daquelas incluídas no Databricks Runtime 10.0.
Nesta secção:
- Bibliotecas de nível superior
- Bibliotecas Python
- Bibliotecas R
- Bibliotecas Java e Scala (cluster Scala 2.12)
Bibliotecas de nível superior
O Databricks Runtime 10.0 ML inclui as seguintes bibliotecas de camada superior:
- GraphFrames
- Horovod e HorovodRunner
- MLflow
- PyTorch
- spark tensorflow connector
- TensorFlow
- TensorBoard
Bibliotecas Python
O Databricks Runtime 10.0 ML usa o Virtualenv para gerenciamento de pacotes Python e inclui muitos pacotes de ML populares.
Além dos pacotes especificados nas seções a seguir, o Databricks Runtime 10.0 ML também inclui os seguintes pacotes:
- hiperopta 0.2.5.db2
- Sparkdl 2.2.0_db3
- feature_store 0.3.4
- AutoML 1.3.1 |
Bibliotecas Python em clusters de CPU
| Biblioteca | Versão | Biblioteca | Versão | Biblioteca | Versão |
|---|---|---|---|---|---|
| ABSL-PY | 0.11.0 | Antergos Linux | 2015.10 (Laminação ISO) | Diretórios de aplicativos | 1.4.4 |
| Argão2-CFFI | 20.1.0 | Astor | 0.8.1 | Astunparse | 1.6.3 |
| gerador assíncrono | 1.10 | ATRs | 20.3.0 | Chamada de retorno | 0.2.0 |
| Cripta | 3.2.0 | lixívia | 3.3.0 | Blis | 0.7.4 |
| Boto3 | 1.16.7 | Botocore | 1.19.7 | Gargalo | 1.3.2 |
| Ferramentas de cache | 4.2.2 | catálogo | 2.0.6 | certifi | 2020.12.5 |
| CFFI | 1.14.5 | Chardet | 4.0.0 | Clang | 5.0 |
| clicar | 7.1.2 | Cloudpickle | 1.6.0 | CMDSTANPY | 0.9.68 |
| ConfigParser | 5.0.1 | convertdate | 2.3.2 | criptografia | 3.4.7 |
| ciclador | 0.10.0 | cymem | 2.0.5 | Cython | 0.29.23 |
| databricks-automl-runtime | 0.1.0 | databricks-cli | 0.14.3 | dbus-python | 1.2.16 |
| decorador | 5.0.6 | DeUsedXML | 0.7.1 | endro | 0.3.2 |
| cache de disco | 5.2.1 | Distlib | 0.3.2 | distro-info | 0,23ubuntu1 |
| pontos de entrada | 0,3 | Ephem | 4.0.0.2 | facetas-visão geral | 1.0.0 |
| bloqueio de ficheiro | 3.0.12 | Frasco | 1.1.2 | flatbuffers | 1.12 |
| FSspec | 0.9.0 | Futuro | 0.18.2 | gast | 0.4.0 |
| GitDB | 4.0.7 | GitPython | 3.1.12 | Google-Auth | 1.22.1 |
| google-auth-oauthlib | 0.4.2 | google-ficheiro | 0.2.0 | Grpcio | 1.39.0 |
| Gunicorn | 20.0.4 | H5PY | 3.1.0 | Hijri-Conversor | 2.2.1 |
| feriados | 0.11.2 | Horovod | 0.22.1 | htmlmin | 0.1.12 |
| Hugging Face Hub | 0.0.12 | IDNA | 2.10 | Imagem Hash | 4.2.1 |
| aprendizagem desequilibrada | 0.8.0 | importlib-metadados | 3.10.0 | Ipykernel | 5.3.4 |
| IPython | 7.22.0 | ipython-genutils | 0.2.0 | ipywidgets | 7.6.3 |
| Isodato | 0.6.0 | é perigoso | 1.1.0 | Jedi | 0.17.2 |
| Jinja2 | 2.11.3 | JmesPath | 0.10.0 | Joblib | 1.0.1 |
| Joblibspark | 0.3.0 | jsonschema | 3.2.0 | Jupyter Client | 6.1.12 |
| Jupyter-core | 4.7.1 | Jupyterlab-Pygments | 0.1.2 | jupyterlab-widgets | 1.0.0 |
| Keras | 2.6.0 | Pré-processamento de Keras | 1.1.2 | Kiwisolver | 1.3.1 |
| coalas | 1.8.1 | Calendário Lunar Coreano | 0.2.1 | LightGBM | 3.1.1 |
| LLVMLITE | 0.37.0 | LunarCalendário | 0.0.9 | Mako | 1.1.3 |
| Markdown | 3.3.3 | Marcação Segura | 1.1.1 | Matplotlib | 3.4.2 |
| faltandonão | 0.5.0 | Mistune | 0.8.4 | PEAML | 0.17.0 |
| mlflow-magro | 1.20.2 | multimétodo | 1.4 | Murmurhash | 1.0.5 |
| nbclient | 0.5.3 | nbconvert | 6.0.7 | nbformat | 5.1.3 |
| Ninho-Asyncio | 1.5.1 | redex | 2,5 | NLTK | 3.6.1 |
| bloco de notas | 6.3.0 | Dormência | 0.54.0 | dormência | 1.19.2 |
| OAuthlib | 3.1.0 | opt-einsum | 3.3.0 | embalagem | 20.9 |
| pandas | 1.2.4 | criação de perfis de pandas | 3.0.0 | PandocFilters | 1.4.3 |
| Paramiko | 2.7.2 | Parso | 0.7.0 | patia | 0.6.0 |
| ingénuo | 0.5.1 | petastorm | 0.11.2 | Espere | 4.8.0 |
| Phik | 0.12.0 | pickleshare | 0.7.5 | Almofada | 8.2.0 |
| pip (o gestor de pacotes do Python) | 21.0.1 | enredo | 5.1.0 | Preshed | 3.0.5 |
| Prometheus-cliente | 0.10.1 | kit de ferramentas de prompt | 3.0.17 | profeta | 1.0.1 |
| Protobuf | 3.17.2 | PSUTIL | 5.8.0 | PSYCOPG2 | 2.8.5 |
| ptyprocess | 0.7.0 | Pyarrow | 4.0.0 | Piasn1 | 0.4.8 |
| pyasn1-módulos | 0.2.8 | Pycparser | 2,20 | Pidântico | 1.8.2 |
| Pigmentos | 2.8.1 | PyGObject | 3.36.0 | PyMeeus | 0.5.11 |
| PyNaCl | 1.3.0 | Pyodbc | 4.0.30 | Pyparsing | 2.4.7 |
| pirsistent | 0.17.3 | Pystan | 2.19.1.1 | python-apt | 2.0.0+ubuntu0.20.4.6 |
| python-dateutil (uma biblioteca de software para manipulação de datas em Python) | 2.8.1 | editor de Python | 1.0.4 | Pytz | 2020.5 |
| PyWavelets | 1.1.1 | PyYAML | 5.4.1 | Pyzmq | 20.0.0 |
| regex | 2021.4.4 | pedidos | 2.25.1 | pedidos-oauthlib | 1.3.0 |
| pedidos-unixsocket | 0.2.0 | RSA | 4.7.2 | s3transferência | 0.3.7 |
| sacremoses | 0.0.45 | scikit-learn (biblioteca de aprendizado de máquina em Python) | 0.24.1 | SciPy | 1.6.2 |
| nascido no mar | 0.11.1 | Enviar Para Lixo | 1.5.0 | Ferramentas de configuração | 52.0.0 |
| setuptools-git | 1.2 | forma | 0.39.0 | simplejson | 3.17.2 |
| seis | 1.15.0 | filtro | 0.0.7 | inteligente-aberto | 5.2.0 |
| smmap | 3.0.5 | espaçado | 3.1.2 | Spacy-legado | 3.0.8 |
| spark-tensorflow-distribuidor | 1.0.0 | SQLPARSE | 0.4.1 | SRSLY | 2.4.1 |
| ssh-import-id | 5.10 | statsmodels (uma biblioteca de Python para modelos estatísticos) | 0.12.2 | tabular | 0.8.7 |
| emaranhado em unicode | 0.1.0 | tenacidade | 6.2.0 | TensorBoard | 2.6.0 |
| Tensorboard-Data-Server | 0.6.1 | Tensorboard-plugin-wit | 1.8.0 | TensorFlow-CPU | 2.6.0 |
| TensorFlow-Estimador | 2.6.0 | Termcolor | 1.1.0 | terminado | 0.9.4 |
| caminho de teste | 0.4.4 | fino | 8.0.8 | ThreadPoolCtl | 2.1.0 |
| tokenizadores | 0.10.3 | tocha | 1.9.0+CPU | Torchvision | 0.10.0+CPU |
| tornado | 6.1 | TQDM | 4.59.0 | traços | 5.0.5 |
| transformadores | 4.9.2 | digitador | 0.3.2 | extensões de digitação | 3.7.4.3 |
| Ujson | 4.0.2 | Atualizações automáticas | 0.1 | urllib3 | 1.25.11 |
| virtualenv | 20.4.1 | visões | 0.7.1 | Wasabi | 0.8.2 |
| largura de wc | 0.2.5 | Codificações Web | 0.5.1 | Websocket-cliente | 0.57.0 |
| Werkzeug | 1.0.1 | wheel | 0.36.2 | widgetsnbextension | 3.5.1 |
| embrulhado | 1.12.1 | xgboost | 1.4.2 | zipp | | 3.4.1 |
Bibliotecas Python em clusters GPU
| Biblioteca | Versão | Biblioteca | Versão | Biblioteca | Versão |
|---|---|---|---|---|---|
| ABSL-PY | 0.11.0 | Antergos Linux | 2015.10 (Laminação ISO) | Diretórios de aplicativos | 1.4.4 |
| Argão2-CFFI | 20.1.0 | Astor | 0.8.1 | Astunparse | 1.6.3 |
| gerador assíncrono | 1.10 | ATRs | 20.3.0 | Chamada de retorno | 0.2.0 |
| Cripta | 3.2.0 | lixívia | 3.3.0 | Blis | 0.7.4 |
| Boto3 | 1.16.7 | Botocore | 1.19.7 | Gargalo | 1.3.2 |
| Ferramentas de cache | 4.2.2 | catálogo | 2.0.6 | certifi | 2020.12.5 |
| CFFI | 1.14.5 | Chardet | 4.0.0 | Clang | 5.0 |
| clicar | 7.1.2 | Cloudpickle | 1.6.0 | CMDSTANPY | 0.9.68 |
| ConfigParser | 5.0.1 | convertdate | 2.3.2 | criptografia | 3.4.7 |
| ciclador | 0.10.0 | cymem | 2.0.5 | Cython | 0.29.23 |
| databricks-automl-runtime | 0.1.0 | databricks-cli | 0.14.3 | dbus-python | 1.2.16 |
| decorador | 5.0.6 | DeUsedXML | 0.7.1 | endro | 0.3.2 |
| cache de disco | 5.2.1 | Distlib | 0.3.2 | distro-info | 0,23ubuntu1 |
| pontos de entrada | 0,3 | Ephem | 4.0.0.2 | facetas-visão geral | 1.0.0 |
| bloqueio de ficheiro | 3.0.12 | Frasco | 1.1.2 | flatbuffers | 1.12 |
| FSspec | 0.9.0 | Futuro | 0.18.2 | gast | 0.4.0 |
| GitDB | 4.0.7 | GitPython | 3.1.12 | Google-Auth | 1.22.1 |
| google-auth-oauthlib | 0.4.2 | google-ficheiro | 0.2.0 | Grpcio | 1.39.0 |
| Gunicorn | 20.0.4 | H5PY | 3.1.0 | Hijri-Conversor | 2.2.1 |
| feriados | 0.11.2 | Horovod | 0.22.1 | htmlmin | 0.1.12 |
| Hugging Face Hub | 0.0.12 | IDNA | 2.10 | Imagem Hash | 4.2.1 |
| aprendizagem desequilibrada | 0.8.0 | importlib-metadados | 3.10.0 | Ipykernel | 5.3.4 |
| IPython | 7.22.0 | ipython-genutils | 0.2.0 | ipywidgets | 7.6.3 |
| Isodato | 0.6.0 | é perigoso | 1.1.0 | Jedi | 0.17.2 |
| Jinja2 | 2.11.3 | JmesPath | 0.10.0 | Joblib | 1.0.1 |
| Joblibspark | 0.3.0 | jsonschema | 3.2.0 | Jupyter Client | 6.1.12 |
| Jupyter-core | 4.7.1 | Jupyterlab-Pygments | 0.1.2 | jupyterlab-widgets | 1.0.0 |
| Keras | 2.6.0 | Pré-processamento de Keras | 1.1.2 | Kiwisolver | 1.3.1 |
| coalas | 1.8.1 | Calendário Lunar Coreano | 0.2.1 | LightGBM | 3.1.1 |
| LLVMLITE | 0.37.0 | LunarCalendário | 0.0.9 | Mako | 1.1.3 |
| Markdown | 3.3.3 | Marcação Segura | 1.1.1 | Matplotlib | 3.4.2 |
| faltandonão | 0.5.0 | Mistune | 0.8.4 | PEAML | 0.17.0 |
| mlflow-magro | 1.20.2 | multimétodo | 1.4 | Murmurhash | 1.0.5 |
| nbclient | 0.5.3 | nbconvert | 6.0.7 | nbformat | 5.1.3 |
| Ninho-Asyncio | 1.5.1 | redex | 2,5 | NLTK | 3.6.1 |
| bloco de notas | 6.3.0 | Dormência | 0.54.0 | dormência | 1.19.2 |
| OAuthlib | 3.1.0 | opt-einsum | 3.3.0 | embalagem | 20.9 |
| pandas | 1.2.4 | criação de perfis de pandas | 3.0.0 | PandocFilters | 1.4.3 |
| Paramiko | 2.7.2 | Parso | 0.7.0 | patia | 0.6.0 |
| ingénuo | 0.5.1 | petastorm | 0.11.2 | Espere | 4.8.0 |
| Phik | 0.12.0 | pickleshare | 0.7.5 | Almofada | 8.2.0 |
| pip (o gestor de pacotes do Python) | 21.0.1 | enredo | 5.1.0 | Preshed | 3.0.5 |
| kit de ferramentas de prompt | 3.0.17 | profeta | 1.0.1 | Protobuf | 3.17.2 |
| PSUTIL | 5.8.0 | PSYCOPG2 | 2.8.5 | ptyprocess | 0.7.0 |
| Pyarrow | 4.0.0 | Piasn1 | 0.4.8 | pyasn1-módulos | 0.2.8 |
| Pycparser | 2,20 | Pidântico | 1.8.2 | Pigmentos | 2.8.1 |
| PyGObject | 3.36.0 | PyMeeus | 0.5.11 | PyNaCl | 1.3.0 |
| Pyodbc | 4.0.30 | Pyparsing | 2.4.7 | pirsistent | 0.17.3 |
| Pystan | 2.19.1.1 | python-apt | 2.0.0+ubuntu0.20.4.6 | python-dateutil (uma biblioteca de software para manipulação de datas em Python) | 2.8.1 |
| editor de Python | 1.0.4 | Pytz | 2020.5 | PyWavelets | 1.1.1 |
| PyYAML | 5.4.1 | Pyzmq | 20.0.0 | regex | 2021.4.4 |
| pedidos | 2.25.1 | pedidos-oauthlib | 1.3.0 | pedidos-unixsocket | 0.2.0 |
| RSA | 4.7.2 | s3transferência | 0.3.7 | sacremoses | 0.0.45 |
| scikit-learn (biblioteca de aprendizado de máquina em Python) | 0.24.1 | SciPy | 1.6.2 | nascido no mar | 0.11.1 |
| Enviar Para Lixo | 1.5.0 | Ferramentas de configuração | 52.0.0 | setuptools-git | 1.2 |
| forma | 0.39.0 | simplejson | 3.17.2 | seis | 1.15.0 |
| filtro | 0.0.7 | inteligente-aberto | 5.2.0 | smmap | 3.0.5 |
| espaçado | 3.1.2 | Spacy-legado | 3.0.8 | spark-tensorflow-distribuidor | 1.0.0 |
| SQLPARSE | 0.4.1 | SRSLY | 2.4.1 | ssh-import-id | 5.10 |
| statsmodels (uma biblioteca de Python para modelos estatísticos) | 0.12.2 | tabular | 0.8.7 | emaranhado em unicode | 0.1.0 |
| tenacidade | 6.2.0 | TensorBoard | 2.6.0 | Tensorboard-Data-Server | 0.6.1 |
| Tensorboard-plugin-wit | 1.8.0 | TensorFlow | 2.6.0 | TensorFlow-Estimador | 2.6.0 |
| Termcolor | 1.1.0 | terminado | 0.9.4 | caminho de teste | 0.4.4 |
| fino | 8.0.8 | ThreadPoolCtl | 2.1.0 | tokenizadores | 0.10.3 |
| tocha | 1.9.0+CU111 | Torchvision | 0.10.0+CU111 | tornado | 6.1 |
| TQDM | 4.59.0 | traços | 5.0.5 | transformadores | 4.9.2 |
| digitador | 0.3.2 | extensões de digitação | 3.7.4.3 | Ujson | 4.0.2 |
| Atualizações automáticas | 0.1 | urllib3 | 1.25.11 | virtualenv | 20.4.1 |
| visões | 0.7.1 | Wasabi | 0.8.2 | largura de wc | 0.2.5 |
| Codificações Web | 0.5.1 | Websocket-cliente | 0.57.0 | Werkzeug | 1.0.1 |
| wheel | 0.36.2 | widgetsnbextension | 3.5.1 | embrulhado | 1.12.1 |
| xgboost | 1.4.2 | zipp | | 3.4.1 |
Pacotes Spark contendo módulos Python
| Pacote Spark | Módulo Python | Versão |
|---|---|---|
| GraphFrames | GraphFrames | 0.8.1-db6-faísca3.2 |
Bibliotecas R
As bibliotecas R são idênticas às bibliotecas R no Databricks Runtime 10.0.
Bibliotecas Java e Scala (cluster Scala 2.12)
Além das bibliotecas Java e Scala no Databricks Runtime 10.0, o Databricks Runtime 10.0 ML contém os seguintes JARs:
Clusters de CPU
| ID do Grupo | ID do Artefacto | Versão |
|---|---|---|
| com.typesafe.akka | akka-actor_2,12 | 2.5.23 |
| ml.combust.mleap | mleap-databricks-runtime_2.12 | 0.17.0-4882dc3 |
| ml.dmlc | xgboost4j-spark_2,12 | 1.4.1 |
| ml.dmlc | xgboost4j_2.12 | 1.4.1 |
| org.graphframes | graphframes_2.12 | 0.8.1-db6-faísca3.2 |
| org.mlflow | mlflow cliente | 1.20.2 |
| org.mlflow | mlflow-Spark | 1.20.2 |
| org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
| org.tensorflow | spark-tensorflow-connector_2.12 (conector de Spark para TensorFlow versão 2.12) | 1.15.0 |
Clusters de GPU
| ID do Grupo | ID do Artefacto | Versão |
|---|---|---|
| com.typesafe.akka | akka-actor_2,12 | 2.5.23 |
| ml.combust.mleap | mleap-databricks-runtime_2.12 | 0.17.0-4882dc3 |
| ml.dmlc | xgboost4j-gpu_2,12 | 1.4.1 |
| ml.dmlc | xgboost4j-faísca-gpu_2.12 | 1.4.1 |
| org.graphframes | graphframes_2.12 | 0.8.1-db6-faísca3.2 |
| org.mlflow | mlflow cliente | 1.20.2 |
| org.mlflow | mlflow-Spark | 1.20.2 |
| org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
| org.tensorflow | spark-tensorflow-connector_2.12 (conector de Spark para TensorFlow versão 2.12) | 1.15.0 |