Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Nota
Il supporto per questa versione di Databricks Runtime è terminato. Per la data di fine del supporto, vedere Cronologia di fine del supporto. Per tutte le versioni supportate di Databricks Runtime, vedere Note di rilascio sulle versioni e la compatibilità di Databricks Runtime.
Databricks Runtime 10.1 for Machine Learning fornisce un ambiente immediatamente disponibile ottimizzato per l'esecuzione di processi di apprendimento automatico e data science basati su Databricks Runtime 10.1 (EoS). Databricks Runtime per Machine Learning contiene molte di queste librerie, tra cui TensorFlow, PyTorch, Keras e XGBoost. È inoltre supportato il training distribuito di deep learning con Horovod.
Per altre informazioni, incluse le istruzioni per la creazione di un cluster di Machine Learning di Databricks Runtime, vedere Intelligenza artificiale e Machine Learning in Databricks.
Miglioramenti e nuove funzionalità
Databricks Runtime 10.1 ML è basato su Databricks Runtime 10.1. Per informazioni sulle novità di Databricks Runtime 10.1, tra cui Apache Spark MLlib e SparkR, vedere le note sulla versione di Databricks Runtime 10.1 (EoS).
Miglioramenti a AutoML
In Databricks Runtime 10.1 AutoML include un rilevamento semantico migliorato, nuovi avvisi per potenziali problemi di dati durante il training, nuove funzionalità per impedire l'overfitting dei modelli e la possibilità di suddividere il set di dati di input in set di training, convalida e test cronologicamente.
Rilevamenti di tipi semantici aggiuntivi
AutoML supporta ora il rilevamento di tipi semantici aggiuntivi:
- Le colonne numeriche che contengono etichette categoriche vengono considerate come un tipo categorico.
- Le colonne stringa che contengono testo in lingua inglese vengono considerate come una funzionalità di testo.
È ora anche possibile aggiungere annotazioni per specificare un tipo di dati della colonna. Per informazioni dettagliate, vedere Rilevamento dei tipi semantici.
Avvisi durante il training per potenziali problemi di dati
AutoML ora rileva e genera avvisi per potenziali problemi con il set di dati. Gli avvisi di esempio includono tipi di colonna non supportati e colonne di cardinalità elevata. Questi avvisi vengono visualizzati nella pagina dell'esperimento nella nuova scheda Avvisi . Altre informazioni sugli avvisi sono incluse nel notebook di esplorazione dei dati. Per altre informazioni, vedere Eseguire l'esperimento e monitorare i risultati.
Riduzione dell'overfitting del modello
Due nuove funzionalità riducono le probabilità di overfitting di un modello quando si usa AutoML:
- AutoML ora segnala le metriche di test in aggiunta alle metriche di convalida e training.
- AutoML ora usa l'arresto anticipato. Arresta il training e l'ottimizzazione dei modelli se la metrica di convalida non è più migliorata.
Suddividere il set di dati in set di allenamento/validazione/test in ordine cronologico
Per i problemi di classificazione e regressione, è possibile suddividere il set di dati in set di training, convalida e test in ordine cronologico. Per maggiori dettagli, vedere Dividere i dati in training, convalida e set di test
Miglioramenti al Feature Store di Databricks
Databricks Feature Store supporta ora tipi di dati aggiuntivi per le tabelle delle funzionalità: BinaryType, DecimalTypee MapType.
MLflow
I miglioramenti seguenti sono disponibili a partire da MLflow versione 1.21.0, incluso in Databricks Runtime 10.1 ML.
- [Modelli] Aggiornare il tipo di modello
fastaiper supportare fastai v2 (2.4.1 e più recenti). - [Modelli] Introdurre un modello mlflow.prophet per i modelli di serie temporali Prophet.
- [Assegnazione dei punteggi] Correggere un errore di imposizione dello schema che esegue un cast non corretto di stringhe simili a date in oggetti datetime.
Hyperopt
SparkTrials supporta ora il early_stopping_fn parametro per fmin. È possibile usare la funzione di arresto anticipato per specificare le condizioni in cui Hyperopt deve interrompere l'ottimizzazione degli iperparametri prima che venga raggiunto il numero massimo di valutazioni. Ad esempio, è possibile usare questo parametro per terminare l'ottimizzazione se la funzione obiettivo non diminuisce più. Per informazioni dettagliate, vedere fmin().
Modifiche principali all'ambiente ML Python di Databricks Runtime
Pacchetti Python aggiornati
- automl 1.3.1 => 1.4.1
- feature_store 0.3.4 => 0.3.5
- festività 0.11.2 => 0.11.3.1
- horovod 0.22.1 => 0.23.0
- hyperopt 0.2.5.db2 => 0.2.5.db4
- sbilanciato-learn 0.8.0 => 0.8.1
- lightgbm 3.1.1 => 3.3.0
- mlflow 1.20.2 => 1.21.0
- petastorm 0.11.2 => 0.11.3
- plotly 5.1.0 => 5.3.0
- pytorch 1.9.0 => 1.9.1
- spacy 3.1.2 => 3.1.3
- sparkdl 2.2.0_db3 => 2.2.0_db4
- torchvision 0.10.0 => 0.10.1
- trasformatori 4.9.2 => 4.11.3
Pacchetti Python aggiunti
- fasttext => 0.9.2
- tensorboard-plugin-profile => 2.5.0
Elementi deprecati
Il tracciamento MLflow automatizzato di MLlib è deprecato nei cluster che eseguono Databricks Runtime 10.1 ML e versioni successive. Usare invece l'autologging di MLflow PySpark ML chiamando mlflow.pyspark.ml.autolog(). L'autologging è abilitato per impostazione predefinita con Databricks Autologging.
Ambiente di sistema
L'ambiente di sistema in Databricks Runtime 10.1 ML differisce da Databricks Runtime 10.1 come indicato di seguito:
-
DBUtils: Databricks Runtime ML non include l'utilità libreria (dbutils.library) (legacy)..
Utilizzare i comandi
%pipinvece. Vedere Librerie Python a livello di notebook. - Per i cluster GPU, Databricks Runtime ML include le librerie GPU NVIDIA seguenti:
- CUDA 11.0
- cuDNN 8.0.5.39
- NCCL 2.10.3
- TensorRT 7.2.2
Librerie
Le sezioni seguenti elencano le librerie incluse in Databricks Runtime 10.1 ML che differiscono da quelle incluse in Databricks Runtime 10.1.
Contenuto della sezione:
Librerie di livello superiore
Databricks Runtime 10.1 ML include le seguenti librerie di livello superiore:
- GraphFrames
- Horovod e HorovodRunner
- MLflow
- PyTorch
- spark-tensorflow-connector (connettore per Spark e TensorFlow)
- TensorFlow
- TensorBoard
Librerie Python
Databricks Runtime 10.1 ML usa Virtualenv per la gestione dei pacchetti Python e include molti pacchetti di Machine Learning più diffusi.
Oltre ai pacchetti specificati nelle sezioni seguenti, Databricks Runtime 10.1 ML include anche i pacchetti seguenti:
- hyperopt 0.2.5.db4
- sparkdl 2.2.0-db4
- feature_store 0.3.5
- automl 1.4.0
Nota
Databricks Runtime 10.1 ML includa scikit-learn versione 0.24 anziché la versione 1.0 a causa di problemi di incompatibilità. Il pacchetto scikit-learn interagisce con molti altri pacchetti in Databricks Runtime 10.1 ML.
È possibile eseguire l'aggiornamento a scikit-learn versione 1.0; Tuttavia, Databricks non supporta questa versione.
Per eseguire l'aggiornamento, usare le librerie con ambito notebook. Da un notebook eseguire %pip install --upgrade "scikit-learn>=1.0,<1.1".
Un'alternativa consiste nell'usare questo script del cluster init:
#!/bin/bash
set -e
pip install --upgrade "scikit-learn>=1.0,<1.1"
Librerie Python su cluster CPU
| Biblioteca | Versione | Biblioteca | Versione | Biblioteca | Versione |
|---|---|---|---|---|---|
| absl-py | 0.11.0 | Antergos Linux | 10/2015 (ISO-Rolling) | appdirs | 1.4.4 |
| argon2-cffi | 20.1.0 | Astor | 0.8.1 | astunparse | 1.6.3 |
| generatore asincrono (async-generator) | 1.10 | att. | 20.3.0 | richiamata | 0.2.0 |
| bcrypt | 3.2.0 | candeggiare | 3.3.0 | blis | 0.7.4 |
| boto3 | 1.16.7 | botocore | 1.19.7 | cachetools (strumento per la gestione della cache) | 4.2.4 |
| catalogo | 2.0.6 | certificato | 2020.12.5 | cffi | 1.14.5 |
| chardet | 4.0.0 | Clang | 5.0 | clic | 7.1.2 |
| cloudpickle (libreria Python per la serializzazione degli oggetti) | 1.6.0 | cmdstanpy | 0.9.68 | configparser (analizzatore di configurazione) | 5.0.1 |
| convertdate | 2.3.2 | criptografia | 3.4.7 | ciclatore | 0.10.0 |
| cymem | 2.0.5 | Cython, un linguaggio di programmazione | 0.29.23 | databricks-automl-runtime | 0.2.3 |
| databricks-cli | 0.14.3 | dbus-python | 1.2.16 | decoratore | 5.0.6 |
| defusedxml (una libreria per migliorare la sicurezza nell'elaborazione di XML) | 0.7.1 | aneto | 0.3.2 | cache del disco | 5.2.1 |
| distlib | 0.3.3 | informazioni sulla distribuzione | 0.23ubuntu1 | punti di ingresso | 0,3 |
| ephem | 4.1 | panoramica delle facce | 1.0.0 | fasttext | 0.9.2 |
| blocco dei file | 3.0.12 | Fiaschetta | 1.1.2 | FlatBuffers | 1.12 |
| fsspec | 0.9.0 | futuro | 0.18.2 | Gast | 0.4.0 |
| gitdb | 4.0.7 | gitpython | 3.1.12 | google-auth (autenticazione Google) | 1.22.1 |
| google-auth-oauthlib | 0.4.2 | Google-Pasta | 0.2.0 | grpcio | 1.39.0 |
| gunicorn | 20.0.4 | gviz-api | 1.10.0 | h5py | 3.1.0 |
| hijri-converter | 2.2.2 | vacanze | 0.11.3.1 | Horovod | 0.23.0 |
| htmlmin (strumento per la minimizzazione del codice HTML) | 0.1.12 | huggingface-hub | 0.0.19 | IDNA | 2.10 |
| ImageHash | 4.2.1 | imbalanced-learn (una libreria di apprendimento automatico per la gestione dei set di dati sbilanciati) | 0.8.1 | importlib-metadata | 3.10.0 |
| ipykernel | 5.3.4 | ipython | 7.22.0 | ipython-genutils | 0.2.0 |
| ipywidgets (una libreria Python per widget interattivi) | 7.6.3 | isodate | 0.6.0 | it’s dangerous | 1.1.0 |
| jedi | 0.17.2 | Jinja2 | 2.11.3 | jmespath | 0.10.0 |
| joblib | 1.0.1 | joblibspark | 0.3.0 | jsonschema | 3.2.0 |
| jupyter-client | 6.1.12 | jupyter-core | 4.7.1 | jupyterlab-pygments | 0.1.2 |
| jupyterlab-widgets | 1.0.0 | Keras | 2.6.0 | keras-preprocessing | 1.1.2 |
| kiwisolver | 1.3.1 | koala | 1.8.2 | calendario lunare coreano | 0.2.1 |
| lightgbm | 3.3.0 | llvmlite | 0.37.0 | Calendario Lunare | 0.0.9 |
| Mako | 1.1.3 | Markdown | 3.3.3 | MarkupSafe | 2.0.1 |
| matplotlib | 3.4.2 | missingno | 0.5.0 | Mistune | 0.8.4 |
| mleap | 0.18.1 | mlflow versione leggera | 1.21.0 | multimetodo | 1.6 |
| mormurhash | 1.0.5 | nbclient | 0.5.3 | nbconvert | 6.0.7 |
| nbformat | 5.1.3 | nest-asyncio | 1.5.1 | networkx | 2,5 |
| nltk (Natural Language Toolkit) | 3.6.1 | taccuino | 6.3.0 | nmbalo | 0.54.1 |
| numpy | 1.19.2 | oauthlib | 3.1.0 | opt-einsum | 3.3.0 |
| imballaggio | 20.9 | Panda | 1.2.4 | pandas-profiling | 3.1.0 |
| pandocfilters | 1.4.3 | paramiko | 2.7.2 | parso | 0.7.0 |
| patia | 0.6.0 | capro espiatorio | 0.5.1 | Petastorm | 0.11.3 |
| pexpect | 4.8.0 | phik | 0.12.0 | pickleshare (libreria di software Python) | 0.7.5 |
| Cuscino | 8.2.0 | seme | 21.0.1 | plotly (software di visualizzazione dati) | 5.3.0 |
| (Note: Without context, a definitive improved translation cannot be accurately proposed). | 3.0.5 | prometheus-client | 0.10.1 | prompt-toolkit | 3.0.17 |
| profeta | 1.0.1 | protobuf | 3.17.2 | psutil | 5.8.0 |
| Psycopg2 | 2.8.5 | ptyprocess | 0.7.0 | pyarrow | 4.0.0 |
| pyasn1 | 0.4.8 | pyasn1-modules | 0.2.8 | pybind11 | 2.8.0 |
| pycparser (un parser scritto in Python) | 2.20 | pydantic | 1.8.2 | Pygments | 2.8.1 |
| PyGObject | 3.36.0 | PyMeeus | 0.5.11 | PyNaCl | 1.4.0 |
| pyodbc | 4.0.30 | pyparsing | 2.4.7 | pirsistente | 0.17.3 |
| pystan | 2.19.1.1 | python-apt | 2.0.0+ubuntu0.20.4.6 | python-dateutil (libreria Python per la gestione delle date) | 2.8.1 |
| Editor di Python | 1.0.4 | pytz | 2020.5 | PyWavelets | 1.1.1 |
| PyYAML | 5.4.1 | pyzmq | 20.0.0 | regex | 2021.4.4 |
| richieste | 2.25.1 | requests-oauthlib | 1.3.0 | requests-unixsocket | 0.2.0 |
| RSA | 4.7.2 | s3transfer | 0.3.7 | sacrimoses | 0.0.46 |
| scikit-learn | 0.24.1 | scipy | 1.6.2 | Seaborn | 0.11.1 |
| Send2Trash | 1.5.0 | setuptools (pacchetto Python per gestire la configurazione e la distribuzione) | 52.0.0 | setuptools-git | 1,2 |
| forma | 0.39.0 | simplejson | 3.17.2 | sei | 1.15.0 |
| strumento di taglio | 0.0.7 | Apertura intelligente | 5.2.0 | smmap | 3.0.5 |
| spaCy | 3.1.3 | spacy-legacy | 3.0.8 | spark-tensorflow-distributor | 1.0.0 |
| sqlparse | 0.4.1 | srsl | 2.4.1 | ssh-import-id (comando per l'importazione di chiavi SSH) | 5.10 |
| statsmodels | 0.12.2 | tabulare | 0.8.7 | aggrovigliato-up-in-unicode | 0.1.0 |
| tenacia | 6.2.0 | TensorBoard | 2.6.0 | server di dati di TensorBoard | 0.6.1 |
| plugin di profilazione per tensorboard | 2.5.0 | tensorboard-plugin-wit | 1.8.0 | tensorflow-cpu | 2.6.0 |
| Stima di tensore tensorflow | 2.6.0 | termcolor | 1.1.0 | terminato | 0.9.4 |
| percorso di test | 0.4.4 | thinc | 8.0.9 | threadpoolctl | 2.1.0 |
| segmentatori | 0.10.3 | Torch | 1.9.1+CPU | visione della torcia | 0.10.1+CPU |
| tornado | 6.1 | tqdm | 4.59.0 | traitlets (una libreria per la configurazione dei parametri nei programmi Python) | 5.0.5 |
| Convertitori | 4.11.3 | Typer | 0.3.2 | tipizzazione di estensioni | 3.7.4.3 |
| ujson (una libreria per la gestione di JSON in Python) | 4.0.2 | aggiornamenti non presidiati | 0,1 | urllib3 | 1.25.11 |
| virtualenv | 20.4.1 | Visione | 0.7.4 | wasabi | 0.8.2 |
| wcwidth (funzione per determinare la larghezza dei caratteri) | 0.2.5 | codifiche web | 0.5.1 | cliente WebSocket | 0.57.0 |
| Attrezzo | 1.0.1 | ruota | 0.36.2 | widgetsnbextension | 3.5.1 |
| avvolto | 1.12.1 | xgboost | 1.4.2 | Zipp | 3.4.1 |
Librerie Python nei cluster GPU
| Biblioteca | Versione | Biblioteca | Versione | Biblioteca | Versione |
|---|---|---|---|---|---|
| absl-py | 0.11.0 | Antergos Linux | 10/2015 (ISO-Rolling) | appdirs | 1.4.4 |
| argon2-cffi | 20.1.0 | Astor | 0.8.1 | astunparse | 1.6.3 |
| generatore asincrono (async-generator) | 1.10 | att. | 20.3.0 | richiamata | 0.2.0 |
| bcrypt | 3.2.0 | candeggiare | 3.3.0 | blis | 0.7.4 |
| boto3 | 1.16.7 | botocore | 1.19.7 | cachetools (strumento per la gestione della cache) | 4.2.4 |
| catalogo | 2.0.6 | certificato | 2020.12.5 | cffi | 1.14.5 |
| chardet | 4.0.0 | Clang | 5.0 | clic | 7.1.2 |
| cloudpickle (libreria Python per la serializzazione degli oggetti) | 1.6.0 | cmdstanpy | 0.9.68 | configparser (analizzatore di configurazione) | 5.0.1 |
| convertdate | 2.3.2 | criptografia | 3.4.7 | ciclatore | 0.10.0 |
| cymem | 2.0.5 | Cython, un linguaggio di programmazione | 0.29.23 | databricks-automl-runtime | 0.2.3 |
| databricks-cli | 0.14.3 | dbus-python | 1.2.16 | decoratore | 5.0.6 |
| defusedxml (una libreria per migliorare la sicurezza nell'elaborazione di XML) | 0.7.1 | aneto | 0.3.2 | cache del disco | 5.2.1 |
| distlib | 0.3.3 | informazioni sulla distribuzione | 0.23ubuntu1 | punti di ingresso | 0,3 |
| ephem | 4.1 | panoramica delle facce | 1.0.0 | fasttext | 0.9.2 |
| blocco dei file | 3.0.12 | Fiaschetta | 1.1.2 | FlatBuffers | 1.12 |
| fsspec | 0.9.0 | futuro | 0.18.2 | Gast | 0.4.0 |
| gitdb | 4.0.7 | gitpython | 3.1.12 | google-auth (autenticazione Google) | 1.22.1 |
| google-auth-oauthlib | 0.4.2 | Google-Pasta | 0.2.0 | grpcio | 1.39.0 |
| gunicorn | 20.0.4 | gviz-api | 1.10.0 | h5py | 3.1.0 |
| hijri-converter | 2.2.2 | vacanze | 0.11.3.1 | Horovod | 0.23.0 |
| htmlmin (strumento per la minimizzazione del codice HTML) | 0.1.12 | huggingface-hub | 0.0.19 | IDNA | 2.10 |
| ImageHash | 4.2.1 | imbalanced-learn (una libreria di apprendimento automatico per la gestione dei set di dati sbilanciati) | 0.8.1 | importlib-metadata | 3.10.0 |
| ipykernel | 5.3.4 | ipython | 7.22.0 | ipython-genutils | 0.2.0 |
| ipywidgets (una libreria Python per widget interattivi) | 7.6.3 | isodate | 0.6.0 | it’s dangerous | 1.1.0 |
| jedi | 0.17.2 | Jinja2 | 2.11.3 | jmespath | 0.10.0 |
| joblib | 1.0.1 | joblibspark | 0.3.0 | jsonschema | 3.2.0 |
| jupyter-client | 6.1.12 | jupyter-core | 4.7.1 | jupyterlab-pygments | 0.1.2 |
| jupyterlab-widgets | 1.0.0 | Keras | 2.6.0 | keras-preprocessing | 1.1.2 |
| kiwisolver | 1.3.1 | koala | 1.8.2 | calendario lunare coreano | 0.2.1 |
| lightgbm | 3.3.0 | llvmlite | 0.37.0 | Calendario Lunare | 0.0.9 |
| Mako | 1.1.3 | Markdown | 3.3.3 | MarkupSafe | 2.0.1 |
| matplotlib | 3.4.2 | missingno | 0.5.0 | Mistune | 0.8.4 |
| mleap | 0.18.1 | mlflow versione leggera | 1.21.0 | multimetodo | 1.6 |
| mormurhash | 1.0.5 | nbclient | 0.5.3 | nbconvert | 6.0.7 |
| nbformat | 5.1.3 | nest-asyncio | 1.5.1 | networkx | 2,5 |
| nltk (Natural Language Toolkit) | 3.6.1 | taccuino | 6.3.0 | nmbalo | 0.54.1 |
| numpy | 1.19.2 | oauthlib | 3.1.0 | opt-einsum | 3.3.0 |
| imballaggio | 20.9 | Panda | 1.2.4 | pandas-profiling | 3.1.0 |
| pandocfilters | 1.4.3 | paramiko | 2.7.2 | parso | 0.7.0 |
| patia | 0.6.0 | capro espiatorio | 0.5.1 | Petastorm | 0.11.3 |
| pexpect | 4.8.0 | phik | 0.12.0 | pickleshare (libreria di software Python) | 0.7.5 |
| Cuscino | 8.2.0 | seme | 21.0.1 | plotly (software di visualizzazione dati) | 5.3.0 |
| (Note: Without context, a definitive improved translation cannot be accurately proposed). | 3.0.5 | prompt-toolkit | 3.0.17 | profeta | 1.0.1 |
| protobuf | 3.17.2 | psutil | 5.8.0 | Psycopg2 | 2.8.5 |
| ptyprocess | 0.7.0 | pyarrow | 4.0.0 | pyasn1 | 0.4.8 |
| pyasn1-modules | 0.2.8 | pybind11 | 2.8.1 | pycparser (un parser scritto in Python) | 2.20 |
| pydantic | 1.8.2 | Pygments | 2.8.1 | PyGObject | 3.36.0 |
| PyMeeus | 0.5.11 | PyNaCl | 1.4.0 | pyodbc | 4.0.30 |
| pyparsing | 2.4.7 | pirsistente | 0.17.3 | pystan | 2.19.1.1 |
| python-apt | 2.0.0+ubuntu0.20.4.6 | python-dateutil (libreria Python per la gestione delle date) | 2.8.1 | Editor di Python | 1.0.4 |
| pytz | 2020.5 | PyWavelets | 1.1.1 | PyYAML | 5.4.1 |
| pyzmq | 20.0.0 | regex | 2021.4.4 | richieste | 2.25.1 |
| requests-oauthlib | 1.3.0 | requests-unixsocket | 0.2.0 | RSA | 4.7.2 |
| s3transfer | 0.3.7 | sacrimoses | 0.0.46 | scikit-learn | 0.24.1 |
| scipy | 1.6.2 | Seaborn | 0.11.1 | Send2Trash | 1.5.0 |
| setuptools (pacchetto Python per gestire la configurazione e la distribuzione) | 52.0.0 | setuptools-git | 1,2 | forma | 0.39.0 |
| simplejson | 3.17.2 | sei | 1.15.0 | strumento di taglio | 0.0.7 |
| Apertura intelligente | 5.2.0 | smmap | 3.0.5 | spaCy | 3.1.3 |
| spacy-legacy | 3.0.8 | spark-tensorflow-distributor | 1.0.0 | sqlparse | 0.4.1 |
| srsl | 2.4.1 | ssh-import-id (comando per l'importazione di chiavi SSH) | 5.10 | statsmodels | 0.12.2 |
| tabulare | 0.8.7 | aggrovigliato-up-in-unicode | 0.1.0 | tenacia | 6.2.0 |
| TensorBoard | 2.6.0 | server di dati di TensorBoard | 0.6.1 | plugin di profilazione per tensorboard | 2.5.0 |
| tensorboard-plugin-wit | 1.8.0 | TensorFlow | 2.6.0 | Stima di tensore tensorflow | 2.6.0 |
| termcolor | 1.1.0 | terminato | 0.9.4 | percorso di test | 0.4.4 |
| thinc | 8.0.9 | threadpoolctl | 2.1.0 | segmentatori | 0.10.3 |
| Torch | 1.9.1+cu111 | visione della torcia | 0.10.1+cu111 | tornado | 6.1 |
| tqdm | 4.59.0 | traitlets (una libreria per la configurazione dei parametri nei programmi Python) | 5.0.5 | Convertitori | 4.11.3 |
| Typer | 0.3.2 | tipizzazione di estensioni | 3.7.4.3 | ujson (una libreria per la gestione di JSON in Python) | 4.0.2 |
| aggiornamenti non presidiati | 0,1 | urllib3 | 1.25.11 | virtualenv | 20.4.1 |
| Visione | 0.7.4 | wasabi | 0.8.2 | wcwidth (funzione per determinare la larghezza dei caratteri) | 0.2.5 |
| codifiche web | 0.5.1 | cliente WebSocket | 0.57.0 | Attrezzo | 1.0.1 |
| ruota | 0.36.2 | widgetsnbextension | 3.5.1 | avvolto | 1.12.1 |
| xgboost | 1.4.2 | Zipp | 3.4.1 |
Pacchetti Spark contenenti moduli Python
| Pacchetto Spark | Modulo Python | Versione |
|---|---|---|
| GraphFrames | GraphFrames | 0.8.2-db1-spark3.2 |
Librerie R
Le librerie R sono identiche alle R Libraries in Databricks Runtime 10.1.
Librerie Java e Scala (cluster Scala 2.12)
Oltre alle librerie Java e Scala in Databricks Runtime 10.1, Databricks Runtime 10.1 ML contiene i file JAR seguenti:
Cluster di CPU
| ID del gruppo | ID artefatto | Versione |
|---|---|---|
| com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
| ml.combust.mleap | mleap-databricks-runtime_2.12 | 0.17.0-4882dc3 |
| ml.dmlc | xgboost4j-spark_2.12 | 1.4.1 |
| ml.dmlc | xgboost4j_2.12 | 1.4.1 |
| org.graphframes | graphframes_2.12 | 0.8.1-db6-spark3.2 |
| org.mlflow | mlflow-client | 1.20.2 |
| org.mlflow | mlflow-spark | 1.20.2 |
| org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
| org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |
Cluster GPU
| ID del gruppo | ID artefatto | Versione |
|---|---|---|
| com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
| ml.combust.mleap | mleap-databricks-runtime_2.12 | 0.18.1-23eb1ef |
| ml.dmlc | xgboost4j-gpu_2.12 | 1.4.1 |
| ml.dmlc | xgboost4j-spark-gpu_2.12 | 1.4.1-spark3.2 |
| org.graphframes | graphframes_2.12 | 0.8.2-db1-spark3.2 |
| org.mlflow | mlflow-client | 1.21.0 |
| org.mlflow | mlflow-spark | 1.21.0 |
| org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
| org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |