Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Importante
Cette documentation a été mise hors service et peut ne pas être mise à jour. Les produits, services ou technologies mentionnés dans ce contenu ne sont plus pris en charge.
Dans cette archive, vous trouverez des versions antérieures de la documentation pour Azure Databricks produits, fonctionnalités, API et workflows.
Administration
Calcul
- Créer une interface utilisateur de cluster (héritée)
- Aperçu de l’interface utilisateur du cluster
- Installer une bibliothèque avec un script init (hérité)
- Scripts init nommés par cluster (hérités)
- Scripts init globaux (anciens)
Outils de développement
- Tableaux de bord hérités
- Migrer à partir d'anciens tableaux de bord
- Supprimer les fonctionnalités de la table Delta (héritée)
- UniForm IcebergCompatV1 hérité
- Lire des tables Databricks depuis des clients Apache Iceberg (ancien)
- Écritures transactionnelles dans le stockage cloud avec DBIO
- Table Hive (héritée)
- Optimisation des jointures déséquilibrées à l’aide d'indicateurs de déséquilibre
- Koalas
-
Gérer les bibliothèques avec des commandes
%conda(héritées) - Bibliothèques d’espaces de travail (héritées)
- Explorer et créer des tables dans DBFS
- FileStore
- Parcourir les fichiers dans DBFS
- Interface CLI Databricks ancienne
- Qu’est-ce que dbx by Databricks Labs ?
- dbutils.library
- Migrer vers Spark 3.x
- VSCode avec dossiers Git
- Répertoire de l’espace de travail VS Code
- Fournisseur de ressources Pulumi Databricks
Gouvernance
- Metastores externes (hérité)
- Créer un stockage managé Unity Catalog en utilisant un principal de service (hérité)
- Transition de la version bêta aBAC vers la préversion publique
- Mise à niveau vers l’héritage des privilèges
- Passage des informations d’identification (hérité)
Machine Learning et intelligence artificielle
- Service LLM optimisé
- Migrer des points de terminaison optimisés de mise en service de LLM vers le débit approvisionné
- Service de modèles (hérité)
- Partager des tables de fonctionnalités entre espaces de travail (ancien)
- Exportation de modèle ML MLeap
- Entraînement distribué avec TensorFlow 2
- Horovod
- Inférence de modèle en utilisant Hugging Face Transformers pour NLP
- Entraîner un modèle PySpark et l’enregistrer au format MLeap
-
Configuration et considérations pour
ai_generate_text() -
Analyser les avis des clients avec
ai_generate_text()et OpenAI - Apache Spark MLlib et suivi MLflow automatisé
- Charger des données à l’aide de Petastorm
MLflow
Cahiers
Partners
Notes de publication
Repos et le contrôle de code source Git
Sécurité
- Schémas de journal d’audit pour la surveillance de la sécurité
- Meilleures pratiques de stratégies de calcul
Stockage
- Connexion Azure Databricks et Azure Synapse avec PolyBase (hérité)
- Source de fichiers de Stockage Blob Azure avec Stockage File d'attente Azure (versions antérieures)
- Azure Cosmos DB
- Écritures de streaming structurée dans Azure Synapse
- Neo4j
-
Lire et écrire des données XML à l’aide de la bibliothèque
spark-xml - Se connecter à des systèmes externes
- Interroger des bases de données en utilisant JDBC
- Query PostgreSQL avec Azure Databricks
- Query MySQL avec Azure Databricks
- Query MariaDB avec Azure Databricks
- Query SQL Server avec Azure Databricks
- Utiliser le connecteur Databricks pour se connecter à un autre espace de travail Databricks
- Amazon S3 Select
- MongoDB
- Cassandre
- Couchbase
- ElasticSearch
- Google BigQuery
- Lire et écrire des données à partir de Snowflake
- données Query dans Azure Synapse Analytics
- Connectez-vous au pool dédié Azure Synapse Analytics
- Query Amazon Redshift à l’aide de Azure Databricks
- Bases de données SQL utilisant le connecteur Apache Spark
- Configurer la capture DDL et l'évolution du schéma
- Activer le suivi des modifications dans Microsoft SQL Server
- Activer le cdc intégré dans Microsoft SQL Server
- Configurer les identifiants de stockage Delta
- Se connecter à Stockage Blob Azure avec WASB (ancien)
- Tutorial : Se connecter à Azure Data Lake Storage
- Configurer l’accès au stockage d’objets cloud pour Azure Databricks à l’aide de modèles hérités
- Connectez-vous à Azure Data Lake Storage et Stockage Blob
- Accéder au stockage à l’aide d’un principal de service et de Microsoft Entra ID (Azure Active Directory)
- Se connecter à Google Cloud Storage
- Se connecter à Amazon S3