Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Vous pouvez utiliser RStudio, un environnement de développement intégré (IDE) populaire pour R, pour vous connecter aux ressources de calcul Azure Databricks au sein d’espaces de travail Azure Databricks à partir de votre ordinateur de développement local.
Configurer RStudio Desktop
Pour configurer RStudio Desktop sur votre ordinateur de développement local :
- Téléchargez et installez R 3.3.0 ou une version ultérieure.
- Téléchargez et installez RStudio Desktop.
- Démarrez RStudio Desktop.
(Facultatif) Pour créer un projet RStudio :
- Démarrez RStudio Desktop.
- Cliquez sur Fichier > Nouveau projet.
- Sélectionnez Nouveau répertoire > Nouveau projet.
- Choisissez un nouveau répertoire pour le projet, puis cliquez sur Créer un projet.
Pour créer un script R :
- Une fois le projet ouvert, cliquez sur Fichier > Nouveau fichier > Script R.
- Cliquez sur Fichier > Enregistrer sous.
- Nommez le fichier, puis cliquez sur Enregistrer.
Se connecter à Databricks
Pour utiliser RStudio Desktop pour vous connecter à un cluster Azure Databricks distant ou à un entrepôt SQL à partir de votre ordinateur de développement local, utilisez une connexion ODBC et appelez des fonctions de package ODBC pour R.
Notes
Vous ne pouvez pas utiliser de packages tels que SparkR ou sparklyr dans ce scénario RStudio Desktop, sauf si vous utilisez également Databricks Connect.
Pour vous connecter au cluster Azure Databricks ou à l’entrepôt SQL distant via ODBC pour R :
Obtenez le nom d’hôte du serveur, le port et les valeurs de chemin HTTP pour votre cluster distant ou votre entrepôt SQL Pour un cluster, ces valeurs se trouvent sous l’onglet JDBC/ODBC des options avancées. Pour un entrepôt SQL, ces valeurs se trouvent sous l’onglet Détails de la connexion.
Obtenez un jeton d’accès personnel Azure Databricks.
Notes
En guise de bonne pratique de sécurité, quand vous vous authentifiez avec des outils, systèmes, scripts et applications automatisés, Databricks recommande d’utiliser des jetons d’accès personnels appartenant à des principaux de service et non des utilisateurs de l’espace de travail. Pour créer des jetons d’accès pour des principaux de service, consultez la section Gérer les jetons pour un principal de service.
Installez et configurez le pilote ODBC Databricks pour votre système d’exploitation.
Configurez un nom de source de données ODBC (DSN) sur votre cluster distant ou votre entrepôt SQL pour Windows, macOS ou Linux, en fonction du système d’exploitation de votre ordinateur local.
À partir de la console RStudio (Afficher > Déplacer le focus sur la console), installez les packages ODBC et DBI à partir de CRAN :
require(devtools) install_version( package = "odbc", repos = "http://cran.us.r-project.org" ) install_version( package = "DBI", repos = "http://cran.us.r-project.org" )Dans votre script R (Afficher > le focus de déplacement vers la source), chargez les packages installés
odbcetDBIpackages :library(odbc) library(DBI)Appelez la version ODBC de la fonction dbConnect dans le
DBIpackage, en spécifiant leodbcpilote dans leodbcpackage et le DSN ODBC que vous avez créés, par exemple, un DSN ODBC deDatabricks.conn = dbConnect( drv = odbc(), dsn = "Databricks" )Appelez une opération via le DSN ODBC, par exemple une
SELECTinstruction via la fonction dbGetQuery dans leDBIpackage, en spécifiant le nom de la variable de connexion et l’instructionSELECTelle-même, par exemple à partir d’une table nomméediamondsdans un schéma (base de données) nommédefault:print(dbGetQuery(conn, "SELECT * FROM default.diamonds LIMIT 2"))
Le script R complet est le suivant :
library(odbc)
library(DBI)
conn = dbConnect(
drv = odbc(),
dsn = "Databricks"
)
print(dbGetQuery(conn, "SELECT * FROM default.diamonds LIMIT 2"))
Pour exécuter le script, en mode source, cliquez sur Source. Les résultats du script R précédent sont les suivants :
_c0 carat cut color clarity depth table price x y z
1 1 0.23 Ideal E SI2 61.5 55 326 3.95 3.98 2.43
2 2 0.21 Premium E SI1 59.8 61 326 3.89 3.84 2.31