Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of mappen te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen om mappen te wijzigen.
U kunt RStudio, een populaire IDE (Integrated Development Environment) voor R, gebruiken om verbinding te maken met Azure Databricks-rekenresources in Azure Databricks-werkruimten vanaf uw lokale ontwikkelcomputer.
RStudio Desktop instellen
RStudio Desktop instellen op uw lokale ontwikkelcomputer:
- Download en installeer R 3.3.0 of hoger.
- Download en installeer RStudio Desktop.
- Start RStudio Desktop.
(Optioneel) Een RStudio-project maken:
- Start RStudio Desktop.
- Klik op Bestand > Nieuw Project.
- Selecteer Nieuwe map > Nieuw project.
- Kies een nieuwe map voor het project en klik vervolgens op Project maken.
Een R-script maken:
- Klik terwijl het project is geopend op Bestand > Nieuw bestand > R Script.
- Klik op Bestand > opslaan als.
- Geef het bestand een naam en klik vervolgens op Opslaan.
Verbinding maken met Databricks
Als u RStudio Desktop wilt gebruiken om verbinding te maken met een extern Azure Databricks-cluster of SQL Warehouse vanaf uw lokale ontwikkelcomputer, gebruikt u een ODBC-verbinding en roept u ODBC-pakketfuncties aan voor R.
Notitie
U kunt geen pakketten zoals SparkR of sparklyr gebruiken in dit RStudio Desktop-scenario, tenzij u ook Databricks Connect gebruikt.
Verbinding maken met het externe Azure Databricks-cluster of SQL Warehouse via ODBC voor R:
Haal de waarden voor de serverhostnaam, poort en HTTP-pad op voor uw externe cluster of SQL Warehouse voor een cluster. Deze waarden bevinden zich op het tabblad JDBC/ODBC van geavanceerde opties. Voor een SQL-warehouse bevinden deze waarden zich op het tabblad Verbindingsgegevens.
Haal een Azure Databricks-toegangstoken voor persoonlijk gebruik op.
Notitie
Als best practice voor beveiliging, wanneer u zich verifieert met geautomatiseerde hulpprogramma's, systemen, scripts en apps, raadt Databricks u aan om persoonlijke toegangstokens te gebruiken die behoren tot service-principals in plaats van werkruimtegebruikers. Om tokens voor service-principals te maken, zie Tokens voor een service-principal beheren.
Installeer en configureer het ODBC-stuurprogramma van Databricks voor uw besturingssysteem.
Stel een ODBC-gegevensbronnaam (DSN) in op uw externe cluster of SQL Warehouse voor Windows, macOS of Linux, op basis van het besturingssysteem van uw lokale computer.
Installeer vanuit de RStudio-console (View > Move Focus to Console) de odbc - en DBI-pakketten van CRAN:
require(devtools) install_version( package = "odbc", repos = "http://cran.us.r-project.org" ) install_version( package = "DBI", repos = "http://cran.us.r-project.org" )Laad de geïnstalleerde > bestanden en pakketten in uw R-script (
DBI):library(odbc) library(DBI)Roep de ODBC-versie van de dbConnect-functie aan in het
DBIpakket, waarbij u hetodbcstuurprogramma in hetodbcpakket en de ODBC DSN opgeeft die u hebt gemaakt, bijvoorbeeld een ODBC DSN vanDatabricks.conn = dbConnect( drv = odbc(), dsn = "Databricks" )Roep een bewerking aan via de ODBC-DSN, bijvoorbeeld een
SELECTinstructie via de dbGetQuery-functie in hetDBIpakket, waarbij u de naam van de verbindingsvariabele en deSELECTinstructie zelf opgeeft, bijvoorbeeld uit een tabel met de naamdiamondsdefaultin een schema (database):print(dbGetQuery(conn, "SELECT * FROM default.diamonds LIMIT 2"))
Het volledige R-script is als volgt:
library(odbc)
library(DBI)
conn = dbConnect(
drv = odbc(),
dsn = "Databricks"
)
print(dbGetQuery(conn, "SELECT * FROM default.diamonds LIMIT 2"))
Als u het script wilt uitvoeren, klikt u in de bronweergave op Bron. De resultaten voor het voorgaande R-script zijn als volgt:
_c0 carat cut color clarity depth table price x y z
1 1 0.23 Ideal E SI2 61.5 55 326 3.95 3.98 2.43
2 2 0.21 Premium E SI1 59.8 61 326 3.89 3.84 2.31