Megosztás a következőn keresztül:


Apache Spark-összekötőt használó SQL-adatbázisok

Az Azure SQL Database-hez és az SQL Serverhez készült Apache Spark-összekötő lehetővé teszi, hogy ezek az adatbázisok bemeneti adatforrásként és kimeneti adatgyűjtőként működjenek az Apache Spark-feladatokhoz. Lehetővé teszi, hogy valós idejű tranzakciós adatokat használjon big data-elemzésekben, és megőrizze az eredményeket alkalmi lekérdezésekhez vagy jelentésekhez.

A beépített JDBC-összekötőhöz képest ez az összekötő lehetővé teszi az adatok tömeges beszúrását az SQL-adatbázisokba. 10-20-szor gyorsabb teljesítménnyel képes felülmúlni a sorról sorra történő beszúrást. Az SQL Serverhez és az Azure SQL Database-hez készült Spark-összekötő a Microsoft Entra ID (korábbi nevén Azure Active Directory) hitelesítést is támogatja, így biztonságosan csatlakozhat azure SQL-adatbázisaihoz az Azure Databricksből a Microsoft Entra ID-fiókjával. A beépített JDBC-összekötőhöz hasonló felületeket biztosít. A meglévő Spark-feladatokat egyszerűen migrálhatja az összekötő használatához.

Követelmények

Az SQL Server Spark-összekötőjének két verziója létezik: egy a Spark 2.4-hez, egy pedig a Spark 3.x-hez. A Spark 3.x-összekötőhöz a Databricks Runtime 7.x vagy újabb verziója szükséges. Az összekötő közösségi támogatással rendelkezik, és nem tartalmazza a Microsoft SLA-támogatását. A GitHubon felmerülő problémákat elküldve segítséget kaphat a közösséghez.

Összetevő Támogatott verziók
Apache Spark 3.0.x és 2.4x
A Databricks futtatókörnyezete Apache Spark 3.0-összekötő: Databricks Runtime 7.x vagy újabb
Scala Apache Spark 3.0-összekötő: 2.12

Apache Spark 2.4-összekötő: 2.11
Microsoft JDBC-illesztőprogram SQL Serverhez 8.2
Microsoft SQL Server SQL Server 2008 vagy újabb
Azure SQL Database Támogatott

A Spark-összekötő használata

A Spark-összekötő használatára vonatkozó utasításokért tekintse meg az Apache Spark-összekötőt: SQL Server & Azure SQL.