Apache Spark bağlayıcısını kullanan SQL Veritabanları
Azure SQL Veritabanı ve SQL Server için Apache Spark bağlayıcısı, bu veritabanlarının Apache Spark işleri için giriş veri kaynakları ve çıkış veri havuzları olarak davranmasını sağlar. Büyük veri analizinde gerçek zamanlı işlem verilerini kullanmanıza ve geçici sorgular veya raporlama için sonuçları kalıcı hale almanızı sağlar.
Yerleşik JDBC bağlayıcısı ile karşılaştırıldığında, bu bağlayıcı SQL veritabanlarına toplu veri ekleme olanağı sağlar. 10x ile 20 kat daha hızlı performansla satır satır eklemeden daha iyi performansa sahip olabilir. SQL Server ve Azure SQL Veritabanı için Spark bağlayıcısı, Microsoft Entra ID (eski adıyla Azure Active Directory) kimlik doğrulamasını da destekleyerek Microsoft Entra ID hesabınızı kullanarak Azure Databricks'ten Azure SQL veritabanlarınıza güvenli bir şekilde bağlanmanızı sağlar. Yerleşik JDBC bağlayıcısına benzer arabirimler sağlar. Bu bağlayıcıyı kullanmak için mevcut Spark işlerinizi kolayca geçirebilirsiniz.
Gereksinimler
SQL Server için Spark bağlayıcısının iki sürümü vardır: biri Spark 2.4 ve biri Spark 3.x için. Spark 3.x bağlayıcısı Databricks Runtime 7.x veya üzerini gerektirir. Bağlayıcı topluluk tarafından desteklenir ve Microsoft SLA desteğini içermez. Yardım için topluluğun katılımını sağlamak için GitHub'da sorunları bildirin.
Bileşen | Desteklenen Sürümler |
---|---|
Apache Spark | 3.0.x ve 2.4x |
Databricks Runtime | Apache Spark 3.0 bağlayıcısı: Databricks Runtime 7.x ve üzeri |
Scala | Apache Spark 3.0 bağlayıcısı: 2.12 Apache Spark 2.4 bağlayıcısı: 2.11 |
SQL Server için Microsoft JDBC sürücüsü | 8.2 |
Microsoft SQL Server | SQL Server 2008 ve üzeri |
Azure SQL Veritabanı | Desteklenir |
Spark bağlayıcısını kullanma
Spark bağlayıcısını kullanma yönergeleri için bkz . Apache Spark bağlayıcısı: SQL Server ve Azure SQL.