Aracılığıyla paylaş


Apache Spark bağlayıcısını kullanan SQL Veritabanları

Azure SQL Veritabanı ve SQL Server için Apache Spark bağlayıcısı, bu veritabanlarının Apache Spark işleri için giriş veri kaynakları ve çıkış veri havuzları olarak davranmasını sağlar. Büyük veri analizinde gerçek zamanlı işlem verilerini kullanmanıza ve geçici sorgular veya raporlama için sonuçları kalıcı hale almanızı sağlar.

Yerleşik JDBC bağlayıcısı ile karşılaştırıldığında, bu bağlayıcı SQL veritabanlarına toplu veri ekleme olanağı sağlar. 10x ile 20 kat daha hızlı performansla satır satır eklemeden daha iyi performansa sahip olabilir. SQL Server ve Azure SQL Veritabanı için Spark bağlayıcısı, Microsoft Entra ID (eski adıyla Azure Active Directory) kimlik doğrulamasını da destekleyerek Microsoft Entra ID hesabınızı kullanarak Azure Databricks'ten Azure SQL veritabanlarınıza güvenli bir şekilde bağlanmanızı sağlar. Yerleşik JDBC bağlayıcısına benzer arabirimler sağlar. Bu bağlayıcıyı kullanmak için mevcut Spark işlerinizi kolayca geçirebilirsiniz.

Gereksinimler

SQL Server için Spark bağlayıcısının iki sürümü vardır: biri Spark 2.4 ve biri Spark 3.x için. Spark 3.x bağlayıcısı Databricks Runtime 7.x veya üzerini gerektirir. Bağlayıcı topluluk tarafından desteklenir ve Microsoft SLA desteğini içermez. Yardım için topluluğun katılımını sağlamak için GitHub'da sorunları bildirin.

Bileşen Desteklenen Sürümler
Apache Spark 3.0.x ve 2.4x
Databricks Runtime Apache Spark 3.0 bağlayıcısı: Databricks Runtime 7.x ve üzeri
Scala Apache Spark 3.0 bağlayıcısı: 2.12

Apache Spark 2.4 bağlayıcısı: 2.11
SQL Server için Microsoft JDBC sürücüsü 8.2
Microsoft SQL Server SQL Server 2008 ve üzeri
Azure SQL Veritabanı Desteklenir

Spark bağlayıcısını kullanma

Spark bağlayıcısını kullanma yönergeleri için bkz . Apache Spark bağlayıcısı: SQL Server ve Azure SQL.