Hızlı Başlangıç: Azure Databricks ile Yönetilen Apache Spark Kümesi Dağıtma

Makale
06/01/2023

Apache Cassandra için Azure Yönetilen Örneği, yönetilen açık kaynak Apache Cassandra veri merkezleri için otomatik dağıtım ve ölçeklendirme işlemleri sağlar. Bu özellik hibrit senaryoları hızlandırır ve devam eden bakımı azaltır.

Bu hızlı başlangıçta, Azure portalını kullanarak Apache Cassandra için Azure Yönetilen Örneği kümenizin Azure Sanal Ağ içinde tam olarak yönetilen bir Apache Spark kümesi oluşturma işlemi gösterilmektedir. Spark kümesini Azure Databricks'te oluşturursunuz. Daha sonra kümeye not defterleri oluşturabilir veya ekleyebilir, farklı veri kaynaklarından verileri okuyabilir ve içgörüleri analiz edebilirsiniz.

Azure Databricks'i Azure Sanal Ağ'ınıza dağıtma (Sanal Ağ Ekleme) hakkında ayrıntılı yönergelerle de daha fazla bilgi edinebilirsiniz.

Önkoşullar

Azure aboneliğiniz yoksa başlamadan önce ücretsiz bir hesap oluşturun.

Azure Databricks kümesi oluşturma

Apache Cassandra için Azure Yönetilen Örneği'ne sahip bir Sanal Ağ Azure Databricks kümesi oluşturmak için şu adımları izleyin:

Azure Portal’ında oturum açın.
Sol gezinti bölmesinde Kaynak grupları'nı bulun. Yönetilen örneğinizin dağıtıldığı Sanal Ağ içeren kaynak grubunuza gidin.
Sanal Ağ kaynağını açın ve Adres alanını not edin:
Kaynak grubunda Ekle'yi seçin ve arama alanında Azure Databricks'i arayın:
Azure Databricks hesabı oluşturmak için Oluştur'u seçin:
Aşağıdaki değerleri girin:
- Çalışma alanı adı Databricks çalışma alanınız için bir ad belirtin.
- Bölge Sanal Ağ ile aynı bölgeyi seçtiğinizden emin olun.
- Fiyatlandırma Katmanı Standart, Premium veya Deneme arasında seçim yapın. Bu katmanlar hakkında daha fazla bilgi için bkz. Databricks fiyatlandırma sayfası.
Ardından Ağ sekmesini seçin ve aşağıdaki ayrıntıları girin:
- Azure Databricks çalışma alanını Sanal Ağ (VNet) ortamınızda dağıtın Evet'i seçin.
- Sanal Ağ Açılan listeden yönetilen örneğinizin bulunduğu Sanal Ağ seçin.
- Genel Alt Ağ Adı Ortak alt ağ için bir ad girin.
- Genel Alt Ağ CIDR Aralığı Ortak alt ağ için bir IP aralığı girin.
- Özel Alt Ağ Adı Özel alt ağ için bir ad girin.
- Özel Alt Ağ CIDR Aralığı Özel alt ağ için bir IP aralığı girin.
Aralık çakışmalarını önlemek için daha yüksek aralıklar seçtiğinizden emin olun. Gerekirse, aralıkları bölmek için görsel bir alt ağ hesaplayıcısı kullanın:

Aşağıdaki ekran görüntüsünde ağ bölmesindeki örnek ayrıntılar gösterilmektedir:
Çalışma alanını dağıtmak için Gözden geçir ve oluştur'u ve ardından Oluştur'u seçin.
Çalışma Alanı oluşturulduktan sonra başlatın.
Azure Databricks portalına yönlendirilirsiniz. Portaldan Yeni Küme'yi seçin.
Yeni küme bölmesinde, aşağıdaki alanlar dışındaki tüm alanlar için varsayılan değerleri kabul edin:
- Küme Adı Küme için bir ad girin.
- Databricks Runtime Sürümü Spark 3.x desteği için Databricks çalışma zamanı sürüm 7.5 veya üzerini seçmenizi öneririz.

Gelişmiş Seçenekler'i genişletin ve aşağıdaki yapılandırmayı ekleyin. Düğüm IP'lerini ve kimlik bilgilerini değiştirdiğinden emin olun:

spark.cassandra.connection.host <node1 IP>,<node 2 IP>, <node IP>
spark.cassandra.auth.password cassandra
spark.cassandra.connection.port 9042
spark.cassandra.auth.username cassandra
spark.cassandra.connection.ssl.enabled true

Hem yerel hem de Azure Cosmos DB Cassandra uç noktalarına bağlanmak için kümenize Apache Spark Cassandra Bağlayıcı kitaplığını ekleyin. Kümenizde Kitaplıklar>Yeni>Maven Yükle'yi seçin ve ardından Maven koordinatlarını ekleyin.com.datastax.spark:spark-cassandra-connector-assembly_2.12:3.0.0

Kaynakları temizleme

Bu yönetilen örnek kümesini kullanmaya devam etmeyecekseniz, aşağıdaki adımları izleyerek silin:

Azure portalının sol tarafındaki menüden Kaynak grupları'nı seçin.
Listeden bu hızlı başlangıç için oluşturduğunuz kaynak grubunu seçin.
Kaynak grubuna Genel Bakış bölmesinde Kaynak grubunu sil'i seçin.
Sonraki pencerede, silinecek kaynak grubunun adını girin ve sil'i seçin.

Sonraki adımlar

Bu hızlı başlangıçta, Apache Cassandra için Azure Yönetilen Örneği kümenizin Sanal Ağ içinde tam olarak yönetilen bir Apache Spark kümesi oluşturmayı öğrendiniz. Ardından küme ve veri merkezi kaynaklarını yönetmeyi öğrenebilirsiniz:

Azure CLI kullanarak Apache Cassandra için Azure Yönetilen Örneği kaynaklarını yönetme

Aracılığıyla paylaş