Aracılığıyla paylaş


Hızlı Başlangıç: Synapse Studio kullanarak sunucusuz Apache Spark havuzu oluşturma

Azure Synapse Analytics, verilerinizi alma, dönüştürme, modelleme, analiz etme ve sunmanıza yardımcı olan çeşitli analiz altyapıları sunar. Apache Spark havuzu açık kaynak büyük veri işlem özellikleri sunar. Synapse çalışma alanınızda bir Apache Spark havuzu oluşturduktan sonra, içgörü elde etmek için veriler yüklenebilir, modellenebilir, işlenebilir ve sunulur.

Bu hızlı başlangıçta Synapse Studio kullanarak Synapse çalışma alanında Apache Spark havuzu oluşturma adımları açıklanmaktadır.

Önemli

Spark örnekleri için faturalandırma, kullansanız da kullanmasanız da dakika başına orantılı olarak ücretlendirilir. Spark örneğinizi kullanmayı tamamladıktan sonra kapatdığınızdan veya kısa bir zaman aşımı ayarladığınızdan emin olun. Daha fazla bilgi için bu makalenin Kaynakları temizleme bölümüne bakın.

Note

Synapse Studio terraform veya bicep tabanlı yapılandırma dosyalarını desteklemeye devam edecektir.

Azure aboneliğiniz yoksa başlamadan önce ücretsiz bir hesap oluşturun.

Önkoşullar

Azure portalda oturum açma

Azure portalda oturum açma

  1. Arama çubuğuna hizmet adını (veya kaynak adını doğrudan) yazarak Apache Spark havuzunun oluşturulacağı Synapse çalışma alanına gidin. Synapse çalışma alanlarının yazıldığı arama çubuğunun Azure portalındaki ekran görüntüsü.

  2. Çalışma alanları listesinden, açılacak çalışma alanının adını (veya adının bir bölümünü) yazın. Bu örnekte contosoanalytics adlı bir çalışma alanı kullanıyoruz. Contoso adını içerenleri gösterecek şekilde filtrelenen Synapse çalışma alanları listesinin Azure portalındaki ekran görüntüsü.

Synapse Studio'yu başlatma

Çalışma alanına genel bakış sayfasında Çalışma Alanı web URL'sini seçerek Synapse Studio'yu açın.

Synapse Studio'yu Başlat seçeneğinin vurgulandığı Synapse çalışma alanına genel bakışın Azure portalının ekran görüntüsü.

Synapse Studio'da Apache Spark havuzu oluşturma

Önemli

Apache Spark 2.4 için Azure Synapse Runtime kullanım dışı bırakıldı ve Eylül 2023'ten bu yana resmi olarak desteklenmiyor. Spark 3.1 ve Spark 3.2 de Destek Sonu duyurulduğunda müşterilerin Spark 3.3'e geçmelerini öneririz.

  1. Synapse Studio giriş sayfasında Yönet simgesini seçerek sol gezinti bölmesinde Yönetim Merkezi'ne gidin. Synapse Studio giriş sayfasının Azure portalında Yönetim Merkezi bölümünün vurgulandığı ekran görüntüsü.

  2. Yönetim Hub'ına girdikten sonra Apache Spark havuzları bölümüne gidip çalışma alanında kullanılabilen Apache Spark havuzlarının geçerli listesini görün. Apache Spark havuzları gezintisinin seçili olduğu Synapse Studio yönetim hub'ının Azure portalının ekran görüntüsü.

  3. + Yeni'yi seçtiğinizde yeni Apache Spark havuzu oluşturma sihirbazı görüntülenir.

  4. Temel Bilgiler sekmesine aşağıdaki ayrıntıları girin:

    Ayarlar Önerilen değer Açıklama
    Apache Spark havuzu adı Geçerli bir havuz adı, örneğin contosospark Bu, Apache Spark havuzunun sahip olacağı addır.
    Düğüm boyutu Küçük (4 vCPU / 32 GB) Bu hızlı başlangıcın maliyetlerini azaltmak için bunu en küçük boyuta ayarlayın
    Otomatik Ölçeklendirme Devre dışı Bu hızlı başlangıçta otomatik ölçeklendirmeye ihtiyacımız olmayacak
    Düğüm sayısı 8 Bu hızlı başlangıçta maliyetleri sınırlamak için küçük bir boyut kullanın
    Yürütücüleri dinamik olarak ayırma Devre dışı Bu ayar, Spark yapılandırmasındaki dinamik ayırma özelliği ile Spark Uygulaması yürütücü ayırma işlemini eşleştirir. Bu hızlı başlangıçta otomatik ölçeklendirmeye ihtiyacımız olmayacaktır.

    Azure portalında, Synapse Studio için yeni Apache Spark havuzunun Temel Bilgiler ekran görüntüsü.

    Önemli

    Apache Spark havuzlarının kullanabileceği adlar için belirli sınırlamalar vardır. Adlar yalnızca harf veya sayı içermelidir, 15 veya daha az karakter uzunluğunda olmalı, bir harfle başlamalıdır, ayrılmış sözcükler içermemelidir ve çalışma alanında benzersiz olmalıdır.

  5. Sonraki sekme olan Ek ayarlar'da tüm ayarları varsayılan olarak bırakın.

  6. Etiketler'i seçin. Azure etiketlerini kullanmayı göz önünde bulundurun. Örneğin, kaynağı kimin oluşturduğunu belirlemek için "Sahip" veya "CreatedBy" etiketi ve bu kaynağın Üretim, Geliştirme vb. içinde olup olmadığını belirlemek için "Ortam" etiketi. Daha fazla bilgi için bkz . Azure kaynakları için adlandırma ve etiketleme stratejinizi geliştirme. Hazır olduğunuzda Gözden Geçir ve oluştur'u seçin.

  7. Gözden Geçir + oluştur sekmesinde, daha önce girilenlere göre ayrıntıların doğru göründüğünden emin olun ve Oluştur'a basın.

    Synapse Studio yeni Apache Spark havuzu oluşturma işleminin Azure portalının ekran görüntüsü.

  8. Apache Spark havuzu sağlama işlemini başlatır.

  9. Sağlama tamamlandıktan sonra yeni Apache Spark havuzu listede görünür.

    Synapse Studio yeni Apache Spark havuz listesinin Azure portalındaki ekran görüntüsü.

Synapse Studio kullanarak Apache Spark havuzu kaynaklarını temizleme

Aşağıdaki adımlar Synapse Studio kullanarak Apache Spark havuzunu çalışma alanından siler.

Uyarı

Spark havuzunun silinmesi analiz altyapısını çalışma alanından kaldırır. Artık havuza bağlanmak mümkün olmayacak ve bu Spark havuzunu kullanan tüm sorgular, işlem hatları ve not defterleri artık çalışmayacaktır.

Apache Spark havuzunu silmek istiyorsanız aşağıdaki adımları uygulayın:

  1. Synapse Studio'daki Yönetim Hub'ında Apache Spark havuzlarına gidin.

  2. Apache Spark havuzu komutlarını göstermek için silinecek Apache Spark havuzunun yanındaki üç noktalı simgeyi (özellikle contosospark) seçin.

    Yakın zamanda oluşturulan havuzun seçili olduğu Apache Spark havuzları listesinin Azure portalındaki ekran görüntüsü.

  3. Sil'i seçin.

  4. Silme işlemini onaylayın ve Sil düğmesine basın.

  5. İşlem başarıyla tamamlandığında Apache Spark havuzu artık çalışma alanı kaynaklarında listelenmez.