Aracılığıyla paylaş


HDInsight kümesi için Apache Spark uygulamaları oluşturmak üzere IntelliJ için Azure Toolkit kullanma

Bu makalede, IntelliJ IDE için Azure Toolkit eklentisini kullanarak Azure HDInsight üzerinde Apache Spark uygulamaları geliştirme adımları gösterilmektedir. Azure HDInsight , bulutta yönetilen, açık kaynaklı bir analiz hizmetidir. Hizmet Hadoop, Apache Spark, Apache Hive ve Apache Kafka gibi açık kaynak çerçeveleri kullanmanıza olanak tanır.

Azure Toolkit eklentisini birkaç yolla kullanabilirsiniz:

  • Scala Spark uygulaması geliştirin ve hdInsight Spark kümesine gönderin.
  • Azure HDInsight Spark kümesi kaynaklarınıza erişin.
  • Scala Spark uygulamasını yerel olarak geliştirin ve çalıştırın.

Bu makalede şunların nasıl yapılacağını öğreneceksiniz:

  • Azure Toolkit for IntelliJ eklentisini kullanma
  • Apache Spark uygulamaları geliştirme
  • Azure HDInsight kümesine uygulama gönderme

Önkoşullar

IntelliJ IDEA için Scala eklentisini yükleme

Scala eklentisini yükleme adımları:

  1. IntelliJ IDEA’yı açın.

  2. Hoş geldiniz ekranında Yapılandır> seçeneğine gidin ve Eklentiler penceresini açın.

    IntelliJ IDEA scala eklentisini etkinleştirir.

  3. Yeni pencerede öne çıkan Scala eklentisi için Yükle'yi seçin.

    IntelliJ IDEA scala eklentisini yükler.

  4. Eklenti başarıyla yüklendikten sonra IDE'yi yeniden başlatmanız gerekir.

HDInsight Spark kümesi için Spark Scala uygulaması oluşturma

  1. IntelliJ IDEA'yı başlatın ve Yeni Proje Oluştur'u seçerek Yeni Proje penceresini açın.

  2. Sol bölmeden Azure Spark/HDInsight'ı seçin.

  3. Ana pencerede Spark Projesi (Scala) öğesini seçin.

  4. Derleme aracı açılan listesinden aşağıdaki seçeneklerden birini belirleyin:

    • Scala için Maven proje oluşturma sihirbazı desteği.

    • Scala projesi için bağımlılıkları yönetmeye ve oluşturmaya yönelik SBT .

      IntelliJ IDEA Yeni Proje iletişim kutusu.

  5. sonrakiseçin.

  6. Yeni Proje penceresinde aşağıdaki bilgileri sağlayın:

    Mülkiyet Açıklama
    Proje adı Bir ad girin. Bu makale myApp kullanır.
    Proje konumu Projenizi kaydetmek için konumu girin.
    Proje SDK'sı Idea'nın ilk kullanımında bu alan boş olabilir. Yeni... öğesini seçin ve JDK'nize gidin.
    Spark Sürümü Oluşturma sihirbazı, Spark SDK ve Scala SDK'sı için uygun sürümü tümleştirir. Spark kümesi sürümü 2.0’dan eskiyse Spark 1.x seçeneğini belirleyin. Aksi takdirde Spark2.x'i seçin. Bu örnekte Spark 2.3.0 (Scala 2.11.8) kullanılır.

    Apache Spark SDK'sını seçme.

  7. Bitirseçin. Projenin kullanılabilir duruma gelmesi birkaç dakika sürebilir.

  8. Spark projesi sizin için otomatik olarak bir yapıt oluşturur. Yapıtı görüntülemek için aşağıdaki adımları uygulayın:

    a. Menü çubuğundan Dosya>gidin.

    b. Proje Yapısı penceresinde Yapıtlar'ı seçin.

    ç. Yapıtı görüntüledikten sonra İptal'i seçin.

    İletişim kutusundaki yapıt bilgileri.

  9. Aşağıdaki adımları uygulayarak uygulama kaynak kodunuzu ekleyin:

    a. Proje'den myApp>src>main>scala'ya gidin.

    b. Scala'ya sağ tıklayın ve Yeni>Scala Sınıfı'na gidin.

    Project'ten Scala sınıfı oluşturmaya yönelik komutlar.

    ç. Yeni Scala Sınıfı Oluştur iletişim kutusunda bir ad girin, Tür açılan listesinde Nesne'yi seçin ve ardından Tamam'ı seçin.

    Yeni Scala Sınıfı Oluştur iletişim kutusu.

    ö. Ardından myApp.scala dosyası ana görünümde açılır. Varsayılan kodu aşağıda bulunan kodla değiştirin:

    import org.apache.spark.SparkConf
    import org.apache.spark.SparkContext
    
    object myApp{
        def main (arg: Array[String]): Unit = {
        val conf = new SparkConf().setAppName("myApp")
        val sc = new SparkContext(conf)
    
        val rdd = sc.textFile("wasbs:///HdiSamples/HdiSamples/SensorSampleData/hvac/HVAC.csv")
    
        //find the rows that have only one digit in the seventh column in the CSV file
        val rdd1 =  rdd.filter(s => s.split(",")(6).length() == 1)
    
        rdd1.saveAsTextFile("wasbs:///HVACOut")
        }
    
    }
    

    Kod, HVAC.csv verileri okur (tüm HDInsight Spark kümelerinde kullanılabilir), CSV dosyasındaki yedinci sütunda yalnızca bir basamak bulunan satırları alır ve çıkışı /HVACOut küme için varsayılan depolama kapsayıcısının altına yazar.

HDInsight kümenize bağlanma

Kullanıcı Azure aboneliğinizde oturum açabilir veya bir HDInsight kümesi bağlayabilir. HDInsight kümenize bağlanmak için Ambari kullanıcı adını/parolasını veya etki alanına katılmış kimlik bilgilerini kullanın.

Azure aboneliğinizde oturum açın

  1. Menü çubuğundan Görünüm>Araç Pencereleri>Azure Gezgini'ne gidin.

    IntelliJ IDEA, Azure Gezgini'ni gösteriyor.

  2. Azure Gezgini'nde Azure düğümüne sağ tıklayıp Oturum Aç'ı seçin.

    IntelliJ IDEA gezinti panelinde Azure'a sağ tıklayın.

  3. Azure Oturum Aç iletişim kutusunda Cihaz Oturum Açma'yı ve ardından Oturum aç'ı seçin.

    'IntelliJ IDEA azure oturum açma cihazı oturum açma'.

  4. Azure Cihaz Oturum Açma iletişim kutusunda Kopyala ve Aç'a tıklayın.

    'IntelliJ IDEA azure cihaz oturum açma'.

  5. Tarayıcı arabiriminde kodu yapıştırın ve İleri'ye tıklayın.

    `HDI için Microsoft kod girme iletişim kutusu`.

  6. Azure kimlik bilgilerinizi girin ve tarayıcıyı kapatın.

    'HDI için Microsoft e-posta girin iletişim kutusu'.

  7. Oturum açtıktan sonra Abonelikleri Seç iletişim kutusunda, kimlik bilgileriyle ilişkili tüm Azure abonelikleri listelenir. Aboneliğinizi ve ardından Seç düğmesini seçin.

    Abonelikleri Seç iletişim kutusu.

  8. Azure Gezgini'ndeHDInsight'ı genişleterek aboneliklerinizdeki HDInsight Spark kümelerini görüntüleyin.

    IntelliJ IDEA Azure Gezgini ana görünümü.

  9. Kümeyle ilişkili kaynakları (örneğin, depolama hesapları) görüntülemek için bir küme adı düğümünü daha da genişletebilirsiniz.

    Azure Explorer depolama hesapları.

Apache Ambari tarafından yönetilen kullanıcı adını kullanarak HDInsight kümesini bağlayabilirsiniz. Benzer şekilde, etki alanına katılmış bir HDInsight kümesi için, etki alanını ve kullanıcı adını kullanarak bağlantı oluşturabilirsiniz; örneğin user1@contoso.com. Ayrıca Livy Service kümesini de bağlayabilirsiniz.

  1. Menü çubuğundan Görünüm>Araç Pencereleri>Azure Gezgini'ne gidin.

  2. Azure Gezgini'nden HDInsight düğümüne sağ tıklayın ve ardından Küme Bağla'yı seçin.

    Azure Gezgini link kümesi bağlam menüsü.

  3. Kümeyi Bağla penceresindeki kullanılabilir seçenekler, Kaynak Türünü Bağla açılan listesinden seçtiğiniz değere bağlı olarak değişir. Değerlerinizi girin ve Tamam'ı seçin.

    • HDInsight Kümesi

      Mülkiyet Değer
      Bağlantı Kaynak Türü Açılan listeden HDInsight Kümesi'ni seçin.
      Küme Adı/URL Küme adını girin.
      Kimlik Doğrulaması Türü Temel Kimlik Doğrulaması olarak bırakın
      Kullanıcı Adı Küme kullanıcı adını girin; varsayılan değer yöneticidir.
      Şifre Kullanıcı adı için parola girin.

      IntelliJ IDEA bir küme iletişim kutusunu bağlar.

    • Livy Hizmeti

      Mülkiyet Değer
      Bağlantı Kaynak Türü Açılan listeden Livy Service'i seçin.
      Livy Uç Noktası Livy Uç Noktası girin
      Küme Adı Küme adını girin.
      Yarn Uç Noktası Opsiyonel.
      Kimlik Doğrulaması Türü Temel Kimlik Doğrulaması olarak bırakın
      Kullanıcı Adı Küme kullanıcı adını girin; varsayılan değer yöneticidir.
      Şifre Kullanıcı adı için parola girin.

      IntelliJ IDEA bağlantı Livy kümesi iletişim kutusu.

  4. Bağlı kümenizi HDInsight düğümünden görebilirsiniz.

    Azure Gezgini bağlantılı küme 1.

  5. Ayrıca bir kümenin Azure Gezgini bağlantısını da kaldırabilirsiniz.

    Azure Gezgini bağlantısı kesilmiş küme.

HDInsight Spark kümesinde Spark Scala uygulaması çalıştırma

Scala uygulamasını oluşturduktan sonra kümeye gönderebilirsiniz.

  1. Project'ten myApp>src>main>scala>myApp konumuna gidin. Uygulamam'a sağ tıklayın ve Spark Uygulaması Gönder'i seçin (Büyük olasılıkla listenin en altında bulunur).

    Spark Uygulamasını HDInsight'a Gönder komutu.

  2. Spark Uygulaması Gönder iletişim kutusunda 1'i seçin. HDInsight üzerinde Spark.

  3. Yapılandırmayı düzenle penceresinde aşağıdaki değerleri sağlayın ve Tamam'ı seçin:

    Mülkiyet Değer
    Spark kümeleri (yalnızca Linux) Uygulamanızı çalıştırmak istediğiniz HDInsight Spark kümesini seçin.
    Göndermek için bir Yapıt seçin Varsayılan ayarı değiştirmeyin.
    Ana sınıf adı Varsayılan değer, seçili dosyadaki ana sınıftır. Sınıfı değiştirmek için üç noktayı (...) seçin ve ardından başka bir sınıf seçin.
    İş yapılandırmaları Varsayılan anahtarları ve veya değerleri değiştirebilirsiniz. Daha fazla bilgi için bkz . Apache Livy REST API.
    Komut satırı argümanları Gerekirse, ana sınıf için boşlukla ayrılmış bağımsız değişkenler girebilirsiniz.
    Başvuruda Belirtilen Jar'lar ve Başvurulan Dosyalar Başvuruda bulunan Jar'ların ve varsa dosyaların yollarını girebilirsiniz. Şu anda yalnızca ADLS 2. Nesil kümesini destekleyen Azure sanal dosya sistemindeki dosyalara da göz atabilirsiniz. Daha fazla bilgi için: Apache Spark Yapılandırması. Ayrıca bkz. Kaynakları kümeye yükleme.
    Görev Yükleme Depolama Alanı Ek seçenekleri göstermek için genişletin.
    Depolama Türü Açılan listeden Karşıya yüklemek için Azure Blobunu kullan'ı seçin.
    Depolama Hesabı Depolama hesabınızı girin.
    Depolama Anahtarı Depolama anahtarınızı girin.
    Depolama Kapsayıcısı Depolama Hesabı ve Depolama Anahtarı girildikten sonra açılan listeden depolama kapsayıcınızı seçin.

    Spark Gönderimi iletişim kutusu.

  4. Projenizi seçili kümeye göndermek için SparkJobRun'u seçin. Kümedeki Uzak Spark İşi sekmesi, iş yürütme ilerlemesini en altta görüntüler. Kırmızı düğmeye tıklayarak uygulamayı durdurabilirsiniz.

    Apache Spark Gönderimi penceresi.

HDInsight kümesinde Apache Spark uygulamalarında yerel olarak veya uzaktan hata ayıklama

Spark uygulamasını kümeye göndermenin başka bir yolunu da öneririz. Bunu yapmak için Çalıştırma/Hata Ayıklama yapılandırmaları IDE'sindeki parametreleri ayarlayabilirsiniz. Bkz. SSH aracılığıyla IntelliJ için Azure Toolkit ile HDInsight kümesinde yerel olarak veya uzaktan Apache Spark uygulamalarında hata ayıklama.

IntelliJ için Azure Toolkit kullanarak HDInsight Spark kümelerine erişme ve kümelerini yönetme

IntelliJ için Azure Toolkit'i kullanarak çeşitli işlemler yapabilirsiniz. İşlemlerin çoğu Azure Gezgini'nden başlatılır. Menü çubuğundan Görünüm>Araç Pencereleri>Azure Gezgini'ne gidin.

İş görünümüne erişme

  1. Azure Gezgini'nden HDInsight><Küme>>İşleriniz'e gidin.

    IntelliJ Azure Gezgini İş görünümü düğümü.

  2. Sağ bölmede Spark İşi Görünümü sekmesi, kümede çalıştırılan tüm uygulamaları görüntüler. Daha fazla ayrıntı görmek istediğiniz uygulamanın adını seçin.

    Spark İşi Görünümü Uygulaması ayrıntıları.

  3. Temel çalışan iş bilgilerini görüntülemek için, iş grafiğinin üzerine gelin ve bekleyin. Aşamalar grafiğini ve her işin oluşturduğu bilgileri görüntülemek için iş grafı üzerinde bir düğüm seçin.

    Spark İş Görünümü İş aşaması detaylarını görüntüleyin.

  4. Sürücü Stderr, Sürücü Stdout ve Dizin Bilgileri gibi sık kullanılan günlükleri görüntülemek için Günlük sekmesini seçin.

    Spark İşleme Günlüğü Ayrıntıları.

  5. Spark geçmişi kullanıcı arabirimini ve YARN kullanıcı arabirimini görüntüleyebilirsiniz (uygulama düzeyinde). Pencerenin üst kısmından bir bağlantı seçin.

Spark geçmiş sunucusuna erişme

  1. Azure Gezgini'nden HDInsight'ı genişletin, Spark kümenizin adına sağ tıklayın ve spark geçmişi kullanıcı arabirimini aç'ı seçin.

  2. İstendiğinde, kümeyi ayarlarken belirttiğiniz kümenin yönetici kimlik bilgilerini girin.

  3. Spark geçmişi sunucusu panosunda, çalıştırmayı yeni tamamladığınız uygulamayı aramak için uygulama adını kullanabilirsiniz. Önceki kodda, val conf = new SparkConf().setAppName("myApp") kullanarak uygulama adını ayarlarsınız. Spark uygulamanızın adı myApp'tir.

Ambari portalını başlatma

  1. Azure Gezgini'nden HDInsight'ı genişletin, Spark kümenizin adına sağ tıklayın ve ardından Küme Yönetim Portalını Aç(Ambari)'yi seçin.

  2. İstendiğinde kümenin yönetici kimlik bilgilerini girin. Bu kimlik bilgilerini küme kurulum işlemi sırasında belirttiniz.

Azure aboneliklerini yönetme

Varsayılan olarak, IntelliJ için Azure Toolkit tüm Azure aboneliklerinizdeki Spark kümelerini listeler. Gerekirse, erişmek istediğiniz abonelikleri belirtebilirsiniz.

  1. Azure Gezgini'nden Azure kök düğümüne sağ tıklayın ve ardından Abonelikleri Seç'i seçin.

  2. AbonelikLeri Seç penceresinde, erişmek istemediğiniz aboneliklerin yanındaki onay kutularını temizleyin ve kapat'ı seçin.

Spark Konsolu

Spark Yerel Konsolu'nu (Scala) veya Spark Livy Etkileşimli Oturum Konsolu'nu (Scala) çalıştırabilirsiniz.

Spark Yerel Konsolu (Scala)

WINUTILS.EXE önkoşulunu karşıladığınızdan emin olun.

  1. Menü çubuğundan >.

  2. Çalıştırma/Hata Ayıklama Yapılandırmaları penceresinde, sol bölmede HDInsight üzerinde Apache Spark>[HDInsight üzerinde Spark] myApp'e gidin.

  3. Ana pencereden Locally Run sekmesini seçin.

  4. Aşağıdaki değerleri sağlayın ve tamam'ı seçin:

    Mülkiyet Değer
    İş ana sınıfı Varsayılan değer, seçili dosyadaki ana sınıftır. Sınıfı değiştirmek için üç noktayı (...) seçin ve ardından başka bir sınıf seçin.
    Ortam değişkenleri HADOOP_HOME değerinin doğru olduğundan emin olun.
    WINUTILS.exe konumu Yolun doğru olduğundan emin olun.

    Yerel Konsol Ayarları Yapılandırması.

  5. Project'ten myApp>src>main>scala>myApp konumuna gidin.

  6. Menü çubuğundan Araçlar>Spark Konsolu Spark Yerel Konsolunu>Çalıştır (Scala) seçeneğine gidin.

  7. Ardından, bağımlılıkları otomatik olarak düzeltmek isteyip istemediğinizi sormak için iki iletişim kutusu görüntülenebilir. Öyleyse, Otomatik Düzeltme'yi seçin.

    IntelliJ IDEA Spark Otomatik Düzeltme iletişim kutusu1.

    IntelliJ IDEA Spark otomatik düzeltme iletişim kutusu.

  8. Konsol aşağıdaki resme benzer görünmelidir. Konsol penceresine yazın sc.appNameve ardından ctrl+Enter tuşlarına basın. Sonuç gösterilir. Kırmızı düğmeye tıklayarak yerel konsolu sonlandırabilirsiniz.

    IntelliJ IDEA yerel konsol sonucu.

Spark Livy Etkileşimli Oturum Konsolu (Scala)

  1. Menü çubuğundan >.

  2. Çalıştırma/Hata Ayıklama Yapılandırmaları penceresinde, sol bölmede HDInsight üzerinde Apache Spark>Spark on HDInsight] myApp'e gidin.

  3. Ana pencerede sekmeyi Remotely Run in Cluster seçin.

  4. Aşağıdaki değerleri sağlayın ve tamam'ı seçin:

    Mülkiyet Değer
    Spark kümeleri (yalnızca Linux) Uygulamanızı çalıştırmak istediğiniz HDInsight Spark kümesini seçin.
    Ana sınıf adı Varsayılan değer, seçili dosyadaki ana sınıftır. Sınıfı değiştirmek için üç noktayı (...) seçin ve ardından başka bir sınıf seçin.

    Etkileşimli Konsol Kümesi Yapılandırması.

  5. Project'ten myApp>src>main>scala>myApp konumuna gidin.

  6. Menü çubuğundan Araçlar>Spark Konsolu>Spark Livy Etkileşimli Oturum Konsolu'nu (Scala) Çalıştır'a gidin.

  7. Konsol aşağıdaki resme benzer görünmelidir. Konsol penceresine yazın sc.appNameve ardından ctrl+Enter tuşlarına basın. Sonuç gösterilir. Kırmızı düğmeye tıklayarak yerel konsolu sonlandırabilirsiniz.

    IntelliJ IDEA Etkileşimli Konsol Sonucu.

Seçimi Spark Konsoluna Gönder

Kodun bir kısmını yerel konsola veya Livy Interactive Session Console (Scala) aracılığıyla göndererek betik sonucunu önceden görmek sizin açınızdan kolaylık sağlar. Scala dosyasında bazı kodları vurgulayabilir ve ardından Seçimi Spark Konsoluna Gönder'e sağ tıklayabilirsiniz. Seçilen kod konsola gönderilir. Sonuç, konsoldaki koddan sonra görüntülenir. Varsa konsol hataları denetler.

Seçimi Spark Konsoluna Gönder.

HDInsight Kimlik Aracısı (HIB) ile tümleştirme

KIMLIK Aracısı (HIB) ile HDInsight ESP kümenize bağlanma

Kimlik Aracısı (HIB) ile HDInsight ESP kümenize bağlanmak için Azure aboneliğinde oturum açmak için normal adımları izleyebilirsiniz. Oturum açma işleminin ardından Azure Gezgini'nde küme listesini görürsünüz. Daha fazla yönerge için bkz . HDInsight kümenize bağlanma.

Kimlik Aracısı (HIB) ile HDInsight ESP kümesinde Spark Scala uygulaması çalıştırma

Kimlik Aracısı (HIB) ile HDInsight ESP kümesine iş göndermek için normal adımları izleyebilirsiniz. Daha fazla yönerge için bkz. HDInsight Spark kümesinde Spark Scala uygulaması çalıştırma .

Gerekli dosyaları oturum açma hesabınızla adlı bir klasöre yükleriz ve yapılandırma dosyasında karşıya yükleme yolunu görebilirsiniz.

yapılandırmada yükleme yolu.

Kimlik Aracısı (HIB) ile HDInsight ESP kümesinde Spark konsolu

Spark Yerel Konsolu'nu (Scala) veya Kimlik Aracısı (HIB) ile bir HDInsight ESP kümesinde Spark Livy Etkileşimli Oturum Konsolu'nu (Scala) çalıştırabilirsiniz. Daha fazla yönerge için Spark Konsolu'na bakın.

Uyarı

Kimlik Aracısı (HIB) içeren HDInsight ESP kümesi için bir kümeyi bağlayın ve Apache Spark uygulamalarında uzaktan hata ayıklama şu anda desteklenmiyor.

Yalnızca okuyucu rolü

Kullanıcılar işi yalnızca okuyucu rolü izni olan bir kümeye gönderdiğinde Ambari kimlik bilgileri gerekir.

  1. Yalnızca okuyucu rol hesabıyla oturum açın.

  2. Azure Gezgini'nde, aboneliğinizdeki HDInsight kümelerini görüntülemek için HDInsight'ı genişletin. "Role:Reader" olarak işaretlenen kümelerin yalnızca okuyucu rol izni vardır.

    `IntelliJ Azure Gezgini Rolü:Okuyucu`.

  3. Yalnızca okuyucu rolü iznine sahip kümeye sağ tıklayın. Bağlam menüsünden Kümeyi Bağla'yı seçin. Ambari kullanıcı adını ve Parolayı girin.

    IntelliJ Azure Gezgini bu kümeyi bağlar.

  4. Küme başarıyla bağlanırsa HDInsight yenilenir. Kümenin aşaması bağlantılı hale gelecek.

    IntelliJ Azure Gezgini bağlantılı iletişim kutusu.

  1. İşler düğümü'ne tıklayın, Küme İşi Erişimi Reddedildi penceresi açılır.

  2. Bu kümeyi bağlamak için Kümeyi Bağla'ya tıklayın.

    küme işine erişim reddedildi iletişim kutusu.

  1. HDInsight Yapılandırması Oluştur. Ardından Kümede Uzaktan Çalıştır'ı seçin.

  2. Spark kümeleri için yalnızca okuyucu rol iznine sahip bir küme seçin (yalnızca Linux). Uyarı iletisi gösterilir. Kümeyi bağlamak için Bu kümeyi bağla'ya tıklayabilirsiniz.

    IntelliJ IDEA çalıştırma/hata ayıklama yapılandırması oluşturma.

Depolama Hesaplarını Görüntüleme

  • Yalnızca okuyucu rolü izni olan kümeler için Depolama Hesapları düğümüne tıklayın, Depolama Erişimi Reddedildi penceresi açılır. Azure Depolama Gezgini'ni açmak için Depolama Gezgini'ne tıklayabilirsiniz.

    'IntelliJ IDEA Depolama Erişimi Reddedildi'.

    IntelliJ IDEA Depolama Erişimi Reddedildi düğmesi.

  • Bağlı kümeler için Depolama Hesapları düğümüne tıklayın, Depolama Erişimi Reddedildi penceresi açılır. Azure Depolama'yı Aç'a tıklayarak Depolama Gezgini'ne açabilirsiniz.

    'IntelliJ IDEA Depolama Erişimi Reddedildi2'.

    IntelliJ IDEA Depolama Erişimi Reddedildi2 düğmesi.

Mevcut IntelliJ IDEA uygulamalarını Azure Toolkit for IntelliJ kullanacak şekilde dönüştürme

IntelliJ IDEA'da oluşturduğunuz mevcut Spark Scala uygulamalarını, IntelliJ için Azure Toolkit ile uyumlu olacak şekilde dönüştürebilirsiniz. Ardından, uygulamaları bir HDInsight Spark kümesine göndermek için eklentiyi kullanabilirsiniz.

  1. IntelliJ IDEA aracılığıyla oluşturulan mevcut bir Spark Scala uygulaması için ilişkili .iml dosyayı açın.

  2. Kök düzeyinde, aşağıdaki metne benzer bir modül öğesidir:

    <module org.jetbrains.idea.maven.project.MavenProjectsManager.isMavenModule="true" type="JAVA_MODULE" version="4">
    

    Modül öğesinin aşağıdaki metin gibi görünmesi için öğeyi UniqueKey="HDInsightTool" eklemek üzere düzenleyin:

    <module org.jetbrains.idea.maven.project.MavenProjectsManager.isMavenModule="true" type="JAVA_MODULE" version="4" UniqueKey="HDInsightTool">
    
  3. Değişiklikleri kaydedin. Uygulamanız artık IntelliJ için Azure Toolkit ile uyumlu olmalıdır. Project'te proje adına sağ tıklayarak test edebilirsiniz. Açılır menüde artık Spark Uygulamasını HDInsight'a Gönder seçeneği vardır.

Kaynakları temizleme

Bu uygulamayı kullanmaya devam etmeyecekseniz, aşağıdaki adımlarla oluşturduğunuz kümeyi silin:

  1. Azure portalınaoturum açın.

  2. Üstteki Arama kutusuna HDInsight yazın.

  3. Hizmetler'in altında HDInsight kümeleri'netıklayın.

  4. Görüntülenen HDInsight kümeleri listesinde, bu makale için oluşturduğunuz kümenin yanındaki ... öğesini seçin.

  5. 'ı seçin,'i silin. Evet'i seçin.

Azure portalı HDInsight kümesini siler.

Hatalar ve çözüm

Aşağıdaki gibi derleme başarısız hataları alırsanız src klasörünü Kaynak olarak işaretlemeyi kaldırın:

Derlemenin başarısız olduğunu gösteren ekran görüntüsü.

Bu sorunu çözmek için src klasörünü Kaynaklar olarak işaretlerini kaldırın:

  1. Dosya'ya gidin ve Proje Yapısı'nı seçin.

  2. Proje Ayarları'nın altındaki Modüller'i seçin.

  3. src dosyasını seçin ve Kaynak olarak işaretini kaldırın.

  4. Uygula düğmesine tıklayın ve ardından tamam düğmesine tıklayarak iletişim kutusunu kapatın.

    Src'nin kaynak olarak işaretini kaldırmayı gösteren ekran görüntüsü.

Sonraki adımlar

Bu makalede, Scala'da yazılmış Apache Spark uygulamaları geliştirmek için IntelliJ için Azure Toolkit eklentisini kullanmayı öğrendiniz. Ardından bunları doğrudan IntelliJ tümleşik geliştirme ortamından (IDE) bir HDInsight Spark kümesine gönderdi. Apache Spark'a kaydettiğiniz verilerin Power BI gibi bir BI analiz aracına nasıl çekilebileceğini görmek için sonraki makaleye ilerleyin.