Bagikan melalui


Mulai cepat: Membuat kumpulan Apache Spark tanpa server baru menggunakan portal Microsoft Azure

Azure Synapse Analytics menawarkan berbagai mesin analitik untuk membantu Anda menyerap, mengubah, memodelkan, menganalisis, dan mendistribusikan data Anda. Kumpulan Apache Spark menyediakan kemampuan komputasi big data sumber terbuka. Setelah Anda membuat kumpulan Apache Spark di ruang kerja Synapse, data dapat dimuat, dimodelkan, diproses, dan didistribusikan untuk wawasan analitik yang lebih cepat.

Di panduan cepat ini, Anda mempelajari cara menggunakan portal Azure untuk membuat kumpulan Apache Spark di ruang kerja Synapse.

Penting

Penagihan untuk instans Spark diprorata per menit, terlepas apakah digunakan atau tidak. Pastikan Anda mematikan instans Spark setelah selesai menggunakannya, atau atur waktu jangka pendek. Untuk informasi selengkapnya, lihat bagian Membersihkan sumber daya di artikel ini.

Jika Anda tidak memiliki langganan Azure, buat akun gratis sebelum Anda memulai.

Prasyarat

Masuk ke portal Microsoft Azure

Masuk ke portal Microsoft Azure.

  1. Navigasi ke workspace Synapse tempat pool Apache Spark akan dibuat dengan mengetik nama layanan (atau nama sumber daya secara langsung) ke bilah pencarian. Cuplikan layar bilah pencarian portal Azure dengan ruang kerja Synapse yang diketik.

  2. Dari daftar ruang kerja, ketik nama (atau bagian dari nama) ruang kerja untuk membukanya. Untuk contoh ini, kami menggunakan ruang kerja bernama contosoanalytics. Cuplikan layar dari portal Azure daftar ruang kerja Synapse yang difilter untuk memperlihatkan ruang kerja yang berisi nama Contoso.

Membuat kumpulan Apache Spark baru

  1. Di ruang kerja Synapse tempat Anda ingin membuat kumpulan Apache Spark, pilih Kumpulan Apache Spark Baru. Cuplikan layar dari portal Microsoft Azure ruang kerja Synapse dengan kotak merah di sekitar perintah untuk membuat kumpulan Apache Spark baru.

  2. Masukkan detail berikut ini pada tab Dasar:

    Pengaturan Nilai yang disarankan Deskripsi
    Nama kumpulan Apache Spark Nama kumpulan yang valid, seperti contosospark Ini adalah nama yang akan dimiliki oleh kumpulan Apache Spark.
    Ukuran simpul Kecil (4 vCPU / 32 GB) Atur ke ukuran terkecil untuk mengurangi biaya pada panduan cepat ini
    Skala otomatis Penyandang Disabilitas Kita tidak perlu penskalaan otomatis untuk panduan awal ini
    Jumlah simpul 5 Pilih ukuran kecil untuk membatasi biaya untuk panduan cepat ini

    Cuplikan layar dari portal Microsoft Azure dari alur pembuatan kumpulan Apache Spark - tab dasar.

    Penting

    Ada batasan khusus untuk nama yang dapat digunakan kumpulan Apache Spark. Nama harus berisi huruf atau angka saja, harus 15 karakter atau kurang, harus dimulai dengan huruf, tidak berisi kata khusus, dan unik di ruang kerja.

  3. Pilih Berikutnya: pengaturan tambahan dan tinjau pengaturan default. Jangan ubah pengaturan default apa pun. Cuplikan layar dari portal Microsoft Azure yang memperlihatkan halaman 'Buat kumpulan Apache Spark' dengan tab 'Pengaturan tambahan' dipilih.

  4. Pilih Berikutnya: tag. Pertimbangkan untuk menggunakan tag Azure. Misalnya, tag "Pemilik" atau "CreatedBy" untuk mengidentifikasi siapa yang membuat sumber daya, dan tag "Lingkungan" untuk mengidentifikasi apakah sumber daya ini berada di Produksi, Pengembangan, dll. Untuk informasi selengkapnya, lihat Mengembangkan strategi penamaan dan pemberian tag untuk sumber daya Azure. Cuplikan layar dari portal Microsoft Azure dari alur pembuatan kumpulan Apache Spark - tab pengaturan tambahan.

  5. Pilih Tinjau + kreasikan.

  6. Pastikan detail terlihat benar berdasarkan apa yang dimasukkan sebelumnya, dan pilih Buat. Cuplikan layar dari portal Azure yang menunjukkan alur pembuatan kumpulan Apache Spark - tab pengaturan.

  7. Pada titik ini, alur provisi sumber daya akan dimulai, mengindikasikan ketika sudah selesai. Cuplikan layar dari portal Microsoft Azure yang memperlihatkan halaman 'Gambaran Umum' dengan pesan 'Penyebaran Anda selesai' ditampilkan.

  8. Setelah provisi selesai, menavigasi kembali ke ruang kerja akan menampilkan entri baru untuk kumpulan Apache Spark yang baru dibuat. Cuplikan layar dari portal Azure dari alur pembuatan kumpulan Apache Spark - penyediaan sumber daya.

  9. Pada titik ini, tidak ada sumber daya yang berjalan, tidak ada biaya untuk Spark, Anda telah membuat metadata tentang instans Spark yang ingin Anda buat.

Membersihkan sumber daya

Langkah-langkah berikut menghapus kumpulan Apache Spark dari ruang kerja.

Peringatan

Menghapus kumpulan Apache Spark akan menghapus mesin analitik dari ruang kerja. Tidak akan mungkin lagi terhubung ke kumpulan, dan semua kueri, alur, dan notebook yang menggunakan kumpulan Apache Spark ini tidak akan berfungsi lagi.

Jika Anda ingin menghapus kumpulan Apache Spark, lakukan langkah-langkah berikut:

  1. Navigasikan ke panel kumpulan Apache Spark di ruang kerja.
  2. Pilih kumpulan Apache Spark yang akan dihapus (dalam hal ini, contosospark).
  3. Pilih Hapus. Cuplikan layar dari portal Azure yang menunjukkan daftar kumpulan Apache Spark, dengan kumpulan yang baru dibuat sudah dipilih.
  4. Konfirmasi penghapusan, dan pilih tombol Hapus . Cuplikan layar dari portal Microsoft Azure dari dialog Konfirmasi untuk menghapus kumpulan Apache Spark yang dipilih.
  5. Ketika proses tersebut telah berhasil, kumpulan Apache Spark tidak akan lagi terdaftar di sumber daya ruang kerja.