Bagikan melalui


Membuat kluster Apache Flink® di HDInsight di AKS dengan portal Azure

Penting

Fitur ini masih dalam mode pratinjau. Ketentuan Penggunaan Tambahan untuk Pratinjau Microsoft Azure mencakup lebih banyak persyaratan hukum yang berlaku untuk fitur Azure yang dalam versi beta, dalam pratinjau, atau belum dirilis ke ketersediaan umum. Untuk informasi tentang pratinjau khusus ini, lihat Azure HDInsight pada informasi pratinjau AKS. Untuk pertanyaan atau saran fitur, kirimkan permintaan di AskHDInsight dengan detail dan ikuti kami untuk pembaruan lebih lanjut di Komunitas Azure HDInsight.

Selesaikan langkah-langkah berikut untuk membuat kluster Apache Flink di portal Azure.

Prasyarat

Selesaikan prasyarat di bagian berikut:

Penting

  • Untuk membuat kluster di kumpulan kluster baru, tetapkan peran AKS agentpool MSI "Managed Identity Operator" pada identitas terkelola yang ditetapkan pengguna yang dibuat sebagai bagian dari prasyarat sumber daya. Jika Anda memiliki izin yang diperlukan, langkah ini otomatis selama pembuatan.
  • Identitas terkelola agentpool AKS dibuat selama pembuatan kumpulan kluster. Anda dapat mengidentifikasi identitas terkelola agentpool AKS dengan (nama clusterpool Anda)-agentpool. Ikuti langkah-langkah ini untuk menetapkan peran.

Kluster Flink dapat dibuat setelah penyebaran kumpulan kluster selesai, mari kita membahas langkah-langkah jika Anda mulai menggunakan kumpulan kluster yang ada

  1. Di portal Azure, ketik kumpulan kluster HDInsight/HDInsight/HDInsight di AKS dan pilih Azure HDInsight pada kumpulan kluster AKS untuk membuka halaman kumpulan kluster. Pada halaman HDInsight di kumpulan kluster AKS, pilih kumpulan kluster tempat Anda ingin membuat kluster Flink baru.

    Diagram memperlihatkan bilah pencarian di portal Azure.

  2. Pada halaman kumpulan kluster tertentu, klik + Kluster baru dan berikan informasi berikut:

    Properti Deskripsi
    Langganan Bidang ini diisi otomatis dengan langganan Azure yang terdaftar untuk Kumpulan Kluster.
    Grup Sumber Daya Bidang ini diisi otomatis dan menunjukkan grup sumber daya pada kumpulan kluster.
    Wilayah Bidang ini diisi otomatis dan menunjukkan wilayah yang dipilih pada kumpulan kluster.
    Kumpulan Kluster Bidang ini diisi otomatis dan menunjukkan nama kumpulan kluster tempat kluster sekarang dibuat. Untuk membuat kluster di kumpulan yang berbeda, temukan kumpulan kluster tersebut di portal dan klik + Kluster baru.
    HDInsight pada Versi Kumpulan AKS Bidang ini diisi otomatis dan menunjukkan versi kumpulan kluster tempat kluster sekarang dibuat.
    HDInsight pada Versi AKS Pilih versi minor atau patch HDInsight pada AKS kluster baru.
    Jenis kluster Dari daftar drop-down, pilih Flink.
    Nama kluster Masukkan nama kluster baru.
    Identitas terkelola yang ditetapkan pengguna Dari daftar drop-down, pilih identitas terkelola yang akan digunakan dengan kluster. Jika Anda adalah pemilik Identitas Layanan Terkelola (MSI), dan MSI tidak memiliki peran Operator Identitas Terkelola pada kluster, klik tautan di bawah kotak untuk menetapkan izin yang diperlukan dari MSI kumpulan agen AKS. Jika MSI sudah memiliki izin yang benar, tidak ada tautan yang ditampilkan. Lihat Prasyarat untuk penetapan peran lain yang diperlukan untuk MSI.
    Akun Penyimpanan Dari daftar drop-down, pilih akun penyimpanan untuk dikaitkan dengan kluster Flink dan tentukan nama kontainer. Identitas terkelola selanjutnya diberikan akses ke akun penyimpanan yang ditentukan, menggunakan peran 'Pemilik Data Blob Penyimpanan' selama pembuatan kluster.
    Jaringan virtual Jaringan virtual untuk kluster.
    Subnet Subnet virtual untuk kluster.
  3. Mengaktifkan katalog Apache Hive untuk Flink SQL.

    Properti Deskripsi
    Menggunakan katalog Apache Hive Aktifkan opsi ini untuk menggunakan metastore Apache Hive eksternal.
    SQL Database untuk Apache Hive Dari daftar drop-down, pilih SQL Database untuk menambahkan tabel hive-metastore.
    nama pengguna administrator SQL Masukkan nama pengguna admin server SQL. Akun ini digunakan oleh metastore untuk berkomunikasi ke database SQL.
    Brankas kunci Dari daftar drop-down, pilih Key Vault, yang berisi rahasia dengan kata sandi untuk nama pengguna admin server SQL. Anda diharuskan untuk menyiapkan kebijakan akses dengan semua izin yang diperlukan seperti izin kunci, izin rahasia, dan izin sertifikat ke MSI, yang sedang digunakan untuk pembuatan kluster. MSI memerlukan peran Administrator Key Vault, menambahkan izin yang diperlukan menggunakan IAM.
    Nama rahasia kata sandi SQL Masukkan nama rahasia dari Key Vault tempat kata sandi database SQL disimpan.

    Cuplikan layar memperlihatkan tab dasar.

    Catatan

    Secara default, kami menggunakan akun Penyimpanan untuk katalog Apache Hive sama dengan akun penyimpanan dan kontainer yang digunakan selama pembuatan kluster.

  4. Pilih Berikutnya: Konfigurasi untuk melanjutkan.

  5. Pada halaman Konfigurasi , berikan informasi berikut:

    Properti Deskripsi
    Ukuran simpul Pilih ukuran simpul yang akan digunakan untuk simpul Flink baik simpul kepala maupun pekerja.
    Jumlah node Pilih jumlah simpul untuk kluster Flink; secara default head node adalah dua. Ukuran simpul pekerja membantu menentukan konfigurasi manajer tugas untuk Flink. Manajer pekerjaan dan server riwayat berada di simpul kepala.
  6. Pada bagian Konfigurasi Layanan, berikan informasi berikut:

    Properti Deskripsi
    CPU pengelola tugas Bilangan bulat. Masukkan ukuran CPU Pengelola tugas (dalam inti).
    Memori pengelola tugas dalam MB Masukkan ukuran memori Pengelola tugas dalam MB. Min of 1800 MB.
    CPU manajer pekerjaan Bilangan bulat. Masukkan jumlah CPU untuk manajer Pekerjaan (dalam inti).
    Memori manajer pekerjaan dalam MB Masukkan ukuran memori dalam MB. Minimal 1800 MB.
    CPU server riwayat Bilangan bulat. Masukkan jumlah CPU untuk manajer Pekerjaan (dalam inti).
    Memori server riwayat dalam MB Masukkan ukuran memori dalam MB. Minimal 1800 MB.

    cuplikan layar memperlihatkan tab konfigurasi.

    Catatan

    • Server riwayat dapat diaktifkan/dinonaktifkan sesuai kebutuhan.
    • Skala otomatis berbasis jadwal didukung di Flink. Anda dapat menjadwalkan jumlah simpul pekerja sesuai kebutuhan. Misalnya, ini diaktifkan skala otomatis berbasis jadwal dengan jumlah simpul pekerja default sebagai 3. Dan selama hari kerja dari pukul 09.00 UTC hingga 20.00 UTC, simpul pekerja dijadwalkan menjadi 10. Kemudian pada hari itu, itu perlu default ke 3 simpul ( antara 20:00 UTC hingga hari berikutnya 09:00 UTC ). Selama akhir pekan dari 9:00 UTC hingga 20:00 UTC, simpul pekerja adalah 4.
  7. Pada bagian Skala Otomatis & SSH , perbarui hal berikut:

    Properti Deskripsi
    Penskalaan Otomatis Setelah pilihan, Anda akan dapat memilih skala otomatis berbasis jadwal untuk mengonfigurasi jadwal operasi penskalaan.
    Aktifkan SSH Setelah pilihan, Anda dapat memilih jumlah total simpul SSH yang diperlukan, yang merupakan titik akses untuk Flink CLI menggunakan Secure Shell. Simpul SSH maksimum yang diizinkan adalah 5.

    Cuplikan layar memperlihatkan konfigurasi layanan skala otomatis.

    Cuplikan layar memperlihatkan aturan skala otomatis.

  8. Klik tombol Berikutnya: Integrasi untuk melanjutkan ke halaman berikutnya.

  9. Pada halaman Integrasi , berikan informasi berikut ini:

    Properti Deskripsi
    Analitik log Fitur ini hanya tersedia jika kumpulan kluster memiliki ruang kerja analitik log terkait, setelah mengaktifkan log yang akan dikumpulkan dapat dipilih.
    Azure Prometheus Fitur ini untuk melihat Wawasan dan Log langsung di kluster Anda dengan mengirim metrik dan log ke ruang kerja Azure Monitor.

    cuplikan layar memperlihatkan tab integrasi.

  10. Klik tombol Berikutnya: Tag untuk melanjutkan ke halaman berikutnya.

  11. Pada halaman Tag , berikan informasi berikut ini:

    Properti Deskripsi
    Nama Opsional. Masukkan nama seperti HDInsight di AKS untuk dengan mudah mengidentifikasi semua sumber daya yang terkait dengan sumber daya kluster Anda.
    Nilai Anda dapat membiarkan ini kosong.
    Sumber daya Pilih Semua sumber daya yang dipilih.
  12. Pilih Berikutnya: Tinjau + buat untuk melanjutkan.

  13. Pada halaman Tinjau + buat , cari pesan Validasi berhasil di bagian atas halaman lalu klik Buat.

Halaman Penyebaran sedang dalam proses ditampilkan tempat kluster dibuat. Dibutuhkan 5-10 menit untuk membuat kluster. Setelah kluster dibuat, pesan "Penyebaran Anda selesai" ditampilkan. Jika Anda menavigasi menjauh dari halaman, Anda dapat memeriksa Pemberitahuan anda untuk status saat ini.

Catatan

Nama proyek Apache, Apache Flink, Flink, dan sumber terbuka terkait adalah merek dagang dari Apache Software Foundation (ASF).