Bagikan melalui


Apa yang baru dalam HDInsight di AKS? (Pratinjau)

Catatan

Kami akan menghentikan Azure HDInsight di AKS pada 31 Januari 2025. Sebelum 31 Januari 2025, Anda harus memigrasikan beban kerja anda ke Microsoft Fabric atau produk Azure yang setara untuk menghindari penghentian tiba-tiba beban kerja Anda. Kluster yang tersisa pada langganan Anda akan dihentikan dan dihapus dari host.

Hanya dukungan dasar yang akan tersedia hingga tanggal penghentian.

Penting

Fitur ini masih dalam mode pratinjau. Ketentuan Penggunaan Tambahan untuk Pratinjau Microsoft Azure mencakup lebih banyak persyaratan hukum yang berlaku untuk fitur Azure yang dalam versi beta, dalam pratinjau, atau belum dirilis ke ketersediaan umum. Untuk informasi tentang pratinjau khusus ini, lihat Azure HDInsight pada informasi pratinjau AKS. Untuk pertanyaan atau saran fitur, kirimkan permintaan di AskHDInsight dengan detail dan ikuti kami untuk pembaruan lebih lanjut di Komunitas Azure HDInsight.

Dalam HDInsight di AKS, semua manajemen dan operasi kluster memiliki dukungan asli untuk manajemen layanan pada portal Azure untuk kluster individual.

Dalam HDInsight di AKS, dua konsep baru diperkenalkan:

  • Kumpulan Kluster digunakan untuk mengelompokkan dan mengelola kluster.
  • Kluster digunakan untuk komputasi sumber terbuka, mereka dihosting dalam kumpulan kluster.

Kumpulan Kluster

HDInsight pada AKS berjalan pada Azure Kubernetes Service (AKS). Sumber daya tingkat atas adalah Kumpulan Kluster dan mengelola semua kluster yang berjalan pada kluster AKS yang sama. Saat Anda membuat Kumpulan Kluster, kluster AKS yang mendasar dibuat pada saat yang sama untuk menghosting semua kluster di kumpulan. Kumpulan kluster adalah pengelompokan kluster logis, yang membantu dalam membangun interoperabilitas yang kuat di beberapa jenis kluster dan memungkinkan perusahaan untuk memiliki kluster dalam jaringan virtual yang sama. Kumpulan kluster menyediakan akses cepat dan hemat biaya ke semua jenis kluster yang dibuat sesuai permintaan dan dalam skala besar. Satu kumpulan kluster sesuai dengan satu kluster dalam infrastruktur AKS.

Kluster

Kluster adalah beban kerja komputasi sumber terbuka individual, seperti Apache Spark, Apache Flink, dan Trino, yang dapat dibuat dengan cepat dalam beberapa menit dengan konfigurasi prasetel dan beberapa klik. Meskipun berjalan pada kumpulan kluster yang sama, setiap kluster dapat memiliki konfigurasinya sendiri, seperti jenis kluster, versi, ukuran VM simpul, jumlah simpul. Kluster berjalan pada sumber daya komputasi yang dipisahkan dengan DNS dan titik akhirnya sendiri.

Fitur yang saat ini berada dalam pratinjau

Daftar tabel berikut ini memperlihatkan fitur HDInsight pada AKS yang saat ini dalam pratinjau. Fitur pratinjau diurutkan menurut abjad.

Luas Fitur
Fundamental Membuat Kumpulan dan kluster menggunakan portal, dukungan shell aman web (ssh), Kemampuan Untuk Memilih jumlah simpul pekerja selama pembuatan kluster
Penyimpanan Dukungan Penyimpanan ADLS Gen2
Metastore Dukungan Metastore Eksternal untuk Trino, Spark dan Flink, Terintegrasi dengan HDInsight
Keamanan Dukungan untuk ARM RBAC, Dukungan untuk autentikasi berbasis MSI, Opsi untuk menyediakan akses kluster ke pengguna lain
Pembuatan Log dan Pemantauan Agregasi log di analitik log Azure, untuk log server, metrik Kluster, dan Layanan melalui Prometheus terkelola dan Grafana, Metrik server dukungan di azure monitor, halaman Status Layanan untuk memantau Kondisi layanan
Penskalaan Otomatis Skala Otomatis berbasis beban, dan Skala Otomatis berbasis Jadwal
Menyesuaikan dan Mengonfigurasi Kluster Dukungan untuk tindakan skrip selama pembuatan kluster, Dukungan untuk manajemen pustaka, Pengaturan konfigurasi layanan setelah pembuatan kluster
Trino Dukungan untuk katalog Trino, Dukungan Trino CLI, dukungan DBeaver untuk pengiriman kueri, Menambahkan atau menghapus plugin dan konektor, Dukungan untuk peristiwa kueri pengelogan, Dukungan untuk memindai statistik kueri untuk setiap Konektor di dasbor Trino, Dukungan untuk dasbor Trino untuk memantau kueri, Penembolokan Kueri, Integrasi dengan Power BI, Integrasi dengan Apache Superset, Redash, Dukungan untuk beberapa konektor
Flink Dukungan untuk UI web asli Flink, dukungan Flink dengan HMS untuk DStream, Kirim pekerjaan ke kluster menggunakan REST API dan portal Azure, Jalankan program yang dikemas sebagai file JAR melalui Flink CLI, Dukungan untuk Titik Penyimpanan persisten, Dukungan untuk memperbarui opsi konfigurasi saat pekerjaan berjalan, Menyambungkan ke beberapa layanan Azure: Azure Cosmos DB, Azure Databricks, Azure Data Explorer, Azure Event Hubs, Azure IoT Hub, Azure Pipelines, Azure Data Factory Workflow Orchestration Manager, HDInsight Kafka, Kirim pekerjaan ke kluster menggunakan Flink CLI dan CDC dengan Flink
Spark Jupyter Notebook, Dukungan untuk Delta lake 2.0, Dukungan Zeppelin, ATS Dukungan, Dukungan untuk antarmuka server Riwayat Yarn, Pengiriman pekerjaan menggunakan SSH, Pengiriman pekerjaan menggunakan SDK dan Pembelajaran Mesin Notebook

Peta Strategi Fitur

Fitur Estimasi garis waktu rilis Status
Skala Otomatis - Berbasis Beban - Trino Q1 2024 Selesai
Mengacak skala otomatis berbasis beban sadar untuk Spark Q2 2024 Dalam Proses
Pemutakhiran Di Tempat Q2 2024 Selesai
Dukungan Instans Yang Dipesan Q2 2024 Dalam Proses
Autentikasi berbasis MSI untuk Metastore (SQL) Q1 2024 Dalam Proses
Spark 3.4 Q2 2024 Dalam Proses
Trino 426 Q1 2024 Selesai
Ranger untuk RBAC Q2 2024 Dalam Proses
Dukungan mode aplikasi untuk Flink Q1 2024 Selesai
Flink 1.17 Q1 2024 Selesai
Dukungan Spark ACID Q1 2024 Dalam Proses
SKU yang dapat dikonfigurasi untuk Headnode, SSH Q2 2024 Dalam Proses
Dukungan Flink SQL Gateway Q1 2024 Selesai
Kluster Privat untuk HDInsight di AKS Q1 2024 Selesai
Dukungan Ranger untuk Spark SQL Q4 2024 Dalam Proses
ACL Ranger pada Lapisan Penyimpanan Q4 2024 Dalam Proses
Dukungan untuk One lake sebagai kontainer utama Q2 2024 Dalam Proses