Bagikan melalui


Kesalahan pembuatan kluster di Azure HDInsight di AKS

Catatan

Kami akan menghentikan Azure HDInsight di AKS pada 31 Januari 2025. Sebelum 31 Januari 2025, Anda harus memigrasikan beban kerja anda ke Microsoft Fabric atau produk Azure yang setara untuk menghindari penghentian tiba-tiba beban kerja Anda. Kluster yang tersisa pada langganan Anda akan dihentikan dan dihapus dari host.

Hanya dukungan dasar yang akan tersedia hingga tanggal penghentian.

Penting

Fitur ini masih dalam mode pratinjau. Ketentuan Penggunaan Tambahan untuk Pratinjau Microsoft Azure mencakup lebih banyak persyaratan hukum yang berlaku untuk fitur Azure yang dalam versi beta, dalam pratinjau, atau belum dirilis ke ketersediaan umum. Untuk informasi tentang pratinjau khusus ini, lihat Azure HDInsight pada informasi pratinjau AKS. Untuk pertanyaan atau saran fitur, kirimkan permintaan di AskHDInsight dengan detail dan ikuti kami untuk pembaruan lebih lanjut di Komunitas Azure HDInsight.

Artikel ini menjelaskan cara memecahkan masalah dan mengatasi kesalahan yang dapat terjadi saat Anda membuat Azure HDInsight pada kluster AKS.

Sr. Tidak Pesan kesalahan Penyebab Resolusi
1 InternalServerError UnrecognizableError Kesalahan ini dapat menunjukkan templat yang salah digunakan. Saat ini, konektor database hanya diizinkan melalui templat ARM. Oleh karena itu validasi konfigurasi tidak dimungkinkan pada templat.
2 InvalidClusterSpec - ServiceDependencyFailure - Konfigurasi tidak valid Memori maksimum per kesalahan simpul. Lihat jenis nilai properti konfigurasi memori maksimum.
3 WaitingClusterResourcesReadyTimeOut - Metastoreservice unready Kesalahan ini bisa disebabkan oleh nama kontainer hanya boleh berisi huruf kecil, angka, dan tanda hubung. Nama kontainer harus dimulai dengan huruf atau angka. Setiap tanda hubung harus didahului dan diikuti oleh karakter nonhifen. Panjang nama harus antara 3 hingga 63 karakter.
4 InvalidClusterSpec -Konfigurasi tidak valid - ClusterUpsertActivity Kesalahan: Properti hive.metastore.uri: may not be nullkonfigurasi tidak valid . Lihat dokumentasi konektor Apache Hive.
5 InternalServerError - An exception has been raised that is likely due to a transient failure. Consider enabling transient error resiliency by adding 'EnableRetryOnFailure()' to the 'UseSqlServer' call. Coba lagi operasi atau buka tiket dukungan ke tim Azure HDInsight.
6 InternalServerError - ObjectDisposedException terjadi dalam kode RP. Coba lagi operasi atau buka tiket dukungan ke tim Azure HDInsight.
7 PreconditionFailed - Kegagalan operasi karena batas kuota pada langganan pengguna. Ada validasi kuota sebelum pembuatan kluster. Tetapi ketika beberapa kluster dibuat di bawah langganan yang sama pada saat yang sama, ada kemungkinan bahwa kluster pertama menempati kuota dan yang lain gagal karena kekurangan kuota. Konfirmasikan ada cukup kuota dan coba lagi pembuatan kluster/kumpulan kluster.
8 ReconcileApplicationSecurityGroupError - Kesalahan AKS internal Coba lagi operasi atau buka tiket dukungan ke tim Azure HDInsight.
9 ResourceGroupBeingDeleted Selama HDI pada pembuatan atau pembaruan sumber daya AKS, pengguna juga menghapus beberapa sumber daya dalam grup sumber daya terkait. Jangan hapus sumber daya dalam grup sumber daya terkait HDI saat HDI pada sumber daya AKS sedang dibuat atau diperbarui.
10 UpsertNodePoolTimeOut - Async operation dependentArmResourceTask has timed out. Masalah AKS – bisa disebabkan oleh lalu lintas yang tinggi di wilayah tertentu pada saat operasi. Coba lagi operasi tersebut setelah beberapa saat. Jika memungkinkan, gunakan wilayah lain.
11 Authorization_IdentityNotFound - {"code":null,"message":"The identity of the calling application could not be established."} Prinsip layanan 1-p tidak ditumpangi ke penyewa. Jalankan perintah untuk memprovisikan prinsip layanan 1-p pada penyewa baru ke onboard.
12 NotFound - ARM/AKS sdk error Pengguna mencoba memperbarui HDI pada kluster AKS tetapi kumpulan agen yang sesuai telah dihapus. Kumpulan agen yang sesuai telah dihapus. Tidak disarankan untuk mengoperasikan kumpulan agen AKS secara langsung.
13 AuthorizationFailed - Scope invalid role assignment issue with managed RG and cluster msi Kurangnya izin untuk melakukan operasi. Periksa apakah ID aplikasi prinsip layanan yang disebutkan dalam pesan kesalahan yang Anda miliki. Jika ya, berikan izin sesuai dengan pesan kesalahan. Jika tidak, buka tiket dukungan ke tim Azure HDInsight.
14 DeleteAksClusterFailed - {"code":"DeleteAksClusterFailed","message":"An Azure service request has failed. ErrorCode: 'DeleteAksClusterFailed', ErrorMessage: 'Delete HDI cluster namespcae failed. Additional info: 'Can't access a disposed object.\\r\\nObject name: 'Microsoft.Azure.Common.Configuration.ManagedConfiguration was already disposed'.''."} RP beralih ke instans peran baru secara tak terduga. coba lagi operasi atau buka tiket dukungan ke tim Azure HDInsight.
15 EntityStoreOperationError - ARM/AKS sdk error Operasi database gagal di sisi AKS selama pembaruan kluster. Coba lagi operasi tersebut setelah beberapa saat. Jika masalah berlanjut, buka tiket dukungan ke tim Azure HDInsight.
16 InternalServerError - {"exception":"System.Threading.Tasks.TaskCanceledException","message":"The operation was canceled."} Kesalahan ini disebabkan karena berbagai masalah. coba lagi operasi atau buka tiket dukungan ke tim Azure HDInsight.
17 InternalServerError - {"exception":"System.IO.IOException","message":"Unable to read data from the transport connection: A connection attempt failed because the connected party didn't properly respond after a period of time, or established connection failed because connected host has failed to respond."} Kesalahan ini disebabkan karena berbagai masalah. coba lagi operasi setelah beberapa waktu. Jika masalah berlanjut, buka tiket dukungan ke tim Azure HDInsight.
18 InternalServerError - Null reference exception occurs in RP code. Kesalahan ini disebabkan karena berbagai masalah. Coba lagi operasi atau buka tiket dukungan ke tim Azure HDInsight.
19 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'InvalidOperationException, Sequence contains no elements.'"} Kesalahan ini disebabkan karena berbagai masalah. coba lagi operasi atau buka tiket dukungan ke tim Azure HDInsight.
20 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'ArgumentNullException, Value can't be null. (Parameter 'roleAssignmentGuid')'"} Kesalahan ini disebabkan karena berbagai masalah. coba lagi operasi atau buka tiket dukungan ke tim Azure HDInsight.
21 OperationNotAllowed - {"code":"OperationNotAllowed","message":"An Azure service request has failed. ErrorCode: 'OperationNotAllowed', ErrorMessage: 'Service request failed.\\r\\nStatus: 409 (Conflict)\\r\\n\\r\\nContent:\\r\\n{\\ n \\"code\\": \\"OperationNotAllowed\\",\\ n \\"details\\": null,\\ n \\"message\\": \\"Operation isn't allowed: Another agent pool operation (Scaling) is in progress, wait for it to finish before starting a new operation. Operasi kumpulan agen lain (Penskalakan) sedang berlangsung. Kesalahan ini disebabkan karena reboot RP Service Fabric. Tunggu hingga operasi sebelumnya selesai sebelum memulai operasi baru. Jika masalah berlanjut setelah mencoba kembali, buka tiket dukungan ke tim Azure HDInsight.
22 ReconcileVMSSAgentPoolFailed Ada validasi kuota sebelum pembuatan kluster. Tetapi ketika beberapa kluster dibuat di bawah langganan yang sama pada saat yang sama, ada kemungkinan bahwa kluster pertama menempati kuota dan yang lain gagal karena kekurangan kuota. Konfirmasikan ada cukup kuota dan coba lagi pembuatan kluster/kumpulan kluster.
23 ReconcileVMSSAgentPoolFailed - Tidak dapat membuat koneksi keluar dari agen AKS/VMSS masalah sisi: VM telah melaporkan kegagalan. coba lagi operasi setelah beberapa waktu. Jika masalah berlanjut, buka tiket dukungan ke tim Azure HDInsight.
24 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'SqlException'"} Kesalahan ini disebabkan karena masalah koneksi SQL sementara. coba lagi operasi setelah beberapa waktu. Jika masalah berlanjut, buka tiket dukungan ke tim Azure HDInsight.
25 NotLatestOperation - ARM/AKS SDK error Operasi tidak dapat dilanjutkan. Operasi telah didahului oleh operasi lain, atau informasi yang diperlukan oleh operasi gagal disimpan (atau belum disimpan). coba lagi operasi setelah beberapa waktu. Jika masalah berlanjut, buka tiket dukungan ke tim Azure HDInsight.
26 ReconcileVMSSAgentPoolFailed - Agent pool drain failed Ada masalah dengan operasi penurunan skala. Buka tiket dukungan ke tim Azure HDInsight.
27 ResourceNotFound - ARM/AKS SDK error Masalah kesalahan ini terjadi ketika sumber daya yang diperlukan dihapus/dihapus oleh pengguna. Pastikan sumber daya yang disebutkan dalam pesan kesalahan ada, lalu coba lagi operasi. Jika masalah berlanjut, buka tiket dukungan ke tim Azure HDInsight.
28 InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance _'xyz'_ has invalid request due to - [Hive metastore storage location access check timed out.]. Inisialisasi HMS mungkin kehabisan waktu karena server SQL atau masalah terkait penyimpanan. Buka tiket dukungan ke tim Azure HDInsight.
29 InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance '_xyz_' has invalid request due to - [Keyvault secrets weren't configured properly. Failed to fetch secrets from keyvault.]. Kesalahan ini dapat terjadi karena keyvault tidak dapat diakses atau kunci rahasia tidak tersedia. Dalam beberapa kasus yang jarang terjadi, kesalahan ini mungkin disebabkan oleh inisialisasi infra identitas pod yang lebih lambat pada node kluster. Jika Anda mengaktifkan Analitik Log, periksa log secretprovider-validate job untuk mengidentifikasi alasan.coba lagi operasi setelah beberapa waktu, jika masalah berlanjut, buka tiket dukungan ke tim Azure HDInsight.
30 FlinkCluster unready - {"FlinkCluster": "Status can't be determined"} Kesalahan ini dapat terjadi karena berbagai alasan seperti masalah penarikan gambar, atau pod pengontrol tidak siap, atau masalah dengan MSI. coba lagi operasi setelah beberapa waktu, jika masalah berlanjut, buka tiket dukungan ke tim Azure HDInsight.
31 FlinkCluster unready - {"FlinkCluster": "StatefulSet instance 'flink-taskmanager' isn't ready due to - [Ready replicas don't match desired replica count]."} Kesalahan ini dapat terjadi karena berbagai alasan seperti masalah penarikan gambar, atau pod pengontrol tidak siap, atau masalah dengan MSI. coba lagi operasi setelah beberapa waktu, jika masalah berlanjut, buka tiket dukungan ke tim Azure HDInsight.
32 InvalidClusterSpec (class com.microsoft.azure.hdinsight.services.spark.exception.ClusterConfigException:[SparkClusterValidator#ConfigurationValidator#][ISSUE:(1)-Component config valid:[[{serviceName='yarn-service,componentName=hadoop-config-client}, {serviceName='yarn-service,componentName=hadoop-config}]],current:[[{serviceName='yarn-service,componentName=yarn-config}'. Kesalahan ini dapat terjadi jika konfigurasi layanan terdiri dari komponen yang tidak diizinkan. Validasi komponen konfigurasi layanan dan coba lagi. Jika masalah berlanjut, buka tiket dukungan ke tim Azure HDInsight.
33 InvalidClusterSpec -1,"conditions":[{"type":"RequestIsValid","status":"UNKNOWN","reason":"UNKNOWN","message":"Unable to determine status of one or more dependencies. Kesalahan ini dapat terjadi karena layanan HMS,SPARK,YARN tidak aktif, kesalahan ini dapat terkait dengan penyimpanan. Buka tiket dukungan ke tim Azure HDInsight.
34 WaitingClusterResourcesReadyTimeOut - Failed to reconcile from generation 1 to 1. Buka tiket dukungan ke tim Azure HDInsight.
35 WaitingClusterResourcesReadyTimeOut - {"YarnService":"StatefulSet instance 'resourcemanager' isn't ready due to - `` see service status for specific details and how to fix it. Failing services are: YarnService, SparkService"} Kesalahan ini dapat terjadi karena layanan HMS,SPARK,YARN tidak aktif, kesalahan ini dapat terkait dengan penyimpanan. Buka tiket dukungan ke tim Azure HDInsight.
36 InvalidClusterSpec - [spec.configs[0].files[3].fileName: Invalid value: "yarn-env.sh": spec.configs[0].files[3].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[0].files[3].values: Required value, spec.configs[1].files[2].fileName: Invalid value: "yarn-env.sh": spec.configs[1].files[2].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[1].files[2].values: Required value]. Kesalahan ini dapat terjadi ketika file yang tidak didukung diteruskan dalam konfigurasi layanan. Validasi komponen konfigurasi layanan dan coba lagi. Jika masalah berlanjut, buka tiket dukungan ke tim Azure HDInsight.
37 InvalidClusterSpec - ".AccessDeniedException: Operation failed: "Server failed to authenticate the request. InvalidAuthenticationInfo, "Server failed to authenticate the request.." Parameter autentikasi tidak valid – lokasi penyimpanan tidak dapat diakses. Benarkan parameter autentikasi dan coba lagi. Jika masalah berlanjut, buka tiket dukungan ke tim Azure HDInsight.
38 InvalidClusterSpec - “_xyz_.dfs.core.windows.net isn't accessible. Reason: HTTP Error -1; url=. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException :. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException : Read timed out.]. Kesalahan ini dapat terjadi ketika sumber daya identitas pod membutuhkan waktu terlalu lama untuk memulai pada simpul ketika pod HMS dijadwalkan. coba lagi operasi, jika masalah berlanjut, buka tiket dukungan ke tim Azure HDInsight.

Langkah berikutnya