Condividi tramite


Errori di creazione del cluster in Azure HDInsight nel servizio Azure Kubernetes

Questo articolo descrive come risolvere e risolvere gli errori che possono verificarsi quando si crea Azure HDInsight nei cluster del servizio Azure Kubernetes.

Sr. No Messaggio di errore Causa Risoluzione
1 InternalServerError UnrecognizableError Questo errore potrebbe indicare un modello non corretto usato. Attualmente, i connettori di database sono consentiti solo tramite il modello di Resource Manager. Di conseguenza, la convalida della configurazione non è possibile nel modello.
2 InvalidClusterSpec - ServiceDependencyFailure - Configurazione non valida Memoria massima per ogni errore del nodo. Fare riferimento ai tipi di valore della proprietà maximum memory configurations.
3 WaitingClusterResourcesReadyTimeOut - Metastoreservice unready Questo errore potrebbe essere dovuto al nome del contenitore può contenere solo lettere minuscole, numeri e trattini. Il nome del contenitore deve iniziare con una lettera o un numero. Ogni trattino deve essere preceduto da e seguito da un carattere non trattino. Il nome deve inoltre avere una lunghezza compresa fra 3 e 63 caratteri.
4 InvalidClusterSpec - Configurazione non valida - ClusterUpsertActivity Errore: proprietà hive.metastore.uri: may not be nulldi configurazione non valida. Vedere la documentazione del connettore Hive.
5 InternalServerError - An exception has been raised that is likely due to a transient failure. Consider enabling transient error resiliency by adding 'EnableRetryOnFailure()' to the 'UseSqlServer' call. Ripetere l'operazione o aprire un ticket di supporto al team di Azure HDInsight.
6 InternalServerError - ObjectDisposedException si verifica nel codice RP. Ripetere l'operazione o aprire un ticket di supporto al team di Azure HDInsight.
7 PreconditionFailed - Errore dell'operazione a causa dei limiti di quota per la sottoscrizione utente. È prevista la convalida della quota prima della creazione del cluster. Tuttavia, quando vengono creati più cluster nella stessa sottoscrizione contemporaneamente, è possibile che il primo cluster occupi la quota e l'altro non riesca a causa della carenza di quote. Verificare che sia disponibile una quota sufficiente e riprovare a creare un cluster o un pool di cluster.
8 ReconcileApplicationSecurityGroupError - Errore interno del servizio Azure Kubernetes Ripetere l'operazione o aprire un ticket di supporto al team di Azure HDInsight.
9 ResourceGroupBeingDeleted Durante la creazione o l'aggiornamento delle risorse del servizio Azure Kubernetes, l'utente elimina anche alcune risorse nei gruppi di risorse correlati. Non eliminare le risorse nei gruppi di risorse correlati a HDI durante la creazione o l'aggiornamento di HDI nelle risorse del servizio Azure Kubernetes.
10 UpsertNodePoolTimeOut - Async operation dependentArmResourceTask has timed out. Problema del servizio Azure Kubernetes: potrebbe essere dovuto a un traffico elevato in una determinata area al momento dell'operazione. Ripetere l'operazione dopo alcuni minuti. Se possibile, usare un'altra area.
11 Authorization_IdentityNotFound - {"code":null,"message":"The identity of the calling application could not be established."} L'entità servizio 1-p non viene inserita nel tenant. Eseguire il comando per effettuare il provisioning dell'entità servizio 1-p nel nuovo tenant da caricare.
12 NotFound - ARM/AKS sdk error L'utente tenta di aggiornare HDI nel cluster del servizio Azure Kubernetes, ma il pool di agenti corrispondente è stato eliminato. Il pool di agenti corrispondente è stato eliminato. Non è consigliabile gestire direttamente il pool di agenti del servizio Azure Kubernetes.
13 AuthorizationFailed - Scope invalid role assignment issue with managed RG and cluster msi Mancanza di autorizzazione per eseguire l'operazione. Controllare se l'ID app dell'entità servizio indicato nel messaggio di errore appartiene all'utente. In caso affermativo, concedere l'autorizzazione in base al messaggio di errore. In caso contrario, aprire un ticket di supporto al team di Azure HDInsight.
14 DeleteAksClusterFailed - {"code":"DeleteAksClusterFailed","message":"An Azure service request has failed. ErrorCode: 'DeleteAksClusterFailed', ErrorMessage: 'Delete HDI cluster namespcae failed. Additional info: 'Can't access a disposed object.\\r\\nObject name: 'Microsoft.Azure.Common.Configuration.ManagedConfiguration was already disposed'.''."} RP è passato a una nuova istanza del ruolo in modo imprevisto. ripetere l'operazione o aprire un ticket di supporto al team di Azure HDInsight.
15 EntityStoreOperationError - ARM/AKS sdk error Un'operazione di database non è riuscita sul lato servizio Azure Kubernetes durante l'aggiornamento del cluster. Ripetere l'operazione dopo alcuni minuti. Se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight.
16 InternalServerError - {"exception":"System.Threading.Tasks.TaskCanceledException","message":"The operation was canceled."} Questo errore è stato causato da vari problemi. ripetere l'operazione o aprire un ticket di supporto al team di Azure HDInsight.
17 InternalServerError - {"exception":"System.IO.IOException","message":"Unable to read data from the transport connection: A connection attempt failed because the connected party didn't properly respond after a period of time, or established connection failed because connected host has failed to respond."} Questo errore è stato causato da vari problemi. ripetere l'operazione dopo qualche tempo. Se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight.
18 InternalServerError - Null reference exception occurs in RP code. Questo errore è stato causato da vari problemi. Ripetere l'operazione o aprire un ticket di supporto al team di Azure HDInsight.
19 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'InvalidOperationException, Sequence contains no elements.'"} Questo errore è stato causato da vari problemi. ripetere l'operazione o aprire un ticket di supporto al team di Azure HDInsight.
20 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'ArgumentNullException, Value can't be null. (Parameter 'roleAssignmentGuid')'"} Questo errore è stato causato da vari problemi. ripetere l'operazione o aprire un ticket di supporto al team di Azure HDInsight.
21 OperationNotAllowed - {"code":"OperationNotAllowed","message":"An Azure service request has failed. ErrorCode: 'OperationNotAllowed', ErrorMessage: 'Service request failed.\\r\\nStatus: 409 (Conflict)\\r\\n\\r\\nContent:\\r\\n{\\ n \\"code\\": \\"OperationNotAllowed\\",\\ n \\"details\\": null,\\ n \\"message\\": \\"Operation isn't allowed: Another agent pool operation (Scaling) is in progress, wait for it to finish before starting a new operation. È in corso un'altra operazione del pool di agenti (ridimensionamento). Questo errore è stato causato dal riavvio di Service Fabric rp. Attendere il completamento dell'operazione precedente prima di avviare una nuova operazione. Se il problema persiste dopo un nuovo tentativo, aprire un ticket di supporto al team di Azure HDInsight.
22 ReconcileVMSSAgentPoolFailed È prevista la convalida della quota prima della creazione del cluster. Tuttavia, quando vengono creati più cluster nella stessa sottoscrizione contemporaneamente, è possibile che il primo cluster occupi la quota e gli altri non riescano a causa della carenza di quote. Verificare che sia disponibile una quota sufficiente e riprovare a creare un cluster o un pool di cluster.
23 ReconcileVMSSAgentPoolFailed - Impossibile stabilire una connessione in uscita dagli agenti AKS/VMSS problema laterale: la macchina virtuale ha segnalato un errore. ripetere l'operazione dopo qualche tempo. Se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight.
24 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'SqlException'"} Questo errore è stato causato da un problema di connessione SQL temporaneo. ripetere l'operazione dopo qualche tempo. Se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight.
25 NotLatestOperation - ARM/AKS SDK error L'operazione non può continuare. L'operazione è stata annullata da un'altra o le informazioni necessarie per l'operazione non sono state salvate (o non sono state ancora salvate). ripetere l'operazione dopo qualche tempo. Se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight.
26 ReconcileVMSSAgentPoolFailed - Agent pool drain failed Si è verificato un problema con l'operazione di riduzione delle prestazioni. Aprire un ticket di supporto al team di Azure HDInsight.
27 ResourceNotFound - ARM/AKS SDK error Questo errore si verifica quando l'utente rimuove o elimina una risorsa richiesta. Assicurarsi che la risorsa menzionata nel messaggio di errore esista, quindi ripetere l'operazione. Se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight.
28 InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance _'xyz'_ has invalid request due to - [Hive metastore storage location access check timed out.]. L'inizializzazione HMS potrebbe verificarsi un timeout a causa di problemi correlati a SQL Server o all'archiviazione. Aprire un ticket di supporto al team di Azure HDInsight.
29 InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance '_xyz_' has invalid request due to - [Keyvault secrets weren't configured properly. Failed to fetch secrets from keyvault.]. Questo errore può verificarsi a causa dell'inaccessibile keyvault o della chiave privata non disponibile. In alcuni rari casi, questo errore potrebbe essere dovuto a un'inizializzazione più lenta dell'infrastruttura di identità del pod nei nodi del cluster. Se Log Analytics è abilitato, controllare i log di secretprovider-validate job per identificare il motivo.ripetere l'operazione dopo qualche tempo, se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight.
30 FlinkCluster unready - {"FlinkCluster": "Status can't be determined"} Questo errore può verificarsi a causa di diversi motivi, ad esempio il problema di pull delle immagini o i pod controller non pronti o un problema con l'identità del servizio gestito. Ripetere l'operazione dopo un certo periodo di tempo, se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight.
31 FlinkCluster unready - {"FlinkCluster": "StatefulSet instance 'flink-taskmanager' isn't ready due to - [Ready replicas don't match desired replica count]."} Questo errore può verificarsi a causa di diversi motivi, ad esempio il problema di pull delle immagini o i pod controller non pronti o un problema con l'identità del servizio gestito. Ripetere l'operazione dopo un certo periodo di tempo, se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight.
32 InvalidClusterSpec (class com.microsoft.azure.hdinsight.services.spark.exception.ClusterConfigException:[SparkClusterValidator#ConfigurationValidator#][ISSUE:(1)-Component config valid:[[{serviceName='yarn-service,componentName=hadoop-config-client}, {serviceName='yarn-service,componentName=hadoop-config}]],current:[[{serviceName='yarn-service,componentName=yarn-config}'. Questo errore può verificarsi se la configurazione del servizio è costituita da componenti non consentiti. Convalidare i componenti di configurazione del servizio e riprovare. Se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight.
33 InvalidClusterSpec -1,"conditions":[{"type":"RequestIsValid","status":"UNKNOWN","reason":"UNKNOWN","message":"Unable to determine status of one or more dependencies. Questo errore può verificarsi a causa di HMS, SPARK, servizi YARN non aggiornati. Questo errore potrebbe essere correlato all'archiviazione. Aprire un ticket di supporto al team di Azure HDInsight.
34 WaitingClusterResourcesReadyTimeOut - Failed to reconcile from generation 1 to 1. Aprire un ticket di supporto al team di Azure HDInsight.
35 WaitingClusterResourcesReadyTimeOut - {"YarnService":"StatefulSet instance 'resourcemanager' isn't ready due to - `` see service status for specific details and how to fix it. Failing services are: YarnService, SparkService"} Questo errore può verificarsi a causa di HMS, SPARK, servizi YARN non aggiornati. Questo errore potrebbe essere correlato all'archiviazione. Aprire un ticket di supporto al team di Azure HDInsight.
36 InvalidClusterSpec - [spec.configs[0].files[3].fileName: Invalid value: "yarn-env.sh": spec.configs[0].files[3].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[0].files[3].values: Required value, spec.configs[1].files[2].fileName: Invalid value: "yarn-env.sh": spec.configs[1].files[2].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[1].files[2].values: Required value]. Questo errore può verificarsi quando i file non supportati vengono passati nella configurazione dei servizi. Convalidare i componenti di configurazione del servizio e riprovare. Se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight.
37 InvalidClusterSpec - ".AccessDeniedException: Operation failed: "Server failed to authenticate the request. InvalidAuthenticationInfo, "Server failed to authenticate the request.." Parametri di autenticazione non validi: il percorso di archiviazione non è accessibile. Correggere i parametri di autenticazione e riprovare. Se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight.
38 InvalidClusterSpec - “_xyz_.dfs.core.windows.net isn't accessible. Reason: HTTP Error -1; url=. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException :. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException : Read timed out.]. Questo errore può verificarsi quando le risorse di identità del pod richiedono troppo tempo per l'avvio nel nodo quando è pianificato il pod HMS. Ripetere l'operazione, se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight.

Passaggi successivi