Klusterskapandefel i Azure HDInsight på AKS

I den här artikeln beskrivs hur du felsöker och löser fel som kan uppstå när du skapar Azure HDInsight i AKS-kluster.

Sr. Nej Felmeddelande Orsak Upplösning
1 InternalServerError UnrecognizableError Det här felet kan tyda på att en felaktig mall används. För närvarande tillåts databasanslutningar endast via ARM-mall. Därför går det inte att validera konfigurationen i mallen.
2 InvalidClusterSpec – ServiceDependencyFailure – Ogiltig konfiguration Maximalt minne per nodfel. Se egenskapsvärdena för maximalt antal minneskonfigurationer.
3 WaitingClusterResourcesReadyTimeOut – Metastoreservice oläst Det här felet kan bero på att containernamnet endast får innehålla gemener, siffror och bindestreck. Containernamnet måste börja med en bokstav eller ett tal. Varje bindestreck måste föregås av och följas av ett icke-hyphentecken. Namnet måste också vara mellan 3 och 63 tecken långt.
4 InvalidClusterSpec –Ogiltig konfiguration – ClusterUpsertActivity Fel: Ogiltig konfigurationsegenskap hive.metastore.uri: may not be null. Se dokumentationen för Hive-anslutningsprogrammet.
5 InternalServerError - An exception has been raised that is likely due to a transient failure. Consider enabling transient error resiliency by adding 'EnableRetryOnFailure()' to the 'UseSqlServer' call. Försök igen eller öppna en supportbegäran till Azure HDInsight-teamet.
6 InternalServerError - ObjectDisposedException inträffar i RP-kod. Försök igen eller öppna en supportbegäran till Azure HDInsight-teamet.
7 PreconditionFailed – Åtgärdsfel på grund av kvotgränser för användarprenumeration. Det finns en kvotverifiering innan klustret skapas. Men när flera kluster skapas under samma prenumeration samtidigt är det möjligt att det första klustret upptar kvoten och det andra misslyckas på grund av kvotbrist. Bekräfta att det finns tillräckligt med kvot och försök skapa kluster/klusterpool igen.
8 ReconcileApplicationSecurityGroupError – Internt AKS-fel Försök igen eller öppna en supportbegäran till Azure HDInsight-teamet.
9 ResourceGroupBeingDeleted Under HDI för skapande eller uppdatering av AKS-resurser tar användaren också bort vissa resurser i relaterade resursgrupper. Ta inte bort resurser i HDI-relaterade resursgrupper när HDI på AKS-resurser skapas eller uppdateras.
10 UpsertNodePoolTimeOut - Async operation dependentArmResourceTask has timed out. AKS-problem – kan bero på hög trafik i en viss region vid tidpunkten för åtgärden. Försök igen efter en stund. Använd om möjligt en annan region.
11 Authorization_IdentityNotFound - {"code":null,"message":"The identity of the calling application could not be established."} 1-p-tjänstprincipen finns inte med i klientorganisationen. Kör kommandot för att etablera 1-p-tjänstprincipen på den nya klientorganisationen som ska registreras.
12 NotFound - ARM/AKS sdk error Användaren försöker uppdatera HDI i AKS-klustret, men motsvarande agentpool har tagits bort. Motsvarande agentpool har tagits bort. Vi rekommenderar inte att du använder AKS-agentpoolen direkt.
13 AuthorizationFailed - Scope invalid role assignment issue with managed RG and cluster msi Brist på behörighet att utföra åtgärden. Kontrollera om app-ID:t för tjänstprincipen som nämns i felmeddelandet som ägs av dig. Om ja beviljar du behörigheten enligt felmeddelandet. Om nej öppnar du en supportbegäran till Azure HDInsight-teamet.
14 DeleteAksClusterFailed - {"code":"DeleteAksClusterFailed","message":"An Azure service request has failed. ErrorCode: 'DeleteAksClusterFailed', ErrorMessage: 'Delete HDI cluster namespcae failed. Additional info: 'Can't access a disposed object.\\r\\nObject name: 'Microsoft.Azure.Common.Configuration.ManagedConfiguration was already disposed'.''."} RP växlade oväntat till en ny rollinstans. försök igen eller öppna en supportbegäran till Azure HDInsight-teamet.
15 EntityStoreOperationError - ARM/AKS sdk error En databasåtgärd misslyckades på AKS-sidan under klusteruppdateringen. Försök igen efter en stund. Om problemet kvarstår öppnar du en supportbegäran till Azure HDInsight-teamet.
16 InternalServerError - {"exception":"System.Threading.Tasks.TaskCanceledException","message":"The operation was canceled."} Det här felet orsakades av olika problem. försök igen eller öppna en supportbegäran till Azure HDInsight-teamet.
17 InternalServerError - {"exception":"System.IO.IOException","message":"Unable to read data from the transport connection: A connection attempt failed because the connected party didn't properly respond after a period of time, or established connection failed because connected host has failed to respond."} Det här felet orsakades av olika problem. försök utföra åtgärden igen efter en stund. Om problemet kvarstår öppnar du en supportbegäran till Azure HDInsight-teamet.
18 InternalServerError - Null reference exception occurs in RP code. Det här felet orsakades av olika problem. Försök igen eller öppna en supportbegäran till Azure HDInsight-teamet.
19 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'InvalidOperationException, Sequence contains no elements.'"} Det här felet orsakades av olika problem. försök igen eller öppna en supportbegäran till Azure HDInsight-teamet.
20 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'ArgumentNullException, Value can't be null. (Parameter 'roleAssignmentGuid')'"} Det här felet orsakades av olika problem. försök igen eller öppna en supportbegäran till Azure HDInsight-teamet.
21 OperationNotAllowed - {"code":"OperationNotAllowed","message":"An Azure service request has failed. ErrorCode: 'OperationNotAllowed', ErrorMessage: 'Service request failed.\\r\\nStatus: 409 (Conflict)\\r\\n\\r\\nContent:\\r\\n{\\ n \\"code\\": \\"OperationNotAllowed\\",\\ n \\"details\\": null,\\ n \\"message\\": \\"Operation isn't allowed: Another agent pool operation (Scaling) is in progress, wait for it to finish before starting a new operation. En annan agentpoolåtgärd (skalning) pågår. Det här felet orsakades av omstart av RP Service Fabric. Vänta tills den föregående åtgärden har slutförts innan du påbörjar en ny åtgärd. Om problemet kvarstår efter ett nytt försök öppnar du en supportbegäran till Azure HDInsight-teamet.
22 ReconcileVMSSAgentPoolFailed Det finns en kvotverifiering innan klustret skapas. Men när flera kluster skapas under samma prenumeration samtidigt är det möjligt att det första klustret upptar kvoten och de andra misslyckas på grund av kvotbrist. Bekräfta att det finns tillräckligt med kvot och försök skapa kluster/klusterpool igen.
23 ReconcileVMSSAgentPoolFailed – Det går inte att upprätta utgående anslutning från agenter AKS/VMSS sidoproblem: Den virtuella datorn har rapporterat ett fel. försök utföra åtgärden igen efter en stund. Om problemet kvarstår öppnar du en supportbegäran till Azure HDInsight-teamet.
24 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'SqlException'"} Det här felet orsakades av ett tillfälligt SQL-anslutningsproblem. försök utföra åtgärden igen efter en stund. Om problemet kvarstår öppnar du en supportbegäran till Azure HDInsight-teamet.
25 NotLatestOperation - ARM/AKS SDK error Åtgärden kan inte fortsätta. Antingen har åtgärden föregripits av en annan, eller så gick det inte att spara den information som krävs av åtgärden (eller så har den inte sparats ännu). försök utföra åtgärden igen efter en stund. Om problemet kvarstår öppnar du en supportbegäran till Azure HDInsight-teamet.
26 ReconcileVMSSAgentPoolFailed - Agent pool drain failed Det uppstod ett problem med nedskalningsåtgärden. Öppna en supportbegäran till Azure HDInsight-teamet.
27 ResourceNotFound - ARM/AKS SDK error Det här felet uppstår när en nödvändig resurs har tagits bort/tagits bort av användaren. Kontrollera att resursen som nämns i felmeddelandet finns och försök sedan utföra åtgärden igen. Om problemet kvarstår öppnar du en supportbegäran till Azure HDInsight-teamet.
28 InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance _'xyz'_ has invalid request due to - [Hive metastore storage location access check timed out.]. HMS-initieringen kan överskrida tidsgränsen på grund av problem med SQL-servern eller lagringen. Öppna en supportbegäran till Azure HDInsight-teamet.
29 InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance '_xyz_' has invalid request due to - [Keyvault secrets weren't configured properly. Failed to fetch secrets from keyvault.]. Det här felet kan inträffa på grund av att den är otillgänglig eller att keyvault den hemliga nyckeln inte är tillgänglig. I vissa sällsynta fall kan det här felet bero på långsammare initiering av poddidentitetsfras på klusternoderna. Om du har Aktiverat Log Analytics kontrollerar du loggarna secretprovider-validate job för för att identifiera åtgärden reason.retry efter en tid. Om problemet kvarstår öppnar du ett supportärende för Azure HDInsight-teamet.
30 FlinkCluster unready - {"FlinkCluster": "Status can't be determined"} Det här felet kan inträffa på grund av olika orsaker, till exempel problem med avbildningshämtning eller att kontrollantpoddar inte är klara eller ett problem med MSI. Försök utföra åtgärden igen efter en stund, om problemet kvarstår, öppna ett supportärende för Azure HDInsight-teamet.
31 FlinkCluster unready - {"FlinkCluster": "StatefulSet instance 'flink-taskmanager' isn't ready due to - [Ready replicas don't match desired replica count]."} Det här felet kan inträffa på grund av olika orsaker, till exempel problem med avbildningshämtning eller att kontrollantpoddar inte är klara eller ett problem med MSI. Försök utföra åtgärden igen efter en stund, om problemet kvarstår, öppna ett supportärende för Azure HDInsight-teamet.
32 InvalidClusterSpec (class com.microsoft.azure.hdinsight.services.spark.exception.ClusterConfigException:[SparkClusterValidator#ConfigurationValidator#][ISSUE:(1)-Component config valid:[[{serviceName='yarn-service,componentName=hadoop-config-client}, {serviceName='yarn-service,componentName=hadoop-config}]],current:[[{serviceName='yarn-service,componentName=yarn-config}'. Det här felet kan inträffa om tjänstkonfigurationen består av komponenter som inte är tillåtna. Verifiera komponenterna för tjänstkonfiguration och försök igen. Om problemet kvarstår öppnar du en supportbegäran till Azure HDInsight-teamet.
33 InvalidClusterSpec -1,"conditions":[{"type":"RequestIsValid","status":"UNKNOWN","reason":"UNKNOWN","message":"Unable to determine status of one or more dependencies. Det här felet kan inträffa på grund av att HMS,SPARK,YARN-tjänster inte är igång, det här felet kan vara relaterat till lagring. Öppna en supportbegäran till Azure HDInsight-teamet.
34 WaitingClusterResourcesReadyTimeOut - Failed to reconcile from generation 1 to 1. Öppna en supportbegäran till Azure HDInsight-teamet.
35 WaitingClusterResourcesReadyTimeOut - {"YarnService":"StatefulSet instance 'resourcemanager' isn't ready due to - `` see service status for specific details and how to fix it. Failing services are: YarnService, SparkService"} Det här felet kan inträffa på grund av att HMS,SPARK,YARN-tjänster inte är igång, det här felet kan vara relaterat till lagring. Öppna en supportbegäran till Azure HDInsight-teamet.
36 InvalidClusterSpec - [spec.configs[0].files[3].fileName: Invalid value: "yarn-env.sh": spec.configs[0].files[3].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[0].files[3].values: Required value, spec.configs[1].files[2].fileName: Invalid value: "yarn-env.sh": spec.configs[1].files[2].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[1].files[2].values: Required value]. Det här felet kan inträffa när filer som inte stöds skickas i tjänstkonfigurationen. Verifiera komponenterna för tjänstkonfiguration och försök igen. Om problemet kvarstår öppnar du en supportbegäran till Azure HDInsight-teamet.
37 InvalidClusterSpec - ".AccessDeniedException: Operation failed: "Server failed to authenticate the request. InvalidAuthenticationInfo, "Server failed to authenticate the request.." Ogiltiga autentiseringsparametrar – lagringsplatsen är otillgänglig. Korrigera autentiseringsparametrar och försök igen. Om problemet kvarstår öppnar du en supportbegäran till Azure HDInsight-teamet.
38 InvalidClusterSpec - “_xyz_.dfs.core.windows.net isn't accessible. Reason: HTTP Error -1; url=. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException :. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException : Read timed out.]. Det här felet kan inträffa när poddidentitetsresurserna tar för lång tid att starta på noden när HMS-podden schemaläggs. om problemet kvarstår öppnar du ett supportärende till Azure HDInsight-teamet.

Nästa steg