Share via


Visa fel i hälsotjänsten

Gäller för: Azure Stack HCI, versionerna 23H2 och 22H2; Windows Server 2022, Windows Server 2019

Hälsotjänsten övervakar ständigt ditt Lagringsdirigering kluster för att identifiera problem och generera "fel". En cmdlet visar eventuella aktuella fel, så att du enkelt kan kontrollera hälsotillståndet för distributionen utan att titta på varje entitet eller funktion i tur och ordning. Fel är utformade till att vara exakta, lätta att förstå och kunna åtgärdas.

Varje fel innehåller fem viktiga fält:

  • Allvarlighetsgrad
  • Beskrivning av problemet
  • Rekommenderade nästa steg för att åtgärda problemet
  • Identifieringsinformation för felaktig entitet
  • Dess fysiska plats (om tillämpligt)

Här är till exempel ett vanligt fel:

Severity: MINOR
Reason: Connectivity has been lost to the physical disk.
Recommendation: Check that the physical disk is working and properly connected.
Part: Manufacturer Contoso, Model XYZ9000, Serial 123456789
Location: Seattle DC, Rack B07, Node 4, Slot 11

Anteckning

Den fysiska platsen härleds från konfigurationen för feldomänen. Mer information om feldomäner finns i Feldomänsmedvetenhet. Om du inte anger den här informationen är platsfältet mindre användbart. Den kanske till exempel bara visar facknumret.

Rotorsaksanalys

Hälsotjänsten kan utvärdera potentiella orsakssamband mellan felande entiteter för att identifiera och kombinera fel som är konsekvenser av samma underliggande problem. Genom att känna igen effektkedjor uppstår färre rapporteringar. Om en server till exempel är nere förväntas alla enheter på servern också vara utan anslutning. Därför genereras bara ett fel för rotorsaken – i det här fallet servern.

Användning i PowerShell

Om du vill se eventuella aktuella fel i PowerShell kör du följande cmdlet:

Get-HealthFault

Detta returnerar eventuella fel som påverkar det övergripande Lagringsdirigering klustret. De här felen är oftast relaterade till maskinvara eller konfiguration. Om det inte finns några fel returnerar cmdleten ingenting.

Anteckning

I en icke-produktionsmiljö och på egen risk kan du experimentera med den här funktionen genom att utlösa fel själv. Du kan till exempel göra detta genom att ta bort en fysisk disk eller stänga av en nod. När felet visas sätter du in den fysiska disken igen eller startar om noden så att felet försvinner.

Användning i .NET och C#

Det här avsnittet visar hur du ansluter till hälsotjänsten, använder identifieringsobjekt och kör felfrågor.

Anslut

För att köra frågor mot hälsotjänsten upprättar du en CimSession med klustret. För att göra det behöver du vissa saker som bara är tillgängliga i fullständig Microsoft .NET, vilket innebär att du inte enkelt kan göra detta direkt från en webb- eller mobilapp. Kodexemplen i det här avsnittet använder C#, det enklaste valet för det här dataåtkomstskiktet.

using System.Security;
using Microsoft.Management.Infrastructure;

public CimSession Connect(string Domain = "...", string Computer = "...", string Username = "...", string Password = "...")
{
    SecureString PasswordSecureString = new SecureString();
    foreach (char c in Password)
    {
        PasswordSecureString.AppendChar(c);
    }

    CimCredential Credentials = new CimCredential(
        PasswordAuthenticationMechanism.Default, Domain, Username, PasswordSecureString);
    WSManSessionOptions SessionOptions = new WSManSessionOptions();
    SessionOptions.AddDestinationCredentials(Credentials);
    Session = CimSession.Create(Computer, SessionOptions);
    return Session;
}

Det angivna användarnamnet ska vara en lokal administratör för måldatorn.

Vi rekommenderar att du skapar SecureString för lösenord direkt från användarindata i realtid, så att lösenordet aldrig lagras i minnet i klartext. Detta bidrar till att minska en mängd olika säkerhetsproblem. Men i praktiken är det vanligt att konstruera det som ovan i prototypsyfte.

Identifiera objekt

När CimSession har upprättats kan du fråga WMI (Windows Management Instrumentation) i klustret.

Innan du kan hämta fel eller mått måste du hämta instanser av flera relevanta objekt. Hämta först MSFT_StorageSubSystem som representerar Lagringsdirigering i klustret. Med det kan du få varje MSFT_StorageNode i klustret och varje MSFT_Volume av datavolymerna. Slutligen måste du hämta MSCluster_ClusterHealthService, själva hälsotjänsten.

CimInstance Cluster;
List<CimInstance> Nodes;
List<CimInstance> Volumes;
CimInstance HealthService;

public void DiscoverObjects(CimSession Session)
{
    // Get MSFT_StorageSubSystem for Storage Spaces Direct
    Cluster = Session.QueryInstances(@"root\microsoft\windows\storage", "WQL", "SELECT * FROM MSFT_StorageSubSystem")
        .First(Instance => (Instance.CimInstanceProperties["FriendlyName"].Value.ToString()).Contains("Cluster"));

    // Get MSFT_StorageNode for each cluster node
    Nodes = Session.EnumerateAssociatedInstances(Cluster.CimSystemProperties.Namespace,
        Cluster, "MSFT_StorageSubSystemToStorageNode", null, "StorageSubSystem", "StorageNode").ToList();

    // Get MSFT_Volumes for each data volume
    Volumes = Session.EnumerateAssociatedInstances(Cluster.CimSystemProperties.Namespace,
        Cluster, "MSFT_StorageSubSystemToVolume", null, "StorageSubSystem", "Volume").ToList();

    // Get MSFT_StorageHealth itself
    HealthService = Session.EnumerateAssociatedInstances(Cluster.CimSystemProperties.Namespace,
        Cluster, "MSFT_StorageSubSystemToStorageHealth", null, "StorageSubSystem", "StorageHealth").First();
}

Det här är samma objekt som du får i PowerShell med hjälp av cmdletar som Get-StorageSubSystem, Get-StorageNode och Get-Volume.

Du kan komma åt samma egenskaper som dokumenteras i Storage Management API-klasser.

using System.Diagnostics;

foreach (CimInstance Node in Nodes)
{
    // For illustration, write each node's Name to the console. You could also write State (up/down), or anything else!
    Debug.WriteLine("Discovered Node " + Node.CimInstanceProperties["Name"].Value.ToString());
}

Frågefel

Anropa Diagnose för att hämta eventuella aktuella fel som är begränsade till CimInstance-målet, som kan vara antingen klustret eller valfri volym.

Den fullständiga listan över fel som är tillgängliga i varje omfång i Windows Server 2019 dokumenteras senare i avsnittet Täckning .

public void GetFaults(CimSession Session, CimInstance Target)
{
    // Set Parameters (None)
    CimMethodParametersCollection FaultsParams = new CimMethodParametersCollection();
    // Invoke API
    CimMethodResult Result = Session.InvokeMethod(Target, "Diagnose", FaultsParams);
    IEnumerable<CimInstance> DiagnoseResults = (IEnumerable<CimInstance>)Result.OutParameters["DiagnoseResults"].Value;
    // Unpack
    if (DiagnoseResults != null)
    {
        foreach (CimInstance DiagnoseResult in DiagnoseResults)
        {
            // TODO: Whatever you want!
        }
    }
}

Valfritt: MyFault-klass

Det kan vara bra att konstruera och bevara din egen representation av fel. Klassen MyFault lagrar till exempel flera viktiga egenskaper för fel, inklusive FaultId, som kan användas senare för att antingen associera uppdateringar, ta bort meddelanden eller deduplicera om samma fel identifieras flera gånger.

public class MyFault {
    public String FaultId { get; set; }
    public String Reason { get; set; }
    public String Severity { get; set; }
    public String Description { get; set; }
    public String Location { get; set; }

    // Constructor
    public MyFault(CimInstance DiagnoseResult)
    {
        CimKeyedCollection<CimProperty> Properties = DiagnoseResult.CimInstanceProperties;
        FaultId     = Properties["FaultId"                  ].Value.ToString();
        Reason      = Properties["Reason"                   ].Value.ToString();
        Severity    = Properties["PerceivedSeverity"        ].Value.ToString();
        Description = Properties["FaultingObjectDescription"].Value.ToString();
        Location    = Properties["FaultingObjectLocation"   ].Value.ToString();
    }
}
List<MyFault> Faults = new List<MyFault>;

foreach (CimInstance DiagnoseResult in DiagnoseResults)
{
    Faults.Add(new Fault(DiagnoseResult));
}

Den fullständiga listan över egenskaper i varje fel (DiagnoseResult) dokumenteras senare i avsnittet Felegenskaper .

Felhändelser

När fel skapas, tas bort eller uppdateras genererar hälsotjänsten WMI-händelser. Dessa är viktiga för att hålla programtillståndet synkroniserat utan frekvent avsökning, och kan till exempel hjälpa dig med saker som att avgöra när e-postaviseringar ska skickas. För att prenumerera på dessa händelser använder följande exempelkod observerdesignmönstret.

Börja med att prenumerera på MSFT_StorageFaultEvent händelser.

public void ListenForFaultEvents()
{
    IObservable<CimSubscriptionResult> Events = Session.SubscribeAsync(
        @"root\microsoft\windows\storage", "WQL", "SELECT * FROM MSFT_StorageFaultEvent");
    // Subscribe the Observer
    FaultsObserver<CimSubscriptionResult> Observer = new FaultsObserver<CimSubscriptionResult>(this);
    IDisposable Disposeable = Events.Subscribe(Observer);
}

Implementera sedan en övervakare vars OnNext() -metod anropas när en ny händelse genereras.

Varje händelse innehåller ChangeType som anger om ett fel skapas, tas bort eller uppdateras samt relevant FaultId.

Dessutom innehåller varje händelse alla egenskaper för själva felet.

class FaultsObserver : IObserver
{
    public void OnNext(T Event)
    {
        // Cast
        CimSubscriptionResult SubscriptionResult = Event as CimSubscriptionResult;

        if (SubscriptionResult != null)
        {
            // Unpack
            CimKeyedCollection<CimProperty> Properties = SubscriptionResult.Instance.CimInstanceProperties;
            String ChangeType = Properties["ChangeType"].Value.ToString();
            String FaultId = Properties["FaultId"].Value.ToString();

            // Create
            if (ChangeType == "0")
            {
                Fault MyNewFault = new MyFault(SubscriptionResult.Instance);
                // TODO: Whatever you want!
            }
            // Remove
            if (ChangeType == "1")
            {
                // TODO: Use FaultId to find and delete whatever representation you have...
            }
            // Update
            if (ChangeType == "2")
            {
                // TODO: Use FaultId to find and modify whatever representation you have...
            }
        }
    }
    public void OnError(Exception e)
    {
        // Handle Exceptions
    }
    public void OnCompleted()
    {
        // Nothing
    }
}

Förstå fellivscykeln

Fel är inte avsedda att markeras som antingen "sedda" eller lösta av användaren. De skapas när hälsotjänsten upptäcker ett problem och de tas bort automatiskt först när hälsotjänsten inte längre kan observera problemet. I allmänhet återspeglar detta att problemet har åtgärdats.

I vissa fall kan fel dock återupptäckas av hälsotjänsten, till exempel efter en redundansväxling, tillfälliga anslutningar och så vidare. Av den anledningen kan det vara klokt att bevara din egen representation av fel, så att du enkelt kan deduplicera. Detta är särskilt viktigt om du skickar e-postaviseringar eller motsvarande.

Felegenskaper

I följande tabell visas flera viktiga egenskaper för felobjektet. För det fullständiga schemat kontrollerar du klassen MSFT_StorageDiagnoseResult i storagewmi.mof.

Egenskap Exempel
FaultId {12345-12345-12345-12345-12345}
FaultType Microsoft.Health.FaultType.Volume.Capacity
Anledning "Volymen har slut på tillgängligt utrymme."
PerceivedSeverity 5
FaultingObjectDescription Contoso XYZ9000 S.N. 123456789
FaultingObjectLocation Rack A06, RU 25, fack 11
RecommendedActions {"Expandera volymen.", "Migrera arbetsbelastningar till andra volymer."}

FaultId: Unikt ID inom omfånget för ett kluster.

PerceivedSeverity: PerceivedSeverity = { 4, 5, 6 } = { "Informational", "Warning" och "Error" }, eller motsvarande färger som blå, gul och röd.

FaultingObjectDescription: Delinformation för maskinvara, vanligtvis tom för programvaruobjekt.

FaultingObjectLocation: Platsinformation för maskinvara, vanligtvis tom för programvaruobjekt.

RecommendedActions: Lista över rekommenderade åtgärder som är oberoende och inte i någon särskild ordning. Idag är den här listan ofta av längd 1.

Egenskaper för felhändelse

I följande tabell visas flera viktiga egenskaper för felhändelsen. För det fullständiga schemat kontrollerar du klassen MSFT_StorageFaultEvent i storagewmi.mof.

Observera ChangeType som anger om ett fel skapas, tas bort eller uppdateras samt FaultId. En händelse innehåller också alla egenskaper för det berörda felet.

Egenskap Exempel
Changetype 0
FaultId {12345-12345-12345-12345-12345}
FaultType Microsoft.Health.FaultType.Volume.Capacity
Anledning "Volymen har slut på tillgängligt utrymme."
PerceivedSeverity 5
FaultingObjectDescription Contoso XYZ9000 S.N. 123456789
FaultingObjectLocation Rack A06, RU 25, fack 11
RecommendedActions {"Expandera volymen.", "Migrera arbetsbelastningar till andra volymer."}

Changetype ChangeType = { 0, 1, 2 } = { "Create", "Remove", "Update" }.

Täckning

I Windows Server 2019 och Azure Stack HCI tillhandahåller hälsotjänsten följande feltäckning:

PhysicalDisk (31)

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailedMedia

  • Allvarlighetsgrad : Varning
  • Orsak: "Den fysiska disken misslyckades."
  • RecommendedAction: "Ersätt den fysiska disken".

FaultType: Microsoft.Health.FaultType.PhysicalDisk.LostCommunication

  • Allvarlighetsgrad : Varning
  • Orsak: "Anslutningen har förlorats till den fysiska disken."
  • RecommendedAction: "Kontrollera att den fysiska disken fungerar och är korrekt ansluten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.Unresponsive

  • Allvarlighetsgrad : Varning
  • Orsak: "Den fysiska disken uppvisar återkommande avbrott."
  • RecommendedAction: "Ersätt den fysiska disken".

FaultType: Microsoft.Health.FaultType.PhysicalDisk.PredictiveFailure

  • Allvarlighetsgrad : Varning
  • Orsak: "Ett fel på den fysiska disken förväntas inträffa snart."
  • RecommendedAction: "Ersätt den fysiska disken".

FaultType: Microsoft.Health.FaultType.PhysicalDisk.UnsupportedHardware

  • Allvarlighetsgrad : Varning
  • Orsak: "Den fysiska disken har placerats i karantän eftersom den inte stöds av lösningsleverantören."
  • RecommendedAction: "Ersätt den fysiska disken med maskinvara som stöds."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.UnsupportedFirmware

  • Allvarlighetsgrad : Varning
  • Orsak: "Den fysiska disken är i karantän eftersom versionen av den inbyggda programvaran inte stöds av lösningsleverantören."
  • RecommendedAction: "Uppdatera den inbyggda programvaran på den fysiska disken till målversionen."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.UnrecognizedMetadata

  • Allvarlighetsgrad : Varning
  • Orsak: "Den fysiska disken har okända metadata."
  • RecommendedAction: "Den här disken kan innehålla data från en okänd lagringspool. Kontrollera först att det inte finns några användbara data på disken och återställ sedan disken."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailedFirmwareUpdate

  • Allvarlighetsgrad : Varning
  • Orsak: "Det gick inte att uppdatera den inbyggda programvaran på den fysiska disken."
  • RecommendedAction: "Prova att använda en annan binär programvara."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.SblFailedMedia

  • Allvarlighetsgrad : Varning
  • Orsak: "Enheten misslyckades."
  • RecommendedAction: "Ersätt enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.SblUnresponsive

  • Allvarlighetsgrad : Varning
  • Orsak: "Den fysiska disken uppvisar återkommande avbrott."
  • RecommendedAction: "Ersätt den fysiska disken".

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailureBadBlock

  • Allvarlighetsgrad : Varning
  • Orsak: "Enheten rapporterade felaktiga block under skrivningar. Enstaka dåliga block är normalt, men för många kan innebära att enheten fungerar dåligt, är skadad eller börjar misslyckas."
  • RecommendedAction: "Om detta fortsätter att hända eller om du ser minskad prestanda bör du överväga att ersätta enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailureBadBlockRead

  • Allvarlighetsgrad : Varning
  • Orsak: "Enheten rapporterade felaktiga block under läsningar. Enstaka dåliga block är normalt, men för många kan innebära att enheten fungerar dåligt, är skadad eller börjar misslyckas."
  • RecommendedAction: "Om detta fortsätter att hända eller om du ser minskad prestanda bör du överväga att ersätta enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailureIoRetry

  • Allvarlighetsgrad : Varning
  • Orsak: "Enheten behövde flera försök att läsa eller skriva. Om detta fortsätter att hända kan det innebära att enheten fungerar dåligt, är skadad eller börjar misslyckas."
  • RecommendedAction: "Om detta fortsätter att hända eller om du ser minskad prestanda bör du överväga att ersätta enheten."

Anteckning

Det här felet är inaktiverat som standard. Om du vill aktivera det anger du hälsoinställningen System.Storage.PhysicalDisk.MarginalFailure.EventBased.IoRetry.Enabled till true

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailureIoFailure

  • Allvarlighetsgrad : Varning
  • Orsak: "Enheten kunde inte läsa eller skriva. Om detta fortsätter att hända kan det innebära att enheten fungerar dåligt, är skadad eller börjar misslyckas."
  • RecommendedAction: "Om detta fortsätter att hända eller om du ser minskad prestanda bör du överväga att ersätta enheten."

Anteckning

Det här felet är inaktiverat som standard. Om du vill aktivera det anger du hälsoinställningen System.Storage.PhysicalDisk.MarginalFailure.EventBased.IoFailure.Enabled till true

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailureSmart

  • Allvarlighetsgrad : Varning
  • Orsak: "Enheten rapporterade följande potentiella problem till Windows med hjälp av SMART (självövervakning, analys och rapporteringsteknik)"
  • RecommendedAction: "Om detta fortsätter att hända eller om du ser minskad prestanda bör du överväga att ersätta enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailureHighWear

  • Allvarlighetsgrad : Varning
  • Orsak: "Enheten har nått en hög procentandel av sin betygsatt skriv uthållighet. Enheten kan bli skrivskyddad, vilket innebär att den inte kan utföra fler skrivningar, när den når 100% av sin rankade uthållighet. Kontrollera databladet eller be tillverkaren om mer information om uthållighetsklassificering och beteende i slutet av livet."
  • RecommendedAction: "Om detta fortsätter att hända eller om du ser minskad prestanda bör du överväga att ersätta enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailureReadOnly

  • Allvarlighetsgrad : Varning
  • Orsak: "Enheten nådde 100% av sin rankade skriv uthållighet och är nu skrivskyddad, vilket innebär att den inte kan utföra fler skrivningar. Solid State-enheter slits ut efter ett visst antal skrivningar, vilket varierar beroende på enhetens uthållighetsklassificering. Mer information finns i enhetsspecifikationerna eller fråga tillverkaren om uthållighetsklassificering och beteende i slutet av livet."
  • RecommendedAction: "Om detta fortsätter att hända eller om du ser minskad prestanda bör du överväga att ersätta enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.HighLatency.SlowestIO

  • Allvarlighetsgrad : Varning
  • Orsak: "Enheten har långa svarstider med hög belastning."
  • RecommendedAction: "Övervaka enhetens prestanda och överväg att ersätta enheten."

Anteckning

Det här felet är inaktiverat som standard. Om du vill aktivera den anger du hälsoinställningen System.Storage.PhysicalDisk.HighLatency.Threshold.Tail.Enabled till true

FaultType: Microsoft.Health.FaultType.PhysicalDisk.HighLatency.AverageIO

  • Allvarlighetsgrad : Varning
  • Orsak: "Enheten har lång genomsnittlig svarstid."
  • RecommendedAction: "Övervaka enhetens prestanda och överväg att ersätta enheten."

Anteckning

Det här felet är inaktiverat som standard. Om du vill aktivera den anger du hälsoinställningen System.Storage.PhysicalDisk.HighLatency.Threshold.Tail.Enabled till true

FaultType: Microsoft.Health.FaultType.PhysicalDisk.HighLatency.Outlier.AverageIO

  • Allvarlighetsgrad : Varning
  • Orsak: "Enheten har lång genomsnittlig svarstid."
  • RecommendedAction: "Övervaka enhetens prestanda och överväg att ersätta enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.HighLatency.Outlier.SlowestIO

  • Allvarlighetsgrad : Varning
  • Orsak: "Enheten har långa svarstider med hög belastning."
  • RecommendedAction: "Övervaka enhetens prestanda och överväg att ersätta enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.HighErrorCount.AverageIO

  • Allvarlighetsgrad : Varning
  • Orsak: "Enheten har ett stort antal fel."
  • RecommendedAction: "Övervaka enhetens prestanda och överväg att ersätta enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.HighErrorCount.Outlier.AverageIO

  • Allvarlighetsgrad : Varning
  • Orsak: "Enheten har ett stort antal fel."
  • RecommendedAction: "Övervaka enhetens prestanda och överväg att ersätta enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.CacheReadOnly

  • Allvarlighetsgrad : Varning
  • Orsak: "Cacheenheten misslyckades med vissa läsningar eller skrivningar, så för att skydda dina data har vi flyttat dem till kapacitetsenheter."
  • RecommendedAction: "Ersätt enheten eller försök att rensa och återställa den."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.CacheReadOnly.Draining

  • Allvarlighetsgrad : Varning
  • Orsak: "Cacheenheten misslyckades med vissa läsningar eller skrivningar. För att skydda dina data har vi slutat skriva till cacheenheten och vi försöker flytta dess data till kapacitetsenheter."
  • RecommendedAction: "Vänta medan vi flyttar data."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.CacheReadOnly.FailedDrain

  • Allvarlighetsgrad : Varning
  • Orsak: "Vissa data på cacheenheten kan inte läsas, vilket hindrar oss från att flytta dem till kapacitetsenheter."
  • RecommendedAction: "Ersätt enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.SedEncKey.RotationFailure

  • Allvarlighetsgrad : Varning
  • Orsak: "Försöket att rotera SED-krypteringsnyckeln till den nya standardinställningen misslyckades."
  • RecommendedAction: "Kontrollera att enheten fungerar och är korrekt ansluten. Om enheten har misslyckats ersätter du den. Starta om rotationen av SED-krypteringsnyckeln när enheten är felfri."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.SedEncKey.NotDefault

  • Allvarlighetsgrad : Varning
  • Orsak: "Den fysiska disken har en SED-krypteringsnyckel, men den matchar inte den aktuella standardnyckeln."
  • RecommendedAction: "Initiate SED encryption key rotation" (Initiera rotation av SED-krypteringsnyckeln).

FaultType: Microsoft.Health.FaultType.PhysicalDisk.SedEncKey.NotDefined

  • Allvarlighetsgrad : Varning
  • Orsak: "Det finns ingen definierad standardkrypteringsnyckel för SED för enheten."
  • RecommendedAction: "Ange en standardkrypteringsnyckel för SED."

FaultType: Microsoft.Health.FaultType.StorageScaleUnit.SedEncKey.RotationTimeout

  • Allvarlighetsgrad : Varning
  • Orsak: "Det gick inte att slutföra roteringen av SED-krypteringsnyckeln på servern före tidsgränsen"
  • RecommendedAction: "Kontrollera att servern kan nås och att alla fysiska diskar är felfria."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.DriveArriveFailure

  • Allvarlighetsgrad : Varning
  • Orsak: "Fysiska diskar misslyckas med frågor. "
  • RecommendedAction: "Verifiera nätverkets tillförlitlighet. Om problemet kvarstår bör du överväga att ersätta enheten."

Virtuell disk (3)

FaultType: Microsoft.Health.FaultType.VirtualDisks.NeedsRepair

  • Allvarlighetsgrad: Information
  • Orsak: "Vissa data på den här volymen är inte helt motståndskraftiga. Den är fortfarande tillgänglig."
  • RecommendedAction: "Återställa återhämtning av data."

FaultType: Microsoft.Health.FaultType.VirtualDisks.Detached

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Volymen är otillgänglig. Vissa data kan gå förlorade."
  • RecommendedAction: "Kontrollera den fysiska och/eller nätverksanslutningen för alla lagringsenheter. Du kan behöva återställa från säkerhetskopian."

FaultType: Microsoft.Health.FaultType.VirtualDisks.NoRedundancy

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Alla kopior av data är inte tillgängliga för en region med virtuell disk. Arbetsbelastningen kan avbrytas och I/O-fel kan observeras."
  • RecommendedAction: "Om en underhållsåtgärd pågår pausar du den och återställer åtkomsten till all lagring tills lagringen stabiliseras."

Poolkapacitet (2)

FaultType: Microsoft.Health.FaultType.StoragePool.TransactionAndCleanupFailure

  • Allvarlighetsgrad : Varning
  • Orsak: "Lagringspoolen kan inte skriva till ett kvorum med metadataenheter. Arbetsbelastningen kan avbrytas och I/O-fel kan observeras."
  • RecommendedAction: "Om en underhållsåtgärd pågår pausar du den och återställer åtkomsten till all lagring tills lagringen stabiliseras."

FaultType: Microsoft.Health.FaultType.StoragePool.PoolCapacityThresholdExceededed

  • Allvarlighetsgrad : Varning
  • Orsak: "Lagringspoolen håller på att få slut på kapacitet."
  • RecommendedAction: "Lägg till ytterligare kapacitet i lagringspoolen eller frigör kapacitet."

Volymkapacitet (5)1

FaultType: Microsoft.Health.FaultType.Volume.Capacity

  • Allvarlighetsgrad : Varning
  • Orsak: "Volymen håller på att få slut på tillgängligt utrymme."
  • RecommendedAction: "Expandera volymen eller migrera arbetsbelastningar till andra volymer."

FaultType: Microsoft.Health.FaultType.Volume.FileSystem.Corruption.Correctable

  • Allvarlighetsgrad : Varning
  • Orsak: "Filsystemet upptäckte ett kontrollsummafel och kunde korrigera det."
  • RecommendedAction: "Starta dataintegritetsgenomsökning från schemaläggaren, lagringen kan gå dåligt. Om det pågår en uppdaterings- eller underhållsåtgärd stoppar du den omedelbart. Du kan behöva återställa från säkerhetskopian."

FaultType: Microsoft.Health.FaultType.Volume.FileSystem.Corruption.Uncorrectable

  • Allvarlighetsgrad : Varning
  • Orsak: "Filsystemet upptäckte ett kontrollsummafel och kunde inte korrigera det."
  • RecommendedAction: "Starta dataintegritetsgenomsökning från schemaläggaren, lagringen kan gå dåligt. Om det pågår en uppdaterings- eller underhållsåtgärd stoppar du den omedelbart. Du kan behöva återställa från säkerhetskopian."

FaultType: Microsoft.Health.FaultType.Volume.FileSystem.Corruption.Uncorrectable.DataRemoved

  • Allvarlighetsgrad : Varning
  • Orsak: "Filsystemet upptäckte en skada på en fil eller mapp. Filen eller mappen har tagits bort från filsystemets namnområde."
  • RecommendedAction: "Starta dataintegritetsgenomsökning från schemaläggaren, lagringen kan gå dåligt. Om det pågår en uppdaterings- eller underhållsåtgärd stoppar du den omedelbart. Du kan behöva återställa från säkerhetskopian."

FaultType: Microsoft.Health.FaultType.Volume.FileSystem.Corruption.Uncorrectable.DataRemovalFailure

  • Allvarlighetsgrad : Varning
  • Orsak: "Filsystemet upptäckte en skada på en fil eller mapp. Filsystemet kan ha misslyckats med att ta bort det från filsystemets namnområde."
  • RecommendedAction: "Initiate Data Integrity scan from task scheduler, storage might be going bad. Om det pågår en uppdaterings- eller underhållsåtgärd stoppar du den omedelbart. Du kan behöva återställa från säkerhetskopian."

Server (12)

FaultType: Microsoft.Health.FaultType.Server.Down

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Det går inte att nå servern."
  • RecommendedAction: "Starta eller ersätt server."

FaultType: Microsoft.Health.FaultType.Server.Isolated

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Servern är isolerad från klustret på grund av anslutningsproblem."
  • RecommendedAction: "Om isoleringen kvarstår kontrollerar du nätverken eller migrerar arbetsbelastningar till andra noder."

FaultType: Microsoft.Health.FaultType.Server.Quarantined

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Servern sätts i karantän av klustret på grund av återkommande fel."
  • RecommendedAction: "Ersätt servern eller åtgärda nätverket."

FaultType: Microsoft.Health.FaultType.Server.Temperature

  • Allvarlighetsgrad : Varning
  • Orsak: "Serverns temperatursensor har utlöst en varning."
  • RecommendedAction: "Kontrollera servertemperaturen."

FaultType: Microsoft.Health.FaultType.Server.Storage.Degraded

  • Allvarlighetsgrad : Varning
  • Orsak: "Servern har lagring som inte är fullständig eller uppdaterad, så vi måste synkronisera den med data från andra servrar i klustret. Detta är normalt när en server startas om eller en enhet misslyckas."
  • RecommendedAction: "Vänta medan vi synkroniserar lagringen. Ta inte bort några enheter eller starta inte om några servrar i klustret förrän vi har bekräftat att synkroniseringen är klar."

FaultType: Microsoft.Health.FaultType.Node.CPUOverloaded

  • Allvarlighetsgrad : Varning
  • Orsak: "Serverns CPU-användning är konsekvent över tröskelvärdet."
  • RecommendedAction: "Flytta virtuella datorer till andra servrar med lägre CPU-användning eller överväg att lägga till ytterligare beräkningskapacitet i klustret (vanligtvis genom att lägga till servrar)."

FaultType: Microsoft.Health.FaultType.Node.VCPUToLCPU

  • Allvarlighetsgrad : Varning
  • Orsak: "Förhållandet mellan virtuella processorer och logiska processorer (trådar) på den här servern har överskridit det konfigurerade tröskelvärdet."
  • RecommendedAction: "Flytta virtuella datorer till en annan server med lägre CPU-användning eller överväg att lägga till ytterligare beräkningskapacitet i klustret."

FaultType: Microsoft.Health.FaultType.Node.LowFreeRam

  • Allvarlighetsgrad : Varning
  • Orsak: "Tillgängligt minne ligger under det konfigurerade tröskelvärdet."
  • RecommendedAction: "Flytta virtuella datorer till en annan server med lägre CPU-användning eller överväg att lägga till ytterligare beräkningskapacitet i klustret."

FaultType: Microsoft.Health.FaultType.Node.HighRootPartitionMemoryUsage

  • Allvarlighetsgrad : Varning
  • Orsak: "Windows Server förbrukar mycket fysiskt minne, vilket överskrider det konfigurerade tröskelvärdet."
  • RecommendedAction: "Sök efter processer eller appar som förbrukar för mycket minne, flytta virtuella datorer till andra servrar eller lägg till minne på servrarna."

FaultType: Microsoft.Health.FaultType.Node.TooHighCpuReservation

  • Allvarlighetsgrad : Varning
  • Orsak: "Den kombinerade CPU-reservationen för virtuella datorer på den här servern överskrider det konfigurerade tröskelvärdet."
  • RecommendedAction: "Överväg att flytta virtuella datorer eller minska deras CPU-reservationer."

FaultType: Microsoft.Health.FaultType.Node.TooHighMemoryUseAfterReclamation

  • Allvarlighetsgrad : Varning
  • Orsak: "Den kombinerade minnestilldelningen för virtuella datorer på den här servern överskrider det konfigurerade tröskelvärdet."
  • RecommendedAction: "Överväg att flytta virtuella datorer eller minska deras tilldelade minne."

FaultType: Microsoft.Health.FaultType.Node.SustainedHighCpuUsage

  • Allvarlighetsgrad : Varning
  • Orsak: "Servern har en processoranvändning som konsekvent överskrider tröskelvärdet."
  • RecommendedAction: "Flytta virtuella datorer till en annan server med lägre CPU-användning eller överväg att lägga till mer beräkningskapacitet."

Kluster (6)

FaultType: Microsoft.Health.FaultType.ClusterQuorumWitness.Error

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Klustret är ett serverfel från att gå ner."
  • RecommendedAction: "Kontrollera vittnesresursen och starta om efter behov. Starta eller ersätt misslyckade servrar."

FaultType: Microsoft.Health.FaultType.Cluster.ValidationReport.Failed

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Klustervalidering har hittat problem."
  • RecommendedAction: "Klusterverifiering har hittat fel i vissa testkategorier. Se klusterverifieringsrapport."

FaultType: Microsoft.Health.FaultType.Cluster.ValidationReportDcb.Failed

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Validate-DCB har hittat problem."
  • RecommendedAction: "Validate-DCB har hittat nätverksfel. Se DCB-valideringsrapport."

FaultType: Microsoft.Health.FaultType.Cluster.TooHighCpuReservation

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Den kombinerade CPU-reservationen för virtuella datorer på den här servern överskrider det konfigurerade tröskelvärdet."
  • RecommendedAction: "Överväg att flytta virtuella datorer eller minska deras CPU-reservationer."

FaultType: Microsoft.Health.FaultType.Cluster.TooHighMemoryUseAfterReclamation

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Den kombinerade minnestilldelningen för virtuella datorer på den här servern överskrider det konfigurerade tröskelvärdet."
  • RecommendedAction: "Överväg att flytta virtuella datorer eller minska deras tilldelade minne."

FaultType: Microsoft.Health.FaultType.Cluster.SustainedHighCpuUsage

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Servern har en processoranvändning som konsekvent överskrider tröskelvärdet."
  • RecommendedAction: "Flytta virtuella datorer till en annan server med lägre CPU-användning eller överväg att lägga till mer beräkningskapacitet."

Nätverkskort/gränssnitt (6)

FaultType: Microsoft.Health.FaultType.NetworkAdapter.Disconnected

  • Allvarlighetsgrad : Varning
  • Orsak: "Nätverksgränssnittet har kopplats från."
  • RecommendedAction: "Återanslut nätverkskabeln."

FaultType: Microsoft.Health.FaultType.NetworkInterface.Missing

  • Allvarlighetsgrad : Varning
  • Orsak: "Servern {server} saknar nätverkskort som är anslutna till klusternätverket {klusternätverk}."
  • RecommendedAction: "Anslut servern till det klusternätverk som saknas."

FaultType: Microsoft.Health.FaultType.NetworkAdapter.Hardware

  • Allvarlighetsgrad : Varning
  • Orsak: "Nätverksgränssnittet har haft ett maskinvarufel."
  • RecommendedAction: "Ersätt nätverksgränssnittskortet."

FaultType: Microsoft.Health.FaultType.NetworkAdapter.Disabled

  • Allvarlighetsgrad : Varning
  • Orsak: "Nätverksgränssnittet {network interface} är inte aktiverat och används inte."
  • RecommendedAction: "Aktivera nätverksgränssnittet."

FaultType: Microsoft.Health.FaultType.StorageSubsystem.RDMA.Alert

  • Allvarlighetsgrad : Varning
  • Orsak: "Klustret har identifierat problem med nätverksanslutningen som hindrar Lagringsdirigering från att fungera korrekt."
  • RecommendedAction: "Kontrollera att nätverket är korrekt konfigurerat och fungerar. Om du använder RDMA Over Converged Ethernet (RoCE) kontrollerar du att DcB (Data Center Bridging), Enhanced Transmission Service (ETS) och PFC (Priority Flow Control) har konfigurerats korrekt och konsekvent på varje klusternod och fysisk växel. Om du inte vet hur du gör detta kan du be leverantören eller någon du litar på att hjälpa dig."

FaultType: Microsoft.Health.FaultType.StorageSubsystem.RDMA.Disabled

  • Allvarlighetsgrad : Varning
  • Orsak: "Klustret har identifierat problem med nätverksanslutningen som hindrar Lagringsdirigering från att fungera korrekt. För att säkerställa konsekvent prestanda och datasäkerhet har Lagringsdirigering slutat använda direktåtkomst till fjärrminne (RDMA) även om RDMA-kompatibel maskinvara finns och är aktiverad. Lagringstrafiken fortsätter att flöda men med sämre prestanda med TCP/IP."
  • RecommendedAction: "Kontrollera att nätverket är korrekt konfigurerat och fungerar och aktivera sedan RDMA igen. Om du använder RDMA Over Converged Ethernet (RoCE) kontrollerar du att DcB (Data Center Bridging), Enhanced Transmission Service (ETS) och PFC (Priority Flow Control) har konfigurerats korrekt och konsekvent på varje klusternod och fysisk växel. Om du inte vet hur du gör detta kan du be leverantören eller någon du litar på att hjälpa dig. Om du vill fortsätta med RDMA inaktiverat kan du stänga aviseringen."

Kabinett (6)

FaultType: Microsoft.Health.FaultType.StorageEnclosure.LostCommunication

  • Allvarlighetsgrad : Varning
  • Orsak: "Kommunikationen har gått förlorad till lagringskabinettet."
  • RecommendedAction: "Starta eller ersätt lagringskabinettet."

FaultType: Microsoft.Health.FaultType.StorageEnclosure.FanError

  • Allvarlighetsgrad : Varning
  • Orsak: "Fläkten vid position {position} i lagringskabinettet misslyckades."
  • RecommendedAction: "Ersätt fläkten i lagringskabinettet."

FaultType: Microsoft.Health.FaultType.StorageEnclosure.CurrentSensorError

  • Allvarlighetsgrad : Varning
  • Orsak: "Den aktuella sensorn vid position {position} i lagringskabinettet misslyckades."
  • RecommendedAction: "Ersätt en aktuell sensor i lagringskabinettet."

FaultType: Microsoft.Health.FaultType.StorageEnclosure.VoltageSensorError

  • Allvarlighetsgrad : Varning
  • Orsak: "Spänningssensorn vid position {position} i lagringskabinettet misslyckades."
  • RecommendedAction: "Ersätt en spänningssensor i lagringskabinettet."

FaultType: Microsoft.Health.FaultType.StorageEnclosure.IoControllerError

  • Allvarlighetsgrad : Varning
  • Orsak: "I/O-styrenheten vid position {position} i lagringskabinettet misslyckades."
  • RecommendedAction: "Ersätt en I/O-styrenhet i lagringskabinettet."

FaultType: Microsoft.Health.FaultType.StorageEnclosure.TemperatureSensorError

  • Allvarlighetsgrad : Varning
  • Orsak: "Temperatursensorn vid position {position} i lagringskabinettet misslyckades."
  • RecommendedAction: "Ersätt en temperatursensor i lagringskabinettet."

Distribution av inbyggd programvara (3)

FaultType: Microsoft.Health.FaultType.FaultDomain.FailedMaintenanceMode

  • Allvarlighetsgrad : Varning
  • Orsak: "Det går för närvarande inte att göra framsteg när den inbyggda programvaran distribueras."
  • RecommendedAction: "Kontrollera att alla lagringsutrymmen är felfria och att ingen feldomän för närvarande är i underhållsläge."

FaultType: Microsoft.Health.FaultType.FaultDomain.FirmwareVerifyVersionFailed

  • Allvarlighetsgrad : Varning
  • Orsak: "Distributionen av den inbyggda programvaran avbröts på grund av oläsbar eller oväntad versionsinformation om den inbyggda programvaran efter att en uppdatering av den inbyggda programvaran har tillämpats."
  • RecommendedAction: "Starta om den inbyggda programvaran när problemet med den inbyggda programvaran har lösts."

FaultType: Microsoft.Health.FaultType.FaultDomain.TooManyFailedUpdates

  • Allvarlighetsgrad : Varning
  • Orsak: "Distributionen av den inbyggda programvaran avbröts på grund av att för många fysiska diskar misslyckades med ett försök att uppdatera den inbyggda programvaran."
  • RecommendedAction: "Starta om den inbyggda programvaran när problemet med den inbyggda programvaran har lösts."

QoS för lagring (3)2

FaultType: Microsoft.Health.FaultType.StorQos.InsufficientThroughput

  • Allvarlighetsgrad : Varning
  • Orsak: "Lagringsdataflödet är otillräckligt för att uppfylla reserver."
  • RecommendedAction: "Konfigurera om QoS-principer för lagring."

FaultType: Microsoft.Health.FaultType.StorQos.LostCommunication

  • Allvarlighetsgrad : Varning
  • Orsak: "QoS-principhanteraren för lagring har förlorat kommunikationen med volymen."
  • RecommendedAction: "Starta om noderna {nodes}"

FaultType: Microsoft.Health.FaultType.StorQos.MisconfiguredFlow

  • Allvarlighetsgrad : Varning
  • Orsak: "En eller flera lagringskonsumenter (vanligtvis Virtual Machines) använder en obefintlig princip med ID {id}."
  • RecommendedAction: "Återskapa eventuella saknade QoS-principer för lagring."

VM/VHD (7)

FaultType: Microsoft.Health.FaultType.Vm.BadHealthState

  • Allvarlighetsgrad : Varning
  • Orsak: "Hälsotillståndet för den virtuella datorn är inte OK."
  • RecommendedAction: "Felsöka den virtuella datorn."

FaultType: Microsoft.Health.FaultType.Vm.BadOperationalStatus

  • Allvarlighetsgrad : Varning
  • Orsak: "Den virtuella datorns driftstatus är inte OK."
  • RecommendedAction: "Felsöka den virtuella datorn."

FaultType: Microsoft.Health.FaultType.Vm.GuestUnhealthy

  • Allvarlighetsgrad : Varning
  • Orsak: "Gästoperativsystemet på den virtuella datorn rapporterar ett feltillstånd."
  • RecommendedAction: " Troubleshoot the virtual machine." (Felsöka den virtuella datorn).

FaultType: Microsoft.Health.FaultType.Vm.ConfigIsOffline

  • Allvarlighetsgrad : Varning
  • Orsak: "Konfigurationsresursen för den virtuella datorn är offline, vilket innebär att den virtuella datorn inte kan administreras."
  • RecommendedAction: "Bring the virtual machine configuration online."

FaultType: Microsoft.Health.FaultType.Vm.NotRespondingToControlCodes

  • Allvarlighetsgrad : Varning
  • Orsak: "Den virtuella datorn svarar inte på klusterkontrollkoder."
  • RecommendedAction: "Kontrollera tillståndet för den virtuella datorklusterresursen."

FaultType: Microsoft.Health.FaultType.Vm.IsNearMemoryLimit

  • Allvarlighetsgrad : Varning
  • Orsak: "Den virtuella datorn behöver mer av sitt konfigurerade maximala minne."
  • RecommendedAction: "Sök efter processer eller appar som förbrukar för mycket minne eller överväg att öka maximalt minne."

FaultType: Microsoft.Health.FaultType.Vhd.IsNearlyFull

  • Allvarlighetsgrad : Varning
  • Orsak: "Den virtuella hårddisken har nått sin kapacitet. Inga fler data kan skrivas till den, vilket kan påverka de virtuella datorerna negativt."
  • RecommendedAction: "Ändra storlek på den virtuella hårddisken eller ta bort oönskade filer."

1 Anger att volymen har nått 80 % full (mindre allvarlighetsgrad) eller 90 % full (allvarlighetsgrad). 2 Anger att vissa .vhd(er) på volymen inte har uppfyllt sin lägsta IOPS för över 10 % (mindre), 30 % (större) eller 50 % (kritisk) för ett rullande 24-timmarsfönster.

Anteckning

Hälsotillståndet för komponenter i lagringskabinett, till exempel fläktar, strömförsörjning och sensorer, härleds från SCSI Enclosure Services (SES). Om leverantören inte ger den här informationen kan inte hälsotjänsten visa den.

Ytterligare referenser