Monitorowanie klastrów za pomocą usługi kondycji

Dotyczy: Azure Stack HCI, wersje 23H2 i 22H2; Windows Server 2022, Windows Server 2019, Windows Server 2016

Usługa kondycji, po raz pierwszy wydana w Windows Server 2016, usprawnia codzienne monitorowanie i działanie klastrów działających Bezpośrednie miejsca do magazynowania.

Wymagania wstępne

Usługa kondycji jest domyślnie włączona w bezpośrednich miejscach do magazynowania. Nie są wymagane żadne dodatkowe działania w celu jej konfiguracji ani uruchomienia. Aby dowiedzieć się więcej o Bezpośrednie miejsca do magazynowania, zobacz omówienie Bezpośrednie miejsca do magazynowania.

Historia wydajności klastra

Uzyskaj informacje o wydajności i pojemności na żywo z klastra Bezpośrednie miejsca do magazynowania. Zobacz Pobieranie historii wydajności klastra.

Błędy usługi kondycji

Wyświetl wszystkie bieżące błędy, aby łatwo zweryfikować kondycję wdrożenia. Zobacz Wyświetlanie błędów usługi kondycji.

Akcje usługi kondycji

Śledzenie postępu akcji usługi kondycji, które są wykonywane autonomicznie. Zobacz Śledzenie akcji usługi kondycji.

Automation

W tej części opisano przepływy pracy, które są automatyzowane przez usługę kondycji w cyklu życia dysku.

Cykl życia dysku

Usługa kondycji automatyzuje większość etapów cyklu życia dysku fizycznego. Załóżmy, że początkowym stanem wdrożenia jest doskonała kondycja — co oznacza, że wszystkie dyski fizyczne działają poprawnie.

Wycofanie

Dyski fizyczne są automatycznie wycofywane, gdy już nie mogą być używane, co powoduje wywołanie odpowiedniego błędu. Istnieje kilka przypadków:

  • Awaria nośnika: dysk fizyczny jest ostatecznie uszkodzony i trzeba go zastąpić.
  • Utrata komunikacji: dysk fizyczny utracił łączność na ponad 15 kolejnych minut.
  • Brak odpowiedzi: dysk fizyczny wykazywał opóźnienie wynoszące ponad 5,0 sekund co najmniej trzy razy w ciągu godziny.

Uwaga

Jeśli połączenie zostało utracone na wielu dyskach fizycznych jednocześnie lub w całym węźle lub obudowie pamięci masowej, usługa kondycji nie spowoduje wycofania tych dysków, ponieważ prawdopodobnie nie stanowią one głównego problemu.

Jeśli wycofany dysk służył jako pamięć podręczna wielu dysków fizycznych, zostanie im automatycznie przydzielony inny dysk pamięci podręcznej, jeśli jest dostępny. Nie jest wymagana żadna akcja ze strony użytkownika.

Przywracanie odporności

Po wycofaniu dysku fizycznego usługa kondycji natychmiast rozpoczyna kopiowanie jego danych do pozostałych dysków fizycznych, aby przywrócić pełną odporność. Po ukończeniu tej czynności dane są całkowicie bezpieczne i ponownie odporne na uszkodzenia.

Uwaga

To natychmiastowe przywracanie wymaga wystarczającej pojemności wśród pozostałych dysków fizycznych.

Migające światło wskaźnika

Jeśli to możliwe, usługa kondycji powoduje miganie światła wskaźnika wycofanego dysku fizycznego lub w jego gniazda. Będzie to kontynuowane bez ograniczenia czasowego, aż wycofany dysk zostanie wymieniony.

Uwaga

W niektórych przypadkach dysk może ulec uszkodzeniu w sposób, który wyklucza działanie jego światła wskaźnika — na przykład w razie całkowitej utraty zasilania.

Fizyczne zastąpienie

Należy zastąpić wycofany dysk fizycznego, kiedy jest to możliwe. Najczęściej składa się to z zamiany na gorąco — tzn. wyłączenie węzła lub obudowy magazynu nie jest wymagane. Zobacz błąd, aby uzyskać przydatne informacje o lokalizacji i części.

Weryfikacja

Po wstawieniu dysku zastępczego zostanie zweryfikowany względem dokumentu Obsługiwane składniki (zobacz następną sekcję).

Buforowanie

Jeśli jest to dozwolone, dysk zastępczy zostanie automatycznie wprowadzony do w puli jego poprzednika, aby zaczął być używany. W tym momencie system jest powraca do stanu początkowego doskonałej kondycji, a błąd znika.

Dokument obsługiwanych składników

Usługa kondycji udostępnia mechanizm wymuszania, aby ograniczyć składniki używane przez Bezpośrednie miejsca do magazynowania do tych w dokumencie Obsługiwanych składników dostarczonym przez administratora lub dostawcę rozwiązania. To może uniemożliwić omyłkowe użycie nieobsługiwanego sprzętu, ułatwiając zachowanie zgodności z umową gwarancyjną lub pomocy technicznej. Ta funkcja jest obecnie ograniczona do urządzeń z dyskami fizycznymi, w tym dyskami SSD, dyskami HDD i dyskami NVMe. Dokument Obsługiwane składniki może ograniczać model, producent (opcjonalnie) i wersję oprogramowania układowego (opcjonalnie).

Użycie

Dokument Obsługiwane składniki używa składni inspirowanej kodem XML. Zalecamy użycie ulubionego edytora tekstów, takiego jak bezpłatny Visual Studio Code lub Notatnik, w celu utworzenia dokumentu XML, który można zapisać i użyć ponownie.

Sekcje

Dokument zawiera dwie niezależne sekcje: Disks i Cache.

Jeśli zostanie podana Disks sekcja, tylko dyski wymienione (jako Disk) mogą dołączać pule. Wszystkie nieznajdowane dyski nie mogą dołączać do pul, co skutecznie uniemożliwia ich użycie w środowisku produkcyjnym. Jeśli ta sekcja pozostanie pusta, każdy dysk będzie mógł dołączyć do pul.

Jeśli zostanie podana Cache sekcja, do buforowania są używane tylko dyski wymienione (jako CacheDisk). Jeśli ta sekcja pozostanie pusta, Bezpośrednie miejsca do magazynowania próbuje odgadnąć na podstawie typu nośnika i typu magistrali. Dyski wymienione tutaj powinny być również wymienione w Diskspliku .

Ważne

Dokument Obsługiwane składniki nie ma zastosowania wstecznie do dysków już w puli i w użyciu.

Przykład

<Components>

  <Disks>
    <Disk>
      <Manufacturer>Contoso</Manufacturer>
      <Model>XYZ9000</Model>
      <AllowedFirmware>
        <Version>2.0</Version>
        <Version>2.1</Version>
        <Version>2.2</Version>
      </AllowedFirmware>
      <TargetFirmware>
        <Version>2.1</Version>
        <BinaryPath>C:\ClusterStorage\path\to\image.bin</BinaryPath>
      </TargetFirmware>
    </Disk>
    <Disk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </Disk>
  </Disks>

  <Cache>
    <CacheDisk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </CacheDisk>
  </Cache>

</Components>

Aby wyświetlić listę wielu dysków, wystarczy dodać dodatkowe <Disk> lub <CacheDisk> tagi.

Aby wstrzyknąć ten kod XML podczas wdrażania Bezpośrednie miejsca do magazynowania, użyj parametru -XML :

$MyXML = Get-Content <Filepath> | Out-String
Enable-ClusterS2D -XML $MyXML

Aby ustawić lub zmodyfikować dokument Obsługiwane składniki po Bezpośrednie miejsca do magazynowania został wdrożony:

$MyXML = Get-Content <Filepath> | Out-String
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.SupportedComponents.Document" -Value $MyXML

Uwaga

Właściwości modelu, producenta i wersji oprogramowania układowego powinny być identyczne do wartości, które można uzyskać za pomocą polecenia cmdlet Get-PhysicalDisk. Mogą się różnić od „zdroworozsądkowych” oczekiwań w zależności od implementacji dostawcy. Na przykład zamiast nazwy „Contoso” producent może używać nazwy „CONTOSO-LTD” lub zostawić tę wartość pustą, a model nazwać „Contoso-XZY9000”.

Do sprawdzenia tego służy następujące polecenie cmdlet programu PowerShell:

Get-PhysicalDisk | Select Model, Manufacturer, FirmwareVersion

Ustawienia usługi kondycji

Zmodyfikuj ustawienia usługi kondycji, aby dostosować agresywność błędów lub akcji, włączyć lub wyłączyć niektóre zachowania i nie tylko. Zobacz Modyfikowanie ustawień usługi kondycji.

Dodatkowe informacje