Problem z niezawodnością klastra ze starszymi obrazami w klastrach usługi HDInsight
Data publikacji problemu: 13 października 2023 r.
W ramach proaktywnego zarządzania niezawodnością usługi Azure HDInsight niedawno znaleźliśmy potencjalny problem z niezawodnością w klastrach usługi HDInsight, które używają obrazów z dnia 2022 lutego 2022 r. lub starszego.
Tło problemu
W obrazach usługi HDInsight z marca 2022 r. wykryto znaną usterkę w jednej konkretnej kompilacji systemu Linux platformy Azure. Agent systemu Linux platformy Microsoft Azure (waagent
), uproszczony proces, który zarządza maszynami wirtualnymi, był niestabilny i spowodował awarie maszyn wirtualnych. Klastry usługi HDInsight, które korzystają z kompilacji systemu Linux platformy Azure, doświadczyły przestojów usług, awarii zadań i negatywnych skutków dla funkcji, takich jak protokół IPsec i skalowanie automatyczne.
Wymagana akcja
Jeśli klaster został utworzony przed marcem 2022 r., zalecamy ponowne skompilowanie klastra przy użyciu najnowszego obrazu usługi HDInsight. Obsługa obrazów klastrów datowana przed marcem 2022 r. zakończyła się 10 listopada 2023 r. Te obrazy nie będą otrzymywać aktualizacji zabezpieczeń, poprawek usterek ani poprawek, pozostawiając je wysoce podatne na luki w zabezpieczeniach.
Ważne
Zalecamy regularne aktualizowanie klastrów do najnowszej wersji usługi HDInsight. Użycie klastrów opartych na najnowszym obrazie usługi HDInsight zapewnia, że mają najnowsze poprawki systemu operacyjnego, poprawki zabezpieczeń, poprawki błędów i wersje biblioteki. Ta praktyka pomaga zminimalizować ryzyko i potencjalne luki w zabezpieczeniach.
Często zadawane pytania
Co się stanie w przypadku awarii maszyny wirtualnej w klastrach usługi HDInsight korzystających z tych obrazów usługi HDInsight?
Nie można odzyskać takich maszyn wirtualnych za pomocą prostych ponownych uruchomień. Awaria może trwać kilka godzin i wymagać ręcznej interwencji zespołu pomocy technicznej firmy Microsoft.
Czy ten problem został naprawiony w najnowszych obrazach usługi HDInsight?
Tak. Rozwiązano ten problem w obrazach usługi HDInsight z dnia 1 marca 2022 r. lub po 1 marca 2022 r. Zalecamy przejście do najnowszej stabilnej wersji, aby zachować umowę dotyczącą poziomu usług (SLA) i niezawodność usługi.
Jak mogę określić datę obrazu usługi HDInsight, na podstawie którego są tworzone moje klastry?
Ostatnie 10 cyfr w wersji obrazu usługi HDInsight wskazują datę i godzinę obrazu. Na przykład wersja obrazu 5.0.3000.1.2208310943 wskazuje datę 31 sierpnia 2022 r. Dowiedz się, jak zweryfikować wersję obrazu usługi HDInsight.