Udostępnij za pośrednictwem


Failover Cluster Troubleshooting

W tym temacie podano informacje dotyczące następujących zagadnień:

  • Podstawowe kroki rozwiązywania problemów.

  • Odzyskiwanie po awarii klaster pracy awaryjnej.

  • Rozwiązywanie typowych pracy awaryjnej klastrowanie problemów.

  • Korzystanie z rozszerzonych procedur przechowywanych i obiekty COM.

Podstawowe kroki rozwiązywania problemów

Podczas pracy z SQL Server pracy awaryjnej klastrowanie, należy pamiętać, że klaster serwerów składa się z instancji klaster pracy awaryjnej, która jest uruchamiana Microsoft klastrowanie (MSCS). Wystąpienie SQL Server może być obsługiwana przez Microsoft Węzłów MSCS zapewniają Microsoft Serwer klastrów.

Jeśli istnieją problemy w węzłach hoście klastra serwerów, te problemy mogą sami manifest jak problemy związane z wystąpienie klaster pracy awaryjnej.Aby zbadać i rozwiązać te problemy, rozwiązywanie problemów z SQL Server Klaster pracy awaryjnej w następującej kolejności:

  1. Sprzęt: PrzeglądanieMicrosoft Windows system zdarzenie dzienników.

  2. System operacyjny: Zapoznaj się z systemu Windows i aplikacji zdarzenie dzienników.

  3. Sieci: Zapoznaj się z systemu Windows i aplikacji zdarzenie dzienników. Sprawdź bieżącą konfiguracja przed artykuł bazy wiedza Microsoft wiedza Base Zalecane Private "Puls" konfiguracja na serwerze sieci klastrów.

  4. Zabezpieczenia: Zapoznaj się z aplikacji systemu Windows i zabezpieczeń zdarzenie dzienników.

  5. MSCS: Przegląd systemu Windows, aplikacja zdarzenie, a dzienniki klastra.

  6. SQL Server: Rozwiązywanie problemów z zwykły sposób po zweryfikowaniu sprzętu, systemu operacyjnego, sieci, zabezpieczeń i fundamentów MSCS wolne problem.

Odzyskanie awaria klaster pracy awaryjnej

Zazwyczaj awarii klaster pracy awaryjnej jest wynik jednego z dwóch przyczyn:

  • Awaria sprzętu w jednym węźle klastra dwuwęzłowego.Ten błąd sprzętowy może być spowodowane awarią karty SCSI lub w systemie operacyjnym.

    Aby przywrócić z tego błędu, należy usunąć uszkodzonego węzła klaster pracy awaryjnej korzystania z SQL Server Program instalacyjny, adres awaria sprzętu w komputerze w trybie offline, przełącz na komputerze tworzyć kopię zapasową zapasowej, a następnie dodaj naprawione węzła do wystąpienie klaster pracy awaryjnej.

    Aby uzyskać więcej informacji zobacz How to: Create a New SQL Server Failover Cluster (Setup) i How to: Recover from Failover Cluster Failure in Scenario 1.

  • Błąd systemu operacyjnego.W takim przypadek węzeł jest w trybie offline, ale nie jest nieodwracalnie przerwane.

    Aby odzyskać błędu systemu operacyjnego, odzyskać węzła i testowanie pracy awaryjnej.Jeśli SQL Server wystąpienie nie praca awaryjna prawidłowo, należy użyć SQL Server Program instalacyjny, aby usunąć SQL Server z klaster praca awaryjna dokonać niezbędnych napraw, Wywołaj komputer, a następnie dodaj naprawione węzła do wystąpienia klaster praca awaryjna.

    Odzyskiwanie po awarii systemu operacyjnego w ten sposób może potrwać.Jeśli awaria systemu operacyjnego można je łatwo odtworzyć, nie należy przy użyciu tej metody.

    Aby uzyskać więcej informacji zobacz How to: Create a New SQL Server Failover Cluster (Setup) i How to: Recover from Failover Cluster Failure in Scenario 2.

Rozwiązania znanych problemów.

Na poniższej liście opisano typowe problemy z użycia i sposób ich rozwiązania.

Problem: Niepoprawnej składni wiersza polecenia do zainstalowania programu SQL Server

Problem 1: Jest trudne do diagnozowania problemów Instalatora, używając /Qn przełącznika wiersz polecenia, jak /Qn przełącznik powoduje pominięcie wszystkich okien dialogowych Instalatora i komunikaty o błędach.Jeśli /Qn przełącznik jest określony, wszystkie wiadomości instalacji, łącznie z komunikatami o błędach, są zapisywane pliki dziennika instalacji.Aby uzyskać więcej informacji na temat plików dziennika Zobacz How to: View and Read SQL Server Setup Log Files.

Rozdzielczość 1: Za pomocą**/qb** przełącznika zamiast /Qn przełącznika.Jeśli używasz /qb przełącznika podstawowego interfejsu użytkownika w każdym kroku zostanie wyświetlona, łącznie z komunikatami o błędach.

Problem: Program SQL Server nie może zalogować się do sieci po wykonuje migrację do innego węzła

**Problem 1:**SQL Server konta usług są w stanie skontaktować się z kontrolerem domena.

Rozdzielczość 1: Sprawdź swoje dzienniki zdarzeń, aby znaki zagadnień sieciowych, takich jak karta błędy lub problemy z DNS. Sprawdź, czy może pingować kontrolera domena.

**Problem 2:**SQL Server hasła konta usługi nie są identyczne na wszystkich węzłach klastra lub węzeł nie ponownie SQL Server Usługa, która ma być migrowane z uszkodzonym węźle.

Rozdzielczość 2: Zmienianie SQL Server za pomocą hasła konta usługa SQL Server Menedżer konfiguracja. Jeśli nie zmienisz SQL Server hasła konta usługa na jednym węźle, trzeba również zmienić hasła dla wszystkich innych węzłach. SQL Server Menedżer konfiguracja robi to automatycznie.

Problem: Program SQL Server nie może uzyskać dostępu do dysków klastra

Problem 1: Sterowniki lub oprogramowanie układowe nie zostaną zaktualizowane na wszystkich węzłach.

Rozdzielczość 1: Sprawdź, czy wszystkie węzły są korzysta z odpowiednim oprogramowaniem układowym wersji i tych samych wersji sterownika.

Problem 2: Węzeł nie może odzyskać dysków klastrowych, które zostały zmigrowane z uszkodzonym węźle na dysku współużytkowanego klastra z inną literę dysku.

Rozdzielczość 2: Litery dysku do dysków klastrowych musi być taka sama na obu serwerach.Jeśli aktualizacje nie są dostępne, należy przejrzeć oryginalnej instalacji systemu operacyjnego i Microsoft Usługa klastrowania (MSCS).

Problem: Błąd usługa SQL Server powoduje, że praca awaryjna

Rozdzielczość: Aby zapobiec powoduje awarii określonych usługSQL Server grupy praca awaryjna, skonfiguruj te usługi za pomocą Administratora klastrów w systemie Windows, w następujący sposób:

  • Wyczyść Grupy pole wyboru Zaawansowane Karta Właściwości pełnego tekstu -okno dialogowe.Jednak jeśli SQL Server powoduje, że pracy awaryjnej, ponowne uruchamianie usługa przeszukiwanie pełnego tekstu.

Problem: Program SQL Server nie zostanie uruchomiony automatycznie

Rozdzielczość: Użyj Administratora klastrów w MSCS, aby automatycznie uruchomić klaster pracy awaryjnej.The SQL Server usługa should be zestaw to start manually; the Cluster Administrator should be configured in MSCS to start the SQL Server usługa. Aby uzyskać więcej informacji zobaczManaging Services.

Problem: Nazwa sieciowa jest w trybie offline i nie można podłączyć się do bazy danych SQL Server przy użyciu protokołu TCP/IP

Problem 1: DNS nie działa prawidłowo z zasób klastra ustawić wymaganie DNS.

Rozdzielczość 1: Rozwiąż problemy DNS.

Problem 2: Duplikat nazwy znajduje się w sieci.

Rozdzielczość 2: Aby znaleźć zduplikowane nazwy, a następnie rozwiązać ten problem, należy użyć NBTSTAT.

**Problem 3:**SQL Server nie łączy się za pomocą nazwanych potoków.

Rozdzielczość 3: Nawiązywanie połączenia przy użyciu nazwanych potoków, utworzyć alias, używając SQL Server konfiguracja Manager do łączenia się z odpowiednim komputerem.Na przykład, jeśli masz klastra z dwoma węzłami)Węzła A and Węzeł B), a wystąpienie klaster pracy awaryjnej (Virtsql) wystąpienie domyślne, użytkownik może się łączyć z serwera, który zawiera zasób Nazwa sieciowa do trybu offline wykonując następujące czynności:

  1. Określić, na który węzeł grupę zawierającą wystąpienie SQL Server Uruchomiono za pomocą Administratora klastrów. W tym przykładzie jest Węzła A.

  2. Uruchom SQL Server usługa przy użyciu komputera polecenie net start.Aby uzyskać więcej informacji o korzystaniu z polecenie net start, see Starting SQL Server Manually.

  3. Uruchom SQL Server Program SQL Server Menedżer konfiguracja na Węzła A.Umożliwia wyświetlenie nazwy potoku nasłuchuje na serwerze.Powinna być podobna do folderu \\.\$$\VIRTSQL\pipe\sql\query.

  4. Na komputerze klienckim uruchom SQL Server konfiguracja Manager.

  5. Tworzenie alias SQLTEST1 do łączenia się za pośrednictwem nazwanych potoków do tej nazwy potoku.Aby to zrobić, należy wprowadzić Węzła A jako nazwa serwera i nazwy potoku do edycji \\.\pipe\$$\VIRTSQL\sql\query.

  6. Połączyć się z tym wystąpienie za pomocą alias SQLTEST1 jako nazwa serwera.

Problem: Konfiguracji programu SQL Server zakończy się niepowodzeniem w klastrze z błąd 11001

Problem: Oddzielony klucz w [HKEY_LOCAL_MACHINE\Software\Microsoft\Microsoft SQL Server\MSSQL.X\Cluster]

Rozdzielczość: Upewnij się, że MSSQL.X gałęzi rejestru nie jest obecnie w użyciu, a następnie usunięcie klucz klastra.

Problem: Błąd instalacji klastra: "Instalator ma niewystarczające uprawnienia dostępu do tego katalogu: dysk < > \Microsoft SQL Server. Nie można kontynuować instalacji.Zaloguj się jako administrator lub skontaktuj się z administrator systemu"

Problem: Ten błąd jest spowodowany przez dysk SCSI udostępniony, który nie jest poprawnie partycjami.

Rozdzielczość: Ponownie utworzyć pojedynczą partycję na dysku udostępnionym wykonując następujące czynności:

  1. Usuń zasób dysku z klastra.

  2. Usuń wszystkie partycje na dysku.

  3. Właściwości dysku sprawdź, czy dysk jest dyskiem podstawowym.

  4. Tworzenie jednej partycji na dysku udostępnionym, sformatować dysk i przypisać literę dysku.

  5. Dodanie dysku do klastra za pomocą Administratora klastrów (cluadmin).

  6. Uruchamianie SQL Server Ustawienia.

Problem: Aplikacje nie można zarejestrować zasobów programu SQL Server w transakcja rozproszona

Problem: Ponieważ Microsoft Koordynator transakcja rozproszona (MS DTC) nie jest w pełni skonfigurowany w systemie Windows zarejestrować mogą nie działać aplikacje SQL Server zasoby w transakcja rozproszona. Ten problem może mieć wpływ na połączonych serwerów kwerendami rozproszonymi i zdalnych procedur przechowywanych, które za pomocą transakcji rozproszonych.Aby uzyskać więcej informacji na temat sposobu konfigurowania usługi MS DTC zobacz Before Installing Failover Clustering.

Rozdzielczość: Aby zapobiec występowaniu takich problemów, należy całkowicie włączyć usługi MS DTC na serwerach, gdzie SQL Server zainstalowano i skonfigurowano usługę MS DTC.

Aby włączyć pełni usługi MS DTC, wykonaj następujące kroki:

  1. W Panelu sterowania otwórz aplet Narzędzia administracyjne, a następnie otwórz Program Zarządzanie komputerem.

  2. W lewym okienku przystawki Zarządzanie komputerem rozwiń węzeł Usługi i aplikacje, a następnie kliknij przycisk Usługi.

  3. W prawym okienku przystawki Zarządzanie komputerem kliknij prawym przyciskiem myszy Koordynator transakcja rozproszonai wybierz opcję Właściwości.

  4. W Koordynator transakcja rozproszona okno kliknijOgólne karcie, a następnie kliknij przycisk Zatrzymaj , aby zatrzymać usługa.

  5. W Koordynator transakcja rozproszona okno kliknijLogowanie kartę, a zestaw logowanie konta NT AUTHORITY\NetworkService.

  6. Kliknij przycisk Zastosowanie and OK zamknięciaKoordynator transakcja rozproszona okna.Zamknij Program Zarządzanie komputerem okna.Zamknij Narzędzia administracyjne okna.

Użycie rozszerzonych procedur przechowywanych i obiektów COM.

Kiedy używasz rozszerzonych procedur przechowywanych w trybie awaryjnym klastrowanie konfiguracja wszystkich rozszerzonych procedur przechowywanych, musi być zainstalowany na SQL Server-dysku klastrowego zależnych. Wykonanie tej czynności daje pewność, że gdy węzeł pracy awaryjnej, rozszerzone procedury przechowywane mogą być nadal używane.

Jeśli składniki COM za pomocą rozszerzonych procedur przechowywanych, administrator musi zarejestrować składniki COM w każdym węźle klastra.Informacje dotyczące ładowania i wykonywania składników modelu COM musi być w rejestrze węzła aktywnego w kolejności składników do utworzenia.W przeciwnym razie informacje pozostają w rejestrze komputera, na której składniki COM zostały po raz pierwszy zarejestrowane.