Uwaga
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
W tym artykule opisano obsługę niezawodności w usłudze Azure Data Factory. Obejmuje ona odporność wewnątrz regionów za pośrednictwem stref dostępności i wdrożeń w wielu regionach.
Niezawodność jest wspólną odpowiedzialnością między Tobą a firmą Microsoft. W tym przewodniku można określić, które opcje niezawodności spełniają określone cele biznesowe i cele dotyczące czasu pracy.
Usługa Data Factory umożliwia tworzenie elastycznych i zaawansowanych potoków danych na potrzeby integracji danych bezserwerowych i przekształcania danych. W związku z tym podczas definiowania planu ciągłości działania pod kątem niezawodności należy wziąć pod uwagę wymagania dotyczące niezawodności i wskazówki dotyczące:
Potoki usługi Data Factory.
Mechanizmy wykonawcze integracji (IRs), które łączą się z magazynami danych i wykonują działania zdefiniowane w ramach procesu.
Magazyny danych łączące się z fabryką danych. Aby zapewnić, że magazyny danych spełniają wymagania dotyczące ciągłości działalności biznesowej, zapoznaj się z dokumentacją i wskazówkami dotyczącymi niezawodności produktu.
Omówienie architektury niezawodności
Usługa Data Factory składa się z wielu składników infrastruktury. Każdy składnik obsługuje niezawodność infrastruktury na różne sposoby.
Składniki usługi Data Factory obejmują:
Podstawowa usługa Data Factory, która zarządza wyzwalaczami potoków i nadzoruje koordynację aktywności potoku. Podstawowa usługa zarządza również metadanymi dla każdego składnika w fabryce danych. Firma Microsoft zarządza podstawową usługą.
Środowiska uruchomieniowe integracji (IR), które wykonują określone działania w ramach potoku. Istnieją różne rodzaje IR.
Zarządzane przez firmę Microsoft IR, które obejmują Azure IR i IR Azure-SQL Server Integration Services (Azure-SSIS). Firma Microsoft zarządza składnikami tworzącymi te środowiska uruchomieniowe. W niektórych scenariuszach skonfigurujesz ustawienia wpływające na odporność Twojego środowiska integracji.
Self-hosted integration runtimes (SHIRs) - Samodzielne środowiska uruchomieniowe integracji. Firma Microsoft udostępnia oprogramowanie, które można uruchamiać we własnej infrastrukturze obliczeniowej w celu wykonywania niektórych części potoków usługi Data Factory. Odpowiadasz za wdrażanie zasobów obliczeniowych i zarządzanie nimi oraz odporność tych zasobów obliczeniowych.
Błędy przejściowe
Błędy przejściowe to krótkotrwałe, sporadyczne awarie w komponentach. Występują one często w środowisku rozproszonym, takich jak chmura, i są one normalną częścią operacji. Błędy przejściowe naprawiają się po krótkim czasie. Ważne jest, aby aplikacje obsługiwały błędy przejściowe, zwykle ponawiając próby żądań, których dotyczy problem.
Wszystkie aplikacje hostowane w chmurze powinny postępować zgodnie ze wskazówkami dotyczącymi obsługi błędów przejściowych platformy Azure podczas komunikowania się z dowolnymi interfejsami API hostowanymi w chmurze, bazami danych i innymi składnikami. Aby uzyskać więcej informacji, zobacz Zalecenia dotyczące obsługi błędów przejściowych.
W przypadku korzystania z usługi Data Factory ważne jest przygotowanie się do przejściowych błędów, zwłaszcza podczas projektowania potoków i działań.
Idempotencja
Działania potoku powinny być idempotentne, co oznacza, że można je ponownie uruchomić wielokrotnie bez powodowania żadnych negatywnych skutków. Jeśli wystąpi błąd przejściowy, taki jak awaria sieci lub awaria strefy dostępności, usługa Data Factory może ponownie uruchomić działania potoku. To ponowne uruchomienie może tworzyć zduplikowane rekordy.
Aby zapobiec wstawieniu zduplikowanego rekordu z powodu błędu przejściowego, zaimplementuj następujące najlepsze rozwiązania:
Użyj unikatowych identyfikatorów dla każdego rekordu przed zapisem w bazie danych. Takie podejście może pomóc w znalezieniu i wyeliminowaniu zduplikowanych rekordów.
Stosuj strategię upsert dla łączników, które ją obsługują. Przed wystąpieniem zduplikowanego wstawiania rekordu użyj tej metody, aby sprawdzić, czy rekord już istnieje. Jeśli istnieje, zaktualizuj go. Jeśli nie istnieje, wstaw go. Na przykład polecenia SQL, takie jak
MERGE
lubON DUPLICATE KEY UPDATE
, korzystają z tego podejścia upsert.Użyj strategii kopiowania. Aby uzyskać więcej informacji, zobacz Weryfikacja spójności danych w działaniu kopiowania.
Zasady ponawiania prób
Możesz użyć zasad ponawiania prób, aby skonfigurować części potoku, aby ponowić próbę, jeśli wystąpi problem, na przykład błędy przejściowe w połączonych zasobach. W usłudze Data Factory można skonfigurować polityki ponownego próbowania dla następujących typów obiektów potoku:
Aby uzyskać więcej informacji na temat zmieniania lub wyłączania zasad ponawiania dla wyzwalaczy i działań Data Factory, zobacz Uruchomienia potoków i wyzwalacze.
Obsługa strefy dostępności
Strefy dostępności są fizycznie oddzielnymi grupami centrów danych w każdym regionie świadczenia usługi Azure. Gdy jedna strefa ulegnie awarii, usługi mogą przejść w tryb failover do jednej z pozostałych stref.
Usługa Data Factory obsługuje nadmiarowość strefową, która zapewnia odporność na awarie w strefach dostępności. W tej sekcji opisano, jak każda część usługi Data Factory obsługuje redundancję strefową.
Obsługiwane regiony
Strefowo nadmiarowe zasoby usługi Data Factory mogą być wdrażane w dowolnym regionie obsługującym strefy dostępności.
Zagadnienia do rozważenia
Podstawowa usługa: Firma Microsoft zarządza składnikami w podstawowej usłudze Data Factory i rozpowszechnia je w różnych strefach dostępności.
Irs: Obsługa nadmiarowości strefy zależy od typu używanego środowiska IR.
Środowisko Azure IR obsługuje nadmiarowość stref i firma Microsoft zarządza tą funkcją.
Azure-SSIS IR wymaga wdrożenia co najmniej dwóch węzłów. Te węzły są przydzielane automatycznie do różnych stref dostępności.
Infrastruktura SHIR zapewnia odpowiedzialność za wdrażanie infrastruktury obliczeniowej w celu hostowania środowiska uruchomieniowego. Można wdrożyć wiele węzłów, takich jak poszczególne maszyny wirtualne, i skonfigurować je pod kątem wysokiej dostępności. Następnie można dystrybuować te węzły w wielu strefach dostępności. Aby uzyskać więcej informacji, zobacz Wysoka dostępność i skalowalność.
Koszt
Podstawowa usługa: W przypadku redundancji strefy nie ma dodatkowych kosztów.
Irs: Koszt nadmiarowości strefy różni się w zależności od typu używanego środowiska IR.
Środowisko Azure IR obejmuje nadmiarowość strefową bez dodatkowych kosztów.
IR Azure-SSIS wymaga wdrożenia co najmniej dwóch węzłów, aby osiągnąć redundancję strefy. Aby uzyskać więcej informacji na temat sposobu naliczania opłat za każdy węzeł, zobacz Przykład cenowy: Uruchamianie pakietów usług SSIS w środowisku Azure-SSIS IR.
Środowisko SHIR wymaga wdrożenia infrastruktury obliczeniowej i zarządzania nią. Aby zapewnić odporność strefy, należy rozłożyć zasoby obliczeniowe w wielu strefach. W zależności od liczby wdrożonych węzłów i sposobu ich konfigurowania mogą być naliczane dodatkowe koszty z bazowych usług obliczeniowych i innych usług pomocniczych. Nie ma dodatkowych opłat za uruchomienie środowiska SHIR w wielu węzłach.
Konfiguruj obsługę stref dostępności
Podstawowa usługa: Nie jest wymagana żadna konfiguracja. Podstawowa usługa Data Factory automatycznie obsługuje redundancję strefową.
Irs:
Środowisko Azure IR: Nie wymaga żadnej konfiguracji. Środowisko Azure IR automatycznie włącza redundancję strefową.
IR Azure-SSIS: Nie jest wymagane konfigurowanie. Środowisko IR Azure-SSIS automatycznie zapewnia nadmiarowość stref po wdrożeniu go z dwoma lub więcej węzłami.
Funkcja SHIR wymaga skonfigurowania własnej odporności, która obejmuje rozłożenie węzłów w wielu strefach dostępności.
Planowanie pojemności i zarządzanie nimi
Podstawowa usługa: Usługa podstawowa usługi Data Factory jest skalowana automatycznie na podstawie zapotrzebowania i nie musisz planować pojemności ani zarządzać nią.
Irs:
Środowisko Azure IR jest skalowane automatycznie na podstawie zapotrzebowania i nie trzeba planować pojemności ani zarządzać nią.
IR Azure-SSIS wymaga konkretnie skonfigurowania liczby używanych węzłów. Aby przygotować się na awarię strefy dostępności, rozważ nadmiarowe zwiększenie pojemności swojego IR. Nadmierna aprowizacja pozwala rozwiązaniu tolerować pewien stopień utraty pojemności i nadal działać bez obniżonej wydajności. Aby uzyskać więcej informacji, zobacz Zarządzaj pojemnością przez nadprzydział zasobów.
SHIR wymaga skonfigurowania swojej pojemności i skalowania. Zastanów się nad nadmiernym przydzielaniem zasobów podczas wdrażania SHIR.
Normalne operacje
Trasowanie ruchu między strefami: Podczas normalnych operacji usługa Data Factory automatycznie dystrybuuje działania w przepływach danych, wyzwalacze i inne zadania między wystąpienia w dobrym stanie w każdej strefie dostępności.
Doświadczenie obniżenia strefy
Wykrywanie i reagowanie: Platforma Data Factory jest odpowiedzialna za wykrywanie awarii w strefie dostępności i odpowiadanie. Nie musisz nic robić, aby zainicjować przełączenie awaryjne strefy w infrastrukturze lub innych składnikach.
Aktywne żądania: Wszystkie potoki i wyzwalacze w toku są nadal uruchamiane i nie występują żadne natychmiastowe zakłócenia w przypadku awarii strefy. Jednak działania w toku podczas awarii strefy mogą zakończyć się niepowodzeniem i zostać uruchomione ponownie. Ważne jest, aby zaprojektować działania idempotentne, co pomaga je odzyskać po awariach strefy i innych błędach. Aby uzyskać więcej informacji, zobacz Błędy przejściowe.
Powrót po awarii
Gdy strefa dostępności zostanie przywrócona, usługa Data Factory automatycznie powróci do oryginalnej strefy. Nie musisz nic robić, aby zainicjować przywracanie po awarii strefy w pipeline'ach lub innych komponentach.
Jeśli jednak używasz środowiska SHIR, może być konieczne ponowne uruchomienie zasobów obliczeniowych, jeśli zostały zatrzymane.
Testowanie pod kątem awarii strefy
W przypadku podstawowej usługi oraz dla platformy Azure i Azure-SSIS IRS usługa Data Factory zarządza routingiem ruchu, trybem failover i powrotem po awarii dla zasobów strefowo nadmiarowych. Ponieważ ta funkcja jest w pełni zarządzana, nie trzeba inicjować ani weryfikować procesów awarii strefy dostępności.
W przypadku shiRs można użyć usługi Azure Chaos Studio do symulowania awarii strefy dostępności na maszynie wirtualnej platformy Azure.
Obsługa wielu regionów
Zasoby usługi Data Factory są wdrażane w jednym regionie świadczenia usługi Azure. Jeśli region stanie się niedostępny, twoja fabryka danych jest również niedostępna. Istnieją jednak podejścia, których można użyć, aby zapewnić odporność na awarie regionów. Te podejścia zależą od tego, czy fabryka danych znajduje się w sparowanym lub innym regionie oraz od konkretnych wymagań i konfiguracji.
Przełączanie awaryjne zarządzane przez firmę Microsoft do regionu partnerskiego
Usługa Data Factory obsługuje tryb failover zarządzany przez firmę Microsoft dla fabryk danych w sparowanych regionach, z wyjątkiem Brazylii Południowej i Azji Południowo-Wschodniej. W mało prawdopodobnym przypadku długotrwałej awarii regionu firma Microsoft może zainicjować regionalny tryb awaryjny instancji Data Factory.
Ze względu na wymagania dotyczące rezydencji danych w Brazylii Południowej i Azji Południowo-Wschodniej dane usługi Data Factory są przechowywane tylko w regionie lokalnym przy użyciu magazynu strefowo nadmiarowego usługi Azure Storage. W Przypadku Azji Południowo-Wschodniej wszystkie dane są przechowywane w Singapurze. W przypadku Brazylii Południowej wszystkie dane są przechowywane w Brazylii.
W przypadku fabryk danych w regionach nieparowanych, takich jak Brazylia Południowa lub Azja Południowo-Wschodnia, firma Microsoft nie wykonuje regionalnego przełączenia awaryjnego na Twoje życzenie.
Ważne
Firma Microsoft wyzwala tryb failover zarządzany przez firmę Microsoft. Prawdopodobnie wystąpi po znaczącym opóźnieniu i zostanie wykonane w miarę możliwości. Istnieją również pewne wyjątki od tego procesu. Możesz doświadczyć pewnej utraty metadanych fabryki danych. Przejście w tryb failover zasobów usługi Data Factory może wystąpić w czasie, który różni się od czasu przejścia w tryb failover innych usług platformy Azure.
Jeśli potrzebujesz odporności na awarie regionów, rozważ użycie jednego z alternatywnych podejść obejmujących wiele regionów.
Przełączenie trybu failover dla IR-ów
Aby przygotować się do przejścia w tryb failover, może istnieć kilka dodatkowych zagadnień, w zależności od używanego środowiska IR.
Środowisko Azure IR można skonfigurować tak, aby automatycznie rozpoznawać używany region. Jeśli region jest ustawiony na automatyczne rozwiązywanie problemów i występuje awaria w regionie podstawowym, środowisko Azure IR automatycznie przełączy się w tryb failover do sparowanego regionu. Tryb przełączania awaryjnego (failover) podlega ograniczeniom. Aby skonfigurować region środowiska Azure IR na potrzeby implementacji działań lub ich uruchomienia w konfiguracji środowiska IR, ustaw region, aby został automatycznie rozpoznany.
Azure-SSIS tryb failover środowiska IR jest zarządzany niezależnie od zarządzanego przez firmę Microsoft trybu failover fabryki danych. Aby uzyskać więcej informacji, zobacz Alternatywne podejścia obejmujące wiele regionów.
SHIR działa na infrastrukturze, za którą odpowiadasz, więc failover zarządzany przez Microsoft nie ma zastosowania do SHIRs. Aby uzyskać więcej informacji, zobacz Alternatywne podejścia obejmujące wiele regionów.
Konfiguracja po przełączeniu awaryjnym
Po zakończeniu pracy w trybie failover zarządzanym przez firmę Microsoft możesz uzyskać dostęp do potoku usługi Data Factory w sparowanym regionie. Jednak po zakończeniu przełączenia awaryjnego może być konieczna ponowna konfiguracja usług IR lub innych składników. Ten proces obejmuje ponowne ustanowienie konfiguracji sieci.
Alternatywne podejścia obejmujące wiele regionów
Jeśli potrzebujesz, aby potoki były odporne na awarie regionalne i potrzebujesz kontroli nad procesem przełączania awaryjnego, warto rozważyć zastosowanie potoku opartego na metadanych.
Skonfiguruj kontrolę źródła dla usługi Data Factory , aby śledzić i przeprowadzać inspekcję wszelkich zmian w metadanych. Za pomocą tego podejścia można uzyskać dostęp do plików JSON metadanych dla potoków, zestawów danych, połączonych usług i wyzwalaczy. Usługa Data Factory obsługuje różne typy repozytoriów Git, takie jak Azure DevOps i GitHub. Aby uzyskać więcej informacji, zobacz Kontrola źródła w usłudze Data Factory.
Użyj systemu ciągłej integracji i ciągłego dostarczania (CI/CD), takiego jak Azure DevOps, do zarządzania metadanymi i wdrożeniami potoku. Można użyć CI/CD do szybkiego przywrócenia operacji instancji w innym regionie. Jeśli region jest niedostępny, możesz aprowizować nową fabrykę danych ręcznie lub za pomocą automatyzacji. Po utworzeniu nowej fabryki danych możesz przywrócić swoje potoki, zestawy danych oraz usługi powiązane w formacie JSON z istniejącego repozytorium Git. Aby uzyskać więcej informacji, zobacz Business continuity and disaster recovery (BCDR) for Data Factory and Azure Synapse Analytics pipelines (Ciągłość działania i odzyskiwanie po awarii — BCDR) dla potoków usługi Data Factory i Azure Synapse Analytics.
W zależności od używanego środowiska IR mogą istnieć inne zagadnienia.
IR Azure-SSIS używa bazy danych przechowywanej w Azure SQL Database lub Azure SQL Managed Instance. Dla tej bazy danych można skonfigurować replikację geograficzną lub grupę przełączenia awaryjnego. Baza danych Azure-SSIS znajduje się w podstawowym regionie świadczenia usługi Azure, który ma dostęp do odczytu i zapisu. Baza danych jest stale replikowana do regionu pomocniczego, który ma dostęp tylko do odczytu. Jeśli region podstawowy jest niedostępny, zostaje uruchomiony tryb awaryjny, co powoduje zamianę ról między bazą danych podstawową a pomocniczą.
Można również skonfigurować parę środowiska Azure SSIS IR z podwójną rezerwą, która działa zsynchronizowana z grupą trybu failover usługi Azure SQL Database lub wystąpienia zarządzanego SQL.
Aby uzyskać więcej informacji, zobacz Configure an Azure-SSIS IR for BCDR (Konfigurowanie środowiska IR Azure-SSIS dla bcDR).
SHIR działa na infrastrukturze, którą zarządzasz. Jeśli środowisko SHIR zostało wdrożone na maszynie wirtualnej Azure, możesz użyć usługi Azure Site Recovery do wyzwolenia przełączenia awaryjnego maszyny wirtualnej w innym regionie.
Tworzenie kopii zapasowej i przywracanie
Usługa Data Factory obsługuje ciągłą integrację/ciągłe wdrażanie za pośrednictwem integracji kontroli źródła, dzięki czemu można utworzyć kopię zapasową metadanych wystąpienia usługi Data Factory. Potoki CI/CD bezproblemowo integrują te metadane w nowym środowisku. Aby uzyskać więcej informacji, zobacz także CI/CD w usłudze Data Factory.
Umowa dotycząca poziomu usług
Umowa dotycząca poziomu usług (SLA) dla usługi Azure Data Factory opisuje oczekiwaną dostępność usługi. Niniejsza umowa opisuje również warunki, które należy spełnić w celu osiągnięcia tego oczekiwania. Aby zrozumieć te warunki, zapoznaj się z umowami dotyczącymi poziomu usług (SLA) dla usług online.