Udostępnij za pomocą


Dublowanie elastycznego serwera usługi Azure Database for PostgreSQL

Dublowanie w sieci szkieletowej zapewnia łatwe środowisko umożliwiające uniknięcie złożonych operacji ETL (wyodrębnianie transformacji) i zintegrowanie istniejącej elastycznej jednostki serwera usługi Azure Database for PostgreSQL z resztą danych w usłudze Microsoft Fabric. Możesz w sposób ciągły replikować swój istniejący serwer elastyczny usługi Azure Database for PostgreSQL bezpośrednio do OneLake w Fabric. Wewnątrz sieci szkieletowej można odblokować zaawansowane scenariusze analizy biznesowej, sztucznej inteligencji, inżynierii danych, nauki o danych i udostępniania danych.

Aby zapoznać się z samouczkiem dotyczącym konfigurowania elastycznego dublowania serwera usługi Azure Database for PostgreSQL w sieci szkieletowej (teraz ogólnie dostępnej), zobacz Samouczek: Konfigurowanie dublowanych baz danych usługi Microsoft Fabric z serwera elastycznego usługi Azure Database for PostgreSQL.

Dlaczego warto używać mirrorowania w Fabric?

Dzięki funkcji mirrorowania w Fabric, nie musisz łączyć różnych usług od wielu dostawców. Zamiast tego możesz korzystać z wysoce zintegrowanego, kompleksowego i łatwego w użyciu produktu, który został zaprojektowany w celu uproszczenia Twoich potrzeb analitycznych i opracowany z myślą o otwartości i współpracy między Microsoft, serwerem elastycznym Azure Database for PostgreSQL oraz tysiącami rozwiązań technologicznych, które potrafią odczytywać format tabeli Delta Lake open source.

Jakie doświadczenia analityczne są wbudowane?

Lustrzane bazy danych są elementem w Magazynie danych Fabric odrębnym od Magazynu i punktu końcowego analizy SQL.

Diagram replikacji bazy danych Fabric dla elastycznego serwera usługi Azure Database for PostgreSQL.

Odbijanie tworzy te elementy w obszarze roboczym Fabric:

  • Element dublowanej bazy danych. Dublowanie zarządza replikacją danych do usługi OneLake i konwersją na Parquet w formacie gotowym do analizy. Umożliwia to wykonywanie scenariuszy podrzędnych, takich jak inżynieria danych, nauka o danych i nie tylko.
  • Punkt końcowy analizy SQL

Każda dublowana baza danych na serwerze elastycznym usługi Azure Database for PostgreSQL ma automatycznie wygenerowany punkt końcowy analizy SQL , który zapewnia zaawansowane środowisko analityczne na podstawie tabel delty utworzonych przez proces dublowania. Użytkownicy mają dostęp do znanych poleceń języka T-SQL, które mogą definiować obiekty danych i wykonywać względem niego zapytania, ale nie manipulować danymi z punktu końcowego analizy SQL, ponieważ jest to kopia tylko do odczytu. Następujące akcje można wykonać w punkcie końcowym analizy SQL:

  • Sprawdź tabele, które odwołują się do danych w tabelach Delta Lake z elastycznego serwera Azure Database dla PostgreSQL.
  • Twórz zapytania i widoki bez kodu i eksploruj dane wizualnie bez konieczności pisania wiersza kodu.
  • Twórz widoki SQL, wbudowane funkcje TVF (funkcje z wartościami tabel) i procedury składowane w celu hermetyzacji semantyki i logiki biznesowej w języku T-SQL.
  • Zarządzanie uprawnieniami do obiektów.
  • Przeszukiwanie danych w innych magazynach i Lakehouse'ach w tym samym obszarze roboczym.

Oprócz edytora zapytań SQL istnieje szeroki ekosystem narzędzi, które mogą wykonywać zapytania dotyczące punktu końcowego analizy SQL, w tym programu SQL Server Management Studio (SSMS),rozszerzenia mssql z programem Visual Studio Code, a nawet usługi GitHub Copilot.

Wymagania dotyczące sieci

Jeśli serwer elastyczny nie jest publicznie dostępny i nie zezwala usługom platformy Azure na łączenie się z nim, możesz utworzyć bramę danych sieci wirtualnej w celu dublowania danych. Upewnij się, że sieć wirtualna platformy Azure lub sieć maszyny bramy może łączyć się z serwerem elastycznym usługi Azure Database for PostgreSQL za pośrednictwem prywatnego punktu końcowego lub jest dozwolona przez regułę zapory.

Aktywne transakcje, obciążenia i zachowania aparatu replikatora

Aktywne transakcje nadal wstrzymują przycinanie dziennika zapisu (WAL) do momentu zatwierdzenia transakcji i elastycznego serwera zreplikowanego w usłudze Azure Database for PostgreSQL osiągającego zgodność, lub przerwania transakcji. Długotrwałe transakcje mogą spowodować zapełnienie WAL bardziej niż zwykle. Baza danych WAL na źródłowym serwerze elastycznym usługi Azure Database for PostgreSQL powinna być monitorowana, aby magazyn nie wypełniał się. Aby uzyskać więcej informacji, zobacz Wal rośnie z powodu długotrwałych transakcji i CDC.

Każde obciążenie użytkownika różni się. Podczas początkowej migawki może wystąpić większe wykorzystanie zasobów w źródłowej bazie danych, zarówno dla procesora, jak i IOPS (liczby operacji wejścia/wyjścia na sekundę), w celu odczytania stron. Operacje aktualizacji/usuwania tabel mogą prowadzić do zwiększenia generowania dzienników. Dowiedz się więcej na temat monitorowania zasobów dla serwera elastycznego usługi Azure Database for PostgreSQL.

Obsługa warstwy obliczeniowej

Źródłowy serwer elastyczny usługi Azure Database for PostgreSQL może być w warstwie obliczeniowej o przeznaczeniu ogólnym lub pamięciowo zoptymalizowanej. Warstwa obliczeniowa o zmiennej wydajności nie jest obsługiwana jako źródło do replikacji.

Aby dowiedzieć się więcej o warstwach obliczeniowych dostępnych na serwerze elastycznym usługi Azure Database for PostgreSQL, zobacz Opcje obliczeń na serwerze elastycznym usługi Azure Database for PostgreSQL.

Następny krok