Uproszczenie zarządzania danymi za pomocą dublowania i wirtualizacji

8 min

Organizacje często napotykają wyzwania związane z zarządzaniem danymi i analizowaniem ich ze względu na złożoność integrowania różnych źródeł danych, zapewnienia spójności danych i utrzymania dostępności danych w czasie rzeczywistym. Usługa SQL Database w usłudze Microsoft Fabric rozwiązuje te wyzwania, zapewniając ujednoliconą platformę, która upraszcza integrację danych, zwiększa spójność danych i zapewnia dostępność danych niemal w czasie rzeczywistym.

Integracja z dublowaniem

Jedną z kluczowych funkcji usługi SQL Database w usłudze Microsoft Fabric jest możliwość dublowania baz danych z usługi Azure SQL Database bezpośrednio w usłudze OneLake w usłudze Fabric. Ponadto baza danych SQL w Fabric jest automatycznie mirrorowana do celów analitycznych, a dane są stale replikowane do OneLake w niemal rzeczywistym czasie.

Ten proces dublowania gwarantuje, że dane są stale replikowane niemal w czasie rzeczywistym, eliminując konieczność złożonych procesów wyodrębniania, przekształcania, ładowania (ETL). Dzięki temu zmniejsza całkowity koszt posiadania i przyspiesza analizę czasową, umożliwiając firmom odblokowanie analizy biznesowej, sztucznej inteligencji, inżynierii danych, nauki o danych i scenariuszy udostępniania danych.

Po zainicjowaniu procesu dublowania można monitorować stan replikacji, wybierając opcję Monitorowanie replikacji na karcie Replikacja . Jeśli w tabelach źródłowych nie ma żadnych aktualizacji, aparat wycofa się i wznowi regularne sondowanie po wykryciu zaktualizowanych danych.

Aby dowiedzieć się więcej na temat konfigurowania dublowanych baz danych, zobacz Samouczek: Konfigurowanie dublowanych baz danych usługi Microsoft Fabric z usługi Azure SQL Database.

Eksplorowanie wirtualizacji danych

Wirtualizacja danych w usłudze SQL Database w sieci szkieletowej to funkcja umożliwiająca uzyskiwanie dostępu do danych z różnych źródeł i manipulowanie nimi bez konieczności fizycznego przenoszenia lub kopiowania danych. Takie podejście zapewnia ujednolicony widok danych, umożliwiając bezproblemową integrację i analizę na różnych platformach.

Te funkcje umożliwiają wykonywanie zapytań dotyczących tabel Parquet, CSV i Delta dostępnych w usłudze Lakehouse.

Możliwość	Definicja	Przykładowe zapytanie
Poświadczenie o zakresie bazy danych	Umożliwia tworzenie poświadczeń, które mogą służyć do bezpiecznego uzyskiwania dostępu do zewnętrznych źródeł danych.	`CREATE DATABASE SCOPED CREDENTIAL MyCredential WITH IDENTITY = 'USER IDENTITY';`
Zewnętrzne źródło danych	Dzięki temu można definiować zewnętrzne źródła danych, takie jak pliki przechowywane w usłudze OneLake.	`'abfss://aaaaaaaa-0000-1111-2222-bbbbbbbbbbbb@<onelake_account_name>.dfs.fabric.microsoft.com/bbbbbbbb-1111-2222-3333-cccccccccccc/Files/parquet/data1.parquet';`
Format pliku zewnętrznego	Ta funkcja umożliwia określenie formatu plików zewnętrznych, takich jak Parquet, CSV i Delta.	`CREATE EXTERNAL FILE FORMAT MyFileFormat WITH ( FORMAT_TYPE = DELIMITEDTEXT, FORMAT_OPTIONS ( FIELD_TERMINATOR = ',', STRING_DELIMITER = '"' ) );`
Tabela zewnętrzna	Dzięki temu można tworzyć tabele odwołujące się do danych przechowywanych poza bazą danych SQL.	`CREATE EXTERNAL TABLE MyExternalTable ( Column1 INT, Column2 NVARCHAR(50) ) WITH ( LOCATION = 'myfolder/myfile.csv', DATA_SOURCE = MyExternalDataSource, FILE_FORMAT = MyFileFormat );`

Opinia

Czy ta strona była pomocna?