Uproszczenie zarządzania danymi za pomocą dublowania i wirtualizacji
Organizacje często napotykają wyzwania związane z zarządzaniem danymi i analizowaniem ich ze względu na złożoność integrowania różnych źródeł danych, zapewnienia spójności danych i utrzymania dostępności danych w czasie rzeczywistym. Usługa SQL Database w usłudze Microsoft Fabric rozwiązuje te wyzwania, zapewniając ujednoliconą platformę, która upraszcza integrację danych, zwiększa spójność danych i zapewnia dostępność danych niemal w czasie rzeczywistym.
Integracja z dublowaniem
Jedną z kluczowych funkcji usługi SQL Database w usłudze Microsoft Fabric jest możliwość dublowania baz danych z usługi Azure SQL Database bezpośrednio w usłudze OneLake w usłudze Fabric. Ponadto baza danych SQL w Fabric jest automatycznie mirrorowana do celów analitycznych, a dane są stale replikowane do OneLake w niemal rzeczywistym czasie.
Ten proces dublowania gwarantuje, że dane są stale replikowane niemal w czasie rzeczywistym, eliminując konieczność złożonych procesów wyodrębniania, przekształcania, ładowania (ETL). Dzięki temu zmniejsza całkowity koszt posiadania i przyspiesza analizę czasową, umożliwiając firmom odblokowanie analizy biznesowej, sztucznej inteligencji, inżynierii danych, nauki o danych i scenariuszy udostępniania danych.
Po zainicjowaniu procesu dublowania można monitorować stan replikacji, wybierając opcję Monitorowanie replikacji na karcie Replikacja . Jeśli w tabelach źródłowych nie ma żadnych aktualizacji, aparat wycofa się i wznowi regularne sondowanie po wykryciu zaktualizowanych danych.
Aby dowiedzieć się więcej na temat konfigurowania dublowanych baz danych, zobacz Samouczek: Konfigurowanie dublowanych baz danych usługi Microsoft Fabric z usługi Azure SQL Database.
Eksplorowanie wirtualizacji danych
Wirtualizacja danych w usłudze SQL Database w sieci szkieletowej to funkcja umożliwiająca uzyskiwanie dostępu do danych z różnych źródeł i manipulowanie nimi bez konieczności fizycznego przenoszenia lub kopiowania danych. Takie podejście zapewnia ujednolicony widok danych, umożliwiając bezproblemową integrację i analizę na różnych platformach.
Te funkcje umożliwiają wykonywanie zapytań dotyczących tabel Parquet, CSV i Delta dostępnych w usłudze Lakehouse.
| Możliwość | Definicja | Przykładowe zapytanie |
|---|---|---|
| Poświadczenie o zakresie bazy danych | Umożliwia tworzenie poświadczeń, które mogą służyć do bezpiecznego uzyskiwania dostępu do zewnętrznych źródeł danych. | CREATE DATABASE SCOPED CREDENTIAL MyCredential WITH IDENTITY = 'USER IDENTITY'; |
| Zewnętrzne źródło danych | Dzięki temu można definiować zewnętrzne źródła danych, takie jak pliki przechowywane w usłudze OneLake. | 'abfss://aaaaaaaa-0000-1111-2222-bbbbbbbbbbbb@<onelake_account_name>.dfs.fabric.microsoft.com/bbbbbbbb-1111-2222-3333-cccccccccccc/Files/parquet/data1.parquet'; |
| Format pliku zewnętrznego | Ta funkcja umożliwia określenie formatu plików zewnętrznych, takich jak Parquet, CSV i Delta. | CREATE EXTERNAL FILE FORMAT MyFileFormat WITH ( FORMAT_TYPE = DELIMITEDTEXT, FORMAT_OPTIONS ( FIELD_TERMINATOR = ',', STRING_DELIMITER = '"' ) ); |
| Tabela zewnętrzna | Dzięki temu można tworzyć tabele odwołujące się do danych przechowywanych poza bazą danych SQL. | CREATE EXTERNAL TABLE MyExternalTable ( Column1 INT, Column2 NVARCHAR(50) ) WITH ( LOCATION = 'myfolder/myfile.csv', DATA_SOURCE = MyExternalDataSource, FILE_FORMAT = MyFileFormat ); |