Bagikan melalui


Apa itu Mirroring in Fabric?

Mirroring in Fabric adalah solusi bernilai rendah dan latensi rendah yang menyatukan data dari berbagai sistem ke dalam satu platform analitik. Anda dapat terus mereplikasi data estate Anda yang ada langsung ke Fabric's OneLake dari berbagai database Azure dan sumber data eksternal.

Dengan data yang paling up-to-date dalam format yang dapat dikueri di OneLake, Anda dapat menggunakan semua layanan berbeda di Fabric, seperti menjalankan analitik dengan Spark, menjalankan notebook, rekayasa data, memvisualisasikan melalui Laporan Power BI, dan banyak lagi.

Dengan menggunakan Mirroring in Fabric, Anda mendapatkan produk yang sangat terintegrasi, end-to-end, dan mudah digunakan yang menyederhanakan kebutuhan analitik Anda. Pencerminan dibangun untuk keterbukaan dan kolaborasi antara Microsoft dan solusi teknologi yang dapat membaca format tabel Delta Lake sumber terbuka. Ini adalah solusi siap pakai dengan biaya rendah dan latensi rendah yang membangun replika data Anda di OneLake untuk semua kebutuhan analitik Anda.

Anda dapat menggunakan tabel Delta di mana saja di Fabric, yang membantu Anda mempercepat perjalanan Anda ke Fabric.

Anda mengaktifkan pencerminan dengan membuat koneksi aman ke sumber data operasional Anda. Anda memilih apakah akan mereplikasi seluruh database atau tabel individual, dan Pencerminan secara otomatis menjaga data Anda tetap sinkron. Setelah disiapkan, data terus mereplikasi ke OneLake untuk konsumsi analitik.

Mengapa menggunakan Mirroring in Fabric?

Saat ini banyak organisasi memiliki data operasional atau analitik misi penting yang berada di silo.

Mengakses dan bekerja dengan data ini memerlukan alur ETL (Ekstrak Transformasi Muatan) yang kompleks, proses bisnis, dan silo keputusan yang menghasilkan:

  • Akses terbatas dan terbatas ke data penting, selalu berubah
  • Gesekan antara orang, proses, dan teknologi
  • Waktu tunggu yang lama untuk membuat alur dan proses ke data yang sangat penting
  • Tidak ada kebebasan untuk menggunakan alat yang Anda butuhkan untuk menganalisis dan berbagi wawasan dengan nyaman
  • Kurangnya fondasi yang tepat bagi orang untuk berbagi dan berkolaborasi pada data
  • Tidak ada format data terbuka umum untuk semua skenario analitik - BI, AI, Integrasi, Teknik, dan bahkan Aplikasi

Mirroring in Fabric memberikan pengalaman yang mudah untuk mempercepat waktu untuk mendapatkan nilai dari wawasan dan keputusan, serta untuk memecah pemisahan data antara solusi teknologi.

  • Replikasi data dan metadata dalam waktu nyata ke danau data SaaS, dengan analitik terintegrasi untuk BI dan AI

Platform Microsoft Fabric dibangun di atas fondasi Software as a Service (SaaS), yang membutuhkan kesederhanaan dan integrasi ke tingkat yang sama sekali baru. Untuk mempelajari selengkapnya tentang Microsoft Fabric, lihat Apa yang Microsoft Fabric?

Berikut ini adalah tenet inti Mirroring:

  • Mengaktifkan Mirroring in Fabric sederhana dan intuitif, tanpa perlu membuat alur ETL yang kompleks, mengalokasikan sumber daya komputasi lainnya, atau mengelola pergerakan data.

  • Mirroring in Fabric adalah layanan yang dikelola sepenuhnya, jadi Anda tidak perlu khawatir tentang hosting, pemeliharaan, atau pengelolaan replikasi koneksi cermin.

Mencerminkan objek

Pencerminan membuat item ini di ruang kerja Fabric Anda:

  • Proses yang mengelola replikasi data dan metadata ke OneLake dan konversi ke Parquet, dalam format siap analitik. Proses ini memungkinkan skenario hilir seperti rekayasa data, ilmu data, dan banyak lagi.
  • Ujung analisis SQL

Selain editor kueri SQL, ada ekosistem alat yang luas termasuk SQL Server Management Studio (SSMS),ekstensi MSSQL untuk Visual Studio Code, dan bahkan GitHub Copilot.

Berbagi memudahkan untuk mengontrol akses dan mengelola izin, sehingga Anda dapat melindungi informasi sensitif. Berbagi juga memungkinkan pengambilan keputusan yang aman dan demokratisasi di seluruh organisasi Anda.

Jenis pencerminan

Microsoft Fabric menawarkan tiga pendekatan berbeda untuk membawa data ke OneLake melalui pencerminan.

  • Pencerminan database - Pencerminan database di Fabric mereplikasi seluruh database dan tabel untuk membawa data dari berbagai sistem bersama ke dalam satu platform analitik.
  • Pencerminan metadata - Pencerminan metadata di Fabric menyinkronkan metadata (seperti nama katalog, skema, dan tabel) alih-alih memindahkan data secara fisik. Pendekatan ini menggunakan pintasan, memastikan data tetap berada dalam sumbernya sambil tetap mudah diakses dalam Fabric.
  • Pencerminan terbuka - Pencerminan terbuka di Fabric dirancang untuk memperluas pencerminan berdasarkan format tabel Delta Lake terbuka. Kemampuan ini memungkinkan pengembang untuk menulis data perubahan aplikasi mereka langsung ke item database cermin di Fabric, berdasarkan pendekatan pencerminan terbuka dan API publik.

Saat ini, database eksternal berikut ini tersedia:

Platform Replikasi mendekati real-time Jenis pencerminan Tutorial ujung-ke-ujung
Database yang dicerminkan Microsoft Fabric dari Azure Cosmos DB Yes Penggandaan database Tutorial: Azure Cosmos DB
Database replika Microsoft Fabric dari Azure Databricks Yes Pencerminan metadata Tutorial: Azure Databricks
Database yang telah dicerminkan Microsoft Fabric dari Azure Database for PostgreSQL Yes Penggandaan database Tutorial: Azure Database for PostgreSQL
Microsoft Fabric mencerminkan database dari Azure Database for MySQL (pratinjau) Yes Penggandaan database Tutorial: Azure Database for MySQL (preview)
Microsoft Fabric database cermin dari Azure SQL Database Yes Penggandaan database Tutorial: Azure SQL Database
Database tercermin Microsoft Fabric dari Azure SQL Managed Instance Yes Penggandaan database Tutorial: Azure SQL Managed Instance
Database tercermin Microsoft Fabric dari Google BigQuery (pratinjau) Yes Penggandaan database Tutorial: Google BigQuery
Database pencerminan Microsoft Fabric dari Oracle Yes Penggandaan database Tutorial: Oracle
Microsoft Fabric mereplikasi database dari SAP Yes Penggandaan database Tutorial: SAP
Database duplikat Microsoft Fabric dari Snowflake Yes Penggandaan database Tutorial: Snowflake
Basis data tercermin Microsoft Fabric dari SQL Server Yes Penggandaan database Tutorial: SQL Server
Membuka database ter-mirror Yes Buka cerminan layar Tutorial: Mengaktifkan Pencerminan
Database yang dicerminkan Microsoft Fabric dari Fabric SQL Yes Penggandaan database Dikonfigurasi secara otomatis

Replikasi mendekati real-time

Replikasi mendekati real-time dapat bergantung pada berbagai faktor, termasuk:

  • Lokasi atau wilayah sumber
  • Lokasi atau wilayah tujuan
  • Volume perubahan
  • Frekuensi perubahan
  • Bandwidth dan latensi jaringan dari sumber
  • Sumber daya komputasi yang dialokasikan ke gateway data lokal

Bagaimana cara kerja pencerminan database?

File Delta tiba secara bertahap dalam Fabric dari sumber data. Metode mengidentifikasi data yang diubah secara bertahap bervariasi di setiap sumber data. Pada SQL Server 2025, misalnya, SQL Database Engine memindai log transaksi database sumber pada frekuensi tinggi. SQL Server menerbitkan perubahan untuk setiap tabel ke file yang sesuai di zona pendaratan Fabric.

Di dalam Fabric, mesin replikator selalu berjalan dan memindai file yang baru diterbitkan pada frekuensi tinggi. Fabric langsung menggabungkan perubahan masuk ke dalam tabel delta target. Perubahan dapat diterbitkan secepat setiap 15 detik.

Logika backoff yang mendeteksi aktivitas rendah menghindari overhead yang berlebihan pada mesin sumber data di luar Fabric dan menurunkan latensi dengan merespons frekuensi perubahan data yang masuk.

Diagram tentang cara kerja Pencerminan Database Fabric.

Bagaimana cara kerja pencerminan metadata?

Pencerminan tidak hanya memungkinkan replikasi data tetapi juga dapat dicapai melalui pintasan atau pencerminan metadata daripada replikasi data penuh, memungkinkan data tersedia tanpa memindahkan atau menduplikasinya secara fisik. Pencerminan dalam konteks ini mengacu pada replikasi hanya metadata-seperti nama katalog, skema, dan tabel-bukan data aktual itu sendiri. Pendekatan ini memungkinkan Fabric untuk membuat data dari berbagai sumber dapat diakses tanpa menduplikasinya, menyederhanakan manajemen data dan meminimalkan kebutuhan penyimpanan.

Misalnya, saat mengakses data yang terdaftar di Unity Catalog, Fabric hanya mencerminkan struktur katalog dari Azure Databricks, memungkinkan data yang mendasar diakses melalui pintasan. Metode ini memastikan bahwa setiap perubahan dalam data sumber langsung tercermin dalam Fabric tanpa memerlukan pergerakan data, mempertahankan sinkronisasi waktu nyata dan meningkatkan efisiensi dalam mengakses informasi terkini.

Bagaimana cara kerja pencerminan terbuka?

Selain mengaktifkan replikasi data dengan membuat koneksi aman ke sumber data Anda, pencerminan memungkinkan Anda memilih penyedia data yang ada atau menulis aplikasi Anda sendiri untuk memasukkan data ke dalam database cermin. Saat Anda membuat database cermin terbuka melalui API publik atau portal Fabric, Anda mendapatkan URL zona pendaratan di OneLake tempat Anda dapat melakukan perubahan data per spesifikasi pencerminan terbuka.

Setelah data berada di zona pendaratan dengan format yang tepat, replikasi mulai berjalan dan mengelola kompleksitas penggabungan perubahan dengan pembaruan, sisipkan, dan hapus untuk direfleksikan ke dalam tabel delta. Metode ini memastikan bahwa setiap data yang ditulis ke zona pendaratan data segera tercermin, menjaga data dalam Fabric tetap terkini.

Berbagi

Berbagi membuat kontrol akses dan manajemen lebih mudah. Kontrol keamanan seperti keamanan tingkat baris (RLS), keamanan tingkat objek (OLS), dan lainnya pastikan Anda dapat mengontrol akses ke informasi sensitif. Berbagi juga memungkinkan pengambilan keputusan yang aman dan demokratisasi di seluruh organisasi Anda.

Dengan berbagi, pengguna memberi pengguna lain atau sekelompok pengguna akses ke database cermin tanpa memberikan akses ke ruang kerja dan sisa itemnya. Saat seseorang berbagi database cermin, mereka juga memberikan akses ke titik akhir analitik SQL.

Untuk informasi selengkapnya, lihat Berbagi database mirror Anda dan mengelola hak akses.

Kueri lintas database

Dengan data dari database cermin Anda yang disimpan di OneLake, Anda dapat menulis kueri lintas database, menggabungkan data dari database cermin, gudang, dan titik akhir analitik SQL Lakehouses dalam satu kueri T-SQL. Untuk informasi selengkapnya, lihat Menulis kueri lintas database.

Misalnya, Anda dapat mereferensikan tabel dari database dan gudang yang dicerminkan dengan menggunakan penamaan tiga bagian. Dalam contoh berikut, gunakan nama berformat tiga bagian untuk merujuk ContosoSalesTable di gudang ContosoWarehouse. Dari database atau gudang data lain, bagian pertama dari konvensi penamaan tiga bagian SQL standar adalah nama basis data yang digandakan.

SELECT *
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;

Biaya pencerminan

Untuk pencerminan database dan pencerminan terbuka, komputasi Fabric dan penyimpanan OneLake bebas hingga batas berbasis kapasitas.

  • Penyimpanan untuk replika bebas hingga batas berdasarkan ukuran kapasitas. Mirroring menawarkan penyimpanan mirroring satu terabyte gratis untuk setiap unit kapasitas (CU) yang Anda beli. Misalnya, jika Anda membeli kapasitas F64, Anda mendapatkan penyimpanan senilai 64 terabyte gratis, yang secara eksklusif digunakan untuk pencerminan. Anda membayar penyimpanan OneLake jika Anda melebihi batas penyimpanan cermin gratis atau ketika kapasitas dihentikan sementara. Untuk informasi selengkapnya, lihat harga Microsoft Fabric.
  • Komputasi Background Fabric yang digunakan untuk mereplikasi data Anda ke Fabric OneLake gratis dan tidak mengonsumsi kapasitas. Permintaan langsung ke OneLake untuk data yang dicerminkan menggunakan kapasitas sebagaimana konsumsi komputasi OneLake yang normal. Komputasi untuk mengkueri data dengan menggunakan SQL, Power BI, atau Spark dikenakan biaya reguler.
  • Kapasitas Fabric yang aktif hanya diperlukan untuk pengaturan awal mirroring.

Rekayasa data dengan data replika database Anda

Microsoft Fabric menyediakan berbagai kemampuan rekayasa data untuk memastikan bahwa data Anda mudah diakses, terorganisir dengan baik, dan berkualitas tinggi. Dari Fabric Data Engineering, Anda dapat:

  • Buat dan kelola data Anda dengan Spark menggunakan lakehouse
  • Merancang alur untuk menyalin data ke lakehouse Anda
  • Menggunakan definisi kerja Spark untuk mengirimkan pekerjaan batch atau streaming ke kluster Spark
  • Menggunakan notebook untuk menulis kode untuk penyerapan, persiapan, dan transformasi data

Ilmu data dengan data database cermin Anda

Microsoft Fabric menawarkan Fabric Data Science untuk memberdayakan pengguna untuk menyelesaikan alur kerja ilmu data end-to-end untuk tujuan pengayaan data dan wawasan bisnis. Anda dapat menyelesaikan berbagai aktivitas di seluruh proses ilmu data, mulai dari eksplorasi data, persiapan dan pembersihan hingga eksperimen, pemodelan, penilaian model, dan penyajian wawasan prediktif ke laporan BI.

Microsoft Fabric pengguna dapat mengakses beban kerja Data Science. Dari sana, mereka dapat menemukan dan mengakses berbagai sumber daya yang relevan. Misalnya, mereka dapat membuat Eksperimen, Model, dan Notebook pembelajaran mesin. Mereka juga dapat mengimpor Notebook yang sudah ada di halaman Beranda Ilmu Data.

Direct Lake dengan data database cermin Anda

Anda dapat menggunakan mode Direct Lake dengan database cermin di Microsoft Fabric untuk mengaktifkan kueri berperforma tinggi melalui data yang dicerminkan tanpa perlu pergerakan data atau duplikasi. Saat Anda membuat database cermin, datanya disimpan dalam format Delta Lake dalam OneLake. Format asli ini memungkinkan Power BI dan alat analitik lainnya untuk terhubung melalui mode Direct Lake, menawarkan wawasan mendekati real-time dengan langsung mengakses file yang mendasar. Integrasi ini menggabungkan kesederhanaan mirroring dengan kecepatan dan skalabilitas Direct Lake, memungkinkan pelaporan data operasional yang cepat dan up-to-date.

Retensi untuk data cermin

Pencerminan dalam Fabric terus mereplikasi data estate Anda yang ada ke oneLake dalam format tabel Delta Lake. Untuk menjaga data yang dicerminkan disimpan secara efisien dan selalu siap untuk analitik, pencerminan secara otomatis menjalankan vakum guna menghapus file lama yang tidak lagi dirujuk oleh log Delta.

Anda dapat menyesuaikan pengaturan retensi sesuai dengan kebutuhan Anda. Misalnya, Anda dapat memilih periode retensi yang lebih pendek untuk mengurangi konsumsi penyimpanan pencerminan atau memperpanjang periode retensi untuk menggunakan kemampuan perjalanan waktu Delta untuk analitik.

Untuk database cermin yang dibuat dari portal Fabric setelah pertengahan Juni 2025, retensi defaultnya adalah satu hari. Untuk database yang dicerminkan yang sudah lama, pengaturannya secara bawaan adalah tujuh hari. Untuk memeriksa atau memperbarui pengaturan retensi, di portal Fabric, navigasikan ke database cermin Anda ->Pengaturan ->tab manajemen tabel Delta, dan tentukan ambang retensi. Anda juga dapat mengonfigurasinya melalui API publik dengan menentukan retentionInDays properti .

Basis data SQL di platform Fabric

Anda juga dapat langsung membuat dan mengelola database SQL di Microsoft Fabric di dalam portal Fabric. Berdasarkan Azure SQL Database, database SQL di Fabric secara otomatis mencerminkan data untuk tujuan analitik dan Anda dapat dengan mudah membuat database operasional Anda di Fabric. Database SQL adalah komponen utama dalam Fabric untuk beban kerja OLTP, dan dapat diintegrasikan dengan pengendalian sumber Fabric.