Bagikan melalui


Apa itu tautan semantik?

Tautan semantik adalah fitur yang memungkinkan Anda membuat koneksi antara model semantik dan Ilmu Data Synapse di Microsoft Fabric. Penggunaan tautan semantik hanya didukung di Microsoft Fabric.

  • Untuk Spark 3.4 ke atas, tautan semantik tersedia dalam runtime default saat menggunakan Fabric, dan tidak perlu menginstalnya.

  • Untuk Spark 3.3 atau di bawahnya, atau untuk memperbarui ke versi terbaru tautan semantik, jalankan perintah berikut:

    %pip install -U semantic-link
    

Tujuan utama tautan semantik adalah untuk:

  • Memfasilitasi konektivitas data.
  • Aktifkan penyebaran informasi semantik.
  • Integrasikan dengan mulus dengan alat yang digunakan ilmuwan data yang mapan, seperti notebook.

Tautan semantik membantu Anda mempertahankan pengetahuan domain tentang semantik data dengan cara standar yang dapat mempercepat analisis data dan mengurangi kesalahan.

Aliran data tautan semantik dimulai dengan model semantik yang berisi data dan informasi semantik. Tautan semantik menjelajah kesenjangan antara Power BI dan pengalaman Ilmu Data Synapse.

Diagram yang memperlihatkan aliran data dari Power BI ke buku catatan di Synapse Ilmu Data dan kembali ke Power BI.

Tautan semantik memungkinkan Anda menggunakan model semantik dari Power BI dalam pengalaman Ilmu Data Synapse untuk melakukan tugas seperti analisis statistik mendalam dan pemodelan prediktif dengan teknik pembelajaran mesin. Anda dapat menyimpan output pekerjaan ilmu data Anda ke OneLake dengan menggunakan Apache Spark, dan menyerap output yang disimpan ke Power BI dengan menggunakan Direct Lake.

konektivitas Power BI

Model semantik berfungsi sebagai model objek tabular tunggal yang menyediakan sumber yang andal untuk definisi semantik seperti pengukuran Power BI. Tautan semantik terhubung ke model semantik dalam ekosistem berikut, sehingga memudahkan ilmuwan data untuk bekerja dalam sistem yang paling mereka kenal.

  • Ekosistem panda python, melalui pustaka SemPy Python.
  • Ekosistem Apache Spark , melalui konektor asli Spark. Implementasi ini mendukung berbagai bahasa, termasuk PySpark, Spark SQL, R, dan Scala.

Aplikasi informasi semantik

Informasi semantik dalam data menyertakan kategori data Power BI seperti alamat dan kode pos, hubungan antara tabel, dan informasi hierarkis.

Kategori data ini terdiri dari metadata yang disebarkan tautan semantik ke lingkungan Synapse Ilmu Data untuk memungkinkan pengalaman baru dan memelihara silsilah data.

Beberapa contoh aplikasi tautan semantik meliputi:

  • Saran cerdas tentang fungsi semantik bawaan.
  • Integrasi inovatif untuk menambah data dengan pengukuran Power BI, dengan menggunakan add-measures.
  • Alat untuk validasi kualitas data berdasarkan hubungan antara tabel dan dependensi fungsional dalam tabel.

Tautan semantik adalah alat canggih yang memungkinkan analis bisnis menggunakan data secara efektif dalam lingkungan ilmu data yang komprehensif.

Tautan semantik memfasilitasi kolaborasi yang mulus antara ilmuwan data dan analis bisnis dengan menghilangkan kebutuhan untuk melengkapi logika bisnis yang disematkan dalam langkah-langkah Power BI. Pendekatan ini memastikan bahwa kedua belah pihak dapat bekerja secara efisien dan produktif, memaksimalkan potensi wawasan berbasis data mereka.

Struktur data FabricDataFrame

FabricDataFrame adalah struktur data utama yang digunakan tautan semantik untuk menyebarluaskan informasi semantik dari model semantik ke lingkungan Synapse Ilmu Data.

Diagram yang menunjukkan aliran data dari konektor ke model semantik ke FabricDataFrame ke fungsi semantik.

Kelas FabricDataFrame:

  • Mendukung semua operasi panda.
  • Subkelas dataframe pandas dan menambahkan metadata, seperti informasi semantik dan silsilah data.
  • Mengekspos fungsi semantik dan metode add-measure yang memungkinkan Anda menggunakan pengukuran Power BI dalam pekerjaan ilmu data.