Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Penyimpanan pengetahuan Genie memungkinkan Anda untuk mengkurasi dan mengembangkan ruang digital Anda melalui metadata yang dilokalkan, pencocokan permintaan, dan instruksi SQL terstruktur. Fitur-fitur ini membantu Genie memahami data Anda dan menghasilkan respons yang lebih akurat dan relevan.
Apa itu penyimpanan pengetahuan?
Penyimpanan pengetahuan adalah kumpulan definisi semantik yang dikumpulkan yang meningkatkan pemahaman Genie tentang data Anda dan meningkatkan akurasi respons.
Penyimpanan pengetahuan terdiri dari:
- Penyesuaian metadata tingkat ruang: Deskripsi khusus ruang untuk tabel, kolom, serta istilah dan sinonim bisnis.
- Kustomisasi data tingkat ruang: Himpunan data yang disederhanakan dan difokuskan tanpa mengubah tabel Unity Catalog yang mendasar.
- Pencocokan permintaan: Contoh yang membantu Genie mencocokkan nilai yang paling relevan dengan pertanyaan pengguna dan memperbaiki masalah ejaan dalam permintaan pengguna. Ini termasuk bantuan format dan pencocokan entitas.
-
Relasi gabungan: Hubungan tabel yang didefinisikan untuk pernyataan yang akurat
JOIN. - Ekspresi SQL: Definisi terstruktur pengukuran, filter, dan dimensi yang menangkap logika bisnis.
Nota
Setiap Genie Space mendukung maksimal 200 cuplikan penyimpanan pengetahuan. Deskripsi tabel, hubungan gabungan, dan ekspresi SQL (pengukuran, filter, dan dimensi) dihitung terhadap batas ini. Instruksi teks, contoh kueri SQL, fungsi SQL, deskripsi kolom, dan pengaturan pencocokan permintaan tidak dihitung terhadap batas ini.
Semua konfigurasi penyimpanan pengetahuan dilingkupkan ke Ruang Genie Anda dan tidak memengaruhi metadata Katalog Unity atau aset Azure Databricks lainnya.
Mengelola metadata penyimpanan pengetahuan
Ajarkan Genie tentang data di ruang Anda dengan memberikan deskripsi tabel dan kolom lokal dan menambahkan sinonim kolom yang selaras dengan istilah bisnis umum. Sederhanakan himpunan data dengan menyembunyikan kolom yang tidak perlu atau duplikat agar Genie tetap fokus.
Praktik ini meningkatkan kegunaan bagi pengguna yang tidak memiliki izin langsung pada tabel yang mendasar, dan mereka juga mendukung perulangan yang lebih cepat saat memperbarui versi instruksi.
Untuk mengakses metadata tingkat ruang, klik Konfigurasikan > Data di Genie Space Anda. Lalu klik nama tabel untuk melihat metadata dan kolomnya.
Menampilkan kolom
Klik nama tabel untuk melihat gambaran umum nama dan detail kolom. Contoh berikut menunjukkan sampel dari tabel bernama accounts.
Deskripsi: Genie menggunakan metadata untuk memahami data Anda dan menghasilkan respons yang akurat. Deskripsi tabel default memperlihatkan metadata Unity Catalog yang terkait dengan aset data Anda. Edit deskripsi ini untuk menambahkan petunjuk spesifik yang membantu Genie dalam membuat SQL untuk ruang kerja Anda. Klik Reset untuk memulihkan deskripsi Katalog Unity.
Kolom: Nama dan deskripsi kolom disertakan dalam daftar kolom. Setiap kolom diberi label dengan tag yang menunjukkan apakah kolom tersebut menyertakan bantuan Format atau Pencocokan entitas. Lihat Gambaran umum pencocokan perintah.
Sembunyikan atau perlihatkan kolom yang relevan
Kolom dapat dikelola secara individual atau massal. Gunakan instruksi berikut untuk menyembunyikan atau memperlihatkan kolom.
-
Sembunyikan satu kolom: Klik
di samping nama kolom. -
Sembunyikan beberapa kolom:
- Pilih kotak centang untuk kolom yang ingin Anda sembunyikan.
- Dari menu Tindakan , pilih Sembunyikan kolom yang dipilih.
- Urungkan perubahan: Ulangi langkah yang sama untuk memperlihatkan kolom yang disembunyikan.
Mengedit metadata kolom
Anda bisa mengkustomisasi yang berikut ini untuk setiap kolom:
- Deskripsi: Deskripsi kolom khusus ruang yang meningkatkan pemahaman Genie.
- Sinonim: Istilah dan kata kunci bisnis yang membantu mencocokkan bahasa pengguna dengan nama kolom.
-
Pengaturan tingkat lanjut: Meminta kontrol yang cocok.
- Bantuan format: Aktifkan atau nonaktifkan pengambilan sampel nilai perwakilan.
- Pencocokan entitas: Mengaktifkan atau menonaktifkan pencocokan entitas untuk kolom kategoris.
Untuk mengedit metadata kolom:
- Klik
ikon pensil di samping nama kolom.
- Edit deskripsi dan sinonim untuk kolom.
- Jika perlu, klik Pengaturan tingkat lanjut untuk membuka perintah yang cocok dengan kontrol.
- Klik Simpan untuk menyimpan perubahan Anda dan menutup dialog.
Gambaran umum pencocokan prompt
Pencocokan perintah memungkinkan Genie untuk mencocokkan kolom dan nilai yang paling relevan dengan pertanyaan pengguna, dan memperbaiki masalah ejaan dalam permintaan pengguna. Ini meningkatkan akurasi Genie dan membantu menghasilkan kueri SQL yang lebih andal.
Ketika pengguna mengajukan pertanyaan di Genie, pembuatan frasa sering kali bersifat percakapan dan dapat menyertakan kesalahan seperti kesalahan ejaan. Dalam kasus ini, nilai dalam perintah mungkin tidak cocok dengan struktur atau nilai dalam data. Hal ini dapat menyebabkan Genie salah menafsirkan pertanyaan dan menghasilkan SQL yang salah.
Example
Tinjau contoh berikut:
"Tunjukkan penjualan mobil di Florida untuk Q1."
Jika data menggunakan singkatan status (seperti FL), dan Genie tidak dapat mengakses nilai untuk kolom tersebut, Genie mungkin menghasilkan SQL yang menyertakan ILIKE '%Florida%', yang tidak mengembalikan hasil.
Mengaktifkan pencocokan entitas pada state kolom memungkinkan Genie mengakses nilai perwakilan. Dengan konteks ini, Genie dapat mengenali bahwa FL sesuai dengan "Florida" dan menghasilkan SQL yang lebih akurat.
| Tanpa pencocokan entitas | Dengan pencocokan entitas |
|---|---|
WHERE state ILIKE '%Florida%' |
WHERE state = 'FL' |
Komponen pencocokan permintaan
- Bantuan format: Bantuan format menyediakan nilai representatif untuk semua kolom yang memenuhi syarat, membantu Genie memahami jenis data dan pola pemformatan. Nilai perwakilan untuk pencocokan permintaan dihasilkan menggunakan izin data pembuat. Nilai-nilai ini menjadi bagian dari konteks bersama ruang dan membantu Genie menginterpretasikan permintaan pengguna secara lebih akurat untuk semua peserta ruang.
- Pencocokan entitas: Pencocokan entitas menyediakan daftar nilai berbeda yang dikumpulkan hingga 120 kolom di mana pengguna cenderung mereferensikan entri tertentu, seperti status dan kategori produk. Ini membantu Genie mencocokkan terminologi pengguna dengan nilai data aktual. Setiap kolom dapat menyertakan hingga 1.024 nilai yang berbeda, masing-masing memiliki panjang hingga 127 karakter. Data pencocokan entitas disimpan di wadah penyimpanan ruang kerja Anda.
Genie secara otomatis menyediakan bantuan format dan pencocokan entitas untuk kolom yang memenuhi syarat saat Anda menambahkan tabel ke ruang. Tabel dengan filter baris atau masker kolom dikecualikan dari pencocokan permintaan.
Mengelola pencocokan perintah
Kontrol kolom mana yang memberikan bantuan format dan pencocokan entitas untuk mengoptimalkan pemahaman Genie tentang data Anda. Pencocokan perintah diaktifkan secara default untuk semua Ruang Genie.
Mengelola bantuan format
Bantuan format diterapkan secara otomatis saat Anda menambahkan tabel ke Genie Space.
Untuk menonaktifkan bantuan format untuk kolom:
- Klik Konfigurasikan > Data di Genie Space Anda.
- Klik nama tabel untuk menampilkan kolomnya.
- Klik
ikon pensil di samping nama kolom.
- Klik Tingkat Lanjut.
- Nonaktifkan Bantuan format .
Tindakan ini juga secara otomatis menonaktifkan pencocokan entitas untuk kolom tersebut. Jika perlu, gunakan pengaturan ini untuk mengaktifkan kembali bantuan Format .
Mengonfigurasi pencocokan entitas
Genie menghasilkan respons menggunakan perintah Anda, metadata tabel yang relevan, kemampuan pencocokan permintaan, sinyal kesalahan, dan kode input atau kueri apa pun. Saat kolom mengaktifkan pencocokan entitas, Genie memanfaatkan nilai yang disimpan untuk mencocokkan permintaan pengguna ke data aktual dengan lebih akurat. Ini menghasilkan kueri SQL yang lebih andal. Pencocokan entitas secara signifikan meningkatkan akurasi Genie, terutama jika dikombinasikan dengan contoh kueri yang jelas dan instruksi yang dibuat dengan baik. Lihat Mengelola Genie Space yang Efektif untuk panduan selengkapnya.
Genie mencegah Anda mengaktifkan pencocokan entitas pada tabel dengan filter baris atau masker kolom. Namun, penulis spasi harus menonaktifkan pencocokan entitas untuk tampilan yang mereferensikan tabel dengan filter baris atau masker kolom, atau untuk tampilan dinamis.
Pencocokan entitas hanya mendukung kolom string. Daftar berikut ini mencakup contoh jenis data yang berfungsi dengan baik dengan pencocokan entitas:
- Kode negara bagian atau negara
- Kategori Produk
- Kode status
- Nama departemen
Untuk mengaktifkan pencocokan entitas, bantuan Format harus diaktifkan. Kemudian, gunakan langkah berikut:
- Klik Konfigurasikan > Data di Genie Space Anda.
- Klik nama tabel untuk menampilkan kolomnya.
- Klik
ikon pensil di samping nama kolom.
- Klik Tingkat Lanjut.
- Aktifkan fitur Entity Matching.
- Untuk menonaktifkan pencocokan entitas untuk kolom, nonaktifkan Pencocokan entitas .
Nota
Saat pengguna memfilter kolom dengan pencocokan entitas diaktifkan, filter ditampilkan sebagai menu drop-down yang dapat diedit yang diisi dengan nilai tersimpan kolom.
Menyegarkan atau menghapus data pencocokan perintah
Me-refresh permintaan yang cocok dengan data memperbarui nilai kolom yang disimpan. Perbarui nilai jika:
- Nilai baru telah ditambahkan ke kolom.
- Format nilai yang ada telah berubah.
Untuk menyegarkan data pencocokan permintaan, klik menu kebab di tampilan kolom, lalu Refresh permintaan yang cocok.
Menentukan hubungan gabungan
Bantu Genie membuat pernyataan yang akurat JOIN dengan menentukan hubungan tabel:
- Klik Gabung.
- Klik Tambahkan.
- Pilih tabel kiri dan kanan dari menu drop-down.
- Masukkan kondisi Gabung (misalnya,
accounts.id = opportunity.accountid)- Untuk kondisi gabungan yang lebih rumit, klik Gunakan ekspresi SQL lalu rekam kondisi gabungan sebagai ekspresi SQL.
- Pilih Tipe Hubungan:
- Banyak ke satu: Beberapa baris di sebelah kiri dipetakan ke satu baris di sebelah kanan
- Satu ke banyak: Satu baris kiri memetakan ke beberapa baris kanan
- Satu ke satu: Satu baris kiri memetakan ke paling banyak satu baris kanan
Nota
Ketika terdapat beberapa gabungan antara tabel yang sama atau gabungan mandiri digunakan, Genie secara otomatis menghasilkan alias untuk tabel di sisi kanan guna menghindari ambiguitas.
Menentukan ekspresi SQL
Ekspresi SQL menyediakan cara terstruktur dan terpandu untuk mengajarkan Genie tentang istilah bisnis umum seperti KPI, atribut, dan kondisi. Genie kemudian menggunakan definisi ini ketika pengguna bertanya tentang istilah bisnis ini.
Ekspresi SQL melengkapi contoh kueri SQL, yang ditentukan dalam instruksi. Ekspresi SQL menentukan konsep bisnis yang dapat digunakan kembali, tetapi contoh kueri SQL lebih membantu untuk mengajari Genie cara mendekati format perintah pengguna umum. Misalnya, jika pengguna biasanya meminta "perincian performa", contoh kueri SQL dapat menunjukkan bahwa ini berarti penjualan tertutup menurut wilayah, perwakilan penjualan, dan manajer.
Ekspresi SQL berfungsi paling baik saat Anda perlu:
- Memberikan definisi terstruktur untuk KPI dan metrik, seperti margin keuntungan atau tingkat konversi
- Berikan konteks eksplisit Genie tentang cara menghitung nilai penting
- Menentukan dimensi tambahan untuk himpunan data, seperti segmen bulan atau pelanggan
- Ajarkan filter Genie untuk kondisi bisnis, seperti pesanan besar atau pesanan sebelum waktu tertentu.
Jenis ekspresi SQL
Anda dapat menentukan jenis ekspresi SQL berikut:
- Ukuran: Indikator performa utama (KPI) dan metrik. Tentukan nama, perhitungan SQL, dan sinonim.
- Filter: Kondisi pemfilteran umum. Tentukan nama, logika filter SQL, dan sinonim.
- Dimensi: Atribut untuk mengelompokkan dan menganalisis data. Tentukan nama, ekspresi SQL, dan sinonim.
Gunakan instruksi berikut untuk menentukan ekspresi SQL:
- Klik Konfigurasikan>Instruksi>Ekspresi SQL
- Klik Tambahkan. Pilih Filter, Ukuran, atau Dimensi.
- Di bidang Nama , masukkan nama untuk ekspresi.
- Di bidang Kode , masukkan ekspresi SQL.
- Ekspresi filter harus dievaluasi menjadi kondisi boolean.
- Ekspresi pengukuran harus menghitung agregasi atas beberapa baris dalam tabel.
- Ekspresi dimensi harus mengubah nilai setiap baris dari data yang ada.
- Di bidang Sinonim , masukkan cara umum agar pengguna dapat merujuk ke ekspresi secara kolektial.
- Di bidang Instruksi , masukkan instruksi khusus yang memberi tahu Genie untuk apa ekspresi tersebut dan cara bekerja dengannya.
Rekomendasi penambangan pengetahuan
Penambangan pengetahuan membantu meningkatkan Genie dengan secara otomatis menyarankan pembaruan ke penyimpanan pengetahuan, mengurangi kurasi manual, dan meningkatkan akurasi jawaban.
Pertama, Genie menganalisis metadata Unity Catalog untuk tabel dan tampilan yang terhubung ke ruang Anda. Kunci primer dan asing yang ditentukan dalam skema Anda secara otomatis disimpan sebagai relasi join di Genie Space.
Genie juga belajar dari interaksi penulis dalam percakapan. Saat penulis mengacungkan jempol respons atau mengunduh hasil kueri, Genie menganalisis kueri dan mengidentifikasi logika berguna yang dapat meningkatkan akurasi pada pertanyaan di masa mendatang. Ini mungkin menyarankan ekspresi SQL baru (pengukuran, filter, atau dimensi) serta hubungan gabungan tambahan untuk ditambahkan ke penyimpanan pengetahuan.
Langkah selanjutnya
Gunakan tautan berikut untuk membantu Anda terus membangun Genie Space Anda.
- Tambahkan konteks ke Genie Space Anda untuk membantu menghasilkan respons yang akurat. Lihat Menambahkan contoh dan instruksi SQL
- Pelajari praktik terbaik untuk mengoptimalkan Genie Space Anda. Lihat Mengkurasi Genie Space secara efektif
- Evaluasi dan tingkatkan performa ruang Anda. Gunakan tolok ukur di Genie Space