Memecahkan masalah Genie Spaces

Halaman ini menguraikan cara mengatasi masalah umum saat membuat dan memelihara Ruang Genie.

Jargon bisnis yang disalahpahami

Sebagian besar perusahaan atau domain memiliki singkatan khusus yang mereka gunakan untuk berkomunikasi tentang peristiwa khusus bisnis. Misalnya, jika mengacu pada satu tahun, itu mungkin selalu berarti tahun fiskal, dan tahun fiskal ini mungkin dimulai pada bulan Februari atau Maret alih-alih Januari. Untuk memungkinkan Genie menjawab pertanyaan-pertanyaan ini secara alami dan akurat, sertakan instruksi yang secara eksplisit memetakan jargon bisnis Anda ke kata-kata dan konsep yang dapat dipahami Genie. Lihat dan berikan instruksi.

Penggunaan tabel atau kolom yang salah

Jika Genie mencoba menarik data dari tabel yang salah atau menjalankan analisis pada kolom yang salah, Anda mungkin menyesuaikan data dengan salah satu cara berikut:

  • Berikan deskripsi yang jelas dan tepat: Periksa tabel dan metadata terkait Anda untuk memverifikasi bahwa terminologi yang digunakan di sana cocok dengan terminologi pengguna dalam pertanyaan yang dikirimkan. Jika tidak, perbaiki deskripsinya atau tambahkan instruksi yang memetakan terminologi yang digunakan dalam tabel dengan terminologi yang digunakan dalam pertanyaan.
  • Menambahkan contoh kueri: Berikan sampel kueri SQL yang dapat digunakan Genie untuk mempelajari cara menanggapi pertanyaan tertentu. Lihat dan berikan instruksi.
  • Menghapus tabel atau kolom dari spasi: Beberapa tabel mungkin menyertakan kolom atau konsep yang tumpang tindih yang menyulitkan Genie untuk mengetahui data mana yang akan digunakan dalam respons. Jika memungkinkan, hapus tabel atau kolom yang tidak perlu atau tumpang tindih. Untuk menyembunyikan kolom dari antarmuka pengguna Genie Space tanpa mengubah objek data yang mendasar, lihat Menyembunyikan atau memperlihatkan kolom yang relevan.

Kesalahan pemfilteran

Kueri yang WHERE dihasilkan sering menyertakan klausul untuk memfilter hasil sesuai dengan nilai tertentu. Saat Genie tidak memiliki visibilitas ke dalam nilai data, Genie mungkin mengatur WHERE klausul untuk memfilter nilai yang salah. Misalnya, mungkin mencoba mencocokkan nama "California" ketika tabel menggunakan singkatan seperti "CA."

Untuk situasi seperti ini, verifikasi bahwa kolom yang relevan mengaktifkan Contoh nilai dan Kamus Nilai . Jika data baru telah ditambahkan ke tabel yang relevan, refresh nilai. Lihat Membangun penyimpanan pengetahuan untuk Genie Spaces yang lebih andal.

Penggabungan yang salah

Jika referensi kunci asing tidak ditentukan dalam Katalog Unity, ruang Anda mungkin tidak tahu cara menggabungkan tabel yang berbeda.

Coba terapkan satu atau beberapa solusi berikut:

  • Tentukan referensi kunci asing di Katalog Unity Anda jika memungkinkan. Lihat klausa CONSTRAINT.
  • Jika hubungan kunci asing tabel Anda tidak ditentukan di Unity Catalog, tentukan hubungan gabungan di penyimpanan pengetahuan Genie Space Anda. Strategi ini berguna untuk skenario gabungan yang lebih kompleks seperti gabungan mandiri, atau jika Anda tidak memiliki izin yang memadai untuk mengubah tabel yang mendasarinya. Lihat Menentukan hubungan gabungan.
  • Berikan contoh kueri tempat Anda menggabungkan tabel bersama-sama dengan cara standar.

Jika tidak ada yang menyelesaikan masalah, gabungkan terlebih dahulu tabel ke dalam tampilan dan gunakan itu sebagai input untuk ruang sebagai gantinya.

Komentar kolom tidak tersinkronisasi dari tabel luar

Azure Databricks tidak mengelola metadata, data, atau semantik untuk menulis ke tabel asing. Bergantung pada tabel sumber, komentar mungkin tidak dapat diakses dari Azure Databricks. Untuk membuat komentar tersedia, Azure Databricks merekomendasikan untuk melakukan salah satu hal berikut ini:

  • Edit metadata kolom di antarmuka pengguna Genie Space. Metadata yang diedit hanya berlaku untuk Genie Space tempat metadata ditulis. Lihat Mengedit metadata kolom.
  • Buat tampilan materialisasi di atas tabel terfederasi. Anda dapat menambahkan dan mengedit komentar pada tampilan materialisasi seperti yang Anda lakukan pada tabel terkelola. Anda dapat menggunakan kembali tampilan ini di beberapa Genie Spaces. Untuk detail tentang memuat data dari tabel asing ke tampilan materialisasi, lihat Memuat data dari tabel asing dengan tampilan materialisasi. Untuk mempelajari selengkapnya tentang bekerja dengan tampilan materialisasi, lihat Tampilan materialisasi.

Masalah perhitungan metrik

Cara perhitungan dan penyajian metrik dapat sangat rumit dan mencakup banyak detail bisnis yang tidak dipahami oleh bidang Anda. Hal ini dapat menyebabkan pelaporan yang salah.

Coba terapkan satu atau beberapa solusi berikut:

  • Tentukan metrik Anda sebagai ekspresi SQL di penyimpanan pengetahuan. Ekspresi SQL memberikan definisi yang dapat digunakan kembali dan tepat untuk pengukuran, filter, dan dimensi yang dapat diterapkan Genie secara konsisten. Lihat Menentukan ekspresi SQL.
  • Jika metrik Anda dikumpulkan dari tabel dasar, berikan contoh kueri SQL yang menghitung setiap nilai roll-up.
  • Jika metrik Anda telah dihitung sebelumnya dan berada dalam tabel agregat, jelaskan ini dalam komentar tabel. Tentukan agregasi yang valid untuk setiap metrik jika metrik dalam tabel tersebut dapat digulung lebih lanjut.
  • Jika SQL yang Anda coba hasilkan sangat rumit, cobalah membuat view yang telah mengagregasi metrik untuk ruang Anda.

Perhitungan berbasis waktu yang salah

Genie mungkin tidak selalu dapat menyimpulkan zona waktu yang diwakili dalam data atau zona waktu di mana analisis Anda perlu dilakukan kecuali Anda secara eksplisit memberikan panduan tambahan.

Sertakan instruksi yang lebih eksplisit yang merinci zona waktu sumber asli, fungsi konversi, dan zona waktu target. Contoh berikut menunjukkan cara mengubah instruksi umum untuk konversi zona waktu yang lebih andal:

  • Selalu konversi waktu ke zona waktu tertentu: Dalam contoh ini, asumsikan bahwa tanda waktu sumber UTC dan Anda ingin menghasilkan zona waktu America/Los_Angeles. Tambahkan yang berikut ini ke instruksi, ganti <timezone-column> dengan nama kolom yang sesuai:
    • Zona waktu dalam tabel berada di UTC.
    • Konversi semua zona waktu menggunakan fungsi berikut: convert_timezone('UTC', 'America/Los_Angeles', <timezone-column>).
  • Mengonversi format tanggalwaktu non-UTC ke UTC: Jika zona waktu default ruang kerja adalah UTC tetapi pengguna di Los Angeles harus mereferensikan hari ini untuk sekumpulan rekaman tertentu, tambahkan yang berikut ini ke instruksi umum ruang:
    • Untuk mereferensikan hari ini, gunakan date(convert_timezone('UTC', 'America/Los_Angeles', current_timestamp())).

Lihat fungsi convert_timezone untuk detail dan sintaks selengkapnya.

Mengabaikan instruksi

Bahkan jika Anda telah menjelaskan tabel dan kolom Anda dalam komentar dan memberikan instruksi umum, ruang kerja Anda mungkin masih belum menggunakannya dengan benar.

Cobalah satu atau beberapa strategi berikut:

  • Berikan contoh kueri yang menggunakan tabel Anda dengan benar. Contoh kueri sangat efektif untuk mengajari sistem Anda bagaimana menggunakan data Anda.
  • Sembunyikan kolom yang tidak relevan di Ruang Genie. Lihat Menyembunyikan atau memperlihatkan kolom yang relevan.
  • Buat tampilan dari tabel Anda yang menyediakan tampilan data Anda yang lebih sederhana.
  • Tinjau instruksi Anda dan coba fokuskan ruang dengan menghapus tabel atau instruksi yang tidak relevan.
  • Coba mulai obrolan baru. Interaksi sebelumnya mungkin memengaruhi respons Genie dalam obrolan tertentu, tetapi memulai obrolan baru memberi Anda titik awal kosong untuk menguji instruksi baru.

Masalah performa

Ketika Genie perlu menghasilkan kueri atau respons teks yang sangat panjang, diperlukan waktu lama untuk merespons atau bahkan kehabisan waktu selama fase berpikir.

Coba satu atau beberapa tindakan berikut untuk meningkatkan performa:

  • Periksa riwayat kueri untuk mengidentifikasi kueri yang berjalan lambat. Banyak masalah performa dapat diatasi dengan mengoptimalkan kueri SQL yang dihasilkan daripada memodifikasi konfigurasi Genie Space. Tinjau waktu eksekusi kueri dan rencana kueri dalam riwayat kueri gudang SQL Anda untuk mengidentifikasi hambatan dan peluang untuk pengoptimalan.
  • Gunakan aset atau tampilan tepercaya untuk merangkum kueri kompleks. Lihat Aset tepercaya.
  • Kurangi panjang contoh kueri SQL Anda jika memungkinkan.
  • Mulai obrolan baru jika Genie mulai menghasilkan respons yang lambat atau gagal.

Respons yang tidak dapat diandalkan terhadap pertanyaan yang sangat penting untuk misi

Gunakan aset tepercaya untuk memberikan jawaban terverifikasi atas pertanyaan tertentu yang Anda harapkan untuk diajukan pengguna. Lihat Aset tepercaya.

Peringatan batas token

Token adalah unit dasar teks yang digunakan Genie untuk memproses dan memahami bahasa. Instruksi teks dan metadata dalam Genie Space dikonversi menjadi token. Jika ruang Anda mendekati batas token, peringatan akan muncul. Genie menggunakan pemfilteran konteks untuk memprioritaskan token yang dianggap paling relevan dengan pertanyaan. Meskipun respons masih harus dihasilkan ketika peringatan muncul, kualitas dapat dikurangi jika konteks penting difilter. Ketika batas token terlampaui, Anda tidak dapat lagi mengirim atau menerima pesan di Genie Space.

Pertimbangkan praktik berikut untuk mengurangi jumlah token:

  • Hapus kolom yang tidak perlu: Kolom yang tidak perlu dalam tabel Anda dapat secara signifikan berkontribusi pada penggunaan token. Jika memungkinkan, buat tampilan untuk mengecualikan bidang redundan atau non-esensial dari tabel mentah Anda. Anda juga dapat menyembunyikan kolom yang tidak diperlukan di Genie Space. Lihat Menyembunyikan atau memperlihatkan kolom yang relevan.
  • Menyederhanakan deskripsi kolom: Meskipun deskripsi kolom penting, hindari informasi duplikat yang sudah disampaikan oleh nama kolom. Misalnya, jika kolom diberi nama account_name, deskripsi seperti "nama akun Anda" mungkin berlebihan dan dapat dihilangkan.
  • Edit metadata kolom di Genie Space: Lihat Mengedit metadata kolom untuk mempelajari cara mengedit deskripsi dan memberikan sinonim dalam metadata kolom.
  • Pangkas contoh kueri SQL: Sertakan berbagai contoh kueri SQL untuk mencakup berbagai jenis pertanyaan, tetapi hapus contoh yang tumpang tindih atau berlebihan.
  • Menyederhanakan instruksi: Verifikasi bahwa instruksi Anda jelas dan ringkas. Hindari kata-kata yang tidak perlu.

Akun Anda tidak diaktifkan untuk pemrosesan lintas geografis

Genie adalah Layanan Tertunjuk yang dikelola oleh Azure Databricks. Layanan yang Ditunjuk menggunakan Databricks Geos untuk mengelola residensi data. Data tidak dapat diproses di Geo yang sama dengan ruang kerja untuk beberapa wilayah. Jika ruang kerja Anda berada di salah satu wilayah tersebut, pemrosesan lintas-Geo harus diaktifkan oleh administrator akun Anda.

Mencapai batas kapasitas pemrosesan

Saat mengakses Genie Spaces melalui Azure Databricks UI, throughput dibatasi hingga 20 pertanyaan per menit per ruang kerja, di semua Genie Spaces.

Saat mengakses Ruang Genie menggunakan paket gratis API Percakapan, throughput dibatasi hingga maksimal lima pertanyaan per menit per ruang kerja untuk semua Ruang Genie. Lihat Menggunakan GENie API untuk mengintegrasikan Genie ke dalam aplikasi Anda.

Batas default ini diberlakukan untuk mencegah penyalahgunaan. Untuk mendapatkan dukungan throughput yang lebih tinggi, hubungi tim akun pelanggan Databricks Anda.