Apa itu ruang Genie

Halaman ini memperkenalkan Genie, fitur Azure Databricks yang memungkinkan tim bisnis berinteraksi dengan data mereka menggunakan bahasa alami. Ini menggunakan AI generatif yang disesuaikan dengan terminologi dan data organisasi Anda, dengan kemampuan untuk memantau dan menyempurnakan performanya melalui umpan balik pengguna.

Gambaran Umum

Pakar domain, seperti analis data, mengonfigurasi ruang Genie dengan himpunan data, kueri sampel, dan panduan teks untuk membantu Genie menerjemahkan pertanyaan bisnis ke dalam kueri analitik. Setelah penyiapan, pengguna bisnis dapat mengajukan pertanyaan dan menghasilkan visualisasi untuk memahami data operasional. Anda dapat terus memperbarui pengetahuan semantik Genie saat data Anda berubah dan pengguna menimbulkan pertanyaan baru. Untuk informasi tambahan tentang fitur yang didukung AI Databricks, lihat Fitur bantuan Databricks AI.

Genie memilih nama dan deskripsi yang relevan dari tabel dan kolom yang diannotasi untuk mengonversi pertanyaan bahasa alami ke kueri SQL yang setara. Kemudian, ia merespons dengan kueri yang dihasilkan dan tabel hasil, jika memungkinkan. Jika Genie tidak dapat menghasilkan jawaban, Genie dapat mengajukan pertanyaan tindak lanjut untuk mengklarifikasi sebelum memberikan respons.

Contoh kasus penggunaan

Anda dapat membuat ruang Genie yang berbeda untuk melayani berbagai audiens non-teknis. Skenario berikut menjelaskan dua kemungkinan kasus penggunaan.

Contoh 1: Memvisualisasikan produk penjualan teratas

Seorang manajer penjualan ingin memahami produk penjualan teratas dari waktu ke waktu di toko roti mereka. Mereka dapat berinteraksi dengan ruang Genie menggunakan bahasa alami dan secara otomatis menghasilkan visualisasi.

GIF berikut menunjukkan interaksi ini:

Gif dengan contoh pertanyaan, respons, dan visualisasi yang dihasilkan secara otomatis

Contoh 2: Melacak logistik

Perusahaan logistik ingin menggunakan ruang Genie untuk membantu pengguna bisnis dari berbagai departemen melacak detail operasional dan keuangan. Mereka menyiapkan ruang Genie bagi manajer fasilitas pengiriman mereka untuk melacak pengiriman dan satu lagi bagi eksekutif keuangan mereka untuk memahami kesehatan keuangan mereka.

Data apa yang harus saya gunakan?

Ruang Genie didasarkan pada data yang terdaftar ke Unity Catalog, termasuk tabel terkelola, tabel eksternal, tabel asing, tampilan, tampilan metrik, dan tampilan materialisasi. Genie menggunakan metadata yang dilampirkan ke objek Katalog Unity, serta penyimpanan pengetahuan yang dikurasi penulis pada tingkat ruang, untuk menghasilkan respons. Himpunan data yang dianotasi dengan baik, dipasangkan dengan instruksi spesifik yang Anda berikan, adalah kunci untuk menciptakan pengalaman positif bagi pengguna akhir.

Catatan

Genie hanya berfungsi dengan data terstruktur. Ini tidak dapat menjawab pertanyaan tentang data yang tidak terstruktur seperti PDF, dokumen Word, atau konten berbasis file lainnya. Untuk memberi Genie akses ke dokumen yang tidak terstruktur, gunakan Chat di Databricks One, yang dapat terhubung ke sumber dokumen eksternal seperti Google Drive atau SharePoint.

Unggahan file

Penting

Fitur ini ada di Pratinjau Umum.

Unggahan file memungkinkan pengguna untuk memadukan file CSV dan Excel lokal mereka dengan data Katalog Unity untuk menjawab pertanyaan. Untuk mengaktifkan unggahan file, hubungi tim akun Databricks Anda. Untuk informasi selengkapnya, lihat Mengunggah file.

Cara kerja Genie

Genie menggunakan sistem AI majemuk untuk menafsirkan pertanyaan bisnis dan menghasilkan jawaban. Alih-alih menggunakan satu model bahasa besar, sistem AI majemuk memproses tugas dalam aplikasi AI dengan menggabungkan beberapa komponen yang berinteraksi. Sistem AI majemuk adalah pola desain yang semakin umum untuk aplikasi AI karena performa dan fleksibilitasnya. Untuk informasi selengkapnya, lihat Pergeseran dari Model ke Sistem AI Gabungan.

Dukungan bahasa

Anda dapat menggunakan Genie dalam bahasa selain bahasa Inggris, seperti Bahasa Portugis dan Prancis. Namun, kerangka kerja agen yang mendasar membungkus perintah dalam bahasa Inggris.

Databricks merekomendasikan agar pembuat ruang menambahkan metadata sebanyak mungkin dalam bahasa pilihan mereka. Respons genie terkadang muncul dalam bahasa Inggris karena perintah sistem yang mendasar.

Apa itu repositori pengetahuan Genie?

Penyimpanan pengetahuan Genie memungkinkan penulis untuk:

  • Edit metadata secara lokal: Penulis Genie dapat menambahkan metadata khusus ruang ke aset data. Misalnya, ini dapat mencakup informasi khusus perusahaan yang relevan dengan bagaimana ruang digunakan. Ini mencakup deskripsi metadata tabel dan kolom, sinonim tingkat kolom, serta kemampuan pencocokan untuk prompt, yang dikonsultasikan Genie saat menghasilkan jawaban. Lapisan metadata terperinci membantu Genie mengambil informasi yang benar dan menghasilkan hasil yang lebih akurat.

  • Berikan instruksi terstruktur dan halus: Penulis dapat menentukan JOIN hubungan antar tabel, untuk mengajarkan Genie cara menulis SQL di beberapa tabel.

Lihat Membangun penyimpanan pengetahuan untuk ruang Genie yang lebih andal.

Bagaimana Genie menghasilkan respons?

Saat pengguna mengirimkan pertanyaan, Genie mengurai permintaan, mengidentifikasi sumber data yang relevan, dan menentukan cara menghasilkan respons yang sesuai. Detail yang disediakan oleh penulis, dikombinasikan dengan komentar, metadata, dan nilai sampel Unity Catalog yang relevan dari kolom yang dipilih, memungkinkan Genie menyimpulkan logika bisnis dan teknis. Untuk informasi selengkapnya, lihat fitur asisten AI Databricks trust dan safety dan penyesuaian prompt. Genie dengan cerdas memfilter contoh kueri SQL, metadata tabel dan kolom, dan riwayat obrolan untuk memilih konteks yang paling relevan untuk menjawab permintaan.

Genie menghasilkan respons menggunakan komponen seperti berikut:

  • Metadata tabel Katalog Unity: Menyertakan nama tabel, deskripsi, dan hubungan kunci primer (PK) dan kunci asing (FK) yang ditentukan. Genie menggunakan data ini saat mengurai permintaan dan mengonversi permintaan bahasa alami ke SQL.
  • Nama dan deskripsi kolom: Genie dengan cerdas memfilter nama dan deskripsi kolom yang relevan untuk dimasukkan.
  • Konteks penyimpanan pengetahuan: Penulis dapat mengedit metadata aset secara lokal dan memilih kolom yang menyediakan nilai yang relevan untuk Genie. Ini membantu Genie menghasilkan respons yang lebih akurat dan tidak mengubah metadata Katalog Unity yang ada. Lihat Membangun penyimpanan pengetahuan untuk ruang Genie yang lebih andal.
  • Contoh kueri SQL: Genie dengan cerdas memilih contoh SQL yang relevan dari Kueri SQL.
  • Fungsi SQL: Semua fungsi SQL yang telah ditambahkan di ruang.
  • Petunjuk: Catatan teks biasa yang disediakan sebagai Instruksi umum disertakan sebagai konteks.
  • Riwayat perintah dan respons: Perintah dan respons dari obrolan saat ini disertakan sebagai konteks. Jika perlu, karena adanya batas token , bagian terlama dari rekaman obrolan dihilangkan.

Catatan

Beberapa detail tabel, seperti pemilik dan ukuran tabel, tidak disertakan secara default. Untuk mengakses informasi ini, gunakan tampilan dari skema informasi yang tersedia untuk semua katalog Katalog Unity. Tampilan default mungkin menyertakan detail yang tidak perlu, jadi membuat tampilan kustom di atasnya dapat membantu fokus pada informasi tertentu yang Anda butuhkan. Untuk informasi selengkapnya tentang apa yang tersedia dalam skema informasi, lihat Skema informasi.

Dalam banyak kasus, Genie menghasilkan kueri SQL yang berjalan di gudang data SQL di ruang tersebut. Kueri yang dihasilkan selalu bersifat baca-saja. Percobaan ulang ditangani secara otomatis, dan gudang SQL menangani konkurensi dan skala. Kumpulan hasil disajikan sebagai bagian dari tanggapan.

Genie mempertahankan kontrol keamanan dan privasi yang kuat. Untuk detailnya, lihat Kepercayaan dan keamanan fitur bantuan Databricks AI.

Meningkatkan akurasi respons menggunakan Inspect

Penting

Fitur ini ada di Pratinjau Umum.

Inspeksi menggunakan penalaran tingkat lanjut untuk meninjau dan meningkatkan akurasi kueri SQL yang dihasilkan oleh Genie. Saat Anda mengaktifkan Periksa respons, Genie:

  1. Meninjau kueri SQL yang dihasilkan awal.
  2. Penulis pernyataan SQL yang lebih kecil untuk memverifikasi aspek kueri tertentu, seperti:
    • Memastikan bahwa nilai filter yang benar telah disertakan.
    • Memvalidasi logika rentang tanggal, seperti jendela 7 hari terakhir.
    • Memeriksa kondisi penggabungan dan agregasi.
  3. Mengidentifikasi celah atau potensi masalah dalam kueri asli.
  4. Jika masalah diidentifikasi, menghasilkan kueri SQL yang ditingkatkan yang menyelesaikannya.
  5. Melakukan perbandingan akhir antara kueri asli dan yang ditingkatkan.
  6. Mengembalikan kueri yang paling akurat menjawab pertanyaan Anda.

Gunakan Periksa saat Anda menginginkan keyakinan tambahan dalam akurasi kueri, terutama untuk kueri kompleks yang melibatkan filter, rentang tanggal, atau beberapa tabel.

Menyiapkan ruang Genie

Anda dapat membuat ruang Genie jika Anda memiliki hal berikut:

  • Hak Akses Databricks SQL.
  • Setidaknya DAPAT MENGGUNAKAN izin pada gudang SQL pro atau tanpa server.
  • Setidaknya SELECT hak istimewa pada satu atau beberapa objek data Unity Catalog.

Lihat Menyiapkan dan mengelola ruang Genie.

Ruang Pendamping Genie untuk dasbor AI/BI (Pratinjau Umum)

Anda dapat menggunakan perintah bahasa alami untuk menghasilkan visualisasi untuk dasbor AI/BI dengan Kode Genie. Lihat Menggunakan Kode Genie untuk pembuatan dasbor.

Saat Anda membuat dasbor, Databricks secara otomatis membuat ruang Genie pendamping yang memungkinkan pengguna bisnis untuk melakukan analitik data mandiri menggunakan bahasa alami. Lihat Ruang Genie dengan dasbor.

Berinteraksi dengan ruang Genie

Tim bisnis adalah pengguna akhir untuk ruang Genie. Untuk menggunakan ruang Genie, pengguna bisnis harus memiliki:

  • Akses konsumen atau izin Databricks SQL.
  • Setidaknya SELECT hak akses pada semua objek data dari Katalog Unity yang digunakan dalam ruang. Pengguna hanya melihat data yang mereka miliki izin untuk mengakses.

Kueri berjalan menggunakan kredensial komputasi yang disematkan oleh penulis yang mengonfigurasi gudang. Pengguna akhir tidak memerlukan izin gudang langsung.

Pengguna bisnis dapat membantu mengatur ruang dengan mengujinya dan memberikan umpan balik dalam proses pengembangan. Untuk mempelajari selengkapnya tentang bagaimana pengguna bisnis dapat mulai bekerja dengan ruang Genie, lihat Menggunakan ruang Genie untuk menjelajahi data bisnis.

Aset tepercaya

Aset tepercaya menyampaikan lapisan jaminan tambahan dalam akurasi hasil kepada pengguna ruang. Saat teks yang tepat dari kueri contoh parameter atau fungsi SQL digunakan untuk menghasilkan respons, Genie menandai respons sebagai Tepercaya. Lihat Aset tepercaya untuk mempelajari selengkapnya tentang aset tepercaya dan bekerja dengan kueri berparameter.

Mengevaluasi respons dengan tolok ukur

Tolok ukur memungkinkan Anda meningkatkan pengujian dan evaluasi respons individu di ruang Genie. Berbeda dari instruksi, tolok ukur dirancang untuk mengevaluasi, bukan menginformasikan, ruang Genie Anda. Genie tidak menggunakan pertanyaan tolok ukur atau contoh SQL untuk meningkatkan konteks Genie.

Dengan menggunakan tolok ukur, Anda dapat menjalankan kumpulan pertanyaan pengujian dan menggunakan respons untuk mengukur akurasi Genie. Secara opsional, Anda dapat menyertakan pernyataan SQL yang mengembalikan hasil yang diharapkan. Ketika pertanyaan tolok ukur berjalan, respons Genie dibandingkan dengan hasil yang disediakan oleh pernyataan SQL dan dinilai untuk akurasi. Pertanyaan ditandai untuk ditinjau jika tidak ada jawaban SQL yang disediakan.

Lihat Penggunaan tolok ukur di ruang Genie.

Cara kerja akses data

Akses data di ruang Genie diatur oleh Unity Catalog. Saat pengguna mengajukan pertanyaan, kueri SQL yang dihasilkan berjalan terhadap data menggunakan kredensial komputasi yang disematkan oleh pembuat ruang (gudang SQL yang dikonfigurasi). Izin data Unity Catalog masing-masing pengguna diterapkan pada hasil kueri. Pengguna hanya melihat data yang diizinkan untuk diakses. Pertanyaan apa pun tentang data yang tidak dapat mereka akses mengembalikan respons kosong.

Ini berarti:

  • Anda tidak perlu memberikan izin gudang langsung kepada pengguna.
  • Filter baris dan masker kolom yang ditentukan dalam Unity Catalog secara otomatis diberlakukan per pengguna.
  • Untuk menerapkan pemfilteran data per pengguna, terapkan keamanan tingkat baris ke tabel yang mendasar di Unity Catalog. Lihat Filter baris dan masker kolom.

Untuk informasi tentang menyiapkan izin pengguna untuk ruang Genie, lihat Berbagi ruang Genie.

Privasi dan keamanan

Akses data di ruang Genie diatur oleh Unity Catalog, termasuk filter baris dan masker kolom apa pun yang telah diterapkan ke tabel Anda. Lihat Kontrol akses data dan Filter baris dan masker kolom.

Untuk FAQ privasi dan keamanan lainnya, lihat FAQ privasi dan keamanan untuk fitur bantuan AI.

Sumber daya tambahan