Menggunakan Kode Genie untuk ilmu data

Halaman ini memperkenalkan Genie Code untuk ilmu data. Dirancang khusus untuk notebook Databricks dan Editor SQL, Kode Genie dalam mode Agen dapat menjelajahi data, menghasilkan dan menjalankan kode, dan memperbaiki kesalahan—semuanya dari satu perintah.

Apa itu Kode Genie untuk ilmu data?

Mode Agen Kode Genie dapat mengotomatiskan seluruh alur kerja ilmu data multi-langkah di notebook Databricks dan Editor SQL.

Gunakan Agen Ilmu Data dalam buku catatan.

Dibandingkan dengan mode Obrolan Kode Genie, mode Agen memiliki kemampuan yang diperluas: merencanakan solusi, mengambil aset yang relevan, menjalankan kode, menggunakan output sel untuk meningkatkan hasil, memperbaiki kesalahan secara otomatis, dan banyak lagi.

Kode Genie dapat merencanakan dan menghasilkan kode untuk dijalankan di notebook atau kueri untuk dijalankan di editor SQL. Kode Genie bekerja dengan Anda untuk menyetujui rencananya dan mengonfirmasi langkah-langkah berikutnya sebelum melanjutkan. Dengan persetujuan Anda, Genie Code dapat menggunakan alat untuk melakukan tugas seperti mencari tabel, mengedit buku catatan, menjalankan sel, dan membaca output sel.

Akses dan tindakan Genie Code diatur oleh izin pengguna. Ini hanya dapat mengakses data yang dapat Anda akses dan melakukan operasi yang izinnya Anda miliki.

Persyaratan

Untuk menggunakan kemampuan ilmu data agenik Genie Code, ruang kerja Anda memerlukan hal berikut:

Menggunakan Kode Genie untuk ilmu data

Untuk menggunakan Kode Genie untuk tugas ilmu data:

  1. Dari notebook Databricks atau Editor SQL, buka panel samping Kode Genie.

  2. Masukkan petunjuk untuk Kode Genie. Misalnya, "Analisis @sales_transactions dari samples.bakehouse untuk mengidentifikasi produk terlaris."

    Petunjuk / Saran

    Mereferensikan tabel tertentu dengan menggunakan @table_name. Agen akan menggunakan tabel tersebut dan metadata terkait untuk mengumpulkan responsnya. Agen menghormati izin Unity Catalog pengguna, sehingga hanya dapat mengakses data yang dapat Anda akses.

  3. Saat Genie Code menghasilkan responsnya, sering kali jeda terjadi untuk mendapatkan input Anda.

    • Untuk tugas yang lebih kompleks, Genie Code dapat membuat rencana langkah demi langkah dan mengajukan pertanyaan klarifikasi. Jawab pertanyaan klarifikasinya untuk membantunya mengasah rencananya.

    • Ketika Kode Genie perlu menjalankan kode, Genie Code meminta persetujuan Anda sebelum melanjutkan. Izinkan atau Tolak permintaannya. Anda juga dapat memilih Izinkan dalam utas ini (mengacu pada utas percakapan Kode Genie) atau Selalu izinkan.

      Penting

      Kode Genie dapat menghasilkan dan menjalankan kode di notebook Anda. Meskipun memiliki pagar pembatas untuk mencegah tindakan berbahaya, masih ada risiko. Gunakan hanya dengan kode dan data yang Anda percayai.

    • Saat Kode Genie melanjutkan pekerjaannya, Anda mungkin diminta untuk memilih Lanjutkan atau Tolak. Tinjau pekerjaan Genie Code yang sudah ada, lalu pilih Lanjutkan untuk mengizinkannya melanjutkan ke langkah berikutnya atau Tolak untuk memberi tahunya untuk mencoba sesuatu yang lain.

    • Untuk menghentikan Kode Genie saat sedang berfungsi, klik ikon Hentikan merah..

Kode Genie dapat membuat sel buku catatan baru (atau kueri), menghasilkan teks dan kode, menjalankan sel buku catatan, dan mengakses output sel untuk menginterpretasikan hasilnya.

Nota

Kode Genie mengharuskan tab saat ini tetap terbuka untuk menyelesaikan tugas multi-langkah.

Petunjuk / Saran

Anda dapat menambahkan instruksi untuk Kode Genie dalam mode Agen untuk digunakan di sebagian besar respons. Misalnya, jika Anda memiliki konvensi kode atau pustaka pilihan untuk digunakan, Anda dapat menambahkan panduan ini ke instruksi untuk Kode Genie. Anda juga dapat membuat keterampilan untuk memperluas Kode Genie dengan kemampuan khusus untuk tugas khusus domain Anda. Untuk detail selengkapnya dan tips lainnya, lihat Tips untuk meningkatkan respons Kode Genie.

Kasus penggunaan

Dalam mode Agen, Genie Code memiliki kemampuan yang diperluas, seperti menemukan data, menginterpretasikan output, dan melakukan tindakan sel.

Kode Genie dapat membantu tugas ilmu data yang kompleks, termasuk analisis data eksploratif, prakiraan, dan pembelajaran mesin. Anda bahkan dapat membuat notebook analisis data baru dari awal dengan Kode Genie. Untuk hasil yang lebih baik, berikan konteks kepada agen dengan mereferensikan tabel, alur, buku catatan, kueri, dan file dengan @<resource_name>. Anda juga dapat mengklik ikon @. Tambahkan konteks untuk memilih konteks yang akan disediakan secara manual. Setiap aset referensi bertahan dalam konteks obrolan.

Coba perintah berikut untuk memulai:

  • Penemuan data:
    • "Tabel mana yang berisi data transaksi bakehouse?"
    • "Saya ingin melihat data cuaca untuk tanggal 2025-01-01 di kota Los Angeles, CA."
    • "Temukan tabel yang berisi data taksi Kota New York dan tunjukkan 10 baris pertama."
  • Analisis data eksploratif:
    • "Bantu saya mengurai string JSON di kolom A."
    • "Buat visualisasi data dari tabel ini."
    • Interpretasikan bagan ini.
    • "Jelaskan himpunan @sales_transactions data. Lakukan beberapa EDA untuk membantu saya memahami statistik kolom dan memvisualisasikan distribusi nilai. Berpikirlah seperti ilmuwan data."
    • "Analisis @workload_insights untuk menemukan 5 pelanggan teratas untuk beban kerja Databricks SQL minggu lalu berdasarkan pendapatan. Kemudian buat plot berapa banyak pengguna yang dimiliki oleh pelanggan tersebut untuk Databricks SQL setiap minggu selama 6 minggu terakhir.
  • Prakiraan:
    • "Menggunakan himpunan @incidents data, buat prakiraan jumlah insiden harian selama 2 minggu ke depan. Setelah selesai, beri saya tabel data dan bagan interaktif untuk menampilkan hasilnya."
    • "Menggunakan himpunan @website_traffic data, prediksi jumlah pengunjung harian untuk bulan mendatang. Sorot pola musiman apa pun."
    • "Hasilkan perkiraan permintaan produk selama 6 bulan ke depan dari himpunan @inventory data, termasuk interval keyakinan."
  • Pembelajaran mesin:
    • "Lakukan beberapa persiapan data dan rekayasa fitur untuk menyiapkan himpunan data ini untuk pelatihan model."
    • Latih model klasifikasi pada dataset @customer_data untuk prediksi churn. Evaluasi model dengan akurasi dan metrik AUC."
    • "Lakukan penyetelan hiperparameter pada model regresi menggunakan himpunan @housing_prices data untuk meningkatkan kesalahan prediksi."
    • "Bangun model pengklusteran pada @sales_leads himpunan data untuk mengidentifikasi segmen pelanggan dan memberikan ringkasan karakteristik setiap kluster."
  • Organisasi buku catatan:
    • "Buat sel baru yang meringkas hasil dari buku catatan ini."
    • "Beri nama yang relevan pada buku catatan ini."

Analisis data eksploratif

Gunakan Kode Genie untuk melakukan analisis data eksploratif pada himpunan data. Misalnya, coba minta untuk membantu Anda membuat buku catatan baru yang menganalisis himpunan samples.bakehouse.sales_transactions data.

Di tab buku catatan kosong, buka panel Kode Genie dan masukkan perintah berikut: "Jelaskan himpunan data, @sales_transactions. Saya ingin melakukan beberapa EDA sehingga saya dapat memahami statistik kolom dan memvisualisasikan distribusi nilai."

Agen Ilmu Data membuat buku catatan untuk EDA.

Agen membuat rencana untuk menjawab permintaan Anda dan mungkin mengajukan pertanyaan klarifikasi. Dengan persetujuan Anda, ini menghasilkan sel buku catatan baru yang menyertakan kode untuk menjelajahi data dan teks yang menjelaskan proses dan temuannya.