Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Artikel ini menyediakan pengenalan tingkat tinggi untuk objek ruang kerja Azure Databricks. Anda dapat membuat, menampilkan, dan mengatur objek ruang kerja di browser ruang kerja di seluruh persona.
Catatan tentang penamaan aset ruang kerja
Nama lengkap aset ruang kerja terdiri dari nama dasar dan ekstensi filenya. Misalnya, ekstensi file buku catatan dapat berupa .py, , .sql, .scala.r, dan .ipynb tergantung pada bahasa dan format buku catatan.
Saat Anda membuat aset buku catatan, nama dasar dan nama lengkapnya (nama dasar yang digabungkan dengan ekstensi file) harus unik dalam folder ruang kerja apa pun. Saat Anda memberi nama aset, Databricks memeriksa untuk melihat apakah memenuhi kriteria ini dengan menambahkan ekstensi file ke dalamnya. Jika nama lengkap cocok dengan file yang sudah ada di folder, nama tersebut tidak diizinkan dan Anda harus memilih nama buku catatan baru. Misalnya, jika Anda mencoba membuat buku catatan Python (dalam format sumber Python) bernama test di folder yang sama dengan file Python bernama test.py, itu tidak akan diizinkan.
Kluster
Kluster Azure Databricks Ilmu Data & Engineering dan Databricks Mosaic AI menyediakan platform terpadu untuk berbagai kasus penggunaan seperti menjalankan alur ETL produksi, analitik streaming, analitik ad-hoc, dan pembelajaran mesin. Kluster adalah jenis sumber daya komputasi Azure Databricks. Jenis sumber daya komputasi lainnya termasuk gudang SQL Azure Databricks.
Untuk informasi terperinci tentang mengelola dan menggunakan kluster, lihat Komputasi.
Buku catatan
Notebook adalah antarmuka berbasis web untuk dokumen yang berisi serangkaian sel yang dapat dijalankan (perintah) yang beroperasi pada file dan tabel , visualisasi , dan teks narasi. Perintah dapat dijalankan secara berurutan, mengacu pada output dari satu atau lebih perintah yang dijalankan sebelumnya.
Buku catatan adalah salah satu mekanisme untuk menjalankan kode di Azure Databricks. Mekanisme lainnya adalah pekerjaan.
Untuk informasi terperinci tentang mengelola dan menggunakan buku catatan, lihat Buku catatan Databricks.
Pekerjaan
Pekerjaan adalah salah satu mekanisme untuk menjalankan kode di Azure Databricks. Mekanisme lainnya adalah buku catatan.
Untuk informasi terperinci tentang mengelola dan menggunakan pekerjaan, lihat Pekerjaan Lakeflow.
Perpustakaan
Perpustakaan kode menyediakan kode pihak ketiga atau buatan lokal untuk digunakan oleh notebook dan tugas yang dijalankan di kluster Anda.
Untuk informasi terperinci tentang mengelola dan menggunakan pustaka, lihat Menginstal pustaka.
Data
Anda dapat mengimpor data ke dalam sistem file terdistribusi yang dipasang ke ruang kerja Azure Databricks dan bekerja dengannya di buku catatan dan kluster Azure Databricks. Anda juga dapat menggunakan berbagai sumber data Apache Spark guna mengakses data.
Untuk informasi terperinci tentang memuat data, lihat Konektor standar di Lakeflow Connect.
File
Penting
Fitur ini ada di Pratinjau Publik.
Di Databricks Runtime 11.3 LTS ke atas, Anda dapat membuat dan menggunakan file sewenang-wenang di ruang kerja Databricks. File dapat berupa jenis file apa pun. Contoh jenis file umum meliputi:
-
.pyfile yang digunakan dalam modul kustom. -
.mdfile, sepertiREADME.md. -
.csvatau file data kecil lainnya. -
.txtfile. - File log.
Untuk informasi terperinci tentang menggunakan file, lihat Bekerja dengan file di Azure Databricks. Untuk informasi tentang cara menggunakan file untuk memodulasi kode saat Anda mengembangkan dengan buku catatan Databricks, lihat Berbagi kode antara buku catatan Databricks
Folder Git
Folder Git adalah folder Azure Databricks yang isinya di-versi-kan bersama-sama dengan menyinkronkannya ke repositori Git jarak jauh. Dengan menggunakan folder Databricks Git, Anda dapat mengembangkan notebook di Azure Databricks dan menggunakan repositori Git jarak jauh untuk kolaborasi dan kontrol versi.
Untuk informasi terperinci tentang menggunakan repositori, lihat Folder Git Azure Databricks.
Model
Model mengacu pada model yang terdaftar di Registri Model MLflow. Registri Model adalah toko model terpusat yang memungkinkan Anda mengelola siklus hidup penuh model MLflow. Ini menyediakan urutan kronologis keturunan model, versi model, transisi tahap, serta anotasi dan deskripsi untuk model dan versi model.
Untuk informasi terperinci tentang mengelola dan menggunakan model, lihat Mengelola siklus hidup model di Unity Catalog.
Eksperimen
Eksperimen MLflow adalah unit utama organisasi dan kontrol akses untuk proses MLflow, termasuk jejak agen, evaluasi aplikasi LLM, dan proses pelatihan model pembelajaran mesin. Semua percobaan MLflow adalah bagian dari sebuah eksperimen. Setiap eksperimen memungkinkan Anda memvisualisasikan, mencari, dan membandingkan eksekusi, serta mengunduh dan menjalankan artefak atau metadata untuk analisis di alat lain.
Untuk informasi terperinci tentang mengelola dan menggunakan eksperimen, lihat Mengatur training runs dengan eksperimen MLflow.
Kueri
Kueri adalah pernyataan SQL yang memungkinkan Anda berinteraksi dengan data Anda. Untuk informasi selengkapnya, lihat Mengakses dan mengelola kueri yang disimpan.
Dashboard
Dasbor adalah presentasi visualisasi kueri dan komentar. Lihat Dashboard.
Peringatan
Peringatan adalah pemberitahuan bahwa bidang yang ditampilkan oleh kueri telah mencapai ambang. Untuk informasi selengkapnya, lihat Pemberitahuan Databricks SQL.
Referensi ke objek ruang kerja
Secara historis, pengguna diharuskan menyertakan prefiks jalur /Workspace untuk beberapa API Databricks (%sh) tapi tidak untuk lainnya (%run, input REST API).
Pengguna dapat menggunakan jalur ruang kerja dengan awalan /Workspace di seluruh tempat. Referensi lama ke jalur tanpa awalan /Workspace dialihkan dan terus berfungsi. Kami menyarankan agar semua jalur ruang kerja membawa /Workspace awalan untuk membedakannya dari jalur Volume dan DBFS.
Prasyarat untuk perilaku awalan jalur yang konsisten /Workspace adalah ini: Di tingkat akar ruang kerja, tidak boleh ada folder /Workspace. Jika Anda memiliki folder di tingkat akar dan ingin mengaktifkan peningkatan UX ini, hapus atau ganti nama folder yang /Workspace/Workspace Anda buat dan hubungi tim akun Azure Databricks Anda.
Berbagi file, folder, atau URL buku catatan
Di ruang kerja Azure Databricks Anda, URL ke file ruang kerja, notebook, dan folder dalam format:
URL file ruang kerja
https://<databricks-instance>/?o=<16-digit-workspace-ID>#files/<16-digit-object-ID>
URL Notebook
https://<databricks-instance>/?o=<16-digit-workspace-ID>#notebook/<16-digit-object-ID>/command/<16-digit-command-ID>
URL Folder (ruang kerja dan Git)
https://<databricks-instance>/browse/folders/<16-digit-ID>?o=<16-digit-workspace-ID>
Tautan ini bisa terputus jika ada folder, file, atau buku catatan di jalur saat ini diperbarui dengan perintah Git pull, atau dihapus dan dibuat ulang dengan nama yang sama. Namun, Anda dapat membuat tautan berdasarkan jalur ruang kerja untuk dibagikan dengan pengguna Databricks lain dengan tingkat akses yang sesuai dengan mengubahnya ke tautan dalam format ini:
https://<databricks-instance>/?o=<16-digit-workspace-ID>#workspace/<full-workspace-path-to-file-or-folder>
Tautan ke folder, buku catatan, dan file dapat dibagikan dengan mengganti semua yang ada di URL setelah ?o=<16-digit-workspace-ID> dengan jalur ke file, folder, atau buku catatan dari akar ruang kerja. Jika Anda berbagi URL ke folder, hapus /browse/folders/<16-digit-ID> dari URL asli juga.
Untuk mendapatkan jalur file, buka menu konteks dengan mengklik kanan folder, buku catatan, atau file di ruang kerja yang ingin Anda bagikan dan pilih Salin URL/jalur>Jalur lengkap. Tambahkan #workspace di depan jalur file yang baru saja Anda salin, dan tambahkan string yang dihasilkan setelah ?o=<16-digit-workspace-ID> sehingga sesuai dengan format URL di atas.
Contoh rumusan URL #1: URL Folder
Untuk berbagi URL folder ruang kerja https://<databricks-instance>/browse/folders/1111111111111111?o=2222222222222222, hapus substring browse/folders/1111111111111111 dari URL. Tambahkan #workspace diikuti dengan jalur ke folder atau objek ruang kerja yang ingin Anda bagikan.
Dalam hal ini, jalur ruang kerja adalah ke folder, /Workspace/Users/user@example.com/team-git/notebooks. Setelah menyalin jalur lengkap dari ruang kerja, Anda sekarang dapat membuat tautan yang dapat dibagikan:
https://<databricks-instance>/?o=2222222222222222#workspace/Workspace/Users/user@example.com/team-git/notebooks
Contoh pembentukan URL 2: URL Notebook
Untuk berbagi URL buku catatan https://<databricks-instance>/?o=1111111111111111#notebook/2222222222222222/command/3333333333333333, hapus #notebook/2222222222222222/command/3333333333333333. Tambahkan #workspace diikuti dengan jalur ke folder atau objek ruang kerja.
Dalam hal ini, jalur ruang kerja menunjuk ke buku catatan, /Workspace/Users/user@example.com/team-git/notebooks/v1.0/test-notebook. Setelah menyalin jalur lengkap dari ruang kerja, Anda sekarang dapat membuat tautan yang dapat dibagikan:
https://<databricks-instance>/?o=1111111111111111#workspace/Workspace/Users/user@example.com/team-git/notebooks/v1.0/test-notebook
Sekarang Anda memiliki URL stabil untuk jalur file, folder, atau buku catatan untuk dibagikan! Untuk informasi selengkapnya tentang URL dan pengidentifikasi, lihat Dapatkan pengidentifikasi untuk objek ruang kerja.