OneLake, OneDrive untuk data

OneLake adalah data lake logis tunggal, terpadu untuk seluruh organisasi Anda. Seperti OneDrive, OneLake hadir secara otomatis dengan setiap penyewa Microsoft Fabric dan dirancang untuk menjadi satu tempat untuk semua data analitik Anda. OneLake membawa pelanggan:

  • Satu data lake untuk seluruh organisasi
  • Satu salinan data untuk digunakan dengan beberapa mesin analitik

Satu data lake untuk seluruh organisasi

Sebelum OneLake, lebih mudah bagi pelanggan untuk membuat beberapa danau untuk grup bisnis yang berbeda daripada berkolaborasi pada satu danau, bahkan dengan overhead ekstra dalam mengelola beberapa sumber daya. OneLake berfokus pada penghapusan tantangan ini dengan meningkatkan kolaborasi. Setiap penyewa pelanggan memiliki tepat satu OneLake. Tidak pernah ada lebih dari satu dan jika Anda memiliki Fabric, tidak akan pernah ada nol. Setiap penyewa Fabric secara otomatis menyediakan OneLake, tanpa sumber daya tambahan untuk disiapkan atau dikelola.

Diatur secara default dengan kepemilikan terdistribusi untuk kolaborasi

Konsep penyewa adalah manfaat unik dari layanan SaaS. Mengetahui di mana organisasi pelanggan dimulai dan berakhir memberikan batas tata kelola dan kepatuhan alami, yang berada di bawah kendali admin penyewa. Data apa pun yang mendarat di OneLake diatur secara default. Meskipun semua data berada dalam batas yang ditetapkan oleh admin penyewa, penting bahwa admin ini tidak menjadi penjaga gerbang pusat yang mencegah bagian lain dari organisasi berkontribusi pada OneLake.

Dalam penyewa, Anda dapat membuat sejumlah ruang kerja. Ruang kerja memungkinkan berbagai bagian organisasi untuk mendistribusikan kebijakan kepemilikan dan akses. Setiap ruang kerja adalah bagian dari kapasitas yang terkait dengan wilayah tertentu dan ditagih secara terpisah.

Diagram showing the function and structure of OneLake.

Dalam ruang kerja, Anda dapat membuat item data dan mengakses semua data di OneLake melalui item data. Mirip dengan cara Office menyimpan file Word, Excel, dan PowerPoint di OneDrive, Fabric menyimpan lakehouse, gudang, dan item lainnya di OneLake. Item dapat memberikan pengalaman yang disesuaikan untuk setiap persona, seperti pengalaman pengembang Spark di lakehouse.

Untuk informasi selengkapnya tentang cara mulai menggunakan OneLake, lihat Membuat lakehouse dengan OneLake.

Buka di setiap tingkat

OneLake terbuka di setiap tingkatan. OneLake dibangun di atas Azure Data Lake Storage (ADLS) Gen2 dan dapat mendukung semua jenis file, terstruktur, atau tidak terstruktur. Semua item data Fabric seperti gudang data dan lakehouse menyimpan datanya secara otomatis dalam format OneLake dalam Delta Parquet. Jika teknisi data memuat data ke lakehouse menggunakan Spark, dan kemudian pengembang SQL menggunakan T-SQL untuk memuat data di gudang data yang sepenuhnya transaksi, keduanya berkontribusi pada data lake yang sama. OneLake menyimpan semua data tabular dalam format Delta Parquet.

OneLake mendukung API DAN SDK ADLS Gen2 yang sama agar kompatibel dengan aplikasi ADLS Gen2 yang ada, termasuk Azure Databricks. Anda dapat mengatasi data di OneLake seolah-olah itu adalah satu akun penyimpanan ADLS besar untuk seluruh organisasi. Setiap ruang kerja muncul sebagai kontainer dalam akun penyimpanan tersebut, dan item data yang berbeda muncul sebagai folder dalam kontainer tersebut.

Diagram showing how you can access OneLake data with APIs and SDKs.

Untuk informasi selengkapnya tentang API dan titik akhir, lihat Akses oneLake dan API. Untuk contoh integrasi OneLake dengan Azure, lihat artikel Azure Synapse Analytics, penjelajah penyimpanan Azure, Azure Databricks, dan Azure HDInsight .

Penjelajah file OneLake untuk Windows

OneLake adalah OneDrive untuk data. Sama seperti OneDrive, Anda dapat dengan mudah menjelajahi data OneLake dari Windows menggunakan penjelajah file OneLake untuk Windows. Anda dapat menavigasi semua ruang kerja dan item data Anda, dengan mudah mengunggah, mengunduh, atau memodifikasi file seperti yang Anda lakukan di Office. Penjelajah file OneLake menyederhanakan bekerja dengan data lake, memungkinkan bahkan pengguna bisnis nonteknis untuk menggunakannya.

Untuk informasi selengkapnya, lihat Penjelajah file OneLake.

Satu salinan data

OneLake bertujuan untuk memberi Anda nilai sebaik mungkin dari satu salinan data tanpa pergerakan data atau duplikasi. Anda tidak perlu lagi menyalin data hanya untuk menggunakannya dengan mesin lain atau untuk memecah silo sehingga Anda dapat menganalisis data dengan data dari sumber lain.

Pintasan menyambungkan data di seluruh domain tanpa pergerakan data

Pintasan memungkinkan organisasi Anda untuk dengan mudah berbagi data antara pengguna dan aplikasi tanpa harus memindahkan dan menduplikasi informasi yang tidak perlu. Saat tim bekerja secara independen di ruang kerja terpisah, pintasan memungkinkan Anda menggabungkan data di berbagai grup bisnis dan domain ke dalam produk data virtual agar sesuai dengan kebutuhan spesifik pengguna.

Pintasan adalah referensi ke data yang disimpan di lokasi file lain. Lokasi file ini dapat berada dalam ruang kerja yang sama atau di berbagai ruang kerja, dalam OneLake atau di luar OneLake di ADLS, S3, atau Dataverse — dengan lebih banyak lokasi target segera hadir. Tidak peduli lokasinya, pintasan membuat file dan folder terlihat seperti Anda menyimpannya secara lokal.

Diagram showing how shortcuts connect data across workspaces and items.

Untuk informasi selengkapnya tentang cara menggunakan pintasan, lihat Pintasan OneLake.

Satu salinan data dengan beberapa mesin analitik

Meskipun aplikasi mungkin memiliki pemisahan penyimpanan dan komputasi, data sering dioptimalkan untuk satu mesin, yang membuatnya sulit untuk menggunakan kembali data yang sama untuk beberapa aplikasi. Dengan Fabric, berbagai mesin analitik (T-SQL, Spark, Analysis Services, dll.) menyimpan data dalam format Delta Parquet terbuka untuk memungkinkan Anda menggunakan data yang sama di beberapa mesin.

Tidak perlu lagi menyalin data hanya untuk menggunakannya dengan mesin lain. Anda selalu dapat memilih mesin terbaik untuk pekerjaan yang anda coba lakukan. Misalnya, bayangkan Anda memiliki tim teknisi SQL yang membangun gudang data transaksi penuh. Mereka dapat menggunakan mesin T-SQL dan semua kekuatan T-SQL untuk membuat tabel, mengubah data, dan memuat data ke tabel. Jika ilmuwan data ingin menggunakan data ini, mereka tidak perlu lagi melalui driver Spark/SQL khusus. OneLake menyimpan semua data dalam format Delta Parquet. Ilmuwan data dapat menggunakan kekuatan penuh mesin Spark dan pustaka sumber terbukanya langsung melalui data.

Pengguna bisnis dapat membuat laporan Power BI langsung di atas OneLake menggunakan mode Direct Lake baru di mesin Analysis Services. Mesin Analysis Services adalah apa yang mendukung model semantik Power BI, dan selalu menawarkan dua mode mengakses data: kueri impor dan langsung. Mode Direct Lake memberi pengguna semua kecepatan impor tanpa perlu menyalin data, menggabungkan kueri impor dan langsung yang terbaik. Untuk informasi selengkapnya, lihat Direct Lake.

Diagram showing how multiple items and engines use the same copy of data.

Contoh diagram memperlihatkan pemuatan data menggunakan Spark, mengkueri menggunakan T-SQL, dan menampilkan data dalam laporan Power BI.