OneLake, OneDrive untuk data

OneLake adalah data lake logis tunggal terpadu untuk seluruh organisasi. Seperti OneDrive, OneLake hadir secara otomatis dengan setiap penyewa Microsoft Fabric dan dirancang untuk menjadi satu tempat untuk semua data analitik Anda. OneLake membawa pelanggan:

  • Satu data lake untuk seluruh organisasi
  • Satu salinan data untuk digunakan dengan beberapa mesin analitik

Penting

Microsoft Fabric saat ini dalam PRATINJAU. Informasi ini berkaitan dengan produk prarilis yang mungkin dimodifikasi secara substansial sebelum dirilis. Microsoft tidak memberikan jaminan, tersurat maupun tersirat, sehubungan dengan informasi yang diberikan di sini.

Satu data lake untuk seluruh organisasi

Sebelum OneLake, lebih mudah bagi pelanggan untuk membuat beberapa danau untuk grup bisnis yang berbeda daripada berkolaborasi pada satu danau, bahkan dengan overhead ekstra dalam mengelola beberapa sumber daya. OneLake berfokus pada penghapusan tantangan ini dengan meningkatkan kolaborasi. Setiap penyewa pelanggan memiliki tepat satu OneLake. Tidak pernah ada lebih dari satu dan jika Anda memiliki Fabric, tidak akan pernah ada nol. OneLake disediakan secara otomatis dengan setiap penyewa Fabric tanpa sumber daya tambahan untuk disiapkan atau dikelola.

Diatur secara default dengan kepemilikan terdistribusi untuk kolaborasi

Konsep penyewa adalah manfaat unik dari layanan SaaS. Mengetahui di mana organisasi pelanggan dimulai dan berakhir, memberikan batas tata kelola dan kepatuhan alami, yang pada akhirnya berada di bawah kendali admin penyewa. Data apa pun yang mendarat di OneLake diatur secara default. Meskipun semua data berada dalam batas yang ditetapkan oleh admin penyewa, penting bahwa admin ini tidak menjadi penjaga gerbang pusat yang mencegah bagian lain dari organisasi berkontribusi pada OneLake. Dalam penyewa, Anda dapat membuat sejumlah ruang kerja. Ruang kerja memungkinkan berbagai bagian organisasi untuk mendistribusikan kebijakan kepemilikan dan akses. Setiap ruang kerja adalah bagian dari kapasitas yang terkait dengan wilayah tertentu dan ditagih secara terpisah.

Diagram memperlihatkan fungsi dan struktur OneLake.

Dalam ruang kerja, Anda dapat membuat item data dan semua data di OneLake diakses melalui item data. Mirip dengan cara Office menyimpan file Word, Excel, dan PowerPoint di OneDrive, Fabric menyimpan lakehouse, gudang, dan item lainnya di OneLake. Item dapat memberikan pengalaman yang disesuaikan untuk setiap persona seperti pengalaman pengembang Spark di lakehouse. Untuk informasi selengkapnya tentang cara mulai menggunakan OneLake, lihat Membuat lakehouse dengan OneLake.

Buka di setiap tingkat

OneLake terbuka di setiap tingkatan. Dibangun di atas Azure Data Lake Storage Gen2, OneLake dapat mendukung semua jenis file, terstruktur, atau tidak terstruktur. Semua item data Fabric seperti gudang data dan lakehouse menyimpan data mereka secara otomatis di OneLake dalam format parkek delta. Ini berarti ketika insinyur data memuat data ke dalam lakehouse menggunakan Spark dan pengembang SQL di gudang data transaksi penuh menggunakan T-SQL untuk memuat data, semua orang masih berkontribusi untuk membangun data lake yang sama. Semua data tabular disimpan dalam OneLake dalam format parquet delta. OneLake mendukung API dan SDK ADLS Gen2 yang sama agar kompatibel dengan aplikasi ADLS Gen2 yang ada termasuk Azure Databricks. Data di OneLake dapat ditangani seolah-olah itu adalah satu akun penyimpanan ADLS besar untuk seluruh organisasi. Setiap ruang kerja muncul sebagai kontainer dalam akun penyimpanan tersebut. Item data yang berbeda muncul sebagai folder di bawah kontainer tersebut.

Diagram memperlihatkan bagaimana Anda dapat mengakses data OneLake dengan API dan SDK.

Untuk informasi selengkapnya tentang API dan titik akhir, lihat Akses oneLake dan API. Untuk contoh integrasi OneLake dengan Azure, lihat artikel Azure Synapse Analytics, penjelajah penyimpanan Azure, Azure Databricks, dan Azure HDInsight.

Penjelajah file OneLake untuk Windows

OneLake adalah OneDrive untuk data. Sama seperti OneDrive, data OneLake dapat dengan mudah dijelajahi dari Windows menggunakan penjelajah file OneLake untuk Windows. Langsung di Windows, Anda dapat menavigasi semua ruang kerja, item data, dengan mudah mengunggah, mengunduh, atau memodifikasi file seperti yang dapat Anda lakukan di kantor. Penjelajah file OneLake menyederhanakan data lake yang memasukkannya ke tangan pengguna bisnis nonteknis sekalipun. Untuk informasi selengkapnya, lihat penjelajah file OneLake.

Satu salinan data

OneLake bertujuan untuk memberi Anda nilai sebaik mungkin dari satu salinan data tanpa pergerakan data atau duplikasi. Anda tidak perlu lagi menyalin data hanya untuk menggunakannya dengan mesin lain atau untuk memecah silo sehingga data dapat dianalisis dengan data lain.

Pintasan memungkinkan Anda menyambungkan data di seluruh domain bisnis tanpa pergerakan data

Pintasan memungkinkan organisasi Anda untuk dengan mudah berbagi data antara pengguna dan aplikasi tanpa harus memindahkan dan menduplikasi informasi yang tidak perlu. Saat tim bekerja secara independen di ruang kerja terpisah, pintasan memungkinkan Anda menggabungkan data di berbagai grup bisnis dan domain ke dalam produk data virtual agar sesuai dengan kebutuhan spesifik pengguna. Pintasan adalah referensi ke data yang disimpan di lokasi file lain. Lokasi file ini dapat berada dalam ruang kerja yang sama atau di berbagai ruang kerja, dalam OneLake atau eksternal ke OneLake di ADLS atau S3. Tidak peduli lokasinya, referensi membuatnya tampak seolah-olah file dan folder disimpan secara lokal.

Diagram memperlihatkan cara pintasan menyambungkan data di seluruh ruang kerja dan item.

Untuk informasi selengkapnya tentang cara menggunakan pintasan, lihat Pintasan OneLake.

Satu salinan data dengan beberapa mesin analitik

Meskipun aplikasi mungkin memiliki pemisahan penyimpanan dan komputasi, data sering dioptimalkan untuk satu mesin, yang membuatnya sulit untuk menggunakan kembali data yang sama untuk beberapa aplikasi. Dengan Fabric, berbagai mesin analitik (T-SQL, Spark, Analysis Services, dll.) menyimpan data dalam format parquet delta terbuka untuk memungkinkan Anda menggunakan data yang sama di beberapa mesin. Tidak perlu lagi menyalin data hanya untuk menggunakannya dengan mesin lain. Anda selalu dapat memilih mesin terbaik untuk pekerjaan yang anda coba lakukan. Misalnya, bayangkan Anda memiliki tim teknisi SQL yang membangun gudang data transaksi penuh. Mereka dapat menggunakan mesin T-SQL dan semua kekuatan T-SQL untuk membuat tabel, mengubah, dan memuat data ke tabel. Jika ilmuwan data ingin menggunakan data ini, mereka tidak perlu lagi melalui driver Spark/SQL khusus. Semua data disimpan dalam OneLake dalam format parquet delta. Ilmuwan data dapat menggunakan kekuatan penuh mesin Spark dan pustaka sumber terbukanya langsung melalui data.

Pengguna bisnis dapat membuat laporan Power BI langsung di atas OneLake menggunakan mode direct lake baru di mesin Analysis Services. Mesin Analysis Services adalah apa yang mendukung Himpunan Data Power BI dan selalu menawarkan dua mode mengakses data, mengimpor, dan kueri langsung. Mode lake langsung memberi pengguna semua kecepatan impor tanpa perlu menyalin data, menggabungkan kueri impor dan langsung terbaik. Pelajari selengkapnya tentang direct lake: https://aka.ms/DirectLake.

Diagram memperlihatkan bagaimana beberapa item dan mesin menggunakan salinan data yang sama.Contoh diagram memperlihatkan pemuatan data menggunakan Spark, mengkueri menggunakan T-SQL dan menampilkan data dalam laporan Power BI.

Langkah berikutnya