OneLake, OneDrive untuk data
OneLake adalah data lake logis tunggal, terpadu untuk seluruh organisasi Anda. Data Lake memproses data dalam volume besar dari berbagai sumber. Seperti OneDrive, OneLake hadir secara otomatis dengan setiap penyewa Microsoft Fabric dan dirancang untuk menjadi satu tempat untuk semua data analitik Anda. OneLake membawa pelanggan:
- Satu data lake untuk seluruh organisasi
- Satu salinan data untuk digunakan dengan beberapa mesin analitik
Satu data lake untuk seluruh organisasi
Sebelum OneLake, lebih mudah bagi pelanggan untuk membuat beberapa danau untuk grup bisnis yang berbeda daripada berkolaborasi pada satu danau, bahkan dengan overhead ekstra dalam mengelola beberapa sumber daya. OneLake berfokus pada penghapusan tantangan ini dengan meningkatkan kolaborasi. Setiap penyewa pelanggan memiliki tepat satu OneLake. Tidak pernah ada lebih dari satu dan jika Anda memiliki Fabric, tidak akan pernah ada nol. Setiap penyewa Fabric secara otomatis menyediakan OneLake, tanpa sumber daya tambahan untuk disiapkan atau dikelola.
Diatur secara default dengan kepemilikan terdistribusi untuk kolaborasi
Konsep penyewa adalah manfaat unik dari layanan SaaS. Mengetahui di mana organisasi pelanggan dimulai dan berakhir memberikan batas tata kelola dan kepatuhan alami, yang berada di bawah kendali admin penyewa. Data apa pun yang mendarat di OneLake diatur secara default. Meskipun semua data berada dalam batas yang ditetapkan oleh admin penyewa, penting bahwa admin ini tidak menjadi penjaga gerbang pusat yang mencegah bagian lain dari organisasi berkontribusi pada OneLake.
Dalam penyewa, Anda dapat membuat sejumlah ruang kerja. Ruang kerja memungkinkan berbagai bagian organisasi untuk mendistribusikan kebijakan kepemilikan dan akses. Setiap ruang kerja adalah bagian dari kapasitas yang terkait dengan wilayah tertentu dan ditagih secara terpisah.
Dalam ruang kerja, Anda dapat membuat item data dan mengakses semua data di OneLake melalui item data. Mirip dengan cara Office menyimpan file Word, Excel, dan PowerPoint di OneDrive, Fabric menyimpan lakehouse, gudang, dan item lainnya di OneLake. Item dapat memberikan pengalaman yang disesuaikan untuk setiap persona, seperti pengalaman pengembang Apache Spark di lakehouse.
Untuk informasi selengkapnya tentang cara mulai menggunakan OneLake, lihat Membuat lakehouse dengan OneLake.
Buka di setiap tingkat
OneLake terbuka di setiap tingkatan. OneLake dibangun di atas Azure Data Lake Storage (ADLS) Gen2 dan dapat mendukung semua jenis file, terstruktur, atau tidak terstruktur. Semua item data Fabric seperti gudang data dan lakehouse menyimpan datanya secara otomatis dalam format OneLake dalam Delta Parquet. Jika teknisi data memuat data ke lakehouse menggunakan Apache Spark, dan kemudian pengembang SQL menggunakan T-SQL untuk memuat data di gudang data transaksional sepenuhnya, keduanya berkontribusi pada data lake yang sama. OneLake menyimpan semua data tabular dalam format Delta Parquet.
OneLake mendukung API DAN SDK ADLS Gen2 yang sama agar kompatibel dengan aplikasi ADLS Gen2 yang ada, termasuk Azure Databricks. Anda dapat mengatasi data di OneLake seolah-olah itu adalah satu akun penyimpanan ADLS besar untuk seluruh organisasi. Setiap ruang kerja muncul sebagai kontainer dalam akun penyimpanan tersebut, dan item data yang berbeda muncul sebagai folder dalam kontainer tersebut.
Untuk informasi selengkapnya tentang API dan titik akhir, lihat Akses oneLake dan API. Untuk contoh integrasi OneLake dengan Azure, lihat artikel Azure Synapse Analytics, penjelajah penyimpanan Azure, Azure Databricks, dan Azure HDInsight .
Penjelajah file OneLake untuk Windows
OneLake adalah OneDrive untuk data. Sama seperti OneDrive, Anda dapat dengan mudah menjelajahi data OneLake dari Windows menggunakan penjelajah file OneLake untuk Windows. Anda dapat menavigasi semua ruang kerja dan item data Anda, dengan mudah mengunggah, mengunduh, atau memodifikasi file seperti yang Anda lakukan di Office. Penjelajah file OneLake menyederhanakan bekerja dengan data lake, memungkinkan bahkan pengguna bisnis nonteknis untuk menggunakannya.
Untuk informasi selengkapnya, lihat Penjelajah file OneLake.
Satu salinan data
OneLake bertujuan untuk memberi Anda nilai sebaik mungkin dari satu salinan data tanpa pergerakan data atau duplikasi. Anda tidak perlu lagi menyalin data hanya untuk menggunakannya dengan mesin lain atau untuk memecah silo sehingga Anda dapat menganalisis data dengan data dari sumber lain.
Pintasan menyambungkan data di seluruh domain tanpa pergerakan data
Pintasan memungkinkan organisasi Anda untuk dengan mudah berbagi data antara pengguna dan aplikasi tanpa harus memindahkan dan menduplikasi informasi yang tidak perlu. Saat tim bekerja secara independen di ruang kerja terpisah, pintasan memungkinkan Anda menggabungkan data di berbagai grup bisnis dan domain ke dalam produk data virtual agar sesuai dengan kebutuhan spesifik pengguna.
Pintasan adalah referensi ke data yang disimpan di lokasi file lain. Lokasi file ini dapat berada dalam ruang kerja yang sama atau di berbagai ruang kerja, dalam OneLake atau di luar OneLake di ADLS, S3, atau Dataverse — dengan lebih banyak lokasi target segera hadir. Tidak peduli lokasinya, pintasan membuat file dan folder terlihat seperti Anda menyimpannya secara lokal.
Untuk informasi selengkapnya tentang cara menggunakan pintasan, lihat Pintasan OneLake.
Satu salinan data dengan beberapa mesin analitik
Meskipun aplikasi mungkin memiliki pemisahan penyimpanan dan komputasi, data sering dioptimalkan untuk satu mesin, yang membuatnya sulit untuk menggunakan kembali data yang sama untuk beberapa aplikasi. Dengan Fabric, berbagai mesin analitik (T-SQL, Apache Spark, Analysis Services, dll.) menyimpan data dalam format Delta Parquet terbuka untuk memungkinkan Anda menggunakan data yang sama di beberapa mesin.
Tidak perlu lagi menyalin data hanya untuk menggunakannya dengan mesin lain. Anda selalu dapat memilih mesin terbaik untuk pekerjaan yang anda coba lakukan. Misalnya, bayangkan Anda memiliki tim teknisi SQL yang membangun gudang data transaksi penuh. Mereka dapat menggunakan mesin T-SQL dan semua kekuatan T-SQL untuk membuat tabel, mengubah data, dan memuat data ke tabel. Jika ilmuwan data ingin menggunakan data ini, mereka tidak perlu lagi melalui driver Spark/SQL khusus. OneLake menyimpan semua data dalam format Delta Parquet. Ilmuwan data dapat menggunakan kekuatan penuh mesin Spark dan pustaka sumber terbukanya langsung melalui data.
Pengguna bisnis dapat membuat laporan Power BI langsung di atas OneLake menggunakan mode Direct Lake baru di mesin Analysis Services. Mesin Analysis Services adalah apa yang mendukung model semantik Power BI, dan selalu menawarkan dua mode mengakses data: kueri impor dan langsung. Mode Direct Lake memberi pengguna semua kecepatan impor tanpa perlu menyalin data, menggabungkan kueri impor dan langsung yang terbaik. Untuk informasi selengkapnya, lihat Direct Lake.
Contoh diagram memperlihatkan pemuatan data menggunakan Spark, mengkueri menggunakan T-SQL, dan menampilkan data dalam laporan Power BI.