Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
OneLake adalah data lake logis tunggal, terpadu untuk seluruh organisasi Anda. Seperti OneDrive, OneLake hadir secara otomatis dengan setiap penyewa Microsoft Fabric dan dirancang untuk menjadi satu tempat untuk semua data analitik Anda.
OneLake menawarkan kepada pelanggan:
- Satu data lake untuk seluruh organisasi
- Satu salinan data untuk digunakan dengan beberapa mesin analitik
- Perlindungan data bawaan dengan opsi penghapusan sementara otomatis dan pemulihan bencana
Satu data lake untuk seluruh organisasi
Sebelum OneLake, banyak organisasi membuat beberapa danau untuk grup bisnis yang berbeda, yang menyebabkan overhead ekstra untuk mengelola beberapa sumber daya. OneLake menghapus tantangan ini dengan meningkatkan kolaborasi:
- Setiap penyewa Fabric secara otomatis mendapatkan satu OneLake
- Anda tidak dapat membuat beberapa OneLakes atau menghapus OneLake Anda
- Tidak ada sumber daya tambahan untuk disediakan atau dikelola
Kesederhanaan ini membantu organisasi Anda berkolaborasi dalam satu data lake terpadu.
Diatur secara default dengan kepemilikan terdistribusi untuk kolaborasi
Tingkat teratas organisasi dan tata kelola untuk data Fabric adalah penyewa. Data apa pun yang mendarat di OneLake secara otomatis dilindungi oleh kebijakan tingkat penyewa untuk keamanan, kepatuhan, dan manajemen data.
Dalam sebuah tenant, kolaborasi terjadi di dalam ruang kerja. Anda dapat membuat sejumlah ruang kerja untuk menata data Anda. Ruang kerja memungkinkan berbagai bagian organisasi untuk mendistribusikan kebijakan kepemilikan dan akses. Setiap ruang kerja adalah bagian dari kapasitas yang terkait dengan wilayah tertentu dan ditagih secara terpisah.
Dalam ruang kerja, Anda membuat dan mengakses semua data melalui item data. Mirip dengan cara Office menyimpan file Word, Excel, dan PowerPoint di OneDrive, Fabric menyimpan lakehouse, gudang, dan item lainnya di OneLake. Setiap jenis item memberikan pengalaman yang disesuaikan untuk persona yang berbeda, seperti pengalaman pengembang Apache Spark di lakehouse.
Dibangun berdasarkan standar dan format terbuka
OneLake dibangun di atas Azure Data Lake Storage (ADLS) Gen2 dan dapat mendukung semua jenis file, terstruktur, atau tidak terstruktur. Semua item data Fabric seperti gudang data dan lakehouse secara otomatis menyimpan datanya dalam format Delta Parquet di OneLake. Jika teknisi data memuat data ke lakehouse menggunakan Apache Spark, dan kemudian pengembang SQL menggunakan T-SQL untuk memuat data di gudang data transaksional sepenuhnya, keduanya berkontribusi pada data lake yang sama. OneLake menyimpan semua data tabular dalam format Delta Parquet.
OneLake mendukung API DAN SDK ADLS Gen2 yang sama agar kompatibel dengan aplikasi ADLS Gen2 yang ada, termasuk Azure Databricks. Anda dapat mengakses data di OneLake seolah-olah itu adalah satu akun penyimpanan ADLS yang besar untuk seluruh organisasi. Setiap ruang kerja muncul sebagai kontainer dalam akun penyimpanan tersebut, dan item data yang berbeda muncul sebagai folder dalam kontainer tersebut.
Untuk informasi selengkapnya tentang API dan titik akhir, lihat Akses OneLake dan API. Untuk contoh integrasi OneLake dengan Azure, lihat artikel Azure Synapse Analytics, penjelajah penyimpanan Azure, Azure Databricks, dan Azure HDInsight .
Penjelajah file OneLake untuk Windows
Anda dapat menjelajahi data OneLake dari Windows menggunakan penjelajah file OneLake untuk Windows. Anda dapat menavigasi semua ruang kerja dan item data Anda, dengan mudah mengunggah, mengunduh, atau memodifikasi file seperti yang Anda lakukan di Office. Penjelajah berkas OneLake menyederhanakan penggunaan data lake, sehingga bahkan pengguna bisnis yang tidak teknis dapat menggunakannya.
Untuk informasi selengkapnya, lihat Penjelajah file OneLake.
Satu salinan data
OneLake bertujuan untuk memberi Anda nilai sebaik mungkin dari satu salinan data tanpa pergerakan data atau duplikasi. Anda tidak perlu menyalin data hanya untuk menggunakannya dengan mesin lain atau menganalisis data dari beberapa sumber.
Jalan pintas menyambungkan data di seluruh domain tanpa pergerakan data
Pintasan adalah referensi ke data yang disimpan di lokasi file lain. Lokasi file ini dapat berada dalam ruang kerja yang sama atau di berbagai ruang kerja, dalam OneLake atau di luar OneLake seperti ADLS, S3, atau Dataverse. Tidak peduli lokasinya, pintasan membuat file dan folder terlihat seperti Anda menyimpannya secara lokal.
Pintasan memungkinkan organisasi Anda berbagi data antara pengguna dan aplikasi tanpa harus memindahkan dan menduplikasi informasi yang tidak perlu. Saat tim bekerja secara independen di ruang kerja terpisah, pintasan memungkinkan Anda menggabungkan data di berbagai grup bisnis dan domain ke dalam produk data virtual agar sesuai dengan kebutuhan spesifik pengguna.
Untuk informasi selengkapnya tentang cara menggunakan pintasan, lihat Pintasan OneLake.
Menyambungkan data ke beberapa mesin analitik
Data sering dioptimalkan untuk satu mesin, yang menyulitkan penggunaan kembali data yang sama untuk beberapa aplikasi. Dengan Fabric, berbagai mesin analitik (T-SQL, Apache Spark, Analysis Services, dan lainnya) menyimpan data dalam format Delta Parquet terbuka untuk memungkinkan Anda menggunakan data yang sama di beberapa mesin.
Anda tidak perlu menyalin data hanya untuk menggunakannya dengan mesin lain atau merasa terjebak dengan menggunakan mesin tertentu karena di situlah data Anda berada. Misalnya, bayangkan tim teknisi SQL membangun gudang data transaksi penuh. Mereka dapat menggunakan mesin T-SQL dan semua kekuatan T-SQL untuk membuat tabel, mengubah data, dan memuat data ke tabel. Jika ilmuwan data ingin menggunakan data ini, mereka tidak perlu melalui driver Spark/SQL khusus. OneLake menyimpan semua data dalam format Delta Parquet. Ilmuwan data dapat menggunakan kekuatan penuh mesin Spark dan pustaka sumber terbukanya langsung melalui data.
Pengguna bisnis dapat membuat laporan Power BI langsung di atas OneLake menggunakan mode Direct Lake di mesin Analysis Services. Mesin Analysis Services mendukung model semantik Power BI, dan selalu menawarkan dua mode mengakses data: impor dan kueri langsung. Mode ketiga, Direct Lake mode, memberikan pengguna semua kecepatan impor tanpa perlu menyalin data, menggabungkan keunggulan terbaik dari impor dan kueri langsung. Untuk informasi selengkapnya, lihat Direct Lake.
Perlindungan data bawaan
OneLake secara otomatis melindungi data Anda dengan fitur bawaan yang membantu Anda pulih dari penghapusan yang tidak disengaja dan mempersiapkan pemadaman regional.
Penghapusan sementara untuk pemulihan file
Saat Anda menghapus file di OneLake, file tersebut tidak segera dihapus. OneLake menyimpan file yang dihapus selama tujuh hari, memberi Anda waktu untuk pulih dari penghapusan yang tidak disengaja atau kesalahan pengguna. Anda dapat memulihkan file yang dihapus sementara menggunakan Azure Storage Explorer atau PowerShell.
Untuk instruksi langkah demi langkah, lihat Memulihkan file yang dihapus di OneLake.
Pemulihan bencana
OneLake menggunakan penyimpanan zona redundan (ZRS) jika tersedia untuk melindungi dari kegagalan pusat data. Anda juga dapat mengaktifkan kelangsungan bisnis dan pemulihan bencana (BCDR) untuk kapasitas untuk mereplikasi data Anda ke wilayah geografis sekunder.
Untuk informasi selengkapnya, lihat Merencanakan pemulihan bencana dan perlindungan data.
Langkah selanjutnya
Siap untuk mulai menggunakan OneLake? Berikut cara memulai: