Apa itu lakehouse di Microsoft Fabric?

Microsoft Fabric Lakehouse adalah platform arsitektur data untuk menyimpan, mengelola, dan menganalisis data terstruktur dan tidak terstruktur dalam satu lokasi. Ini adalah solusi fleksibel dan dapat diskalakan yang memungkinkan organisasi menangani data dalam volume besar menggunakan berbagai alat dan kerangka kerja untuk memproses dan menganalisis data tersebut. Ini terintegrasi dengan alat manajemen data dan analitik lainnya untuk memberikan solusi komprehensif untuk rekayasa dan analitik data.

Gif of overall lakehouse experience.

Titik akhir analitik Lakehouse SQL

Lakehouse membuat lapisan penyajian dengan secara otomatis menghasilkan titik akhir analitik SQL dan model semantik default selama pembuatan. Fungsionalitas see-through baru ini memungkinkan pengguna untuk bekerja langsung di atas tabel Delta di danau untuk memberikan pengalaman tanpa gesekan dan berkinerja dari penyerapan data hingga pelaporan.

Penting untuk dicatat bahwa titik akhir analitik SQL adalah pengalaman baca-saja dan tidak mendukung area permukaan T-SQL penuh dari gudang data transaksi.

Catatan

Hanya tabel dalam format Delta yang tersedia di titik akhir analitik SQL. Parquet, CSV, dan format lainnya tidak dapat dikueri menggunakan titik akhir analitik SQL. Jika Anda tidak melihat tabel, Anda harus mengonversinya ke format Delta.

Penemuan dan pendaftaran tabel otomatis

Penemuan dan pendaftaran tabel otomatis adalah fitur Lakehouse yang menyediakan pengalaman file terkelola penuh untuk tabel bagi insinyur data dan ilmuwan data. Anda dapat meletakkan file ke area terkelola Lakehouse dan sistem secara otomatis memvalidasinya untuk format terstruktur yang didukung, dan mendaftarkannya ke metastore dengan metadata yang diperlukan seperti nama kolom, format, kompresi, dan banyak lagi. (Saat ini satu-satunya format yang didukung adalah tabel Delta.) Anda kemudian dapat mereferensikan file sebagai tabel dan menggunakan sintaks SparkSQL untuk berinteraksi dengan data.

Berinteraksi dengan item Lakehouse

Teknisi data dapat berinteraksi dengan lakehouse dan data dalam lakehouse dengan beberapa cara:

  • Penjelajah Lakehouse: Penjelajah adalah halaman interaksi utama Lakehouse. Anda dapat memuat data di Lakehouse Anda, menjelajahi data di Lakehouse menggunakan penjelajah objek, mengatur label MIP , dan berbagai hal lainnya. Pelajari selengkapnya tentang pengalaman penjelajah: Navigasikan penjelajah Fabric Lakehouse.

  • Notebooks: Teknisi data dapat menggunakan notebook untuk menulis kode untuk membaca, mengubah, dan menulis langsung ke Lakehouse sebagai tabel dan/atau folder. Anda bisa mempelajari selengkapnya tentang cara menggunakan buku catatan untuk Lakehouse: Menjelajahi data di lakehouse Anda dengan buku catatan dan Cara menggunakan buku catatan untuk memuat data ke lakehouse Anda.

  • Alur: Teknisi data dapat menggunakan alat integrasi data seperti alat penyalinan alur untuk menarik data dari sumber lain dan masuk ke Lakehouse. Temukan informasi selengkapnya tentang cara menggunakan aktivitas salin: Cara menyalin data menggunakan aktivitas salin.

  • Definisi kerja Apache Spark: Teknisi data dapat mengembangkan aplikasi yang kuat dan mengatur eksekusi pekerjaan Spark yang dikompilasi di Java, Scala, dan Python. Pelajari selengkapnya tentang pekerjaan Spark: Apa itu definisi kerja Apache Spark?

  • Aliran Data Gen 2: Teknisi data dapat menggunakan Aliran Data Gen 2 untuk menyerap dan menyiapkan data mereka. Temukan informasi selengkapnya tentang memuat data menggunakan aliran data: Buat aliran data pertama Anda untuk mendapatkan dan mengubah data.

Pelajari selengkapnya tentang berbagai cara untuk memuat data ke lakehouse Anda: Opsi untuk memasukkan data ke Fabric Lakehouse.

Multitugas dengan lakehouse

Pengalaman multitugas menyediakan desain tab browser yang memungkinkan Anda membuka dan beralih di antara beberapa item dengan mulus memungkinkan Anda mengelola data lakehouse Anda lebih efisien dari sebelumnya. Tidak ada lagi juggling antara jendela yang berbeda atau kehilangan jejak tugas Anda. Lakehouse memberikan pengalaman multitugas yang ditingkatkan untuk membuat perjalanan manajemen data Anda seefisien dan ramah pengguna dengan kemampuan berikut:

  • Mempertahankan operasi yang sedang berjalan: Anda dapat mengunggah atau menjalankan operasi pemuatan data dalam satu tab dan memeriksa tugas lain di tab yang berbeda. Dengan multi-tugas yang disempurnakan, operasi yang sedang berjalan tidak dibatalkan saat Anda menavigasi antar tab. Anda dapat fokus pada pekerjaan Anda tanpa gangguan.

  • Pertahankan konteks Anda: Objek, tabel data, atau file yang dipilih tetap terbuka dan tersedia saat Anda beralih antar tab. Konteks data lakehouse Anda selalu ada di ujung jari Anda.

  • Daftar non-pemblokiran memuat ulang: Mekanisme muat ulang yang tidak diblokir untuk file dan daftar tabel Anda. Anda bisa terus bekerja saat daftar di-refresh di latar belakang. Ini memastikan bahwa Anda memiliki data terbaru sambil memberi Anda pengalaman yang lancar dan tidak terganggu.

  • Pemberitahuan yang ditentukan dengan jelas: Pemberitahuan roti panggang menentukan lakehouse asalnya, sehingga lebih mudah untuk melacak perubahan dan pembaruan di lingkungan multi-tugas Anda.

Desain lakehouse yang dapat diakses

Aksesibilitas selalu menjadi prioritas utama untuk memastikan bahwa Lakehouse inklusif dan ramah pengguna untuk semua orang. Berikut adalah inisiatif utama yang telah kami terapkan sejauh ini untuk mendukung aksesibilitas:

  • Kompatibilitas pembaca layar: Anda dapat bekerja dengan mulus dengan pembaca layar populer, memungkinkan pengguna yang terganggu secara visual untuk menavigasi dan berinteraksi dengan platform kami secara efektif.

  • Desain Responsif aliran teks yang beradaptasi dengan ukuran dan orientasi layar yang berbeda. Teks dan konten reflow secara dinamis, sehingga memudahkan pengguna untuk melihat dan berinteraksi dengan aplikasi kami di berbagai perangkat.

  • Navigasi keyboard: Navigasi keyboard yang ditingkatkan untuk memungkinkan pengguna bergerak melalui lakehouse tanpa mengandalkan mouse, meningkatkan pengalaman bagi mereka yang memiliki disabilitas motorik.

  • Teks alternatif untuk gambar: Semua gambar sekarang menyertakan teks alt deskriptif, sehingga memungkinkan pembaca layar untuk menyampaikan informasi yang bermakna.

  • Bidang formulir dan Label: Semua bidang formulir memiliki label terkait, menyederhanakan input data untuk semua orang, termasuk yang menggunakan pembaca layar.

Dalam gambaran umum ini, Anda mendapatkan pemahaman dasar tentang lakehouse. Lanjutkan ke artikel berikutnya untuk mempelajari cara membuat dan menggunakan lakehouse Anda sendiri: