Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Petunjuk
Data Factory di Microsoft Fabric adalah generasi Azure Data Factory berikutnya, dengan arsitektur yang lebih sederhana, AI bawaan, dan fitur baru. Jika Anda baru menggunakan integrasi data, mulailah dengan Fabric Data Factory. Beban kerja ADF yang ada dapat ditingkatkan ke Fabric untuk mengakses kemampuan baru di seluruh ilmu data, analitik real time, dan pelaporan.
Manipulasi data melibatkan transformasi dan format ulang data dari sumber aslinya untuk membuatnya lebih cocok dan berguna untuk berbagai aplikasi hilir.
Organisasi perlu memiliki kemampuan untuk mengeksplorasi data bisnis penting mereka untuk penyiapan data dan manipulasi untuk memberikan analisis yang akurat tentang data kompleks yang terus tumbuh setiap hari. Penyiapan data diperlukan agar organisasi dapat menggunakan data dalam berbagai proses bisnis dan mengurangi waktu ke nilai.
Data Factory memberdayakan Anda dengan persiapan data bebas kode pada skala cloud secara berulang menggunakan Power Query. Data Factory terintegrasi dengan Power Query Online dan membuat fungsi Power Query M tersedia sebagai aktivitas alur.
Data Factory menerjemahkan M yang dihasilkan oleh Power Query Online Mashup Editor ke dalam kode spark untuk eksekusi skala cloud dengan menerjemahkan M ke dalam Aliran Data Azure Data Factory. Manipulasi data dengan Power Query dan aliran data sangat berguna untuk teknisi data atau 'integrator data warga negara'.
Kasus penggunaan
Eksplorasi dan penyiapan data interaktif yang cepat
Beberapa insinyur data dan integrator data warga dapat secara interaktif menjelajahi dan menyiapkan himpunan data pada skala cloud. Dengan maraknya volume, variasi, dan kecepatan data di data lake, pengguna membutuhkan cara yang efektif untuk mengeksplorasi dan menyiapkan himpunan data. Misalnya, Anda mungkin perlu membuat himpunan data yang 'memiliki semua info demografis pelanggan untuk pelanggan baru sejak 2017'. Anda tidak memetakan ke target yang diketahui. Anda sedang menjelajahi, memanipulasi, dan mempersiapkan dataset untuk memenuhi sebuah persyaratan sebelum menerbitkannya di datalake. Wrangling sering digunakan untuk skenario analitik yang kurang formal. Himpunan data yang disiapkan dapat digunakan untuk melakukan transformasi dan operasi pembelajaran mesin downstream.
Penyiapan data agile bebas kode
Integrator data warga negara menghabiskan lebih dari 60% dari waktu mereka untuk mencari dan menyiapkan data. Mereka ingin melakukannya dengan cara bebas kode untuk meningkatkan produktivitas operasional. Memungkinkan integrator data warga memperkaya, membentuk, dan menerbitkan data menggunakan alat yang diketahui seperti Power Query Online dengan cara yang dapat diskalakan secara drastis meningkatkan produktivitas mereka. Wrangling in Azure Data Factory memungkinkan editor mashup Online Power Query yang akrab untuk memungkinkan integrator data warga memperbaiki kesalahan dengan cepat, menstandarkan data, dan menghasilkan data berkualitas tinggi untuk mendukung keputusan bisnis.
Validasi dan eksplorasi data
Pindai data Anda secara visual dengan cara bebas kode untuk menghapus outlier, anomali, dan menyesuaikannya dengan bentuk untuk analitik cepat.
Sumber yang didukung
| Konektor | Format data | Jenis autentikasi |
|---|---|---|
| Azure Blob Storage | CSV, Parquet, Excel | Kunci Akun, Perwakilan Layanan, MSI |
| Azure Data Lake Storage Gen1 | CSV, Parquet, Excel | Perwakilan Layanan, MSI |
| Azure Data Lake Storage Gen2 | CSV, Parquet, Excel | Kunci Akun, Perwakilan Layanan, MSI |
| Azure SQL Database | - | Autentikasi SQL, MSI, Perwakilan Layanan |
| Azure Synapse Analytics | - | Autentikasi SQL, MSI, Perwakilan Layanan |
Editor gabungan
Saat Anda membuat aktivitas Power Query, semua himpunan data sumber menjadi kueri himpunan data dan ditempatkan di folder ADFResource. Secara default, UserQuery akan menunjuk ke kueri himpunan data pertama. Semua transformasi harus dilakukan pada UserQuery karena perubahan pada kueri himpunan data tidak didukung dan tidak akan disimpan. Mengganti nama, menambahkan, dan menghapus kueri saat ini tidak didukung.
Saat ini tidak semua fungsi Power Query M didukung untuk manipulasi data meskipun tersedia selama penulisan. Saat membangun aktivitas Power Query, Anda akan diminta dengan pesan kesalahan berikut jika fungsi tidak didukung:
The Power Query Spark Runtime does not support the function
Untuk informasi selengkapnya tentang transformasi yang didukung, lihat fungsi manipulasi data Power Query.
Konten terkait
Pelajari cara membuat kombinasi manipulasi data Power Query.