Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Petunjuk
Data Factory di Microsoft Fabric adalah generasi Azure Data Factory berikutnya, dengan arsitektur yang lebih sederhana, AI bawaan, dan fitur baru. Jika Anda baru menggunakan integrasi data, mulailah dengan Fabric Data Factory. Beban kerja ADF yang ada dapat ditingkatkan ke Fabric untuk mengakses kemampuan baru di seluruh ilmu data, analitik real time, dan pelaporan.
Aktivitas Pig Azure HDInsight dalam alur Azure Data Factory mengeksekusi kueri Pig di kluster Azure HDInsight sendiri atau sesuai permintaan. Artikel ini membangun artikel aktivitas transformasi data, yang menyajikan gambaran umum tentang transformasi data dan aktivitas transformasi yang didukung.
Untuk mempelajari lebih lanjut, baca pengenalan Azure Data Factory atau Synapse Analytics dan lakukan Tutorial: mengubah data sebelum membaca artikel ini.
Tambahkan aktivitas HDInsight Pig ke alur dengan UI
Untuk menggunakan aktivitas HDInsight Pig ke dalam alur, selesaikan langkah-langkah berikut:
Cari Pig di panel Aktivitas pipeline, dan seret aktivitas Pig ke kanvas pipeline.
Pilih aktivitas Pig baru pada kanvas jika belum dipilih.
Pilih tab Kluster HDI untuk memilih atau membuat layanan tertaut baru ke kluster HDInsight yang akan digunakan untuk menjalankan aktivitas MapReduce.
Pilih tab Script untuk memilih atau membuat layanan tertaut skrip baru ke lokasi Azure Storage tempat skrip Anda akan dihosting. Tentukan nama kelas yang akan dieksekusi di sana, dan jalur file di dalam lokasi penyimpanan. Anda juga dapat mengonfigurasi detail tingkat lanjut, termasuk debugging, serta argumen dan parameter yang akan diteruskan ke skrip.
Sintaks
{
"name": "Pig Activity",
"description": "description",
"type": "HDInsightPig",
"linkedServiceName": {
"referenceName": "MyHDInsightLinkedService",
"type": "LinkedServiceReference"
},
"typeProperties": {
"scriptLinkedService": {
"referenceName": "MyAzureStorageLinkedService",
"type": "LinkedServiceReference"
},
"scriptPath": "MyAzureStorage\\PigScripts\\MyPigScript.pig",
"getDebugInfo": "Failure",
"arguments": [
"SampleHadoopJobArgument1"
],
"defines": {
"param1": "param1Value"
}
}
}
Detail sintaksis
| Properti | Deskripsi | Wajib |
|---|---|---|
| nama | Nama aktivitas | Ya |
| deskripsi | Teks yang menjelaskan untuk apa aktivitas tersebut digunakan | Tidak |
| jenis | Untuk Hive Activity, jenis aktivitasnya adalah HDinsightPig | Ya |
| NamaLayananTertaut | Referensi ke kluster HDInsight yang terdaftar sebagai layanan tertaut. Untuk mempelajari layanan tertaut ini, lihat artikel Layanan tertaut komputasi. | Ya |
| scriptLinkedService | Referensi ke Layanan Tertaut Azure Storage yang digunakan untuk menyimpan skrip Pig yang akan dieksekusi. Hanya Azure Blob Storage dan ADLS Gen2 yang didukung di sini. Jika Anda tidak menentukan Layanan Tertaut ini, Layanan tertaut Azure Storage yang ditentukan dalam Layanan Tertaut HDInsight digunakan. | Tidak |
| scriptPath | Berikan jalur ke file skrip yang disimpan di Azure Storage yang dirujuk oleh scriptLinkedService. Nama file sensitif terhadap huruf besar/kecil. | Tidak |
| getDebugInfo | Menentukan kapan file log disalin ke Azure Storage yang digunakan oleh kluster HDInsight (atau) yang ditentukan oleh scriptLinkedService. Nilai yang diizinkan: None, Always, atau Failure. Nilai default: None. | Tidak |
| argumen | Menentukan rangkaian argumen untuk pekerjaan Hadoop. Argumen diteruskan sebagai argumen baris perintah untuk tiap tugas. | Tidak |
| mendefinisikan | Tentukan parameter sebagai pasangan kunci/nilai untuk merujuk dalam skrip Pig. | Tidak |
Konten terkait
Lihat artikel berikut yang menjelaskan cara mentransformasikan data dengan cara lain: