Bagikan melalui


Bekerja di ekosistem Apache Hadoop di HDInsight dari PC Windows

Pelajari tentang opsi pengembangan dan manajemen di PC Windows untuk bekerja di ekosistem Apache Hadoop di HDInsight.

HDInsight didasarkan pada komponen Apache Hadoop dan Hadoop, teknologi sumber terbuka yang dikembangkan di Linux. HDInsight versi 3.4 dan yang lebih tinggi menggunakan distribusi Linux Ubuntu sebagai OS yang mendasari untuk kluster. Namun, Anda dapat bekerja dengan HDInsight dari klien Windows atau lingkungan pengembangan Windows.

Menggunakan PowerShell untuk tugas penggunaan dan manajemen

Azure PowerShell adalah lingkungan pembuatan skrip yang dapat Anda gunakan untuk mengontrol dan mengotomatiskan tugas penyebaran dan manajemen di HDInsight dari Windows.

Contoh tugas yang bisa Anda lakukan dengan PowerShell:

Ikuti langkah-langkah untuk memasang dan mengonfigurasi Microsoft Azure PowerShell untuk mendapatkan versi terbaru.

Utilitas yang dapat Anda jalankan di browser

Utilitas berikut memiliki UI web yang berjalan di browser:

Sebelum Anda masuk ke contoh berikut, pasang dan coba Data Lake Tool untuk Visual Studio.

Visual Studio dan .NET SDK

Anda dapat menggunakan Visual Studio dengan .NET SDK untuk mengelola kluster dan mengembangkan aplikasi big data. Anda bisa menggunakan ID lain untuk tugas berikut, tetapi contoh diperlihatkan di Visual Studio.

Contoh tugas yang bisa Anda lakukan dengan .NET SDK di Visual Studio:

Intellij IDEA dan Eclipse IDE untuk kluster Spark

Baik Intellij IDEA dan Eclipse IDE dapat digunakan untuk:

  • Mengembangkan dan Mengirim aplikasi Scala Spark pada kluster HDInsight Spark.
  • Akses sumber daya kluster Spark.
  • Mengembangkan dan menjalankan aplikasi Scala Spark secara lokal.

Artikel-artikel ini menunjukkan cara:

Notebook di Spark untuk ilmuwan data

Kluster Apache Spark di HDInsight termasuk notebook Apache Zeppelin dan kernel yang dapat digunakan dengan Jupyter Notebooks.

Menjalankan alat dan teknologi berbasis Linux di Windows

Jika Anda menemukan situasi di mana Anda harus menggunakan alat atau teknologi yang hanya tersedia di Linux, pertimbangkan opsi berikut:

  • Bash on Ubuntu pada Windows 10 menyediakan subsistem Linux pada Windows. Bash memungkinkan Anda untuk secara langsung menjalankan utilitas Linux tanpa harus mempertahankan penginstalan Linux khusus. Lihat Panduan Penginstalan Subsistem Windows untuk Linux untuk Windows 10 sebagai langkah-langkah penginstalan. Shell Unix lainnya juga berfungsi.
  • Docker untuk Windows menyediakan akses ke banyak alat berbasis Linux, dan dapat dijalankan langsung dari Windows. Misalnya, Anda dapat menggunakan Docker untuk menjalankan klien Beeline untuk Apache Hive langsung dari Windows. Anda juga dapat menggunakan Docker untuk menjalankan Jupyter Notebook lokal dan terhubung dari jarak jauh ke Spark di HDInsight. Mulai menggunakan Docker untuk Windows
  • MobaXTerm memungkinkan Anda untuk secara grafis menelusuri sistem file kluster melalui koneksi SSH.

Alat lintas platform

Antarmuka baris perintah Azure (CLI) adalah pengalaman baris perintah lintas platform Microsoft untuk mengelola sumber daya Azure. Untuk informasi selengkapnya, lihat Azure Command-Line Interface (CLI).

Langkah berikutnya

Jika Anda baru bekerja di kluster berbasis Linux, lihat artikel berikut ini: