Memilih analitik data dan teknologi pelaporan di Azure

Tujuan dari sebagian besar solusi mahadata adalah untuk memberikan wawasan tentang data dan pelaporan. Ini mencakup laporan dan visualisasi yang telah dikonfigurasi sebelumnya, atau eksplorasi data interaktif.

Apa pilihan Anda saat akan memilih teknologi analitik data?

Ada beberapa opsi untuk analisis, visualisasi dan pelaporan di Azure, tergantung pada kebutuhan Anda:

Power BI

Power BI merupakan rangkaian alat untuk analisis bisnis. Ini dapat terhubung ke ratusan sumber data, dan dapat digunakan untuk analisis. Lihat daftar dari sumber data yang tersedia. Gunakan Power BI Embedded untuk mengintegrasikan Power BI dalam aplikasi Anda tanpa memerlukan lisensi tambahan.

Organisasi dapat menggunakan Power BI untuk membuat laporan dan mempublikasikan ke organisasi. Setiap orang dapat membuat dasbor pribadi, dengan tata kelola dan keamanan bawaan . Power BI menggunakan ID Microsoft Entra untuk mengautentikasi pengguna yang masuk ke layanan Power BI, dan menggunakan kredensial masuk Power BI setiap kali pengguna mencoba mengakses sumber daya yang memerlukan autentikasi.

Jupyter Notebooks

Jupyter Notebooksmenyediakan aplikasi berbasis browser yang memungkinkan ilmuwan membuat catatan yang berisi Python, Scala, atau R dan teks menurun, hal ini merupakan cara yang efektif untuk berkolaborasi dengan berbagi dan mendokumentasikan kode dan hasil dalam satu dokumen.

Sebagian besar HDInsight, seperti Spark atau Hadoop, telah dikonfigurasi sebelumnya dengan Jupyter notebooks untuk berinteraksi dengan data dan mengirimkan tugas untuk diproses. Tergantung pada jenis HDInsight yang digunakan, satu atau lebih inti akan disediakan untuk menafsirkan dan menjalankan kode Anda. Misalnya, Spark di HDInsight menyediakan inti terkait Spark yang dapat dipilih untuk menjalankan kode Python atau Scala menggunakan mesin Spark.

Jupyter Notebooks menyediakan sarana yang bagus untuk menganalisis, memvisualisasikan, dan memproses data Anda sebelum membangun visualisasi yang lebih canggih dengan alat BI / pelaporan seperti Power BI.

Zeppelin Notebooks

Zeppelin Notebooks adalah pilihan lain untuk aplikasi berbasis browser, fungsinya mirip dengan Jupyter. Beberapa HDInsight telah dikonfigurasi sebelumnya dengan Zeppelin notebooks. Akan tetapi, jika Anda menggunakan HDInsight Interactive Query (Hive LLAP), Zeppelinyang saat ini merupakan satu-satunya pilihan catatan yang dapat digunakan untuk menjalankan kueri interaktif Hive. Selain itu, jika Anda menggunakan bergabung dengan-domain HDInsight , Zeppelin notebooks adalah satu-satunya tipe yang dapat menetapkan login pengguna yang berbeda untuk mengontrol akses ke buku catatan dan tabel Hive.

Jupyter Notebooks di Visual Studio Code

VS Code adalah editor kode gratis dan platform pengembangan yang dapat Anda gunakan secara lokal atau terhubung ke komputasi jarak jauh. Dikombinasikan dengan ekstensi Jupyter, ia menawarkan lingkungan penuh untuk pengembangan Jupyter yang dapat ditingkatkan dengan ekstensi bahasa tambahan. Jika Anda menginginkan pengalaman Jupyter gratis terbaik di kelasnya dengan kemampuan untuk memanfaatkan komputasi pilihan Anda, ini adalah pilihan yang bagus. Dengan menggunakan Visual Studio Code, Anda dapat mengembangkan dan menjalankan notebook terhadap remote dan kontainer. Untuk mempermudah transisi dari Azure Notebooks, kami telah membuat gambar kontainer tersedia sehingga dapat digunakan dengan Visual Studio Code juga.

Jupyter (sebelumnya IPython Notebook) adalah proyek sumber terbuka yang memungkinkan Anda dengan mudah menggabungkan teks Markdown dan kode sumber Python yang dapat dieksekusi pada satu kanvas yang disebut notebook. Visual Studio Code mendukung bekerja dengan Jupyter Notebooks secara asli, dan melalui file kode Python.

Kriteria pilihan utama

Untuk mempersempit pilihan, mulailah dengan menjawab pertanyaan-pertanyaan ini:

  • Apakah Anda perlu terhubung ke berbagai sumber data, menyediakan tempat terpusat untuk membuat laporan untuk data yang tersebar di seluruh domain? Jika demikian, pilih opsi yang memungkinkan Anda terhubung ke 100-an sumber data.

  • Apakah Anda ingin menyematkan visualisasi dinamis di situs web atau aplikasi eksternal? Jika demikian, pilih opsi yang menyediakan kemampuan menyematkan.

  • Apakah Anda ingin mendesain visualisasi dan laporan saat luring? Jika ya, pilih opsi dengan kemampuan luring.

  • Apakah Anda memerlukan daya pemrosesan data besar untuk model AI yang kompleks atau bekerja dengan kumpulan data yang sangat besar? Jika ya, pilih opsi yang dapat terhubung ke rumpun data besar.

Matriks kemampuan

Tabel berikut merangkum perbedaan utama kemampuan.

Kemampuan secara umum

Kemampuan Power BI Jupyter Notebooks Zeppelin Notebooks Jupyter Notebooks di Visual Studio Code
Koneksi ke big data untuk pemrosesan tingkat lanjutan Ya Ya Ya Tidak
Layanan terkelola Ya Ya 1 Ya 1 Ya
Koneksi dengan 100-an sumber data Ya No No Tidak
Kapabilitas offline Ya 2 Tidak No Tidak
Menyematkan kemampuan Ya No No Tidak
Penyegaran data otomatis Ya No No Tidak
Akses ke berbagai open source No Ya 3 Ya 3 Ya 4
Transformasi data/pembersihan Power Query, R 40 bahasa pemrograman, termasuk Python, R, Julia, dan Scala 20 lebih penerjemah, termasuk Python, JDBC, dan R Python, F#, R
Harga Gratis untuk Power BI Desktop (authoring), lihat harga untuk pilihan hosting Gratis Gratis Gratis
Kolaborasi multiuser Ya Ya (melalui sharing atau dengan server multiuser seperti JupyterHub) Ya Ya (melalui sharing)

[1] Ketika digunakan sebagai bagian pengelolaan HDInsight.

[2] Dengan menggunakan Power BI Desktop.

[2] Anda dapat mencari Maven repository untuk kontribusi komunitas.

[3] Python dapat diinstal menggunakan pip atau conda. R dapat diinstal dari CRAN atau GitHub. F# dapat diinstal melalui nuget.org dengan menggunakan Paket manajer dependensi.

Kontributor

Artikel ini dikelola oleh Microsoft. Ini awalnya ditulis oleh kontributor berikut.

Penulis utama:

Langkah berikutnya