Pertanyaan yang sering diajukan tentang Azure Synapse Analytics

Dalam panduan ini, Anda akan menemukan pertanyaan yang paling sering diajukan tentang Azure Synapse Analytics.

Umum

Bagaimana cara menggunakan peran RBAC untuk mengamankan ruang kerja saya?

Azure Synapse memperkenalkan sejumlah peran dan cakupan untuk menetapkannya yang akan mengamankan ruang kerja Anda dengan secara sederhana.

Peran RBAC Synapse:

  • Administrator Sinaps
  • Admin Synapse SQL
  • Admin Synapse Spark
  • Synapse Contributor
  • Synapse Artifact Publisher
  • Synapse Artifact User
  • Synapse Compute Operator
  • Synapse Credential User
  • Synapse Linked Data Manager
  • Pengguna Synapse

Untuk mengamankan ruang kerja Synapse Anda, tetapkan Peran RBAC ke cakupan RBAC berikut:

  • Ruang kerja
  • Kumpulan Spark
  • Runtime integrasi
  • Layanan Tertaut
  • Kredensial

Selain itu, dengan kumpulan SQL khusus Anda memiliki semua fitur keamanan yang sama yang Anda kenali dan sukai.

Bagaimana cara mengontrol kumpulan SQL khusus, kumpulan SQL tanpa server, dan kumpulan Spark tanpa server?

Sebagai titik awal, Azure Synapse bekerja dengan analisis biaya bawaan dan pemberitahuan biaya yang tersedia di tingkat langganan Azure.

  • Kumpulan SQL khusus - Anda memiliki visibilitas langsung ke dalam biaya dan kontrol atas biaya, karena Anda membuat dan menentukan ukuran kumpulan SQL khusus. Anda dapat mengontrol lebih lanjut pengguna mana yang dapat membuat atau menskalakan kumpulan SQL khusus dengan peran Azure RBAC.

  • Kumpulan SQL tanpa server - Anda memiliki kontrol pemantauan dan manajemen biaya yang memungkinkan Anda menutup pengeluaran pada tingkat harian, mingguan, dan bulanan. Lihat pengelolaan Biaya untuk kumpulan SQL tanpa server untuk informasi selengkapnya.

  • Kumpulan Spark Tanpa Server - Anda dapat membatasi siapa yang dapat membuat kumpulan Spark dengan peran RBAC Synapse.

Akankah ruang kerja Synapse mendukung pengorganisasian folder objek dan granularitas di GA?

Ruang kerja Synapse mendukung folder yang ditentukan pengguna.

Bisakah saya menautkan lebih dari satu ruang kerja Power BI ke satu Ruang Kerja Azure Synapse?

Ya, mulai 10 Juni 2021, Synapse Studio sekarang memungkinkan Anda menambahkan lebih dari satu ruang kerja Power BI ke satu Azure Synapse Workspace.

Azure Synapse Analytics saat ini mendukung Azure Synapse Link dari Azure Cosmos DB ke Synapse Apache Spark dan kumpulan SQL tanpa server. Link Azure Synapse untuk Apache Spark adalah GA. Link Synapse untuk kumpulan SQL tanpa server sedang dalam pratinjau. Untuk informasi selengkapnya, lihat Azure Synapse Link untuk Azure Cosmos DB.

Azure Synapse Link untuk SQL umumnya tersedia untuk SQL Server 2022 dan Azure SQL Database. Untuk informasi selengkapnya, lihat Apa itu Link Azure Synapse untuk SQL?.

Apakah ruang kerja Azure Synapse Mendukung CI/CD?

Ya! Semua artefak Alur, notebook, skrip SQL, dan definisi pekerjaan Spark akan berada di Git. Semua definisi kumpulan akan disimpan di Git sebagai template Azure Resource Manager (ARM). Objek kumpulan SQL khusus (skema, tabel, tampilan, dll.) akan dikelola dengan proyek database dengan dukungan CI/CD. Untuk informasi selengkapnya, lihat Panduan CI dan CD ini.

Apa perbedaan fungsional antara kumpulan SQL khusus dan kumpulan tanpa server?

Kemampuan dan persyaratan berbeda antara dua jenis kumpulan. Perbedaannya termasuk objek database, kemampuan bahasa kueri, keamanan, alat, akses data, dan format data. Untuk perbandingan terperinci tentang kumpulan SQL dan kumpulan tanpa server, kunjungi Perbandingan Kumpulan. Untuk praktik terbaik saat menggunakan salah satu jenis kumpulan, lihat Praktik Terbaik untuk Kumpulan SQL Khusus dan Praktik Terbaik untuk Kumpulan SQL Tanpa Server.

Apa yang dimaksud dengan tabel Delta, dan mengapa saya harus menggunakannya?

Lakehouse didasarkan pada format data akses langsung terbuka, seperti Apache Parquet. Fitur ini memiliki dukungan kelas satu untuk pembelajaran mesin dan ilmu data. Tabel Delta adalah tampilan data yang terkandung dalam Delta Lake, yang mendukung sebagian besar opsi yang disediakan oleh API baca dan tulis Apache Spark DataFrame. Lakehouse dapat membantu tantangan besar dengan gudang data, seperti masa berlaku data, keandalan, total biaya kepemilikan, dan penguncian data. Pada tabel Delta, pengoptimalan seperti pemadatan otomatis dan rencana kueri adaptif tersedia. Untuk panduan terperinci ke Delta Lake, silakan kunjungi Panduan Delta Lake.

Apa itu Pemadatan Otomatis?

Pemadatan Otomatis adalah salah satu dari dua fitur pelengkap Pengoptimalan Otomatis untuk tabel Delta. Setelah penulisan ke tabel berhasil, Pemadatan Otomatis dapat memadatkan file lebih lanjut untuk partisi yang memiliki jumlah file kecil terbanyak. Memilih untuk Pemadatan Otomatis disarankan untuk kasus penggunaan streaming di mana penambahan menit latensi dapat diterima dan ketika Anda tidak memiliki panggilan OPTIMASI reguler di meja Anda. Untuk informasi selengkapnya tentang Pengoptimalan Otomatis dan Pemadatan Otomatis, lihat Panduan Pengoptimalan Otomatis ini.

Pipelines

Bagaimana cara memastikan saya mengetahui informasi masuk apa yang digunakan untuk menjalankan sebuah jalur?

Setiap aktivitas dalam sebuah Jalur Synapse dijalankan menggunakan informasi masuk yang ditentukan di dalam layanan yang ditautkan.

Apakah SSIS IRs didukung dalam Synapse Integrate?

Tidak untuk saat ini.

Bagaimana perbedaan alur Azure Data Factory dengan alur Azure Synapse?

Beberapa contoh perbedaannya adalah dukungan untuk parameter global, pemantauan Pekerjaan Spark untuk Aliran Data, dan berbagi Integration Runtime. Untuk informasi selengkapnya, lihat dokumen ini untuk Integrasi Data - Synapse vs ADF.

Bagaimana cara memigrasikan alur yang sudah ada dari Azure Data Factory ke ruang kerja Azure Synapse?

Saat ini, Anda harus membuat ulang alur Azure Data Factory dan artefak terkait secara manual dengan mengekspor JSON dari alur asli dan mengimpornya ke ruang kerja Synapse Anda.

Bagaimana cara menggunakan Definisi Kerja Apache Spark?

Bisakah saya memanggil notebook dari alur ADF?

Ada dua opsi untuk kasus penggunaan ini. Salah satu opsinya adalah menyimpan alur di ADF, dan Anda harus membungkus aktivitas web. Untuk informasi selengkapnya tentang opsi ini, silakan lihat Panduan Aktivitas Web ini. Opsi lainnya adalah memigrasikan alur ke Synapse. Untuk informasi selengkapnya tentang opsi kedua, lihat Sampel Kode Migrasi ini.

Apache Spark

Apa perbedaan antara Apache Spark for Synapse dan Apache Spark?

Apache Spark untuk Synapse adalah Apache Spark dengan dukungan tambahan untuk integrasi dengan layanan lain (MICROSOFT Entra ID, AzureML, dll.) dan pustaka tambahan (mssparktuils, Hummingbird) dan konfigurasi performa yang telah disetel sebelumnya.

Beban kerja apa pun yang saat ini berjalan di Apache Spark akan berjalan di Apache Spark for Azure Synapse tanpa perubahan.

Versi Spark mana yang tersedia?

Pada September 2023, Azure Synapse Apache Spark sepenuhnya mendukung Spark 3.3. Untuk daftar lengkap komponen inti dan versi yang saat ini didukung lihat dukungan versi Apache Spark.

Apakah ada yang setara dengan DButils di Azure Synapse Spark?

Ya, Azure Synapse Apache Spark menyediakan pustaka mssparkutils. Untuk dokumentasi lengkap utilitas, lihat Pengenalan utilitas Microsoft Spark.

Bagaimana cara mengatur parameter sesi di Apache Spark?

Untuk mengatur parameter sesi, gunakan %%configure magic yang tersedia. Diperlukan menghidupkan ulang sesi agar parameter berlaku.

Bagaimana cara mengatur parameter tingkat kluster di kumpulan Spark tanpa server?

Untuk mengatur parameter tingkat kluster, Anda dapat menyediakan file spark.conf untuk kumpulan Spark-nya. Kumpulan ini kemudian akan mematuhi parameter terdahulu di dalam file konfigurasi.

Bisakah saya menjalankan Spark Cluster multi-pengguna di Azure Synapse Analytics?

Azure Synapse menyediakan mesin yang dibuat khusus untuk kasus penggunaan tertentu. Apache Spark for Synapse dirancang sebagai layanan pekerjaan dan bukan model kluster. Ada dua skenario di mana orang-orang meminta model kluster multi-pengguna.

Skenario #1: Banyak pengguna yang mengakses kluster untuk melayani data untuk tujuan BI.

Cara termudah untuk menyelesaikan tugas ini adalah mengolah data dengan Spark dan kemudian memanfaatkan kemampuan penyajian Synapse SQL sehingga mereka dapat menghubungkan Power BI ke himpunan data tersebut.

Skenario #2: Memiliki beberapa pengembang pada satu kluster untuk menghemat uang.

Untuk memenuhi skenario ini, Anda harus memberi setiap pengembang sebuah kumpulan Spark tanpa server yang diatur untuk menggunakan sejumlah kecil sumber daya Spark. Karena kumpulan Spark tanpa server tidak dikenakan biaya apa pun, hingga digunakan secara aktif, meminimalkan biaya ketika ada banyak pengembang. Kumpulan itu berbagi metadata (tabel Spark) sehingga dapat dengan mudah bekerja dengan sesamanya.

Bagaimana cara menyertakan, mengelola, dan memasang pustaka?

Anda dapat memasang paket eksternal melalui file requirements.txt saat membuat kumpulan Spark, dari ruang kerja Synapse, atau dari portal Microsoft Azure. Lihat Mengelola pustaka untuk Apache Spark di Azure Synapse Analytics.

Alat apa yang tersedia untuk saya di Synapse Spark?

MSSparkUtils di Synapse Spark menawarkan berbagai utilitas untuk meningkatkan pengalaman Anda dan membuat integrasi dengan alat dan layanan lain lebih mudah. Bekerja dengan sistem file, dapatkan variabel lingkungan, notebook rantai bersama-sama, dan bekerja dengan rahasia dengan langkah manual minimal. Untuk dokumentasi lengkap, silakan kunjungi Utilitas Microsoft Spark.

Kumpulan SQL khusus

Apa perbedaan antara kumpulan SQL khusus (SQL DW) dan kumpulan SQL khusus di ruang kerja Azure Synapse?

Kumpulan SQL khusus (sebelumnya SQL DW) adalah platform pergudangan data perusahaan Azure Platform-as-a-Service (PaaS). Anda dapat mengkueri kumpulan SQL khusus yang ada (sebelumnya SQL DW) dan juga membuat kumpulan SQL khusus baru di ruang kerja Azure Synapse Anda. Tidak semua fitur kumpulan SQL khusus di ruang kerja Azure Synapse berlaku untuk kumpulan SQL khusus (sebelumnya SQL DW) mandiri, dan sebaliknya. Untuk informasi selengkapnya, lihat Apa perbedaan antara kumpulan SQL khusus Azure Synapse (sebelumnya SQL DW) dan kumpulan SQL khusus di ruang kerja Azure Synapse Analytics?. Untuk mengaktifkan fitur ruang kerja Azure Synapse kumpulan SQL khusus yang ada (sebelumnya SQL DW), lihat Cara mengaktifkan ruang kerja untuk kumpulan SQL khusus Anda (sebelumnya SQL DW).

Apa perbedaan fungsional antara kumpulan SQL khusus dan kumpulan tanpa server?

Anda dapat menemukan daftar lengkap tentang perbedaannya dalam perbedaan fitur T-SQL di Synapse SQL.

Karena sekarang Azure Synapse adalah GA, bagaimana cara memindahkan kumpulan SQL khusus saya yang sebelumnya mandiri ke Azure Synapse?

Tidak ada “pindah” atau “migrasi” yang diperlukan. Anda dapat memilih untuk mengaktifkan fitur ruang kerja baru di kumpulan yang sudah ada. Jika iya, tidak ada perubahan yang mengganggu, sebagai gantinya Anda akan dapat menggunakan fitur baru seperti Synapse Studio, Spark, dan kumpulan SQL tanpa server. Tidak semua fitur kumpulan SQL khusus di ruang kerja Azure Synapse berlaku untuk kumpulan SQL khusus (sebelumnya SQL DW), dan sebaliknya. Untuk mengaktifkan fitur ruang kerja dari kumpulan SQL khusus yang ada (sebelumnya SQL DW) lihat Cara mengaktifkan ruang kerja untuk kumpulan SQL khusus Anda (sebelumnya SQL DW).

Apa penyebaran default dari kumpulan SQL khusus saat ini?

Secara Default, semua kumpulan SQL khusus baru akan disebarkan ke sebuah ruang kerja; tetapi, jika perlu, Anda masih dapat membuat kumpulan SQL khusus (sebelumnya SQL DW) dalam faktor bentuk dan ukuran mandiri.

Keamanan jaringan

Bagaimana cara mengamankan akses ke ruang kerja Azure Synapse saya?

Dengan atau tanpa jaringan virtual terkelola, Anda dapat tersambung ke ruang kerja Anda dari jaringan publik. Untuk informasi selengkapnya, lihat Pengaturan Konektivitas. Akses dari jaringan publik dapat dikontrol dengan mengaktifkan fitur akses jaringan publik atau firewall ruang kerja. Atau, Anda dapat menyambungkan ke ruang kerja Anda menggunakan titik akhir privat terkelola dan Private Link. Tanpa Jaringan Virtual Terkelola Azure Synapse Analytics, ruang kerja Azure Synapse tidak memiliki kemampuan untuk tersambung melalui titik akhir privat terkelola.