Bagikan melalui


Melakukan analitik dengan Azure Machine Learning Studio (klasik) menggunakan database Microsoft SQL Server

BERLAKU UNTUK:Berlaku untuk.Azure Machine Learning Studio (klasik) Tidak berlaku untuk.Azure Machine Learning

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Kami menyarankan Anda beralih ke Azure Machine Learning pada tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

Dukumentasi ML Studio (klasik) akan dihentikan dan mungkin tidak diperbarui pada masa mendatang.

Seringkali perusahaan yang bekerja dengan data lokal ingin memanfaatkan skala dan ketangkasan cloud untuk beban kerja pembelajaran mesin mereka. Tetapi mereka tidak ingin mengganggu proses dan alur kerja bisnis mereka saat ini dengan memindahkan data lokal mereka ke cloud. Azure Machine Learning Studio (klasik) sekarang mendukung membaca data Anda dari database Microsoft SQL Server lalu melatih dan menilai model dengan data ini. Anda tidak lagi harus menyalin dan menyinkronkan data antara cloud dan server lokal Anda secara manual. Sebagai gantinya, modul Impor Data di Azure Machine Learning Studio (klasik) sekarang dapat membaca langsung dari database SQL Server Anda untuk pekerjaan pelatihan dan penilaian Anda.

Artikel ini memberikan ringkasan tentang cara mengubah data Microsoft SQL Server ke Azure Machine Learning Studio (klasik). Ini mengasumsikan bahwa Anda terbiasa dengan konsep Studio (klasik) seperti ruang kerja, modul, himpunan data, eksperimen, dll..

Catatan

Fitur ini tidak tersedia untuk ruang kerja gratis. Untuk informasi selengkapnya tentang harga dan tingkatan Azure Machine Learning, lihat Harga Azure Machine Learning Studio (klasik).

Instal Data Factory Self-hosted Integration Runtime

Untuk mengakses database Microsoft SQL Server di Azure Machine Learning Studio (klasik), Anda perlu mengunduh dan memasang Microsoft Integration Runtime yang Di-hosting-sendiri oleh Azure Data Factory, yang sebelumnya dikenal sebagai Gateway Manajemen Data. Saat mengonfigurasi koneksi di Machine Learning Studio (klasik), Anda memiliki kesempatan untuk mengunduh dan menginstal Integration Runtime (IR) menggunakan dialog Unduh dan daftarkan gateway data yang dijelaskan di bawah ini.

Anda juga dapat menginstal IR terlebih dahulu dengan mengunduh dan menjalankan paket pemasangan MSI dari Pusat Unduhan Microsoft. MSI juga dapat digunakan untuk meningkatkan IR yang ada ke versi terbaru, dengan semua pengaturan tetap terjaga.

Data Factory Self-Hosted Integration Runtime memiliki prasyarat berikut:

  • Integrasi Data Factory Self-Hosted memerlukan Sistem Operasi 64-bit dengan .NET Framework 4.6.1 atau lebih tinggi.
  • Versi sistem operasi Windows yang didukung adalah Windows 10 , Windows Server 2012, Windows Server 2012 R2, Windows Server 2016.
  • Konfigurasi yang disarankan untuk mesin IR minimal 2 GHz, CPU Core 4, RAM 8GB, dan disk 80GB.
  • Jika mesin host berhibernasi, IR tidak akan menanggapi permintaan data. Oleh karena itu, konfigurasikan rencana daya yang sesuai pada komputer sebelum menginstal IR. Jika mesin dikonfigurasi untuk hibernasi, instalasi IR menampilkan pesan.
  • Karena aktivitas salin terjadi pada frekuensi tertentu, penggunaan sumber daya (CPU, memori) pada mesin juga mengikuti pola yang sama dengan waktu sibuk dan waktu senggang. Pemanfaatan sumber daya juga sangat tergantung pada jumlah data yang dipindahkan. Ketika beberapa pekerjaan salinan sedang berlangsung, Anda akan mengamati penggunaan sumber daya naik selama waktu sibuk. Meskipun konfigurasi minimum yang tercantum di atas secara teknis cukup, Anda mungkin ingin memiliki konfigurasi dengan lebih banyak sumber daya daripada konfigurasi minimum tergantung pada beban spesifik Anda untuk pergerakan data.

Pertimbangkan hal berikut ini saat menyiapkan dan menggunakan Data Factory Self-hosted Integration Runtime:

  • Anda hanya dapat menginstal satu instans IR pada satu komputer.

  • Anda dapat menggunakan satu IR untuk beberapa sumber data lokal.

  • Anda dapat menghubungkan beberapa IR di komputer yang berbeda ke sumber data lokal yang sama.

  • Anda mengonfigurasi IR hanya untuk satu ruang kerja pada satu waktu. Saat ini, IR tidak dapat dibagikan antara ruang kerja.

  • Anda dapat mengonfigurasi beberapa IR untuk satu ruang kerja. Misalnya, Anda mungkin ingin menggunakan IR yang terhubung ke sumber data pengujian Anda selama pengembangan dan IR produksi saat Anda siap untuk mengoperasionalkan.

  • IR tidak perlu berada di komputer yang sama dengan sumber data. Tetapi tetap dekat dengan sumber data mengurangi waktu bagi gateway untuk terhubung ke sumber data. Kami menyarankan agar Anda menginstal IR pada komputer yang berbeda dari yang menghosting sumber data lokal sehingga gateway dan sumber data tidak bersaing untuk sumber daya.

  • Jika Anda sudah memasang IR di komputer Anda yang menyajikan skenario Power BI atau Azure Data Factory, instal IR terpisah untuk Azure Machine Learning Studio (klasik) di komputer lain.

    Catatan

    Anda tidak dapat menjalankan Data Factory Self-hosted Integration Runtime yang dan Power BI Gateway di komputer yang sama.

  • Anda perlu menggunakan Data Factory Self-hosted Integration Runtime untuk Machine Learning Studio (klasik) bahkan jika Anda menggunakan Azure ExpressRoute untuk data lain. Anda harus memperlakukan sumber data Anda sebagai sumber data lokal (yang ada di belakang firewall) bahkan saat Anda menggunakan ExpressRoute. Gunakan Data Factory Self-hosted Integration Runtime untuk membangun konektivitas antara Machine Learning dan sumber data.

Anda dapat menemukan informasi terperinci tentang prasyarat penginstalan, langkah-langkah penginstalan, dan tips pemecahan masalah dalam artikel Integration Runtime di Data Factory.

Masukkan data dari database Microsoft SQL Server Anda ke Azure Machine Learning

Dalam penelusuran ini, Anda akan menyiapkan Azure Data Factory Integration Runtime di ruang kerja Azure Machine Learning, mengonfigurasinya, lalu membaca data dari database SQL Server.

Tips

Sebelum memulai, nonaktifkan pemblokir pop-up browser Anda untuk studio.azureml.net. Jika Anda menggunakan browser Google Chrome, unduh dan instal salah satu dari beberapa plug-in yang tersedia di Google Chrome WebStore Klik Sekali Ekstensi Aplikasi.

Catatan

Azure Data Factory Self-hosted Integration Runtime sebelumnya dikenal sebagai Gateway Pengelolaan Data. Tutorial langkah demi langkah akan terus mengacu padanya sebagai gateway.

Langkah 1: Membuat gateway

Langkah pertama adalah membuat dan menyiapkan gateway untuk mengakses database SQL Anda.

  1. Masuk ke Azure Machine Learning Studio (klasik) dan pilih ruang kerja yang ingin Anda kerjakan.

  2. Klik bilah PENGATURAN di sebelah kiri, lalu klik tab GATEWAY DATA di bagian atas.

  3. Klik GATEWAY DATA BARU di bagian bawah layar.

    Gateway Data Baru

  4. Dalam dialog Gateway data baru , masukkan Nama Gateway dan secara opsional tambahkan Deskripsi. Klik panah di sudut kanan bawah untuk masuk ke langkah konfigurasi berikutnya.

    Masukkan nama dan deskripsi gateway

  5. Dalam dialog Unduh dan mendaftarkan gateway data, salin GATEWAY REGISTRATION KEY ke clipboard.

    Mengunduh dan mendaftar gateway data

  6. Jika Anda belum mengunduh dan menginstal Microsoft Data Management Gateway, lalu klik Unduh gateway manajemen data. Langkah tersebut akan membawa Anda ke Pusat Unduhan Microsoft di mana Anda dapat memilih versi gateway yang Anda butuhkan, mengunduhnya, dan menginstalnya. Anda dapat menemukan informasi terperinci tentang prasyarat penginstalan, langkah-langkah penginstalan, dan tips pemecahan masalah di bagian awal artikel Memindahkan data antara sumber lokal dan cloud dengan Data Management Gateway.

  7. Setelah gateway diinstal, Data Management Gateway Configuration Manager akan terbuka dan dialog Daftarkan gateway ditampilkan. Tempelkan Kunci Pendaftaran Gateway yang Anda salin ke clipboard dan klik Daftar.

  8. Jika Anda sudah memiliki gateway yang terinstal, jalankan Data Management Gateway Configuration Manager. Klik Ubah kunci, tempelkan Kunci Pendaftaran Gateway yang Anda salin ke clipboard di langkah sebelumnya, dan klik OK.

  9. Setelah penginstalan selesai, dialog Daftarkan gateway untuk Microsoft Data Management Gateway Configuration Manager ditampilkan. Tempelkan KUNCI PENDAFTARAN GATEWAY yang Anda salin ke clipboard di langkah sebelumnya dan klik Daftar.

    Mendaftarkan gateway

  10. Konfigurasi gateway selesai saat nilai berikut diatur pada tab Beranda di Microsoft Data Management Gateway Configuration Manager:

    • Nama gateway dan Nama instance disetel ke nama gateway.

    • Pendaftaran diatur ke Terdaftar.

    • Status diatur ke Dimulai.

    • Bilah status di bagian bawah menampilkan Tersambung ke Data Management Gateway Cloud Service bersama dengan tanda centang hijau.

      Manajer Gateway Manajemen Data

      Azure Machine Learning Studio (klasik) juga akan diperbarui ketika pendaftaran berhasil.

    Pendaftaran gateway berhasil

  11. Dalam dialog Unduh dan daftarkan gateway data, klik tanda centang untuk menyelesaikan penyetelan. Halaman Pengaturan menampilkan status gateway sebagai "Online". Di panel kanan, Anda akan menemukan status dan informasi berguna lainnya.

    Pengaturan gateway

  12. Di Microsoft Data Management Gateway Configuration Manager beralih ke tab Sertifikat . Sertifikat yang ditentukan pada tab ini digunakan untuk mengenkripsi/mendekripsi kredensial untuk penyimpanan data lokal yang Anda tentukan di portal. Sertifikat ini adalah sertifikat default. Microsoft menyarankan agar Anda mengganti sertifikat dengan sertifikat Anda sendiri yang dicadangkan dalam sistem manajemen sertifikat Anda. Klik Ubah untuk menggunakan sertifikat Anda sendiri sebagai gantinya.

    Mengubah sertifikat gateway

  13. (opsional) Jika Anda ingin mengaktifkan pengelogan verbose untuk memecahkan masalah dengan gateway, di Microsoft Data Management Gateway Configuration Manager beralih ke tab Diagnostik dan centang opsi Aktifkan pengelogan verbose untuk tujuan pemecahan masalah . Informasi pengelogan dapat ditemukan di Penampil Peristiwa Windows di bawah node Log Aplikasi dan Layanan ->Gateway Manajemen Data . Anda juga dapat menggunakan tab Diagnostik untuk menguji koneksi ke sumber data lokal menggunakan gateway.

    Aktifkan pencatatan log terperinci

Ini menyelesaikan proses penyiapan gateway di Azure Machine Learning Studio (klasik). Anda sekarang siap untuk menggunakan data lokal Anda.

Anda dapat membuat dan menyiapkan beberapa gateway di Studio (klasik) untuk setiap ruang kerja. Misalnya, Anda mungkin memiliki gateway yang ingin Anda hubungkan ke sumber data pengujian selama pengembangan, dan gateway lain untuk sumber data produksi Anda. Azure Machine Learning Studio (klasik) memberi Anda fleksibilitas untuk menyiapkan beberapa gateway bergantung pada lingkungan perusahaan Anda. Saat ini Anda tidak dapat berbagi gateway antara ruang kerja dan hanya satu gateway yang dapat diinstal pada satu komputer. Untuk informasi selengkapnya, lihat Memindahkan data antara sumber lokal dan cloud dengan Gateway Manajemen Data.

Langkah 2: Gunakan gateway untuk membaca data dari sumber data lokal

Setelah menyiapkan gateway, Anda bisa menambahkan modul Impor Data ke eksperimen yang memasukkan data dari database SQL Server.

  1. Di Studio Pembelajaran Mesin (klasik), pilih tab EKSPERIMEN , klik +BARU di sudut kiri bawah, dan pilih Eksperimen Kosong (atau pilih salah satu dari beberapa eksperimen sampel yang tersedia).

  2. Temukan dan seret modul Impor Data ke kanvas eksperimen.

  3. Klik Simpan seperti di bawah kanvas. Masukkan "Machine Learning Studio (klasik) On-Premises SQL Server Tutorial" sebagai nama eksperimen, pilih ruang kerja, dan klik tanda centang OK.

    Simpan eksperimen dengan nama baru

  4. Klik modul Impor Data untuk memilihnya, lalu di panel Properti di sebelah kanan kanvas, pilih "Database SQL Lokal" di daftar dropdown Sumber data .

  5. Pilih Data Gateway yang Anda pasang dan daftarkan. Anda dapat mengatur gateway lain dengan memilih "(tambahkan Gateway Data baru...)".

    Pilih gateway data untuk modul Impor Data

  6. Masukkan nama server SQL Database dan Nama database, bersama dengan kueri SQL Database yang ingin Anda jalankan.

  7. Klik Masukkan nilai di bawah Nama pengguna dan kata sandi dan masukkan kredensial database Anda. Anda dapat menggunakan Windows Integrated Authentication atau SQL Server Authentication tergantung bagaimana SQL Server Anda dikonfigurasi.

    Masukkan kredensial database

    Pesan "nilai yang diperlukan" berubah menjadi "kumpulan nilai" dengan tanda centang hijau. Anda hanya perlu memasukkan kredensial sekali kecuali informasi database atau perubahan kata sandi. Azure Machine Learning Studio (klasik) menggunakan sertifikat yang Anda berikan saat memasang gateway untuk mengenkripsi info masuk di cloud. Azure tidak pernah menyimpan kredensial lokal tanpa enkripsi.

    Properti modul Impor Data

  8. Klik JALANKAN untuk menjalankan eksperimen.

Setelah eksperimen selesai berjalan, Anda dapat memvisualisasikan data yang Anda impor dari database dengan mengklik port output modul Impor Data dan memilih Visualisasikan.

Setelah selesai mengembangkan eksperimen, Anda dapat menyebarkan dan mengoperasionalkan model Anda. Menggunakan Layanan Eksekusi Batch, data dari database SQL Server yang dikonfigurasi dalam modul Impor Data akan dibaca dan digunakan untuk penilaian. Meskipun Anda bisa menggunakan Layanan Respons Permintaan untuk menilai data lokal, Microsoft merekomendasikan penggunaan Add-in Excel sebagai gantinya. Saat ini, menulis ke database SQL Server melalui Ekspor Data tidak didukung baik dalam eksperimen Anda atau layanan web yang diterbitkan.