Bagikan melalui


Impor dari Azure SQL Database

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Artikel ini menjelaskan cara menggunakan modul Impor Data di Pembelajaran Mesin Studio (klasik), untuk mendapatkan data dari Azure SQL Database atau SQL do Azure Data Warehouse.

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.

Untuk mengimpor data dari database, Anda harus menentukan nama server dan nama database, dan pernyataan SQL yang menentukan tabel, tampilan, atau kueri.

Secara umum, menyimpan data di database Azure lebih mahal daripada menggunakan tabel atau blob di Azure. Mungkin juga ada batasan jumlah data yang dapat Anda simpan dalam database, tergantung pada jenis langganan Anda. Namun, tidak ada biaya transaksi terhadap SQL Azure Database, sehingga opsi ini sangat ideal untuk akses cepat ke sejumlah kecil informasi yang sering digunakan, seperti tabel pencarian data atau kamus data.

Menyimpan data dalam database Azure juga lebih disukai jika Anda harus dapat memfilter data sebelum membacanya, atau jika Anda ingin menyimpan prediksi atau metrik kembali ke database untuk pelaporan.

Cara mengimpor data dari Azure SQL Database atau SQL Data Warehouse

Menggunakan Panduan Impor Data

Modul ini menampilkan panduan baru untuk membantu Anda memilih opsi penyimpanan, memilih dari antara langganan dan akun yang ada, dan dengan cepat mengonfigurasi semua opsi.

  1. Tambahkan modul Impor Data ke eksperimen Anda. Anda dapat menemukan modul di Studio (klasik), dalam kategori Input dan Output Data .

  2. Klik Luncurkan Panduan Data Impor dan ikuti petunjuknya.

  3. Ketika konfigurasi selesai, untuk benar-benar menyalin data ke dalam eksperimen Anda, klik kanan modul, dan pilih Jalankan Dipilih.

Jika Anda perlu mengedit koneksi data yang ada, wizard memuat semua detail konfigurasi sebelumnya sehingga Anda tidak perlu memulai lagi dari awal

Mengatur properti secara manual dalam modul Impor Data

Langkah-langkah berikut menjelaskan cara mengonfigurasi sumber impor secara manual.

  1. Tambahkan modul Impor Data ke eksperimen Anda. Anda dapat menemukan modul ini di Studio (klasik), dalam kategori Input dan Output Data .

  2. Untuk Sumber data, pilih Azure SQL Database.

  3. Tetapkan opsi berikut khusus untuk Azure SQL Database atau SQL do Azure Data Warehouse.

    Nama server database: Ketik nama server yang dihasilkan oleh Azure. Biasanya memiliki bentuk <generated_identifier>.database.windows.net.

    Nama database: Ketik nama database yang ada di server yang baru saja Anda tentukan.

    Nama akun pengguna server: Ketik nama pengguna akun yang memiliki izin akses untuk database.

    Kata sandi akun pengguna server: Berikan kata sandi untuk akun pengguna yang ditentukan.

    Kueri database: Ketik atau tempelkan pernyataan SQL yang menjelaskan data yang ingin Anda baca. Selalu validasi pernyataan SQL dan verifikasi hasil kueri sebelumnya, menggunakan alat seperti Visual Studio Server Explorer atau SQL Server Data Tools.

    Catatan

    Modul Impor Data hanya mendukung penginputan nama Database, nama akun pengguna, dan kata sandi sebagai kredensial.

  4. Jika himpunan data yang Anda baca Pembelajaran Mesin tidak diharapkan berubah di antara menjalankan eksperimen, pilih opsi Gunakan hasil cache.

    Ketika ini dipilih, jika tidak ada perubahan lain pada parameter modul, eksperimen memuat data saat pertama kali modul dijalankan, dan setelah itu menggunakan versi cache dari himpunan data.

    Jika Anda ingin memuat ulang himpunan data pada setiap iterasi eksperimen, batal pilih opsi ini. Himpunan data dimuat ulang dari sumber setiap kali parameter apa pun diubah di Data Impor.

  5. Jalankan eksperimen.

    Saat Impor Data memuat data ke Studio (klasik), beberapa konversi tipe implisit juga dapat dilakukan, tergantung pada tipe data yang digunakan dalam database sumber.

Hasil

Saat impor selesai, klik himpunan data output dan pilih Visualisasikan untuk melihat apakah data berhasil diimpor.

Secara opsional, Anda dapat mengubah himpunan data dan metadatanya menggunakan alat di Studio (klasik):

  • Gunakan Edit Metadata untuk mengubah nama kolom, mengonversi kolom ke tipe data yang berbeda, atau untuk menunjukkan kolom mana yang merupakan label atau fitur.

  • Gunakan Pilih Kolom dalam Himpunan Data untuk memilih subset kolom.

  • Gunakan Partisi dan Sampel untuk memisahkan himpunan data berdasarkan kriteria, atau dapatkan n baris teratas.

Contoh

Untuk contoh cara menggunakan data dari database Azure dalam pembelajaran mesin, lihat artikel dan eksperimen berikut:

Catatan teknis

Bagian ini berisi detail implementasi, tips, dan jawaban atas pertanyaan yang sering diajukan.

Pertanyaan umum

Bisakah saya memfilter data saat sedang dibaca dari sumbernya?

Modul Impor Data tidak mendukung pemfilteran saat data sedang dibaca. Sebaiknya buat tampilan atau tentukan kueri yang hanya menghasilkan baris yang Anda butuhkan.

Catatan

Jika Anda menemukan bahwa Anda telah memuat lebih banyak data daripada yang Anda butuhkan, Anda dapat menimpa himpunan data yang di-cache dengan membaca himpunan data baru, dan menyimpannya dengan nama yang sama dengan data yang lebih lama dan lebih besar.

Mengapa saya mendapatkan kesalahan, "Ketik Desimal tidak didukung"?

Saat membaca data dari database SQL, Anda mungkin menemukan pesan kesalahan yang melaporkan tipe data yang tidak didukung.

Jika data yang Anda dapatkan dari database SQL menyertakan tipe data yang tidak didukung dalam Pembelajaran Mesin, Anda harus mentransmisikan atau mengonversi desimal ke data yang didukung sebelum membaca data. Data Impor tidak dapat secara otomatis melakukan konversi apa pun yang akan mengakibatkan hilangnya presisi.

Untuk informasi selengkapnya tentang tipe data yang didukung, lihat Tipe Data Modul.

Apa yang terjadi jika database berada di wilayah geografis yang berbeda. Bisakah Impor Data masih mengakses database? Di mana data disimpan?

Jika database berada di wilayah yang berbeda dari akun pembelajaran mesin, akses data mungkin lebih lambat. Selanjutnya, Anda dikenakan biaya untuk masuknya data dan keluar pada langganan jika node komputasi berada di wilayah yang berbeda dari akun penyimpanan.

Data yang Anda baca ke ruang kerja untuk eksperimen disimpan di akun penyimpanan yang terkait dengan eksperimen.

Mengapa beberapa karakter tidak ditampilkan dengan benar?

Pembelajaran Mesin mendukung pengkodean UTF-8. Jika kolom string dalam database Anda menggunakan pengkodean yang berbeda, karakter mungkin tidak diimpor dengan benar.

Salah satu opsinya adalah mengekspor data ke file CSV di penyimpanan Azure, dan gunakan opsi CSV dengan pengkodean untuk menentukan parameter untuk pembatas kustom, halaman kode, dan sebagainya.

Parameter modul

Nama Rentang Jenis Default Deskripsi
Sumber data Daftar Sumber data atau sink Azure Blob Storage Sumber data dapat berupa HTTP, FTP, HTTPS anonim atau FTPS, file di penyimpanan Azure BLOB, tabel Azure, Azure SQL Database, database SQL Server lokal, tabel Hive, atau titik akhir OData.
HDFS server URI apa pun String tidak ada Titik akhir istirahat HDFS
Nama server database apa pun String tidak ada Nama akun penyimpanan Azure
Nama database apa pun SecureString tidak ada Kunci penyimpanan Azure
Nama akun pengguna server apa pun String tidak ada Nama kontainer Azure
Nama akun pengguna server Daftar (subset) Konten Url OData Tipe format data
Kueri database apa pun String tidak ada Tipe format data
Menggunakan hasil cache BENAR/SALAH Boolean FALSE deskripsi

Output

Nama Jenis Deskripsi
Kumpulan data hasil Tabel Data Himpunan data dengan data yang diunduh

Pengecualian

Pengecualian Deskripsi
Kesalahan 0027 Pengecualian terjadi ketika dua objek harus berukuran sama, tetapi tidak.
Kesalahan 0003 Pengecualian terjadi jika satu atau lebih input null atau kosong.
Kesalahan 0029 Pengecualian terjadi ketika URI yang tidak valid dilewatkan.
Kesalahan 0030 pengecualian terjadi ketika tidak mungkin mengunduh file.
Kesalahan 0002 Pengecualian terjadi jika satu atau beberapa parameter tidak dapat diurai atau dikonversi dari tipe yang ditentukan ke jenis yang diperlukan oleh metode target.
Kesalahan 0009 Pengecualian terjadi jika nama akun penyimpanan Azure atau nama kontainer ditentukan secara tidak benar.
Kesalahan 0048 Pengecualian terjadi ketika tidak mungkin untuk membuka file.
Kesalahan 0015 Pengecualian terjadi jika koneksi database gagal.
Kesalahan 0046 Pengecualian terjadi ketika tidak mungkin membuat direktori pada jalur tertentu.
Kesalahan 0049 Pengecualian terjadi ketika tidak mungkin mengurai file.

Untuk daftar kesalahan khusus untuk modul Studio (klasik), lihat Pembelajaran Mesin Kode kesalahan.

Untuk daftar pengecualian API, lihat Pembelajaran Mesin Kode Kesalahan REST API.

Lihat juga

Mengimpor data
Mengekspor data
Mengimpor dari URL Web melalui HTTP
Impor dari Hive Query
Impor dari Azure Table
Impor dari Azure Blob Storage
Impor dari Penyedia Umpan Data
Impor dari Database SQL Server Lokal