Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Penting
Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.
Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.
- Lihat informasi tentang memindahkan proyek pembelajaran mesin dari ML Studio (klasik) ke Azure Machine Learning.
- Mer informasjon tentang Azure Machine Learning.
ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.
Artikel ini menjelaskan cara menggunakan modul Impor Data di Pembelajaran Mesin Studio (klasik), untuk mendapatkan data dari Azure SQL Database atau SQL do Azure Data Warehouse.
Catatan
Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja
Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.
Untuk mengimpor data dari database, Anda harus menentukan nama server dan nama database, dan pernyataan SQL yang menentukan tabel, tampilan, atau kueri.
Secara umum, menyimpan data di database Azure lebih mahal daripada menggunakan tabel atau blob di Azure. Mungkin juga ada batasan jumlah data yang dapat Anda simpan dalam database, tergantung pada jenis langganan Anda. Namun, tidak ada biaya transaksi terhadap SQL Azure Database, sehingga opsi ini sangat ideal untuk akses cepat ke sejumlah kecil informasi yang sering digunakan, seperti tabel pencarian data atau kamus data.
Menyimpan data dalam database Azure juga lebih disukai jika Anda harus dapat memfilter data sebelum membacanya, atau jika Anda ingin menyimpan prediksi atau metrik kembali ke database untuk pelaporan.
Cara mengimpor data dari Azure SQL Database atau SQL Data Warehouse
Menggunakan Panduan Impor Data
Modul ini menampilkan panduan baru untuk membantu Anda memilih opsi penyimpanan, memilih dari antara langganan dan akun yang ada, dan dengan cepat mengonfigurasi semua opsi.
Tambahkan modul Impor Data ke eksperimen Anda. Anda dapat menemukan modul di Studio (klasik), dalam kategori Input dan Output Data .
Klik Luncurkan Panduan Data Impor dan ikuti petunjuknya.
Ketika konfigurasi selesai, untuk benar-benar menyalin data ke dalam eksperimen Anda, klik kanan modul, dan pilih Jalankan Dipilih.
Jika Anda perlu mengedit koneksi data yang ada, wizard memuat semua detail konfigurasi sebelumnya sehingga Anda tidak perlu memulai lagi dari awal
Mengatur properti secara manual dalam modul Impor Data
Langkah-langkah berikut menjelaskan cara mengonfigurasi sumber impor secara manual.
Tambahkan modul Impor Data ke eksperimen Anda. Anda dapat menemukan modul ini di Studio (klasik), dalam kategori Input dan Output Data .
Untuk Sumber data, pilih Azure SQL Database.
Tetapkan opsi berikut khusus untuk Azure SQL Database atau SQL do Azure Data Warehouse.
Nama server database: Ketik nama server yang dihasilkan oleh Azure. Biasanya memiliki bentuk
<generated_identifier>.database.windows.net.Nama database: Ketik nama database yang ada di server yang baru saja Anda tentukan.
Nama akun pengguna server: Ketik nama pengguna akun yang memiliki izin akses untuk database.
Kata sandi akun pengguna server: Berikan kata sandi untuk akun pengguna yang ditentukan.
Kueri database: Ketik atau tempelkan pernyataan SQL yang menjelaskan data yang ingin Anda baca. Selalu validasi pernyataan SQL dan verifikasi hasil kueri sebelumnya, menggunakan alat seperti Visual Studio Server Explorer atau SQL Server Data Tools.
Catatan
Modul Impor Data hanya mendukung penginputan nama Database, nama akun pengguna, dan kata sandi sebagai kredensial.
Jika himpunan data yang Anda baca Pembelajaran Mesin tidak diharapkan berubah di antara menjalankan eksperimen, pilih opsi Gunakan hasil cache.
Ketika ini dipilih, jika tidak ada perubahan lain pada parameter modul, eksperimen memuat data saat pertama kali modul dijalankan, dan setelah itu menggunakan versi cache dari himpunan data.
Jika Anda ingin memuat ulang himpunan data pada setiap iterasi eksperimen, batal pilih opsi ini. Himpunan data dimuat ulang dari sumber setiap kali parameter apa pun diubah di Data Impor.
Jalankan eksperimen.
Saat Impor Data memuat data ke Studio (klasik), beberapa konversi tipe implisit juga dapat dilakukan, tergantung pada tipe data yang digunakan dalam database sumber.
Hasil
Saat impor selesai, klik himpunan data output dan pilih Visualisasikan untuk melihat apakah data berhasil diimpor.
Secara opsional, Anda dapat mengubah himpunan data dan metadatanya menggunakan alat di Studio (klasik):
Gunakan Edit Metadata untuk mengubah nama kolom, mengonversi kolom ke tipe data yang berbeda, atau untuk menunjukkan kolom mana yang merupakan label atau fitur.
Gunakan Pilih Kolom dalam Himpunan Data untuk memilih subset kolom.
Gunakan Partisi dan Sampel untuk memisahkan himpunan data berdasarkan kriteria, atau dapatkan n baris teratas.
Contoh
Untuk contoh cara menggunakan data dari database Azure dalam pembelajaran mesin, lihat artikel dan eksperimen berikut:
Perkiraan Ritel Langkah 1 dari 6 - praproses data: Template peramalan Ritel menggambarkan skenario khas yang menggunakan data yang disimpan di Azure SQLDB untuk analisis.
Ini juga menunjukkan beberapa teknik yang berguna, seperti menggunakan Azure SQLDB untuk meneruskan himpunan data antara eksperimen di akun yang berbeda, menyimpan dan menggabungkan perkiraan, dan cara membuat Azure SQLDB untuk pembelajaran mesin.
Gunakan Pembelajaran Mesin dengan SQL Data Warehouse: Artikel ini menunjukkan cara membuat model regresi untuk memprediksi harga menggunakan SQL do Azure Data Warehouse.
Cara menggunakan Azure ML dengan SQL do Azure Data Warehouse: Artikel ini membuat model pengelompokan di AdventureWorks, menggunakan Data Impor dan Mengekspor Data dengan SQL do Azure Data Warehouse.
Catatan teknis
Bagian ini berisi detail implementasi, tips, dan jawaban atas pertanyaan yang sering diajukan.
Pertanyaan umum
Bisakah saya memfilter data saat sedang dibaca dari sumbernya?
Modul Impor Data tidak mendukung pemfilteran saat data sedang dibaca. Sebaiknya buat tampilan atau tentukan kueri yang hanya menghasilkan baris yang Anda butuhkan.
Catatan
Jika Anda menemukan bahwa Anda telah memuat lebih banyak data daripada yang Anda butuhkan, Anda dapat menimpa himpunan data yang di-cache dengan membaca himpunan data baru, dan menyimpannya dengan nama yang sama dengan data yang lebih lama dan lebih besar.
Mengapa saya mendapatkan kesalahan, "Ketik Desimal tidak didukung"?
Saat membaca data dari database SQL, Anda mungkin menemukan pesan kesalahan yang melaporkan tipe data yang tidak didukung.
Jika data yang Anda dapatkan dari database SQL menyertakan tipe data yang tidak didukung dalam Pembelajaran Mesin, Anda harus mentransmisikan atau mengonversi desimal ke data yang didukung sebelum membaca data. Data Impor tidak dapat secara otomatis melakukan konversi apa pun yang akan mengakibatkan hilangnya presisi.
Untuk informasi selengkapnya tentang tipe data yang didukung, lihat Tipe Data Modul.
Apa yang terjadi jika database berada di wilayah geografis yang berbeda. Bisakah Impor Data masih mengakses database? Di mana data disimpan?
Jika database berada di wilayah yang berbeda dari akun pembelajaran mesin, akses data mungkin lebih lambat. Selanjutnya, Anda dikenakan biaya untuk masuknya data dan keluar pada langganan jika node komputasi berada di wilayah yang berbeda dari akun penyimpanan.
Data yang Anda baca ke ruang kerja untuk eksperimen disimpan di akun penyimpanan yang terkait dengan eksperimen.
Mengapa beberapa karakter tidak ditampilkan dengan benar?
Pembelajaran Mesin mendukung pengkodean UTF-8. Jika kolom string dalam database Anda menggunakan pengkodean yang berbeda, karakter mungkin tidak diimpor dengan benar.
Salah satu opsinya adalah mengekspor data ke file CSV di penyimpanan Azure, dan gunakan opsi CSV dengan pengkodean untuk menentukan parameter untuk pembatas kustom, halaman kode, dan sebagainya.
Parameter modul
| Nama | Rentang | Jenis | Default | Deskripsi |
|---|---|---|---|---|
| Sumber data | Daftar | Sumber data atau sink | Azure Blob Storage | Sumber data dapat berupa HTTP, FTP, HTTPS anonim atau FTPS, file di penyimpanan Azure BLOB, tabel Azure, Azure SQL Database, database SQL Server lokal, tabel Hive, atau titik akhir OData. |
| HDFS server URI | apa pun | String | tidak ada | Titik akhir istirahat HDFS |
| Nama server database | apa pun | String | tidak ada | Nama akun penyimpanan Azure |
| Nama database | apa pun | SecureString | tidak ada | Kunci penyimpanan Azure |
| Nama akun pengguna server | apa pun | String | tidak ada | Nama kontainer Azure |
| Nama akun pengguna server | Daftar (subset) | Konten Url | OData | Tipe format data |
| Kueri database | apa pun | String | tidak ada | Tipe format data |
| Menggunakan hasil cache | BENAR/SALAH | Boolean | FALSE | deskripsi |
Output
| Nama | Jenis | Deskripsi |
|---|---|---|
| Kumpulan data hasil | Tabel Data | Himpunan data dengan data yang diunduh |
Pengecualian
| Pengecualian | Deskripsi |
|---|---|
| Kesalahan 0027 | Pengecualian terjadi ketika dua objek harus berukuran sama, tetapi tidak. |
| Kesalahan 0003 | Pengecualian terjadi jika satu atau lebih input null atau kosong. |
| Kesalahan 0029 | Pengecualian terjadi ketika URI yang tidak valid dilewatkan. |
| Kesalahan 0030 | pengecualian terjadi ketika tidak mungkin mengunduh file. |
| Kesalahan 0002 | Pengecualian terjadi jika satu atau beberapa parameter tidak dapat diurai atau dikonversi dari tipe yang ditentukan ke jenis yang diperlukan oleh metode target. |
| Kesalahan 0009 | Pengecualian terjadi jika nama akun penyimpanan Azure atau nama kontainer ditentukan secara tidak benar. |
| Kesalahan 0048 | Pengecualian terjadi ketika tidak mungkin untuk membuka file. |
| Kesalahan 0015 | Pengecualian terjadi jika koneksi database gagal. |
| Kesalahan 0046 | Pengecualian terjadi ketika tidak mungkin membuat direktori pada jalur tertentu. |
| Kesalahan 0049 | Pengecualian terjadi ketika tidak mungkin mengurai file. |
Untuk daftar kesalahan khusus untuk modul Studio (klasik), lihat Pembelajaran Mesin Kode kesalahan.
Untuk daftar pengecualian API, lihat Pembelajaran Mesin Kode Kesalahan REST API.
Lihat juga
Mengimpor data
Mengekspor data
Mengimpor dari URL Web melalui HTTP
Impor dari Hive Query
Impor dari Azure Table
Impor dari Azure Blob Storage
Impor dari Penyedia Umpan Data
Impor dari Database SQL Server Lokal