Bagikan melalui


Impor dari Database SQL Server Lokal

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Artikel ini menjelaskan cara menggunakan modul Impor Data di Pembelajaran Mesin Studio (klasik), untuk mengimpor data dari database SQL Server lokal ke dalam eksperimen pembelajaran mesin.

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.

Pembelajaran Mesin dapat mengakses database SQL Server lokal jika data disediakan menggunakan Microsoft Tiedonhallinta Gateway. Oleh karena itu, sebelum Anda menggunakan Data Impor, Anda harus memenuhi persyaratan berikut:

Setelah koneksi gateway dibuat, Anda kemudian dapat menentukan properti tambahan, seperti nama server dan database, metode otentikasi, dan kueri database.

Cara menginstal Microsoft Tiedonhallinta Gateway

Untuk mengakses database SQL Server lokal di Pembelajaran Mesin, Anda perlu mengunduh dan menginstal Microsoft Tiedonhallinta Gateway, lalu mendaftarkan gateway di Pembelajaran Mesin Studio (klasik).

Untuk detail tentang menginstal dan mendaftarkan gateway, lihat artikel berikut:

Cara mengimpor data dari database SQL Server lokal

Setelah Gateway Tiedonhallinta diinstal di komputer di mana ia dapat mengakses database SQL Server Anda, dan Anda telah mendaftarkan gateway di Pembelajaran Mesin Studio (klasik), Anda harus mengonfigurasi modul Impor Data.

Sebelum Anda mulai, nonaktifkan pemblokir pop-up browser Anda untuk situs, studio.azureml.net.

Jika Anda menggunakan browser Google Chrome, Anda harus mengunduh dan menginstal salah satu plug-in yang tersedia di Google Chrome WebStore: Klik Ekstensi Aplikasi Sekali.

Menggunakan Panduan Impor Data

Modul ini menampilkan panduan baru untuk membantu Anda memilih opsi penyimpanan, memilih dari antara langganan dan akun yang ada, dan dengan cepat mengonfigurasi semua opsi.

  1. Tambahkan modul Impor Data ke eksperimen Anda. Anda dapat menemukan modul di Studio (klasik), dalam kategori Input dan Output Data .

  2. Klik Luncurkan Panduan Data Impor dan ikuti petunjuknya.

  3. Ketika konfigurasi selesai, untuk benar-benar menyalin data ke dalam eksperimen Anda, klik kanan modul, dan pilih Jalankan Dipilih.

Jika Anda perlu mengedit koneksi data yang ada, wizard memuat semua detail konfigurasi sebelumnya sehingga Anda tidak perlu memulai lagi dari awal.

Mengatur properti secara manual dalam modul Impor Data

  1. Tambahkan modul Impor Data ke eksperimen Anda. Anda dapat menemukan modul di Studio (klasik), dalam kategori Input dan Output Data .

  2. Untuk Sumber data, pilih SQL Database Lokal.

  3. Atur opsi berikut khusus untuk database SQL Server.

    • Gateway data: Pilih gateway yang Anda buat. Gateway harus terdaftar atau tidak ditampilkan dalam daftar.

    • Nama server database: Ketik nama instans SQL Server.

    • Nama database: Ketik nama database.

    • Klik Masukkan nilai di bagian Nama pengguna dan kata sandi dan masukkan kredensial database Anda. Anda dapat menggunakan Autentikasi Terintegrasi Windows atau Autentikasi SQL Server tergantung pada bagaimana SQL Server lokal Anda dikonfigurasi.

      Penting

      Manajer kredensial harus diluncurkan dari dalam jaringan yang sama dengan instans SQL Server dan klien gateway. Kredensial tidak dapat diteruskan di seluruh domain.

    • Ketik atau tempelkan ke kueri Database pernyataan SQL yang menjelaskan data yang ingin Anda baca. Selalu validasi pernyataan SQL dan verifikasi hasil kueri sebelumnya, menggunakan alat seperti Visual Studio Server Explorer atau SQL Server Data Tools.

    • Jika himpunan data tidak diharapkan berubah di antara menjalankan eksperimen, pilih opsi Gunakan hasil cache . Ketika ini dipilih, jika tidak ada perubahan lain pada parameter modul, eksperimen akan memuat data saat pertama kali modul dijalankan, dan setelah itu menggunakan versi cache dari himpunan data.

  4. Jalankan eksperimen.

Hasil

Saat Impor Data memuat data ke Studio (klasik), beberapa konversi tipe implisit mungkin dilakukan, tergantung pada tipe data yang digunakan dalam database sumber. Untuk informasi selengkapnya tentang tipe data, lihat Tipe Data Modul.

Setelah selesai, klik himpunan data output dan pilih Visualisasikan untuk melihat apakah data berhasil diimpor.

Secara opsional, Anda dapat mengubah himpunan data dan metadatanya menggunakan alat di Studio (klasik):

  • Gunakan Edit Metadata untuk mengubah nama kolom, mengonversi kolom ke tipe data yang berbeda, atau untuk menunjukkan kolom mana yang merupakan label atau fitur.

  • Gunakan Pilih Kolom dalam Himpunan Data untuk memilih subset kolom.

  • Gunakan Partisi dan Sampel untuk memisahkan himpunan data berdasarkan kriteria, atau dapatkan n baris teratas.

Catatan teknis

Bagian ini berisi detail implementasi, tips, dan jawaban atas pertanyaan yang sering diajukan.

Pertanyaan umum

Bisakah saya memfilter data saat sedang dibaca dari sumbernya?

Modul Impor Data itu sendiri tidak mendukung pemfilteran saat data sedang dibaca. Sebaiknya buat tampilan atau tentukan kueri yang hanya menghasilkan baris yang Anda butuhkan.

Catatan

Jika Anda menemukan bahwa Anda telah memuat lebih banyak data daripada yang Anda butuhkan, Anda dapat menimpa himpunan data yang di-cache dengan membaca himpunan data baru, dan menyimpannya dengan nama yang sama dengan data yang lebih lama dan lebih besar.

Mengapa saya mendapatkan kesalahan, "Ketik Desimal tidak didukung"

Saat membaca data dari database SQL, Anda mungkin menemukan pesan kesalahan yang melaporkan tipe data yang tidak didukung.

Jika data yang Anda dapatkan dari database SQL menyertakan tipe data yang tidak didukung dalam Pembelajaran Mesin, Anda harus mentransmisikan atau mengonversi desimal ke tipe data yang didukung sebelum membaca data. Alasannya adalah bahwa Data Impor tidak dapat secara otomatis melakukan konversi apa pun yang akan mengakibatkan hilangnya presisi.

Mengapa beberapa karakter tidak ditampilkan dengan benar

Pembelajaran Mesin mendukung pengkodean UTF-8. Jika kolom string dalam database Anda menggunakan pengkodean yang berbeda, karakter mungkin tidak diimpor dengan benar.

Salah satu opsi untuk melestarikan karakter ini adalah mengekspor data ke file CSV di penyimpanan Azure, dan menggunakan opsi CSV dengan pengkodean untuk menentukan parameter untuk pembatas khusus, halaman kode, dan sebagainya.

Saya menyiapkan Gateway Tiedonhallinta di server lokal saya. Bisakah saya berbagi gateway yang sama antar ruang kerja

Nomor. Anda harus membuat gateway terpisah untuk setiap ruang kerja.

Meskipun Anda dapat menyiapkan beberapa Gateway Tiedonhallinta dalam satu ruang kerja (misalnya, masing-masing untuk pengembangan, pengujian, produksi, dll.), Gateway tidak dapat dibagikan di seluruh ruang kerja.

Saya telah menyiapkan Gateway Tiedonhallinta di server lokal saya yang saya gunakan untuk Power BI atau Azure Data Factory dan ingin menggunakan gateway yang sama untuk Pembelajaran Mesin

Setiap layanan memerlukan Gateway Tiedonhallinta terpisah. Jika Anda sudah memiliki gateway yang digunakan untuk Power BI atau Azure Data Factory, Anda harus menyiapkan server terpisah dan menginstal gateway untuk pembelajaran mesin.

Anda tidak dapat menginstal beberapa gateway di satu server.

Saya ingin dapat mengekspor data ke server SQL lokal saya. Dapatkah saya menggunakan gateway dengan modul Export Data untuk menulis data ke server SQL lokal saya?

Saat ini, Pembelajaran Mesin hanya mendukung pengimporan data. Kami sedang mengevaluasi apakah Anda akan dapat menulis ke database lokal Anda di masa mendatang. Sementara itu, Anda dapat menggunakan Azure Data Factory untuk menyalin data dari cloud ke database lokal Anda.

Saya memiliki sumber data yang tidak Microsoft SQL Server (Oracle, Teradata, dll.). Bisakah saya membaca data di Pembelajaran Mesin menggunakan opsi lokal di modul Impor Data?

Saat ini modul Data Impor Pembelajaran Mesin hanya mendukung Microsoft SQL Server.

Sebagai solusinya, Anda dapat menggunakan Azure Data Factory untuk menyalin data lokal Anda ke penyimpanan cloud seperti Azure Blob Storage atau Azure Database, lalu menggunakan sumber data cloud Anda di modul Impor Data.

Parameter modul

Nama Rentang Jenis Default Deskripsi
Sumber data Daftar Sumber data atau sink Azure Blob Storage Sumber data dapat berupa HTTP, FTP, HTTPS anonim atau FTPS, file di penyimpanan Azure BLOB, tabel Azure, Azure SQL Database, database SQL Server lokal, tabel Hive, atau titik akhir OData.
Gateway data apa pun DataGatewayName tidak ada Nama gateway data
Nama server database apa pun String tidak ada SQL Server lokal
Nama database apa pun String tidak ada Instans database SQL Server lokal
Nama pengguna dan kata sandi apa pun SecureString tidak ada Nama pengguna dan kata sandi
Kueri database apa pun StreamReader tidak ada Kueri SQL lokal

Output

Nama Jenis Deskripsi
Kumpulan data hasil Tabel Data Himpunan data dengan data yang diunduh

Pengecualian

Pengecualian Deskripsi
Kesalahan 0027 Pengecualian terjadi ketika dua objek harus berukuran sama, tetapi tidak.
Kesalahan 0003 Pengecualian terjadi jika satu atau lebih input null atau kosong.
Kesalahan 0029 Pengecualian terjadi ketika URI yang tidak valid dilewatkan.
Kesalahan 0030 pengecualian terjadi ketika tidak mungkin mengunduh file.
Kesalahan 0002 Pengecualian terjadi jika satu atau beberapa parameter tidak dapat diurai atau dikonversi dari tipe yang ditentukan ke jenis yang diperlukan oleh metode target.
Kesalahan 0048 Pengecualian terjadi ketika tidak mungkin untuk membuka file.
Kesalahan 0015 Pengecualian terjadi jika koneksi database gagal.
Kesalahan 0046 Pengecualian terjadi ketika tidak mungkin membuat direktori pada jalur tertentu.
Kesalahan 0049 Pengecualian terjadi ketika tidak mungkin mengurai file.

Untuk daftar kesalahan khusus untuk modul Studio (klasik), lihat Pembelajaran Mesin Kode kesalahan.

Untuk daftar pengecualian API, lihat Pembelajaran Mesin Kode Kesalahan REST API.

Lihat juga

Mengimpor data
Mengekspor data
Mengimpor dari URL Web melalui HTTP
Impor dari Hive Query
Impor dari Azure SQL Database
Impor dari Azure Table
Impor dari Azure Blob Storage
Impor dari Penyedia Umpan Data