Konversi ke TSV

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Mengonversi input data ke format yang dibatasi tab

Kategori: Konversi Format Data

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.

Ringkasan Modul

Artikel ini menjelaskan cara menggunakan modul Konversi ke TSV di Pembelajaran Mesin Studio (klasik), untuk mengonversi himpunan data apa pun dari format internal yang digunakan oleh semua modul Pembelajaran Mesin Studio (klasik), ke file datar dalam format yang dipisahkan tab.

File tab-separated value (TSV) kompatibel dengan banyak alat eksternal, termasuk:

  • R dan Python

  • Excel dan PowerPivot

  • Semua database relasional

Misalnya, jika eksperimen Anda memiliki himpunan data perantara yang ingin Anda simpan untuk digunakan kembali di alat lain atau ingin menelepon dari kode, Anda mengonversinya ke format TSV, lalu klik kanan himpunan data yang dikonversi untuk mendapatkan kode Python yang diperlukan untuk mengakses himpunan data.

Cara menggunakan Konversi ke TSV

Gunakan modul Konversi ke TSV kapan pun Anda perlu mengunduh himpunan data dalam format yang dibatasi tab.

  1. Tambahkan Konversi ke TSV ke eksperimen Anda. Anda dapat menemukan modul ini dalam kategori Konversi Format Data di Pembelajaran Mesin Studio (klasik).

  2. Koneksi modul ke datset lain, atau ke modul yang mengeluarkan dataset tabular.

  3. Jalankan eksperimen, atau klik kanan hanya modul Konversi ke TSV , dan pilih Jalankan yang dipilih.

Hasil

Ketika konversi selesai, Anda dapat membuka himpunan data, menyebutnya dari kode R atau Python, menggunakannya di buku catatan Jupyter, atau menyimpannya ke file lokal.

Jika Anda ingin mengunduh himpunan data, klik dua kali output modul, dan tunjukkan apakah Anda ingin membuka atau menyimpan datset.

  • Jika Anda memilih Buka, himpunan data dimuat menggunakan alat apa pun yang digunakan komputer Anda secara default untuk membuka. File TSV. Biasanya ini Microsoft Excel.

  • Jika Anda memilih Unduh himpunan data, secara default, file disimpan dengan nama modul ditambah GUID yang mewakili ID ruang kerja. Namun, Anda dapat memilih opsi Simpan Sebagai selama pengunduhan dan ubah nama atau lokasi file.

Contoh

Meskipun tidak ada contoh yang spesifik untuk format ini, Anda dapat melihat contoh bagaimana konversi format digunakan dengan menjelajahi eksperimen sampel ini di Galeri AI Azure:

  • Validasi Silang untuk sampel Klasifikasi Biner: Mengekspor hasil validasi silang ke format nilai yang dipisahkan koma (CSV) sehingga hasil untuk beberapa model dapat dibandingkan dengan menggunakan alat seperti Excel.

  • Kuantisasi Kompresi Gambar Berbasis Warna: Mengekspor himpunan data yang digunakan untuk setiap bagian analisis ke file CSV, sehingga Anda dapat dengan mudah menjalankan model serupa dalam alat apa pun yang mendukung format CSV.

Catatan teknis

Bagian ini berisi detail implementasi, tips, dan jawaban atas pertanyaan yang sering diajukan.

Persyaratan format TSV

Tab-separated values (TSV) adalah format teks yang digunakan untuk menyimpan data dalam struktur tabular. Ini sangat mirip dengan format CSV, tetapi pembatas adalah tab daripada koma.

Format TSV adalah alternatif yang berguna untuk format CSV jika data Anda berisi koma. Koma sangat umum dalam data teks dan mereka digunakan dalam format angka Eropa.

Satu masalah dengan format yang dibatasi tab adalah bahwa perhentian tab sering dianggap sebagai spasi putih dalam teks yang tidak terstruktur. Namun, standar IANA untuk TSV mendorong penguraian file TSV yang bersih dan akurat dengan melarang tab dalam bidang.

Perhatikan persyaratan berikut untuk file TSV di Pembelajaran Mesin Studio (klasik):

  • Modul Konversi ke TSV mendukung output dari satu baris judul, jika himpunan data berisi nama kolom.

  • Penyedia TSV hanya mendukung pengkodean karakter UTF-8.

  • Saat membaca dari atau menulis ke file TSV, kinerja bisa lebih lambat dibandingkan dengan format lain (seperti CSV).

Input yang diharapkan

Nama Jenis Deskripsi
Himpunan Data Tabel Data Himpunan data input

Output

Nama Jenis Deskripsi
Kumpulan data hasil GenericTsv Himpunan data output

Lihat juga

Konversi Format Data
Daftar Modul A-Z