Sebelum anda membina model pengelasan kategori

Sebelum anda membina model klasifikasi kategori anda, pastikan data anda ada dan Microsoft Dataverse ia distrukturkan dalam format yang betul.

Prasyarat

  • Model ini memerlukan data latihan tersedia dalam Dataverse jadual. Sokongan untuk data daripada sumber luaran tidak tersedia pada masa ini.

  • Pastikan pentadbir anda telah memperuntukkan anda peranan keselamatan dengan keistimewaan Baca untuk jadual yang mempunyai data latihan.

  • Pastikan anda mempunyai keizinan yang sesuai untuk mencipta jadual dalam persekitaran anda Power Platform . Anda boleh menggunakan sama ada peranan keselamatan terbina dalam Penyesuai Sistem atau Pentadbir Sistem.

Bahasa yang Disokong

AI Builder Klasifikasi kategori menyokong bahasa berikut. Jika anda cuba mengklasifikasikan teks dalam bahasa lain, model anda mungkin tidak berfungsi dengan betul.

  • Inggeris
  • Perancis
  • Jerman
  • Itali
  • Sepanyol
  • Bahasa Portugis

Penyediaan data

Data latihan yang digunakan untuk melatih model daripada Dataverse jadual hendaklah mematuhi yang berikut:

  • Simpan teks dan tag sebagai dua lajur dalam jadual yang sama. Setiap baris mesti mempunyai data dalam lajur Teks .

  • Anda boleh menyediakan satu atau lebih teg kepada data dalam baris yang sama dalam lajur Teks . Anda juga boleh membiarkan lajur Tag kosong.

  • Jika anda telah mengenal pasti berbilang teg dalam sampel teks, berikan tag tersebut sebagai teks yang dibatasi dalam medan Teg. Pada masa ini, koma (,), titik koma (;) dan aksara tab disokong sebagai pemisah.

    Teks Tag
    Bilik yang bersih dan tenang dengan sarapan percuma untuk dibawa pulang Ruang makan
    Bilik kecil tetapi terancang dengan baik yang selesa Bilik
    Saya suka pemandangan dari tingkat 13 (tiada)
  • Pastikan anda mempunyai sekurang-kurangnya 10 sampel teks berbeza untuk setiap tag yang akan diekstrak. Tag dengan kurang daripada 10 sampel tidak akan dilatih. Dalam contoh sebelumnya, sepatutnya terdapat sekurang-kurangnya 10 baris setiap satu yang telah ditandakan dengan tag Makan dan Bilik .

  • Jika Bilik telah ditandakan dalam kurang daripada 10 baris dalam data, ia akan diabaikan. Model tidak akan dilatih untuk mengkategorikan data untuk tag tersebut.

  • Untuk setiap teg yang digunakan, sediakan sekurang-kurangnya 10 sampel teks yang tidak digunakan.

    Teks Tag
    Bilik yang bersih dan tenang dengan sarapan percuma untuk pergi Bilik
    Bilik kecil tetapi terancang dengan baik yang selesa Bilik
    (tiada) Bilik

    Jika semua baris dalam jadual ditag ke Bilik dan tiada baris—atau kurang daripada 10 baris—yang telah ditag ke label lain, model akan gagal dalam proses latihan.

  • Jadual mesti mempunyai sekurang-kurangnya dua tag dan setiap satu mesti mempunyai 10 sampel teks.

  • Anda boleh mentakrifkan sehingga 200 tag yang berbeza. Setiap tag ialah kategori yang akan dikenal pasti dan diekstrak daripada teks yang diberikan.

  • Setiap sampel data teks mesti mempunyai kurang daripada 5,000 aksara.

Jika anda tidak mempunyai data latihan dan ingin mencuba AI Builder klasifikasi kategori, ikut arahan ini untuk menggunakan data sampel.

Contoh format data latihan

Bahagian ini menyediakan contoh format data latihan dalam Dataverse jadual.

Lajur Jenis data Saiz
Komen Teks 3,000
Tag Teks 100



Komen Tag
Semasa penginapan saya, saya diabaikan sepenuhnya. Kakitangan gagal menangkap saya
Aspirasi dan mempunyai UTI. Saya juga menghidap radang paru-paru.
Penjagaan
Saya dilihat sejurus selepas tiba setiap kali dan semua kakitangan, jururawat, doktor,
Dan pakar bius sangat membantu. Nampaknya terdapat rasa kerja berpasukan yang baik.
Kakitangan, Daftar Masuk
Peralatan itu kelihatan terkini. Jururawat/pembantu penjagaan kesihatan kelihatan
Cukup prihatin.
Kemudahan, Kakitangan

Nota

Jika anda tidak mempunyai data latihan anda sendiri dan ingin mencuba AI Builder klasifikasi kategori, anda boleh bermula dengan memuat turun data sampel untuk model klasifikasi kategori. Maklumat lanjut: Gunakan data sampel untuk melakukan klasifikasi kategori

Import data anda ke dalam Dataverse

Oleh kerana data latihan untuk model klasifikasi kategori perlu tersedia sebagai Dataverse jadual, mari kita mulakan dengan menyediakan data dalam Dataverse jadual.

Dataverse Termasuk set penyambung yang berkuasa untuk membantu anda mengimport data daripada pelbagai sumber. Maklumat lanjut: Tambah data pada jadual dengan Microsoft Dataverse menggunakan Power Query.

Sebagai contoh, mari kita lihat cara mengimport data latihan daripada buku kerja Excel. Contoh ini menggunakan fail yang mengandungi perkara yang ditunjukkan dalam jadual berikut.

ID Tag Teks
1 Makan Sarapan pagi agak menyusahkan.
2 Ruang makan Bilik yang bersih dan tenang dengan sarapan percuma untuk dibawa pulang.
3 Bilik, Makan, Lokasi Kakitangan yang kami berurusan sangat mesra dan membantu. Lorong dan bilik kami bersih dan selesa. Sarapan pagi (termasuk) ialah muffin dan bagel.
4 Lokasi, Makan Kawasan sekitarnya penuh dengan bar dan restoran. 
5 Perkhidmatan Kakitangan menghormati.

Dalam contoh, tag dipisahkan dengan koma (,). Sebagai alternatif, anda boleh menggunakan titik koma (aksara ;) atau tab.

  1. Daftar masuk ke Power Apps.

  2. Pilih persekitaran yang anda mahu bekerja.

    Tangkapan skrin memilih persekitaran anda.

  3. Pilih Jadual Data>.

  4. Pilih jadual anda. Jika anda belum mempunyai jadual, ikut langkah dalam Buat jadual tersuai.

  5. Pilih Data>Dapatkan data>Dapatkan data daripada Excel daripada reben jadual yang dipilih.

    Tangkapan skrin menunjukkan Dapatkan data daripada Excel.

  6. Pada skrin Import data , pilih fail Excel yang mempunyai data yang dirujuk dalam bahagian Contoh format data latihan di awal topik ini dan kemudian pilih Muat naik.

    Tangkapan skrin memuat naik fail Excel.

  7. Untuk menyemak pemetaan medan pada skrin Pemetaan lajur untuk Kategori Teks , pilih Lajur Peta.

    Tangkapan skrin menunjukkan pemetaan Lajur untuk kategori teks.

    Bahagian kiri menyenaraikan semua lajur yang ditakrifkan dalam jadual. Senarai lungsur di sebelah kanan menunjukkan lajur yang tersedia dalam fail Excel.

    Petakan lajur Teg, Teks dan Id dari Excel ke lajur masing-masing dalam jadual.

  8. Selepas anda memetakan lajur, kembali ke langkah import dengan memilih Simpan perubahan di penjuru kanan sebelah atas.

    Tangkapan skrin menyimpan perubahan anda.

  9. Selepas anda melihat Status pemetaan sebagai berjaya, mulakan proses import dengan memilih Import di penjuru kanan sebelah atas.

    Tangkapan skrin memulakan proses import dengan memilih butang Import.

  10. Proses import mungkin mengambil masa beberapa minit bergantung pada volum data yang diimport. Selepas beberapa minit, muat semula tab Data jadual untuk mencari semua rekod yang diimport daripada fail Excel.

Anda kini bersedia untuk pergi ke langkah seterusnya.

Langkah seterusnya

Buat model klasifikasi kategori