Преди да създадете модел за класификация по категории
Преди да изградите своя модел за класификация на категориите, уверете се, че данните ви са в Microsoft Dataverse и са структурирани в правилния формат.
Предварителни изисквания
Този модел изисква данните за обучението да бъдат налични в таблица Dataverse . Поддръжка за данни от външни източници в момента не е налична.
Уверете се, че вашият администратор ви е назначил права за достъп с привилегия за четене за таблицата, която съдържа данните за обучение.
Уверете се, че имате подходящи разрешения за създаване на таблици във вашата Power Platform среда. Можете да използвате вградените права за достъп на System Customizer или System Administrator.
Поддържани езици
AI Builder Класификацията на категориите поддържа следните езици. Ако се опитате да класифицирате текст на други езици, вашият модел може да не работи правилно.
- English
- Френски
- Немски
- Италиански
- Испански
- Португалски
Подготовка на данни
Данните от обучението, използвани за обучение на модела от таблицата Dataverse , трябва да отговарят на следното:
Съхраняване на текст и етикети като две колони в една и съща таблица. Всеки ред трябва да има данни в колоната Текст .
Можете да предоставите един или повече етикети на данни в един и същ ред в колоната Текст . Можете също да оставите колоната Етикети празна.
Ако сте идентифицирали няколко етикета в текстовата извадка, предоставете ги като текст с разделители в полетата Етикети . В момента се поддържат разделители на запетаи (,), точка и запетая (;) и знаци за табулация.
Текстово съобщение Етикети Страхотна чиста и тиха стая с безплатна закуска Трапезария Малка, но добре организирана стая, която беше удобна Зала Обичам гледката от 13-ия етаж (няма) Уверете се, че имате минимум 10 отделни текстови проби за всеки етикет, който трябва да бъде извлечен. Етикети с по-малко от 10 проби няма да бъдат обучавани. В предишния пример трябваше да има минимум 10 реда всеки, които са маркирани с етикетите за трапезария и стая .
Ако Room е маркирана в по-малко от 10 реда в данните, тя ще бъде игнорирана. Моделът няма да бъде обучен да категоризира данните за този етикет.
За всеки таг, който се използва, предоставете минимум 10 текстови примера, където не се използва.
Текстово съобщение Етикети Страхотна чиста и тиха стая с безплатна закуска Зала Малка, но добре организирана стая, която беше удобна Зала (няма) Зала Ако всички редове в таблицата са маркирани в Room и няма редове – или по-малко от 10 реда – които са маркирани с друг етикет, моделът ще се провали в процеса на обучение.
Една таблица трябва да има поне два етикета и всеки от тях трябва да има 10 текстови образеца.
Можете да дефинирате до 200 различни етикета. Всеки таг е категория, която ще бъде идентифицирана и извлечена от дадения текст.
Всяка извадка от текстови данни трябва да има по-малко от 5000 знака.
Ако нямате данни за обучение и искате да опитате AI Builder класификация на категориите, следвайте тези инструкции , за да използвате примерни данни.
Примери за формат на данните за обучението
Този раздел предоставя примери за формата на данните за обучение в Dataverse таблица.
Колони | Тип на данни | Размер |
---|---|---|
Коментари | Текстово съобщение | 3,000 |
Етикети | Текстово съобщение | 100 |
Коментари | Етикети |
---|---|
По време на престоя си бях напълно игнориран. Персоналът не успя да ме вдигне аспириране и наличие на UTI. Аз също имах пневмония. |
Грижа |
Виждаха ме много скоро след пристигането всеки път и целият персонал, медицинска сестра, лекар, Анестезиологът беше много полезен. Изглежда, че има добро чувство за работа в екип. |
Персонал, Настаняване |
Оборудването изглеждаше актуално. Медицинската сестра / здравният асистент изглеждаше Доста грижовно. |
Съоръжения, Персонал |
Бележка
Ако нямате собствени данни за обучение и искате да опитате AI Builder класификация на категориите, можете да започнете, като изтеглите примерни данни за модела за класификация на категориите. Повече информация:Използвайте примерни данни, за да направите класификация на категориите
Импортиране на вашите данни в Dataverse
Тъй като данните за обучение за модел за класификация на категориите трябва да бъдат налични като Dataverse таблица, нека започнем с подготовката на данните в Dataverse таблицата.
Dataverse включва мощен набор от конектори, които ви помагат да импортирате данни от много източници. Повече информация: Добавяне на данни към таблица в Microsoft Dataverse чрез използване Power Query.
Като пример, нека разгледаме как да импортирате данни за обучение от работна книга на Excel. Този пример използва файл, съдържащ това, което е показано в следващата таблица.
ИД | Етикети | Текстово съобщение |
---|---|---|
1 | Хранене | Закуската беше малко кавга. |
2 | Трапезария | Страхотна чиста и тиха стая с безплатна закуска. |
3 | Стая, Трапезария, Местоположение | Персоналът, с който се занимавахме, беше много любезен и отзивчив. Коридорите и стаята ни бяха чисти и удобни. Закуската (включена) беше кифли и гевреци. |
4 | Местоположение, Хранене | Околността е пълна с барове и ресторанти. |
5 | Service | Персоналът беше уважителен. |
В примера таговете са разделени със запетая (,). Като алтернатива можете да използвате точка и запетая (знак ;) или табулация.
Влезте в Power Apps.
Изберете средата, в която искате да работите.
Изберете Таблици с> данни.
Изберете вашата таблица. Ако все още нямате таблица, следвайте стъпките в Създаване на таблица по избор.
Изберете Данни >Получаване на данни>Получаване на данни от Excel от лентата на избраната таблица.
На екрана Импортиране на данни изберете файла на Excel, съдържащ данните, посочени в раздела Примери за формат на данни за обучение по-горе в тази тема, и след това изберете Качване.
За да прегледате съпоставянията на полета в екрана Съпоставяния на колони за категория на текст , изберете Нанесени колони.
Вляво са изброени всички колони, дефинирани в таблицата. Падащият списък вдясно показва колоните, налични във файла на Excel.
Нанесете колоните " Етикети", "Текст" и "ИД " от Excel в съответните колони в таблицата.
След като нанесете колоните, върнете се към стъпката за импортиране, като изберете Запиши промените в горния десен ъгъл.
След като видите състоянието на съпоставяне като успешно, започнете процеса на импортиране, като изберете Импортиране в горния десен ъгъл.
Процесът на импортиране може да отнеме няколко минути в зависимост от обема на импортираните данни. След няколко минути обновете раздела Данни на таблицата, за да намерите всички записи, импортирани от файла на Excel.
Вече сте готови да преминете към следващата стъпка.