Поделиться через


Использование таксономии хранилища терминов при создании средства извлечения в Microsoft Syntex

Область применения: ✓ Обработка неструктурированных документов



При создании средства извлечения в неструктурированной модели обработки документов с помощью Microsoft Syntex вы можете воспользоваться преимуществами глобальных наборов терминов в хранилище терминов для отображения предпочтительных терминов для извлекаемых данных.

В качестве примера модель определяет и классифицирует все документы контракта, отправленные в библиотеку документов. Кроме того, модель также извлекает значение службы контракта из каждого контракта и отображает его в столбце в представлении библиотеки. Среди различных значений служб контрактов есть несколько старых значений, которые компания больше не использует, и которые были переименованы. Например, все ссылки на значения служб контрактов Дизайн, Графика и Топография должны быть заменены ссылками на Творческая служба. Каждый раз, когда модель извлекает одно из устаревших терминов из контрактного документа, вы хотите, чтобы в представлении библиотеки отображалось текущее выражение — Creative. В следующем примере при обучении модели мы видим, что один пример документа содержит устаревший термин Конструктор.

Хранилище терминов.

Использование столбца управляемых метаданных в средстве извлечения

Наборы терминов настраиваются в хранилище терминов служб управляемых метаданных (MMS) в Центре администрирования SharePoint. В приведенном ниже примере набор терминовслужбы контрактов настроен для включения нескольких терминов, включая Creative. В сведениях указано, что термин имеет три синонима (Дизайн, Графика и Топография), которые должны быть преобразованы в Творческая служба.

Набор терминов.

Существует множество причин, по которым синонимы могут использоваться в наборе терминов. Например, имеются устаревшие либо переименованные термины или отделами организации используются различные вариации при именовании.

Чтобы поле управляемых метаданных можно было выбрать при создании средства извлечения в модели, нужно добавить его в качестве столбца сайта управляемых метаданных. После добавления столбец сайта можно выбрать при создании средства извлечения для модели.

Служба контрактов.

После применения модели к библиотеке документов при отправке документов в библиотеку в столбце Творческие службы будет отображаться предпочитаемый термин (Творческая служба), если средство извлечения найдет одно из значений синонимов (Дизайн, Графика или Топография).

Столбец службы контракта.

Примечание.

Если набор терминов открыт, все извлеченные значения, которые не соответствуют предпочтительному термину или значению синонима, будут добавлены в качестве нового термина в корень набора терминов. Эти новые термины можно переместить, объединить или сделать синонимами в хранилище терминов, где находится набор терминов.

См. также

Общие сведения об управляемых метаданных

Создание средства извлечения

Создание столбца управляемых метаданных