Обнаружение и редактирование личных сведений в беседах
Признак личных сведений в беседах может оценивать беседы для извлечения конфиденциальной информации (личных сведений) в содержимом по нескольким предварительно определенным категориям и редактировать их. Этот API работает с транскрибированным текстом (на который ссылается расшифровка) и чатами. Для расшифровок API также обеспечивает повторение аудиосегментов, содержащих личные сведения, предоставляя данные о времени произнесения этих аудиосегментов.
Определение способа обработки данных (необязательно)
Указание модели обнаружения персональных данных
По умолчанию эта функция использует последнюю доступную модель ИИ при работе с входными данными. Вы также можете настроить запросы API для использования определенной версии модели.
Поддержка языков
В настоящее время предварительная версия API личных сведений в беседах поддерживает только английский язык.
Поддержка регионов
В настоящее время предварительная версия API личных сведений в беседах доступна для всех регионов Azure, поддерживаемых языковой службой.
Отправка данных
Примечание
Сведения о форматировании текста беседы для отправки с помощью Language Studio см. в статье Language Studio.
Входные данные можно отправить в API в виде списка элементов беседы. Анализ выполняется при получении запроса. Так как этот API является асинхронным, может возникать задержка между отправкой запросов к API и получением результатов. Сведения о размере и числе запросов, которые можно отправлять в минуту и секунду, см. в разделе об ограничениях данных ниже.
При использовании асинхронного признака результаты API доступны в течение 24 часов с момента приема запроса и указываются в ответе. По истечении этого периода результаты очищаются и больше не будут доступны для извлечения.
При отправке данных в личные сведения беседы можно отправлять по одной беседе (в форме чате или в устной форме) в каждом запросе.
API будет пытаться обнаружить указанные категории сущностей для соответствующих входных данных беседы. Если необходимо указать, какие сущности будут обнаружены и возвращены, используйте необязательный параметр piiCategories
с соответствующими категориями сущностей.
Для речевых расшифровок обнаруженные сущности будут возвращены по указанному значению параметра redactionSource
. В настоящее время поддерживаются text
значения redactionSource
, lexical
, itn
и maskedItn
(которые сопоставляются с текстом в формате , itn
lexical
и maskedItn
REST API display
\displayText
текста соответственно). Кроме того, для голосовых входных данных расшифровки этот API также предоставит информацию о тайминге аудиозаписи, чтобы расширить возможности редактирования аудиозаписи. Для использования функции audioRedaction используйте необязательный includeAudioRedaction
флаг со значением true
. Изменение звука выполняется на основе лексического формата ввода.
Примечание
Личные сведения беседы теперь поддерживают 40 000 символов в качестве размера документа.
Получение обнаруженных персональных данных
При получении результатов от функции распознавания персональных данных можно передать результаты в приложение в потоке или сохранить выходные данные в файл в локальной системе. В ответе API будут указаны распознанные сущности, а также их категории, подкатегории и оценки достоверности. Будет также возвращена текстовая строка с отредактированными сущностями персональных данных.
Примеры
Перейдите на страницу обзора ресурса на портале Azure.
В меню слева выберите Ключи и конечная точка. Вам потребуется один из ключей и конечная точка для проверки подлинности запросов API.
Скачайте и установите пакет клиентской библиотеки для выбранного языка:
Язык Версия пакета .NET 1.0.0 Python 1.0.0 Дополнительные сведения о клиенте и возвращаемом объекте см. в следующей справочной документации:
Ограничения службы и данных
Сведения о размере и числе запросов, которые можно отправлять в минуту и секунду, см. в статье об ограничениях службы.