RecognizePiiEntitiesAction Класс

RecognizePiiEntitiesAction инкапсулирует параметры для запуска длительной операции распознавания сущностей личных сведений. Дополнительные сведения см. в документации по службам: https://aka.ms/azsdk/language/pii

Если вы просто хотите распознавать сущности pii в списке документов и не выполнять несколько длительных действий при входе документов, вызовите метод recognize_pii_entities вместо взаимодействия с этой моделью.

Наследование
azure.ai.textanalytics._dict_mixin.DictMixin
RecognizePiiEntitiesAction

Конструктор

RecognizePiiEntitiesAction(*, categories_filter: List[str | PiiEntityCategory] | None = None, domain_filter: str | None = None, model_version: str | None = None, string_index_type: str | None = None, disable_service_logs: bool | None = None, **kwargs: Any)

Параметры Keyword-Only

Имя Описание
model_version

Версия модели, используемая для анализа, например latest. Если версия модели не указана, API по умолчанию будет использовать последнюю, не предварительную версию. Дополнительные сведения см. здесь: https://aka.ms/text-analytics-model-versioning

domain_filter

Необязательная строка, включающая в домен персональных данных только подмножество категорий сущностей личных сведений. Возможные значения: phi или None.

categories_filter

Вместо фильтрации по всем категориям сущностей персональных данных можно передать список конкретных категорий сущностей piI, которые вы хотите отфильтровать. Например, если вы хотите отфильтровать только номера социального страхования США в документе, вы можете передать [PiiEntityCategory.US_SOCIAL_SECURITY_NUMBER] для этого kwarg.

string_index_type

Задает метод, используемый для интерпретации смещений строк. По умолчанию используется кодировка Python в Юникоде. Чтобы переопределить python по умолчанию, можно также передать Utf16CodeUnit или TextElement_v8. Дополнительные сведения см. в разделе https://aka.ms/text-analytics-offsets

disable_service_logs

По умолчанию имеет значение true, то есть языковая служба не будет регистрировать входной текст на стороне службы для устранения неполадок. Если задано значение False, языковая служба регистрирует входной текст в течение 48 часов, чтобы разрешить устранение неполадок, связанных с предоставлением функций обработки естественного языка службы. Дополнительные сведения см. в примечаниях к соответствию и конфиденциальности Cognitive Services по адресу https://aka.ms/cs-compliance , а также в статье Принципы ответственного использования ИИ Майкрософт по адресу https://www.microsoft.com/ai/responsible-ai.

Методы

get
has_key
items
keys
update
values

get

get(key: str, default: Any | None = None) -> Any

Параметры

Имя Описание
key
Обязательно
default
значение по умолчанию: None

has_key

has_key(k: str) -> bool

Параметры

Имя Описание
k
Обязательно

items

items() -> Iterable[Tuple[str, Any]]

keys

keys() -> Iterable[str]

update

update(*args: Any, **kwargs: Any) -> None

values

values() -> Iterable[Any]

Атрибуты

categories_filter

Вместо фильтрации по всем категориям сущностей персональных данных можно передать список конкретных категорий сущностей piI, которые вы хотите отфильтровать. Например, если вы хотите отфильтровать только номера социального страхования США в документе, вы можете передать [PiiEntityCategory.US_SOCIAL_SECURITY_NUMBER] для этого kwarg.

categories_filter: List[str | PiiEntityCategory] | None = None

disable_service_logs

По умолчанию имеет значение true, то есть языковая служба не будет регистрировать входной текст на стороне службы для устранения неполадок. Если задано значение False, языковая служба регистрирует входной текст в течение 48 часов, чтобы разрешить устранение неполадок, связанных с предоставлением функций обработки естественного языка службы. Дополнительные сведения см. в примечаниях к соответствию и конфиденциальности Cognitive Services по адресу https://aka.ms/cs-compliance , а также в статье Принципы ответственного использования ИИ Майкрософт по адресу https://www.microsoft.com/ai/responsible-ai.

disable_service_logs: bool | None = None

domain_filter

Необязательная строка, включающая в домен персональных данных только подмножество категорий сущностей личных сведений. Возможные значения: phi или None.

domain_filter: str | None = None

model_version

Версия модели, используемая для анализа, например latest. Если версия модели не указана, API по умолчанию будет использовать последнюю, не предварительную версию. Дополнительные сведения см. здесь: https://aka.ms/text-analytics-model-versioning

model_version: str | None = None

string_index_type

Задает метод, используемый для интерпретации смещений строк. По умолчанию используется кодировка Python в Юникоде. Чтобы переопределить python по умолчанию, можно также передать Utf16CodeUnit или TextElement_v8. Дополнительные сведения см. в разделе https://aka.ms/text-analytics-offsets

string_index_type: str | None = None