Dela via


RecognizePiiEntitiesAction Klass

RecognizePiiEntitiesAction kapslar in parametrarna för att starta en tidskrävande igenkänningsåtgärd för PII-entiteter. Mer information finns i tjänstdokumenten: https://aka.ms/azsdk/language/pii

Om du bara vill identifiera pii-entiteter i en lista med dokument och inte utföra flera långvariga åtgärder på indata för dokument anropar du metoden recognize_pii_entities i stället för att samverka med den här modellen.

Arv
azure.ai.textanalytics._dict_mixin.DictMixin
RecognizePiiEntitiesAction

Konstruktor

RecognizePiiEntitiesAction(*, categories_filter: List[str | PiiEntityCategory] | None = None, domain_filter: str | None = None, model_version: str | None = None, string_index_type: str | None = None, disable_service_logs: bool | None = None, **kwargs: Any)

Keyword-Only parametrar

Name Description
model_version

Den modellversion som ska användas för analysen, t.ex. "senaste". Om en modellversion inte har angetts kommer API:et som standard att vara den senaste versionen som inte är en förhandsversion. Mer information finns här: https://aka.ms/text-analytics-model-versioning

domain_filter

En valfri sträng som anger att PII-domänen endast ska innehålla en delmängd av PII-entitetskategorierna. Möjliga värden är "phi" eller None.

categories_filter

I stället för att filtrera över alla PII-entitetskategorier kan du skicka in en lista över de specifika PII-entitetskategorier som du vill filtrera bort. Om du till exempel bara vill filtrera bort amerikanska personnummer i ett dokument kan du skicka in [PiiEntityCategory.US_SOCIAL_SECURITY_NUMBER] för denna kwarg.

string_index_type

Anger den metod som används för att tolka strängförskjutningar. UnicodeCodePoint, Python-kodningen, är standardinställningen. Om du vill åsidosätta Python-standardvärdet kan du även skicka In Utf16CodeUnit eller TextElement_v8. Mer information finns i https://aka.ms/text-analytics-offsets

disable_service_logs

Standardvärdet är true, vilket innebär att språktjänsten inte loggar indatatexten på tjänstsidan för felsökning. Om värdet är Falskt loggar språktjänsten indatatexten i 48 timmar, enbart för att tillåta felsökning av problem med att tillhandahålla tjänstens bearbetningsfunktioner för naturligt språk. Mer information finns i Efterlevnads- och sekretessanteckningar för Cognitive Services på https://aka.ms/cs-compliance och Microsofts ansvarsfulla AI-principer på https://www.microsoft.com/ai/responsible-ai.

Metoder

get
has_key
items
keys
update
values

get

get(key: str, default: Any | None = None) -> Any

Parametrar

Name Description
key
Obligatorisk
default
standardvärde: None

has_key

has_key(k: str) -> bool

Parametrar

Name Description
k
Obligatorisk

items

items() -> Iterable[Tuple[str, Any]]

keys

keys() -> Iterable[str]

update

update(*args: Any, **kwargs: Any) -> None

values

values() -> Iterable[Any]

Attribut

categories_filter

I stället för att filtrera över alla PII-entitetskategorier kan du skicka in en lista över de specifika PII-entitetskategorier som du vill filtrera bort. Om du till exempel bara vill filtrera bort amerikanska personnummer i ett dokument kan du skicka in [PiiEntityCategory.US_SOCIAL_SECURITY_NUMBER] för denna kwarg.

categories_filter: List[str | PiiEntityCategory] | None = None

disable_service_logs

Standardvärdet är true, vilket innebär att språktjänsten inte loggar indatatexten på tjänstsidan för felsökning. Om värdet är Falskt loggar språktjänsten indatatexten i 48 timmar, enbart för att tillåta felsökning av problem med att tillhandahålla tjänstens bearbetningsfunktioner för naturligt språk. Mer information finns i Efterlevnads- och sekretessanteckningar för Cognitive Services på https://aka.ms/cs-compliance och Microsofts ansvarsfulla AI-principer på https://www.microsoft.com/ai/responsible-ai.

disable_service_logs: bool | None = None

domain_filter

En valfri sträng som anger att PII-domänen endast ska innehålla en delmängd av PII-entitetskategorierna. Möjliga värden är "phi" eller None.

domain_filter: str | None = None

model_version

Den modellversion som ska användas för analysen, t.ex. "senaste". Om en modellversion inte har angetts kommer API:et som standard att vara den senaste versionen som inte är en förhandsversion. Mer information finns här: https://aka.ms/text-analytics-model-versioning

model_version: str | None = None

string_index_type

Anger den metod som används för att tolka strängförskjutningar. UnicodeCodePoint, Python-kodningen, är standardinställningen. Om du vill åsidosätta Python-standardvärdet kan du även skicka In Utf16CodeUnit eller TextElement_v8. Mer information finns i https://aka.ms/text-analytics-offsets

string_index_type: str | None = None