Sdílet prostřednictvím


RecognizePiiEntitiesAction Třída

RecognizePiiEntitiesAction zapouzdřuje parametry pro spuštění dlouhotrvající operace rozpoznávání entit PII. Další informace najdete v dokumentaci ke službě: https://aka.ms/azsdk/language/pii

Pokud chcete jen rozpoznat entity pii v seznamu dokumentů a neprovádět více dlouhotrvajících akcí na vstupu dokumentů, volejte metodu recognize_pii_entities místo propojení s tímto modelem.

Dědičnost
azure.ai.textanalytics._dict_mixin.DictMixin
RecognizePiiEntitiesAction

Konstruktor

RecognizePiiEntitiesAction(*, categories_filter: List[str | PiiEntityCategory] | None = None, domain_filter: str | None = None, model_version: str | None = None, string_index_type: str | None = None, disable_service_logs: bool | None = None, **kwargs: Any)

Výhradně parametry klíčových slov

Name Description
model_version

Verze modelu, která se má použít pro analýzu, například "nejnovější". Pokud není zadaná verze modelu, rozhraní API bude ve výchozím nastavení používat nejnovější verzi, která není verze Preview. Další informace najdete tady: https://aka.ms/text-analytics-model-versioning

domain_filter

Volitelný řetězec pro nastavení domény PII tak, aby zahrnovala pouze podmnožinu kategorií entit PII. Mezi možné hodnoty patří phi nebo None.

categories_filter

Místo filtrování podle všech kategorií entit pii můžete předat seznam konkrétních kategorií entit pii, které chcete odfiltrovat. Pokud například chcete v dokumentu vyfiltrovat jenom čísla sociálního pojištění v USA, můžete pro tento kwarg předat [PiiEntityCategory.US_SOCIAL_SECURITY_NUMBER].

string_index_type

Určuje metodu použitou k interpretaci posunů řetězců. UnicodeCodePoint, kódování Pythonu, je výchozí. Pokud chcete přepsat výchozí python, můžete také předat Utf16CodeUnit nebo TextElement_v8. Další informace najdete v tématu https://aka.ms/text-analytics-offsets

disable_service_logs

Výchozí hodnota je true, což znamená, že služba Language nebude protokolovat váš vstupní text na straně služby pro účely řešení potíží. Pokud je nastavená hodnota Nepravda, služba jazyka protokoluje váš vstupní text po dobu 48 hodin, a to výhradně kvůli řešení potíží při poskytování funkcí zpracování přirozeného jazyka služby. Další podrobnosti najdete v poznámkách k dodržování předpisů a ochraně osobních údajů služeb Cognitive Services na adrese https://aka.ms/cs-compliance a principy zodpovědné AI společnosti Microsoft na adrese https://www.microsoft.com/ai/responsible-ai.

Metody

get
has_key
items
keys
update
values

get

get(key: str, default: Any | None = None) -> Any

Parametry

Name Description
key
Vyžadováno
default
výchozí hodnota: None

has_key

has_key(k: str) -> bool

Parametry

Name Description
k
Vyžadováno

items

items() -> Iterable[Tuple[str, Any]]

keys

keys() -> Iterable[str]

update

update(*args: Any, **kwargs: Any) -> None

values

values() -> Iterable[Any]

Atributy

categories_filter

Místo filtrování podle všech kategorií entit pii můžete předat seznam konkrétních kategorií entit pii, které chcete odfiltrovat. Pokud například chcete v dokumentu vyfiltrovat jenom čísla sociálního pojištění v USA, můžete pro tento kwarg předat [PiiEntityCategory.US_SOCIAL_SECURITY_NUMBER].

categories_filter: List[str | PiiEntityCategory] | None = None

disable_service_logs

Výchozí hodnota je true, což znamená, že služba Language nebude protokolovat váš vstupní text na straně služby pro účely řešení potíží. Pokud je nastavená hodnota Nepravda, služba jazyka protokoluje váš vstupní text po dobu 48 hodin, a to výhradně kvůli řešení potíží při poskytování funkcí zpracování přirozeného jazyka služby. Další podrobnosti najdete v poznámkách k dodržování předpisů a ochraně osobních údajů služeb Cognitive Services na adrese https://aka.ms/cs-compliance a principy zodpovědné AI společnosti Microsoft na adrese https://www.microsoft.com/ai/responsible-ai.

disable_service_logs: bool | None = None

domain_filter

Volitelný řetězec pro nastavení domény PII tak, aby zahrnovala pouze podmnožinu kategorií entit PII. Mezi možné hodnoty patří phi nebo None.

domain_filter: str | None = None

model_version

Verze modelu, která se má použít pro analýzu, například "nejnovější". Pokud není zadaná verze modelu, rozhraní API bude ve výchozím nastavení používat nejnovější verzi, která není verze Preview. Další informace najdete tady: https://aka.ms/text-analytics-model-versioning

model_version: str | None = None

string_index_type

Určuje metodu použitou k interpretaci posunů řetězců. UnicodeCodePoint, kódování Pythonu, je výchozí. Pokud chcete přepsat výchozí python, můžete také předat Utf16CodeUnit nebo TextElement_v8. Další informace najdete v tématu https://aka.ms/text-analytics-offsets

string_index_type: str | None = None