Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Azure Language in Foundry Tools es un servicio basado en la nube que aplica características de procesamiento de lenguaje natural (NLP) a datos basados en texto. La característica DCP puede evaluar texto no estructurado, extraer y tachar datos personales (PII) e información sanitaria (PHI) en texto en varias categorías predefinidas.
Opciones de desarrollo
Para usar la detección de información de identificación personal (PII), debe enviar texto para su análisis y controlar la salida de la API en la aplicación. El análisis se realiza tal cual, sin personalización adicional al modelo usado en los datos. Hay dos maneras de usar la detección de PII:
| Opción de desarrollo | Descripción |
|---|---|
| Portal de Microsoft Foundry (nuevo) | Foundry (nuevo) es una plataforma de inteligencia artificial basada en la nube que proporciona acceso simplificado a los modelos, agentes y herramientas de Foundry a través de proyectos de Foundry. |
| Portal de Foundry (clásico) | Foundry (clásico) es una plataforma basada en la nube que admite proyectos basados en concentradores y otros tipos de recursos. Al registrarse, puede usar sus propios datos para detectar información de identificación personal dentro de ejemplos de texto. |
| API REST o biblioteca cliente (SDK de Azure) | Integre la detección de PII en las aplicaciones mediante la API REST o la biblioteca cliente disponible en una variedad de lenguajes. |
Especificación del modelo de detección de DCP
De manera predeterminada, esta característica usará el modelo de IA disponible más reciente en el texto. También puede configurar las solicitudes de API para usar una versión del modelo específica.
Idiomas de entrada
Al enviar texto de entrada para que se procese, puede especificar en cuál de los idiomas admitidos están escritos. Si no especifica un idioma, el valor predeterminado de la extracción es inglés. La API puede devolver desplazamientos en la respuesta para admitir diferentes codificaciones multilingües y emojis.
Parámetros de configuración adicionales (2025-11-15-preview)
Importante
- Las versiones preliminares públicas de Azure Language in Foundry Tools proporcionan acceso anticipado a las características que están en desarrollo activo.
- Las características, los enfoques y los procesos pueden cambiar, antes de la disponibilidad general (GA), en función de los comentarios de los usuarios.
- Las características en versión preliminar están sujetas a los términos aplicables a las versiones preliminares, tal como se describe en los Términos de uso complementarios para las versiones preliminares de Microsoft Azure y el Anexo de protección de datos de productos y servicios de Microsoft (DPA).
Directivas de redacción
A partir de la versión 2025-11-15-preview y posteriores, puede especificar el parámetro redactionPolicies para definir qué políticas de redacción se aplican al procesar texto. Puede incluir más de una política en una sola solicitud, especificando una política como defaultRedactionPolicy y estableciendo anulaciones de políticas adicionales para entidades especificadas.
El campo de directiva acepta cuatro tipos de directiva:
Para obtener más información, consulteParámetros de la tarea PII de la API REST.
syntheticReplacement policy type 🆕
El tipo de directiva syntheticReplacement ** reemplaza una entidad PII detectada por un valor de reemplazo. Por ejemplo, una entrada como "John Doe recibió una llamada del 424-878-9193". se puede transformar en "Sam Johnson recibió una llamada del 401-255-6901". Estos sustitutos se seleccionan aleatoriamente a partir de un conjunto predefinido de valores alternativos.
POST {Endpoint}/language/:analyze-text?api-version=2025-11-15-preview
{
"kind": "PiiEntityRecognition",
"parameters": {
"modelVersion": "latest",
"redactionPolicies": [
{
"policyKind": "syntheticReplacement",
"entityTypes": [
"Person",
"PhoneNumber"
]
}
]
}
}
Tipo de directiva characterMask
El tipo de directiva characterMask ** permite enmascarar el texto censurado mediante un carácter especificado (por ejemplo, "") al tiempo que conserva la longitud y el desplazamiento del texto original. Por ejemplo, " recibió una llamada de ************"
Además, también hay un campo opcional denominado
redactionCharacterque permite especificar el carácter usado para la anonimización al aplicar la directivacharacterMask.
Solicitud de ejemplo
POST {Endpoint}/language/:analyze-text?api-version=2025-11-15-preview
{
"kind": "PiiEntityRecognition",
"parameters": {
"modelVersion": "latest",
"redactionPolicies": [
{
"policyKind": "characterMask",
"redactionCharacter": "-"
}
]
}
}
tipo de directiva noMask
noMask policy type** permite devolver la respuesta sin incluir el campo redactedText. Por ejemplo, "John Doe recibió una llamada del 424-878-919".
Solicitud de ejemplo
POST {Endpoint}/language/:analyze-text?api-version=2025-11-15-preview
{
"kind": "PiiEntityRecognition",
"parameters": {
"modelVersion": "latest",
"redactionPolicies": [
{
"policyKind": "noMask"
}
]
}
}
tipo de directiva entityMask
El tipo de directiva entityMask ** permite enmascarar tanto el texto de la entidad PII detectada como su tipo de entidad correspondiente. Por ejemplo, "[PERSON_1] recibió una llamada de [PHONENUMBER_1]."
POST {Endpoint}/language/:analyze-text?api-version=2025-11-15-preview
{
"kind": "PiiEntityRecognition",
"parameters": {
"modelVersion": "latest",
"redactionPolicies": [
{
"policyKind": "entityMask"
}
]
}
}
Para obtener más información, consulteNota de transparencia para información de identificación personal (PII).
ConfidenceScoreThreshold 🆕
La función PII actualmente oculta todas las entidades detectadas, independientemente de sus puntuaciones de confianza. Por lo tanto, también se quitan las entidades con puntuaciones de confianza baja, incluso si se prefieren conservarlas. Para mejorar la flexibilidad, puede configurar un umbral de confianza que determine la puntuación de confianza mínima que debe tener una entidad para permanecer en la salida.
Solicitud de ejemplo
POST {Endpoint}/language/:analyze-text?api-version=2025-11-15-preview
{
"kind":"PiiEntityRecognition",
"parameters":{
"modelVersion":"latest",
"confidenceScoreThreshold":{
"default":0.9,
"overrides":[
{
"value":0.8,
"entity":"USSocialSecurityNumber"
},
{
"value":0.6,
"entity":"Person",
"language":"en"
}
]
}
}
}
Para más información, consulteReferencia de la API REST: ConfidenceScoreThreshold
DesactivarValidaciónDeEntidad
Al usar el servicio PII, valida varios tipos de entidad para garantizar la integridad de los datos y minimizar los falsos positivos. Sin embargo, esta validación estricta a veces puede ralentizar los flujos de trabajo en los que la validación no es necesaria. Para ofrecer más flexibilidad, presentamos un parámetro que le permite deshabilitar la validación de entidades si lo desea. De forma predeterminada, este parámetro se establece en false, lo que significa que la validación estricta de entidades permanece en vigor. Si desea omitir la validación de entidades para las solicitudes, puede establecer el parámetro en true.
Solicitud de ejemplo
POST {Endpoint}/language/:analyze-text?api-version=2025-11-15-preview
{
"kind":"PiiEntityRecognition",
"parameters":{
"modelVersion":"latest",
"disableEntityValidation":"true | false"
},
"analysisInput":{
"documents":[
{
"id":"id01",
"text":"blah"
}
]
}
}
Para más información, consulteReferencia de la API REST: PiiTaskParameters
Selección de las entidades que se van a devolver
La API intenta detectar las categorías de entidad definidas para el idioma de una entrada de texto determinada. Si desea especificar qué entidades se detectarán y devolverán, use el parámetro piiCategories opcional con las categorías de entidad adecuadas. Este parámetro también puede permitirle detectar entidades que no están habilitadas de forma predeterminada para el lenguaje del texto de entrada. En el siguiente ejemplo, solo se detectaría Person. Puede especificar uno o varios tipos de entidad que se van a devolver.
Sugerencia
Si no incluye default al especificar las categorías de entidad, la API solo devuelve las categorías de entidad que especifique.
Entrada:
Nota:
En este ejemplo, devuelve solo el tipo de entidad person.
https://<your-language-resource-endpoint>/language/:analyze-text?api-version=2022-05-01
{
"kind": "PiiEntityRecognition",
"parameters": {
"modelVersion": "latest",
"piiCategories": [
"Person"
],
"redactionPolicies": {
"policyKind": "characterMask",
"redactionCharacter": "*"
# MaskWithCharacter|MaskWithEntityType|DoNotRedact
}
},
"analysisInput": {
"documents": [
{
"id": "1",
"language": "en",
"text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
}
]
}
}
Salida:
{
"kind": "PiiEntityRecognitionResults",
"results": {
"documents": [
{
"redactedText": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is ********) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!",
"id": "1",
"entities": [
{
"text": "John Doe",
"category": "Person",
"offset": 226,
"length": 8,
"confidenceScore": 0.98
}
],
"warnings": []
}
],
"errors": [],
"modelVersion": "2021-01-15"
}
}
Adaptación de PII al dominio
Para adaptarse al vocabulario personalizado de un cliente que se usa para identificar entidades (también conocidas como "contexto"), la característica permite a los entitySynonyms clientes definir sus propios sinónimos para tipos de entidad específicos.
Esta característica está diseñada para identificar entidades dentro de contextos que pueden no estar familiarizados con el modelo, especialmente términos específicos de la entrada del cliente. Al hacerlo, garantiza que la terminología única del cliente se reconozca y vincule correctamente durante el proceso de detección.
La valueExclusionPolicy opción permite a los clientes adaptar el servicio PII para escenarios en los que los clientes prefieren que determinados términos no se detecten y redacten incluso si esos términos se dividen en una categoría de PII que les interesa detectar. Por ejemplo, un departamento de policía podría querer que los identificadores personales se redacten en la mayoría de los casos, excepto para términos como "oficial de policía", "sospechoso" y "testigo".
Los clientes ahora pueden adaptar la detección del servicio PII especificando su propia expresión regular mediante un archivo de configuración para el reconocimiento de expresiones regulares. Consulte nuestras guías prácticas de contenedores para ver un tutorial sobre cómo instalar y ejecutar contenedores de detección de PII.
Puede encontrar un tutorial más detallado en la guía de procedimientos "Adaptación de PII a su dominio".
Envío de datos
El análisis se realiza tras la recepción de la solicitud. El uso de la característica de detección de DCP de forma asincrónica no tiene estado. No se almacenan datos en la cuenta y los resultados se devuelven inmediatamente en la respuesta.
Cuando se usa esta característica de forma asincrónica, los resultados de la API están disponibles durante 24 horas desde el momento en que se ingiere la solicitud y se indica en la respuesta. Después de este período de tiempo, los resultados se purgan y ya no están disponibles para la recuperación.
Obtención de resultados de DCP
Cuando obtiene los resultados de la detección de DCP, puede transmitirlos a una aplicación, o bien guardar la salida en un archivo en el sistema local. La respuesta de la API incluye entidades reconocidas, lo que incluye sus categorías y subcategorías, y las puntuaciones de confianza. También se devuelve la cadena de texto con las entidades DCP tachadas.
Límites de servicio y datos
Para obtener información sobre el tamaño y el número de solicitudes que puede enviar por minuto y segundo, consulte el artículo sobre límites del servicio.
Pasos siguientes
Información general sobre la información de identificación personal (DCP)