¿Qué es el reconocimiento de entidades con nombre personalizadas?

Reconocimiento de entidades con nombre personalizadas es una de las características que ofrece Lenguaje de Azure AI. Se trata de un servicio de API basado en la nube que aplica inteligencia de aprendizaje automático que le permite crear modelos personalizados para tareas de reconocimiento de entidades con nombre personalizadas.

Reconocimiento de entidades con nombre personalizadas permite a los usuarios crear modelos de inteligencia artificial personalizados para extraer entidades específicas del dominio de texto no estructurado, como contratos o documentos financieros. Mediante la creación de un proyecto de Reconocimiento de entidades con nombre (NER) personalizadas, los desarrolladores pueden etiquetar datos de forma iterativa, entrenar, evaluar y mejorar el rendimiento del modelo antes de que esté disponible para su consumo. La calidad de los datos etiquetados afecta considerablemente al rendimiento del modelo. Para simplificar la creación y personalización del modelo, el servicio ofrece un portal web personalizado al que se puede acceder a través de Language Studio. Si sigue los pasos que se indican en este inicio rápido, le resultará fácil empezar a usar el servicio.

Esta documentación contiene los siguientes tipos de artículos:

  • Los inicios rápidos son instrucciones de inicio que le guiarán a la hora de hacer solicitudes al servicio.
  • Los conceptos proporcionan explicaciones sobre la funcionalidad y las características del servicio.
  • Las guías de procedimientos contienen instrucciones para usar el servicio de una manera más específica o personalizada.

Escenarios de uso de ejemplo

La clasificación de entidades con nombre personalizadas se puede usar en un sinfín de escenarios en diferentes ámbitos empresariales:

Extracción de información

Muchas organizaciones financieras y legales extraen y normalizan datos de miles de orígenes de textos no estructurados complejos a diario. Estas fuentes incluyen extractos bancarios, contratos legales o formularios bancarios. Por ejemplo, la extracción de datos de solicitud de hipoteca hecha manualmente por revisores humanos puede tardar varios días en llevarse a cabo. La automatización de estos pasos a partir de la creación de un modelo de Reconocimiento de entidades con nombre personalizadas simplifica el proceso y ahorra costos, tiempo y esfuerzo.

La búsqueda es fundamental para cualquier aplicación que ofrezca contenido de texto a los usuarios. Entre los escenarios comunes se incluyen la búsqueda de catálogos, documentos y productos minoristas o la minería de conocimiento para la ciencia de datos. Muchas empresas de varios sectores quieren crear una mejor experiencia de búsqueda de contenido privado y heterogéneo que incluya documentos tanto estructurados como no estructurados. Como parte de su canalización, los desarrolladores pueden usar Reconocimiento de entidades con nombre personalizadas para extraer entidades del texto que son relevantes para su sector. Estas entidades se pueden usar para enriquecer la indexación del archivo, con el fin de personalizar más la experiencia de búsqueda.

Auditoría y cumplimiento

En lugar de revisar manualmente archivos de texto considerablemente largos para auditar y aplicar directivas, los departamentos de TI de empresas financieras o legales pueden usar Reconocimiento de entidades con nombre personalizado para crear soluciones automatizadas. Estas soluciones ayudan a aplicar directivas de cumplimiento y a configurar reglas de negocio necesarias en función de las canalizaciones de minería de conocimiento que procesan tanto el contenido estructurado como el no estructurado.

Ciclo de vida del desarrollo de proyectos

El uso de Reconocimiento de entidades con nombre personalizadas suele implicar varios pasos diferentes.

El ciclo de vida del desarrollo

  1. Definir el esquema: conozca los datos e identifique las entidades que quiere extraer. Evita la ambigüedad.

  2. Etiquetar los datos: el etiquetado de datos es un factor clave para determinar el rendimiento del modelo. Agregue las etiquetas de forma precisa, coherente y completa.

    1. Etiquetar con precisión: etiquete cada entidad en su tipo correcto siempre. Incluya solo lo que quiera extraer y evite datos innecesarios en sus etiquetas.
    2. Etiquetar de forma coherente: la misma entidad debe tener la misma etiqueta en todos los archivos.
    3. Etiquetar por completo: etiquete todas las instancias de la entidad en todos los archivos.
  3. Entrenar el modelo: el modelo empieza a aprender de los datos etiquetados.

  4. Ver el rendimiento del modelo: una vez que se complete el entrenamiento, vea los detalles de evaluación del modelo, su rendimiento e instrucciones sobre cómo mejorarlo.

  5. Implementar el modelo: la implementación de un modelo hace que esté disponible para su uso mediante Analyze API.

  6. Extraer entidades: use los modelos personalizados para las tareas de extracción de entidades.

Documentación de referencia y ejemplos de código

Consulte la siguiente documentación de referencia y ejemplos de Lenguaje de Azure AI al usar Reconocimiento de entidades con nombre personalizadas:

Idioma u opción de desarrollo Documentación de referencia Ejemplos
API de REST (creación) Documentación de la API REST
API de REST (entorno de ejecución) Documentación de la API REST
C# (entorno de ejecución) Documentación de C# Ejemplos de C#
Java (Runtime) Documentación de Java Ejemplos de Java
JavaScript (Runtime) Documentación de JavaScript Ejemplos de JavaScript
Python (Runtime) Documentación de Python Ejemplos de Python

Inteligencia artificial responsable

Los sistemas de inteligencia artificial incluyen no solo la tecnología, sino también las personas que la usarán, las personas que se verán afectadas por ella y el entorno en el que se implementa. Lea la nota de transparencia de Reconocimiento de entidades con nombre personalizadas para obtener información sobre el uso responsable de la inteligencia artificial y la implementación en los sistemas. También puede consultar los siguientes artículos para obtener más información:

Pasos siguientes

  • Use el artículo de inicio rápido para empezar a usar el reconocimiento de entidades con nombre personalizadas.

  • Cuando avance por el ciclo de vida del desarrollo de proyectos, consulte el glosario para más información sobre los términos que se usan en la documentación para esta característica.

  • No olvide ver los límites del servicio para obtener información como la disponibilidad regional.