Definiciones y términos del reconocimiento de entidades con nombre personalizadas

Artigo
09/03/2024

Use este artículo para obtener información sobre algunas de las definiciones y los términos que se pueden encontrar al usar NER personalizado.

Entidad

Una entidad es un fragmento de texto que indica un determinado tipo de información. El fragmento de texto puede constar de una o varias palabras. En el ámbito de NER personalizado, las entidades representan la información que el usuario quiere extraer del texto. Los desarrolladores etiquetan entidades dentro de sus datos con las entidades necesarias antes de pasarla al modelo para el entrenamiento. Por ejemplo, "Número de factura", "Fecha de inicio", "Número de envío", "Lugar de nacimiento", "Ciudad de origen", "Nombre del proveedor" o "Dirección de cliente".

Por ejemplo, en la frase "John pidió prestados 25 000 USD a Fred", las entidades podrían ser:

Nombre o tipo de entidad	Entidad
Nombre del prestatario	John
Nombre del prestador	Fred
Importe del préstamo	25 000 USD

Puntuación F1

La puntuación F1 es una función de precisión y coincidencia. Es necesaria cuando se busca un equilibrio entre precisión y coincidencia.

Modelo

Un modelo es un objeto que se entrena para realizar una tarea determinada, en este caso el reconocimiento de entidades personalizadas. Para entrenar los modelos se proporcionan datos etiquetados de los que aprenden para que posteriormente se puedan usar para tareas de reconocimiento.

El entrenamiento del modelo es el proceso de enseñar al modelo qué extraer en función de los datos etiquetados.
La evaluación del modelo es el proceso que se produce justo después del entrenamiento para saber cómo funciona el modelo.
La implementación es el proceso de asignación del modelo a una implementación para que esté disponible para su uso mediante la API de predicción.

Precision

Mide lo preciso o exacto que es el modelo. Es la relación entre los positivos identificados correctamente (verdaderos positivos) y todos los positivos identificados. La métrica de precisión revela cuántas de las clases previstas están correctamente etiquetadas.

Project

Un proyecto es un área de trabajo para compilar modelos de Machine Learning personalizados basados en los datos. A su proyecto solo puede acceder usted y otros usuarios que tengan acceso al recurso de Azure que se usa. Como requisito previo para crear un proyecto de extracción de entidades personalizado debe conectar el recurso a una cuenta de almacenamiento con el conjunto de datos al crear un nuevo proyecto. El proyecto incluye automáticamente todos los archivos .txt disponibles en el contenedor.

Dentro del proyecto se puede hacer lo siguiente:

Etiquetar los datos: proceso de etiquetado de los datos para que, al entrenar el modelo, aprenda lo que quiere extraer.
Compilar y entrenar el modelo: paso principal del proyecto, donde el modelo comienza a aprender de los datos etiquetados.
Ver los detalles de evaluación del modelo: revise el rendimiento del modelo para decidir si es posible mejorarlo o si está satisfecho con los resultados.
Implementación: una vez que haya revisado el rendimiento del modelo y decidido que se puede usar en su entorno, debe asignarlo a una implementación para poder usarlo. La asignación del modelo a una implementación hace que esté disponible para su uso mediante la API de predicción.
Modelo de prueba: después de implementar el modelo, pruebe la implementación en Language Studio para ver cómo funcionaría en producción.

Recuperación

Mide la capacidad del modelo para predecir clases positivas reales. Es la relación entre los verdaderos positivos previstos y lo que realmente se ha etiquetado. La métrica de coincidencia revela cuántas de las clases previstas están correctamente etiquetadas.

Compartir por