Compartir vía


Componentes de entidad en análisis de texto personalizado en el ámbito de la salud

En Text Analytics personalizado en el ámbito de la salud, las entidades son fragmentos de información relevantes que se extraen del texto de entrada no estructurado. Hay diferentes métodos para extraer una entidad: por aprendizaje a través del contexto, por coincidencia con respecto una lista o por detección mediante una entidad reconocida creada previamente. Cada entidad del proyecto se compone de uno o varios de estos métodos, que se definen como "componentes de la entidad". Cuando más de un componente define una entidad, sus predicciones pueden superponerse. Puede determinar el comportamiento de una predicción de entidad si sus componentes se superponen mediante un conjunto fijo de opciones de Opciones de entidad.

Tipos de componentes

Un componente de entidad determina una manera de extraer la entidad. Una entidad puede contener un componente, que determinaría el único método que se usaría para extraer la entidad, o varios componentes para ampliar las formas en que se define y extrae la entidad.

Las entidades de Text Analytics en el ámbito de la salud se cargan automáticamente en el proyecto como entidades con componentes creados previamente. Puede definir componentes de lista para entidades con componentes creados previamente, pero no puede agregar componentes aprendidos. De forma similar, puede crear nuevas entidades con componentes aprendidos y de lista, pero no puede rellenarlas con componentes creados previamente adicionales.

Componente aprendido

El componente aprendido usa las etiquetas de entidad con las que etiqueta el texto para entrenar un modelo de aprendizaje automático. El modelo aprende a predecir dónde está la entidad, en función del contexto dentro del texto. Las etiquetas proporcionan ejemplos de dónde se espera que la entidad esté presente en el texto, en función del significado de las palabras que la rodean y de las palabras etiquetadas. Este componente solo se define si se agregan etiquetas a los datos de la entidad. Si no etiqueta datos, no tendrá un componente aprendido.

Las entidades de Text Analytics en el ámbito de la salud, que tienen de forma predeterminada componentes creados previamente, no pueden ampliarse con componentes aprendidos, lo que significa que no requieren ni aceptan etiquetado adicional para funcionar.

Captura de pantalla que muestra un ejemplo de componentes de aprendizaje para entidades.

Componente de lista

Un componente de lista representa un conjunto fijo y cerrado de palabras relacionadas y sus sinónimos. El componente realiza una búsqueda de coincidencia de texto exacta con respecto a la lista de valores que proporcionó como sinónimos. Cada sinónimo pertenece a una "clave de lista" que se puede usar como valor estándar normalizado para el sinónimo que se va a devolver en la salida si el componente de lista coincide. Las claves de lista no se usan para buscar coincidencias.

En proyectos multilingües puede especificar otro conjunto de sinónimos para cada idioma. Al usar la API de predicción puede especificar el idioma de la solicitud de entrada, que solo coincide con los sinónimos asociados a ese idioma.

Captura de pantalla que muestra un ejemplo de componentes de lista para entidades.

Componente creado previamente

Las entidades de Text Analytics en el ámbito de la salud se cargan automáticamente en el proyecto como entidades con componentes creados previamente. Puede definir componentes de lista para entidades con componentes creados previamente, pero no puede agregar componentes aprendidos. De forma similar, puede crear nuevas entidades con componentes aprendidos y de lista, pero no puede rellenarlas con componentes creados previamente adicionales. Las entidades con componentes creados previamente se entrenan previamente y pueden extraer información relacionada con sus categorías sin etiquetas.

Captura de pantalla que muestra un ejemplo de componentes creados previamente para entidades.

Opciones de entidad

Cuando se definen varios componentes para una entidad, sus predicciones pueden superponerse. Cuando esto pasa, la predicción final de cada entidad se determina mediante una de las siguientes opciones.

Combinación de componentes

Combine los componentes como una entidad cuando se superpongan al tomar la unión de todos los componentes.

Úsela para combinar todos los componentes cuando se superpongan. Cuando se combinan los componentes, se obtiene toda la información adicional asociada a una lista o un componente precompilado, si están presentes.

Ejemplo

Imagine que tiene una entidad con el nombre Software que tiene un componente de lista que contiene "Proseware OS" como entrada. En los datos de entrada, tiene "Quiero comprar Proseware OS 9" con "Proseware OS 9" etiquetado como Software:

Captura de pantalla que muestra una entidad aprendida y de lista superpuesta.

Al usar los componentes de la combinación, la entidad se devuelve con el contexto completo como "Proseware OS 9" junto con la clave del componente de lista:

Captura de pantalla que muestra el resultado de un componente combinado.

Imagine que tenía la misma expresión, pero que el componente aprendido solo predijo "OS 9":

Captura de pantalla que muestra una expresión con OS 9 predicho por el componente aprendido.

Con los componentes de la combinación, la entidad se seguirá devolviendo como "Proseware OS 9" con la clave del componente de lista:

Captura de pantalla que muestra la entidad de software devuelta.

No combinar componentes

Cada componente superpuesto se devuelve como una instancia independiente de la entidad. Aplique su propia lógica después de la predicción con esta opción.

Ejemplo

Imagine que tiene una entidad con el nombre Software que tiene un componente de lista que contiene "Proseware Desktop" como entrada. En los datos etiquetados, tiene "Quiero comprar Proseware Desktop Pro" con "Proseware Desktop Pro" etiquetado como Software:

Captura de pantalla que muestra un ejemplo de una entidad aprendida y de lista superpuestas.

Si no combina los componentes, la entidad se devuelve dos veces:

Captura de pantalla que muestra la entidad devuelta dos veces.

Uso de componentes y opciones

Los componentes proporcionan la flexibilidad necesaria para definir la entidad de varias maneras. Al combinar componentes se garantiza que cada uno de ellos esté representado y se reduce el número de entidades devueltas en las predicciones.

Una práctica habitual es extender un componente precompilado con una lista de valores que es posible que el precompilado no admita. Por ejemplo, si tiene una entidad nombre de medicamento con un componente creado previamente Medication.Name agregado, es posible que la entidad no prediga todos los nombres de medicamento específicos del dominio. Puede usar un componente de lista para extender los valores de la entidad nombre de medicamento y, por tanto, extender el elemento creado previamente con sus propios valores de nombres de medicamentos.

Otras veces es posible que le interese extraer una entidad por medio del contexto, como un dispositivo médico. Etiquetaría para que el componente aprendido del dispositivo médico aprendiera dónde está basado un dispositivo médico en su posición dentro de la oración. También podría tener una lista de dispositivos médicos que ya conoce de antemano y que le gustaría extraer siempre. La combinación de ambos componentes en una entidad permite obtener ambas opciones para la entidad.

Si no se combinan los componentes, se permite que cada uno de ellos actúe como extractor de entidades independientes. Una manera de usar esta opción es separar las entidades extraídas de una lista de las extraídas por medio de los componentes aprendidos o precompilados para controlarlas y tratarlas de forma diferente.

Pasos siguientes