Ejemplo: Compilación e implementación de una aptitud personalizada con Azure Machine Learning (archivado)

Artículo
02/01/2023

Este ejemplo se archiva y no es compatible. Se explica cómo crear una aptitud personalizada mediante Azure Machine Learning para extraer opiniones basadas en aspectos de las revisiones. Esto permitió que la asignación de opiniones positivas y negativas dentro de la misma revisión se describa correctamente a las entidades identificadas, como personal, sala, sala de espera o grupo.

Para entrenar el modelo de opinión basada en aspectos de Azure Machine Learning, usará el repositorio nlp-recipes. A continuación, el modelo se implementará como un punto de conexión en un clúster de Azure Kubernetes. Una vez implementado, el punto de conexión se agrega a la canalización de enriquecimiento como una aptitud de Azure Machine Learning para su uso por parte del servicio Cognitive Search.

Se proporcionan dos conjuntos de datos. Si quiere entrenar el modelo por su cuenta, se necesita el archivo hotel_reviews_1000.csv. ¿Prefiere omitir el paso de entrenamiento? Descargue el archivo hotel_reviews_100.csv.

Creación de una instancia de Azure Cognitive Search
Creación de un área de trabajo de Azure Machine Learning (el servicio de búsqueda y el área de trabajo deben estar en la misma suscripción)
Entrenamiento e implementación de un modelo en un clúster de Azure Kubernetes
Vinculación de una canalización de enriquecimiento con IA al modelo implementado
Ingesta de la salida del modelo implementado como una aptitud personalizada

Importante

Esta aptitud está en versión preliminar pública en los términos de uso complementarios. La API REST de versión preliminar admite esta aptitud.

Requisitos previos

Suscripción de Azure: obtenga una suscripción gratuita.
Servicio Cognitive Search
Recurso de Cognitive Services
Cuenta de Azure Storage)
Área de trabajo de Azure Machine Learning

Configurar

Clone o descargue el contenido del repositorio de ejemplo.
Si la descarga es un archivo comprimido, extraiga el contenido. Asegúrese de que los archivos sean de lectura y escritura.
Al configurar las cuentas y los servicios de Azure, copie los nombres y las claves en un archivo de texto de acceso fácil. Los nombres y las claves se agregarán a la primera celda del cuaderno, donde se definen las variables para acceder a los servicios de Azure.
Si no está familiarizado con Azure Machine Learning y sus requisitos, revise estos documentos antes de empezar:
Configuración de un entorno de desarrollo para Azure Machine Learning
Creación y administración de áreas de trabajo de Azure Machine Learning en Azure Portal
Al configurar el entorno de desarrollo para Azure Machine Learning, considere la posibilidad de usar la instancia de proceso basada en la nube para comenzar de manera más fácil y rápida.
Cargue el archivo del conjunto de datos en un contenedor de la cuenta de almacenamiento. Si quiere realizar el paso de entrenamiento en el cuaderno, el archivo más grande es necesario. Si prefiere omitir el paso de entrenamiento, se recomienda el archivo más pequeño.

Apertura del cuaderno y conexión a los servicios de Azure

Coloque toda la información necesaria de las variables que permitirán el acceso a los servicios de Azure dentro de la primera celda y ejecute la celda.
Al ejecutar la segunda celda, se confirmará que se ha conectado al servicio de búsqueda de la suscripción.
En las secciones 1.1 a 1.5 se creará el almacén de datos del servicio de búsqueda, el conjunto de aptitudes, el índice y el indexador.

En este momento puede optar por omitir los pasos para crear el conjunto de datos de entrenamiento y experimentar en Azure Machine Learning y pasar directamente a registrar los dos modelos que se proporcionan en la carpeta models del repositorio de GitHub. Si omite estos pasos, en el cuaderno pasará a la sección 3.5, en la que escribirá el script de puntuación. Este proceso ahorra tiempo; los pasos de descarga y carga de los datos pueden tardar hasta 30 minutos en completarse.

Creación y entrenamiento de los modelos

La sección 2 tiene seis celdas donde se descarga el archivo de inserciones GloVe del repositorio npl-recipes. Después de la descarga, el archivo se carga en el almacén de datos de Azure Machine Learning. El archivo ZIP tiene unos 2 G y tardará algún tiempo en realizar estas tareas. Una vez cargado, los datos de entrenamiento se extraen y ahora está listo para pasar a la sección 3.

Entrenamiento del modelo de opinión basada en aspectos e implementación del punto de conexión

En la sección 3 del cuaderno se entrenarán los modelos creados en la sección 2, se registrarán esos modelos y se implementarán como un punto de conexión en un clúster de Azure Kubernetes. Si no está familiarizado con Azure Kubernetes, se recomienda encarecidamente que revise los artículos siguientes antes de intentar crear un clúster de inferencia:

La creación e implementación del clúster de inferencia puede tardar hasta 30 minutos. Se recomienda probar el servicio web antes de continuar con los pasos finales, de forma que se actualice el conjunto de aptitudes y se ejecute el indexador.

Actualización del conjunto de aptitudes

La sección 4 del cuaderno tiene cuatro celdas donde se actualizan el conjunto de aptitudes y el indexador. Como alternativa, puede usar el portal para seleccionar y aplicar la nueva aptitud al conjunto de aptitudes y, luego, ejecutar el indexador para actualizar el servicio de búsqueda.

En el portal, vaya al conjunto de aptitudes y seleccione el vínculo de definición del conjunto de aptitudes (JSON). El portal mostrará el archivo JSON del conjunto de aptitudes que se creó en las primeras celdas del cuaderno. A la derecha de la pantalla hay un menú desplegable en el que puede seleccionar la plantilla de definición de aptitudes. Seleccione la plantilla de Azure Machine Learning (AML). Proporcione el nombre del área de trabajo de Azure ML y el punto de conexión del modelo implementado en el clúster de inferencia. La plantilla se actualizará con el URI y la clave del punto de conexión.

Copie la plantilla del conjunto de aptitudes de la ventana y péguela en la definición del conjunto de aptitudes de la izquierda. Edite la plantilla para proporcionar los valores que faltan en:

Nombre
Descripción
Context
"entradas": nombre y origen
"salidas": nombre y targetName

Guarde el conjunto de aptitudes.

A continuación, vaya al indexador y seleccione el vínculo de definición del indexador (JSON). El portal mostrará el archivo JSON del indexador que se creó en las primeras celdas del cuaderno. Las asignaciones de campos de salida deberán actualizarse con asignaciones de campos adicionales para garantizar que el indexador pueda administrarlas y pasarlas correctamente. Guarde los cambios y, luego, seleccione Ejecutar.

Limpieza de recursos

Cuando trabaje con su propia suscripción, es una buena idea al final de un proyecto identificar si todavía se necesitan los recursos que ha creado. Los recursos que se dejan en ejecución pueden costarle mucho dinero. Puede eliminar los recursos de forma individual o eliminar el grupo de recursos para eliminar todo el conjunto de recursos.

Puede encontrar y administrar recursos en el portal, mediante el vínculo Todos los recursos o Grupos de recursos en el panel de navegación izquierdo.

Si está usando un servicio gratuito, recuerde que está limitado a tres índices, indexadores y orígenes de datos. Puede eliminar elementos individuales en el portal para mantenerse por debajo del límite.

Compartir a través de