Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Después de completar los pasos previos, complete los pasos descritos en este artículo para implementar la extensión RAG de Edge.
Importante
La versión preliminar de RAG de Edge habilitada por Azure Arc está actualmente en versión preliminar. Consulte Términos de uso complementarios para las versiones preliminares de Microsoft Azure para conocer los términos legales que se aplican a las características de Azure que se encuentran en la versión beta, en versión preliminar o que todavía no se han publicado para que estén disponibles con carácter general.
Prerrequisitos
Antes de comenzar, complete los requisitos previos de implementación para edge RAG Preview.
Implementar la extensión
Implemente Edge RAG mediante Azure Portal o la CLI de Azure con un modelo de lenguaje proporcionado por Microsoft o agregue su propio modelo de lenguaje.
En Azure Portal, vaya al clúster de Azure Kubernetes en Azure Local.
Seleccione Configuración>Extensiones>+ Agregar y Edge RAG en la lista.
En la pestaña Básico, especifique la siguiente información:
Campo Importancia Suscripción Seleccione la suscripción que contiene el clúster de Azure Kubernetes Service (AKS) en Azure Local. Grupo de recursos Seleccione el grupo de recursos que contiene el clúster de AKS Arc. Nombre de implementación Proporcione un nombre para la implementación. Región Seleccione la región para implementar Edge RAG. Clúster Seleccione el clúster en el que desea implementar Edge RAG. Seleccione Siguiente: Configuration (Siguiente: Configuración).
En la pestaña Configuración, proporcione la siguiente información:
Campo Importancia Modo de implementación Seleccione el modo de GPU o el modo de CPU en función del hardware disponible. Modelo La información que escriba en esta sección depende del modelo de lenguaje que seleccione. Modelo de lenguaje Seleccione el modelo de lenguaje que desea implementar. Elija un modelo de lenguaje proporcionado por Microsoft o bien su propio modelo de lenguaje. Modelo de lenguaje de Microsoft Si eligió Microsoft proporcionado, seleccione uno de los modelos de lenguaje proporcionados por Microsoft. Adición de su propio modelo de lenguaje Si decide proporcionar su propio modelo de lenguaje, escriba la siguiente información. Nombre del modelo Escriba el nombre del modelo de lenguaje. Punto de conexión LLM Escriba el nombre del punto de conexión del modelo de lenguaje grande (LLM) en el formato http://some-endpoint
ohttps://some-endpoint
. Por ejemplo:https://<Endpoint_Name>.openai.azure.com/openai/deployments/<model_name> /chat/completions?api-version=<API_VERSION>
.Token máximo (k) Escriba un intervalo de números entre 4K y 2048 K para el modelo de lenguaje. Configuración de SSL SSL CNAME Proporcione el nombre de dominio del sistema. Este nombre de dominio es el mismo que el URI de redirección proporcionado durante el registro de la aplicación. Nombre del secreto SSL de Kubernetes Proporcione un nombre descriptivo para el secreto SSL que va a usar la aplicación. De forma predeterminada, Edge RAG usa un certificado SSL autofirmado para almacenar bajo este nombre en el almacén de secretos de Kubernetes. Después de la instalación, puede actualizar el certificado con un certificado firmado oficial. Acceso Entra ID de aplicación Proporcione el identificador de la aplicación de la aplicación que registró como parte de la configuración de la autenticación (Registros de aplicaciones > Su aplicación > Información general). Entra el ID de inquilino Proporcione el tenant ID de la aplicación que registró como parte de la configuración de la autenticación (Registros de aplicaciones > Su aplicación > Resumen). Seleccione Siguiente: Revisar y crear.
Revise y valide los parámetros proporcionados.
Seleccione Crear para completar la implementación de RAG de Edge.
Una vez completada la implementación, en Extensiones, compruebe que se enumeran los tipos de extensión microsoft.arc.rag y microsoft.extensiondiagnostics .
La implementación de la extensión RAG de Edge suele tardar unos 30 minutos, pero puede tardar más en función de la conectividad.
Adición de su propio modelo de lenguaje
Si ha agregado su propio modelo de lenguaje al desplegar la extensión Edge RAG, complete los pasos descritos en Configure la autenticación del endpoint "BYOM" para Edge RAG.
Contenido relacionado
- Configurar la autenticación del endpoint "BYOM" para Edge RAG
- Autoridad certificadora personalizada en el Servicio Kubernetes de Azure (AKS)
- Configuración de la solución de chat para Edge RAG
- Adición de un origen de datos para la solución de chat en Edge RAG