Compartir a través de


Implementación de la extensión para edge RAG Preview habilitada por Azure Arc

Después de completar los pasos previos, complete los pasos descritos en este artículo para implementar la extensión RAG de Edge.

Importante

La versión preliminar de RAG de Edge habilitada por Azure Arc está actualmente en versión preliminar. Consulte Términos de uso complementarios para las versiones preliminares de Microsoft Azure para conocer los términos legales que se aplican a las características de Azure que se encuentran en la versión beta, en versión preliminar o que todavía no se han publicado para que estén disponibles con carácter general.

Prerrequisitos

Antes de comenzar, complete los requisitos previos de implementación para edge RAG Preview.

Implementar la extensión

Implemente Edge RAG mediante Azure Portal o la CLI de Azure con un modelo de lenguaje proporcionado por Microsoft o agregue su propio modelo de lenguaje.

  1. En Azure Portal, vaya al clúster de Azure Kubernetes en Azure Local.

  2. Seleccione Configuración>Extensiones>+ Agregar y Edge RAG en la lista.

    Captura de pantalla de las extensiones que puede agregar desde el clúster con Edge RAG resaltado.

  3. En la pestaña Básico, especifique la siguiente información:

    Campo Importancia
    Suscripción Seleccione la suscripción que contiene el clúster de Azure Kubernetes Service (AKS) en Azure Local.
    Grupo de recursos Seleccione el grupo de recursos que contiene el clúster de AKS Arc.
    Nombre de implementación Proporcione un nombre para la implementación.
    Región Seleccione la región para implementar Edge RAG.
    Clúster Seleccione el clúster en el que desea implementar Edge RAG.

    Captura de pantalla de la pestaña básica con campos para escribir los detalles del proyecto y de la instancia.

  4. Seleccione Siguiente: Configuration (Siguiente: Configuración).

  5. En la pestaña Configuración, proporcione la siguiente información:

    Campo Importancia
    Modo de implementación Seleccione el modo de GPU o el modo de CPU en función del hardware disponible.
    Modelo La información que escriba en esta sección depende del modelo de lenguaje que seleccione.
    Modelo de lenguaje Seleccione el modelo de lenguaje que desea implementar. Elija un modelo de lenguaje proporcionado por Microsoft o bien su propio modelo de lenguaje.
    Modelo de lenguaje de Microsoft Si eligió Microsoft proporcionado, seleccione uno de los modelos de lenguaje proporcionados por Microsoft.
    Adición de su propio modelo de lenguaje Si decide proporcionar su propio modelo de lenguaje, escriba la siguiente información.
    Nombre del modelo Escriba el nombre del modelo de lenguaje.
    Punto de conexión LLM Escriba el nombre del punto de conexión del modelo de lenguaje grande (LLM) en el formato http://some-endpoint o https://some-endpoint. Por ejemplo: https://<Endpoint_Name>.openai.azure.com/openai/deployments/<model_name> /chat/completions?api-version=<API_VERSION>.
    Token máximo (k) Escriba un intervalo de números entre 4K y 2048 K para el modelo de lenguaje.
    Configuración de SSL
    SSL CNAME Proporcione el nombre de dominio del sistema. Este nombre de dominio es el mismo que el URI de redirección proporcionado durante el registro de la aplicación.
    Nombre del secreto SSL de Kubernetes Proporcione un nombre descriptivo para el secreto SSL que va a usar la aplicación. De forma predeterminada, Edge RAG usa un certificado SSL autofirmado para almacenar bajo este nombre en el almacén de secretos de Kubernetes. Después de la instalación, puede actualizar el certificado con un certificado firmado oficial.
    Acceso
    Entra ID de aplicación Proporcione el identificador de la aplicación de la aplicación que registró como parte de la configuración de la autenticación (Registros de aplicaciones > Su aplicación > Información general).
    Entra el ID de inquilino Proporcione el tenant ID de la aplicación que registró como parte de la configuración de la autenticación (Registros de aplicaciones > Su aplicación > Resumen).

    Captura de pantalla de la pestaña de configuración donde se selecciona el tipo de modelo y otras configuraciones.

  6. Seleccione Siguiente: Revisar y crear.

  7. Revise y valide los parámetros proporcionados.

  8. Seleccione Crear para completar la implementación de RAG de Edge.

  9. Una vez completada la implementación, en Extensiones, compruebe que se enumeran los tipos de extensión microsoft.arc.rag y microsoft.extensiondiagnostics .

La implementación de la extensión RAG de Edge suele tardar unos 30 minutos, pero puede tardar más en función de la conectividad.

Adición de su propio modelo de lenguaje

Si ha agregado su propio modelo de lenguaje al desplegar la extensión Edge RAG, complete los pasos descritos en Configure la autenticación del endpoint "BYOM" para Edge RAG.