Plantillas de aplicación de IA
En esta sección de la documentación se presentan las plantillas de aplicación de IA y los artículos relacionados que usan estas plantillas para demostrar cómo realizar tareas clave para desarrolladores. Las plantillas de aplicación de IA proporcionan implementaciones de referencia bien mantenidas y fáciles de implementar que ayudan a garantizar un punto de partida de alta calidad para las aplicaciones de IA.
Hay dos categorías de plantillas de aplicación de IA, bloques de creación y soluciones de un extremo a otro. En las secciones siguientes se presentan algunas de las plantillas clave de cada categoría para el lenguaje de programación que ha seleccionado en la parte superior de este artículo. Para examinar una lista más completa, incluidas estas y otras plantillas, consulte las plantillas de aplicación de IA en la galería de la CLI para desarrolladores de Azure.
Bloques de creación
Los bloques de creación son ejemplos a menor escala que se centran en escenarios y tareas específicos. La mayoría de los bloques de creación muestran la funcionalidad que aprovecha la solución de un extremo a otro del chat empresarial.
Bloque de creación | Descripción | Artículo |
---|---|---|
Equilibrio de carga con Azure Container Apps | Aprenda a agregar equilibrio de carga a la aplicación para ampliar la aplicación de chat más allá de los límites de cuota de modelo y token de Azure OpenAI. Este enfoque usa Azure Container Apps para crear tres puntos de conexión de Azure OpenAI, así como un contenedor principal para dirigir el tráfico entrante a uno de los tres puntos de conexión. | Equilibrio de carga con Azure Container Apps |
Bloque de creación | Descripción | Artículo |
---|---|---|
Adición del recorte de seguridad de documentos a Azure AI Search | Al compilar una aplicación de chat mediante el patrón RAG con sus propios datos, asegúrese de que cada usuario recibe una respuesta en función de sus permisos. Un usuario autorizado debe tener acceso a las respuestas contenidas en los documentos de la aplicación de chat. Un usuario no autorizado no debe tener acceso a las respuestas de documentos protegidos que no tienen autorización para ver. | Configuración de la seguridad del documento para la aplicación de chat de Python |
Evaluación de respuestas de la aplicación de chat | Obtenga información sobre cómo evaluar las respuestas de una aplicación de chat con un conjunto de respuestas correctas o ideales (conocidas como verdad básica). Siempre que cambie la aplicación de chat de una manera que afecte a las respuestas, ejecute una evaluación para comparar los cambios. Esta aplicación de demostración ofrece herramientas que puede usar hoy para facilitar la ejecución de evaluaciones. | Evaluación de la aplicación de chat de Python |
Equilibrio de carga con Azure Container Apps | Aprenda a agregar equilibrio de carga a la aplicación para ampliar la aplicación de chat más allá de los límites de cuota de modelo y token de Azure OpenAI. Este enfoque usa Azure Container Apps para crear tres puntos de conexión de Azure OpenAI, así como un contenedor principal para dirigir el tráfico entrante a uno de los tres puntos de conexión. | Equilibrio de carga con Azure Container Apps |
Equilibrio de carga con API Management | Aprenda a agregar equilibrio de carga a la aplicación para ampliar la aplicación de chat más allá de los límites de cuota de modelo y token de Azure OpenAI. Este enfoque usa Azure API Management para crear tres puntos de conexión de Azure OpenAI, así como un contenedor principal para dirigir el tráfico entrante a uno de los tres puntos de conexión. | Equilibrio de carga con Azure Container Apps |
Prueba de carga con locust | Obtenga información sobre el proceso para realizar pruebas de carga en una aplicación de chat de Python mediante el patrón RAG con Locust, una popular herramienta de prueba de carga de código abierto. El objetivo principal de las pruebas de carga es asegurarse de que la carga esperada en la aplicación de chat no supera la cuota actual de transacciones de Azure OpenAI por minuto (TPM). Al simular el comportamiento del usuario bajo una carga pesada, puede identificar posibles cuellos de botella y problemas de escalabilidad en la aplicación. | Prueba de carga de la aplicación de chat de Python con Locust |
Bloque de creación | Descripción | Artículo |
---|---|---|
Equilibrio de carga con Azure Container Apps | Aprenda a agregar equilibrio de carga a la aplicación para ampliar la aplicación de chat más allá de los límites de cuota de modelo y token de Azure OpenAI. Este enfoque usa Azure Container Apps para crear tres puntos de conexión de Azure OpenAI, así como un contenedor principal para dirigir el tráfico entrante a uno de los tres puntos de conexión. | Equilibrio de carga con Azure Container Apps |
Bloque de creación | Descripción | Artículo |
---|---|---|
Evaluación de respuestas de la aplicación de chat | Obtenga información sobre cómo evaluar las respuestas de una aplicación de chat con un conjunto de respuestas correctas o ideales (conocidas como verdad básica). Siempre que cambie la aplicación de chat de una manera que afecte a las respuestas, ejecute una evaluación para comparar los cambios. Esta aplicación de demostración ofrece herramientas que puede usar hoy para facilitar la ejecución de evaluaciones. | Evaluación de la aplicación de chat de JavaScript |
Equilibrio de carga con Azure Container Apps | Aprenda a agregar equilibrio de carga a la aplicación para ampliar la aplicación de chat más allá de los límites de cuota de modelo y token de Azure OpenAI. Este enfoque usa Azure Container Apps para crear tres puntos de conexión de Azure OpenAI, así como un contenedor principal para dirigir el tráfico entrante a uno de los tres puntos de conexión. | Equilibrio de carga con Azure Container Apps |
Equilibrio de carga con API Management | Aprenda a agregar equilibrio de carga a la aplicación para ampliar la aplicación de chat más allá de los límites de cuota de modelo y token de Azure OpenAI. Este enfoque usa Azure API Management para crear tres puntos de conexión de Azure OpenAI, así como un contenedor principal para dirigir el tráfico entrante a uno de los tres puntos de conexión. | Equilibrio de carga con Azure Container Apps |
Soluciones de un extremo a otro
Las soluciones de un extremo a otro son ejemplos de referencia completos, como la documentación, el código fuente y la implementación, que le permiten tomar y ampliar para sus propios fines.
Chat de empresa con .NET
Esta plantilla es una solución completa de un extremo a otro que muestra el patrón de generación aumentada de recuperación (RAG) que se ejecuta en Azure, mediante Azure AI Search para la recuperación y los modelos de lenguaje grande de Azure OpenAI para potenciar las experiencias de chatGPT y preguntas y respuestas.
Para empezar a trabajar con esta plantilla, consulte Introducción al ejemplo de chat empresarial de .NET mediante RAG. Para acceder al código fuente y leer detalles detallados sobre la plantilla, consulte el repositorio de GitHub azure-search-openai-demo-csharp .
Esta plantilla muestra el uso de estas características.
Solución de hospedaje de Azure | Tecnologías | Modelos de IA |
---|---|---|
Azure Container Apps Funciones de Azure |
Azure OpenAI Azure Computer Vision Azure Form Recognizer Azure AI Search Azure Storage |
GPT 3.5 Turbo GPT 4.0 |
Contoso chat retail Copilot with .NET and Semantic Kernel
Esta plantilla implementa Contoso Outdoors, una tienda conceptual especializada en equipos al aire libre para practicar senderismo y entusiastas del camping. Esta tienda virtual mejora la participación del cliente y el soporte técnico de ventas a través de un agente de chat inteligente. Este agente se basa en el patrón de generación aumentada de recuperación (RAG) dentro de Microsoft Azure AI Stack, enriquecido con el kernel semántico y la compatibilidad con Prompty.
Para acceder al código fuente y leer detalles detallados sobre la plantilla, consulte el repositorio de GitHub contoso-chat-csharp-prompty .
Esta plantilla muestra el uso de estas características.
Solución de hospedaje de Azure | Tecnologías | Modelos de IA |
---|---|---|
Azure Container Apps |
Azure OpenAI Microsoft Entra ID Azure Managed Identity Azure Monitor Azure AI Search Azure AI Studio Azure SQL Azure Storage |
GPT 3.5 Turbo GPT 4.0 |
Automatización de procesos con conversión de voz en texto y resumen con .NET y GPT 3.5 Turbo
Esta plantilla es una solución de automatización de procesos que recibe los problemas notificados por los trabajadores de campo y de planta de tiendas en una empresa llamada Contoso Manufacturing, una empresa de fabricación que fabrica baterías de automóviles. Los trabajos comparten los problemas a través de la entrada del micrófono o se graban previamente como archivos de audio. La solución traduce la entrada de audio de voz a texto y, a continuación, usa un LLM y Prompty o Promptflow para resumir el problema y devolver los resultados en un formato especificado por la solución.
Para acceder al código fuente y leer detalles detallados sobre la plantilla, consulte el repositorio de GitHub resumen-openai-csharp-prompty .
Esta plantilla muestra el uso de estas características.
Solución de hospedaje de Azure | Tecnologías | Modelos de IA |
---|---|---|
Azure Container Apps | Speech to Text Resumen Azure OpenAI |
GPT 3.5 Turbo |
Chat empresarial con Python
Esta plantilla es una solución completa de un extremo a otro que muestra el patrón de generación aumentada de recuperación (RAG) que se ejecuta en Azure, mediante Azure AI Search para la recuperación y los modelos de lenguaje grande de Azure OpenAI para potenciar las experiencias de chatGPT y preguntas y respuestas.
Para empezar a trabajar con esta plantilla, consulte Introducción al ejemplo de chat empresarial de Python mediante RAG. Para acceder al código fuente y leer detalles detallados sobre la plantilla, consulte el repositorio de GitHub azure-search-openai-demo .
Esta plantilla muestra el uso de estas características.
Solución de hospedaje de Azure | Tecnologías | Modelos de IA |
---|---|---|
Azure App Service | Azure OpenAI Búsqueda de Bing Azure Managed Identity Azure Monitor Azure AI Search Azure AI Studio |
GPT 3.5 Turbo GPT 4.0 DALL-E |
Copilot de escritura creativa multi modal con DALL-E
Esta plantilla es una solución creativa de escritura multiagente para ayudar a los usuarios a escribir artículos. Muestra cómo crear y trabajar con agentes de IA controlados por Azure OpenAI. Incluye una aplicación de Flask que toma un tema e instrucciones de un usuario, a continuación, llama a un agente de investigación que usa Bing Search API para investigar el tema, un agente de producto que usa Azure AI Search para realizar una búsqueda de similitud semántica para productos relacionados de un almacén de vectores, un agente de escritura para combinar la investigación y la información del producto en un artículo útil, y un agente de editor para refinar el artículo que finalmente se presenta al usuario.
Para acceder al código fuente y leer detalles detallados sobre la plantilla, consulte el repositorio de GitHub agent-openai-python-prompty .
Esta plantilla muestra el uso de estas características.
Solución de hospedaje de Azure | Tecnologías | Modelos de IA |
---|---|---|
Registro de contenedor de Azure Azure Kubernetes |
Azure OpenAI Búsqueda de Bing Azure Managed Identity Azure Monitor Azure AI Search Azure AI Studio |
GPT 3.5 Turbo GPT 4.0 DALL-E |
Contoso Chat Retail Copilot con AI Studio
Esta plantilla es una solución de chat de soporte técnico y ventas de clientes. Muestra cómo crear una aplicación de modelo de lenguaje grande (LLM) con una arquitectura RAG (generación aumentada de recuperación) mediante Azure AI Studio y Prompt Flow.
Para acceder al código fuente y leer detalles detallados sobre la plantilla, consulte el repositorio de GitHub contoso-chat .
Esta plantilla muestra el uso de estas características.
Solución de hospedaje de Azure | Tecnologías | Modelos de IA |
---|---|---|
Azure Container Apps |
Azure OpenAI Azure AI Search Azure AI Studio Azure Cosmos DB |
GPT 3.5 Turbo GPT 4.0 Managed Integration Runtime (MIR) |
Automatización de procesos con conversión de voz en texto y resumen con AI Studio
Esta plantilla es una solución de automatización de procesos que recibe los problemas notificados por los trabajadores de campo y de planta de tiendas en una empresa llamada Contoso Manufacturing, una empresa de fabricación que fabrica baterías de automóviles. Los trabajos comparten los problemas a través de la entrada del micrófono, grabados previamente como archivos de audio o como entrada de texto. La solución traduce la entrada de audio de voz a texto y, a continuación, usa los informes de texto como entrada en un LLM y Prompty/Promptflow para resumir el problema y devolver los resultados en un formato especificado por la solución.
Para acceder al código fuente y leer detalles detallados sobre la plantilla, consulte el repositorio de GitHub resumen-openai-python-prompflow .
Esta plantilla muestra el uso de estas características.
Solución de hospedaje de Azure | Tecnologías | Modelos de IA |
---|---|---|
Azure Container Apps | Azure AI Studio Speech to Text Service Flujo de solicitud Managed Integration Runtime (MIR) |
GPT 3.5 Turbo |
Llamada a funciones con Prompty, LangChain y Elastic Search
Esta plantilla es una aplicación que usa Prompty, Langchain y Elasticsearch para crear un agente de búsqueda de modelos de lenguaje grande (LLM). Este agente con tecnología de generación aumentada de recuperación (RAG) es capaz de responder a las preguntas del usuario en función de los datos proporcionados mediante la integración de la recuperación de información en tiempo real con respuestas generativas.
Para acceder al código fuente y leer detalles detallados sobre la plantilla, consulte el repositorio agent-python-openai-prompty-langchain de GitHub.
Esta plantilla muestra el uso de estas características.
Solución de hospedaje de Azure | Tecnologías | Modelos de IA |
---|---|---|
Machine Learning Service | Azure AI Studio Búsqueda elástica Microsoft Entra ID Azure Managed Identity Azure Monitor Azure Storage Azure AI Studio Managed Integration Runtime (MIR) |
GPT 3.5 Turbo |
Llamada a funciones con Prompty, LangChain y Pinecone
Esta plantilla utiliza la nueva herramienta Prompty, Langchain y Pinecone para crear un agente de búsqueda de modelos de lenguaje grande (LLM). Este agente con tecnología de generación aumentada de recuperación (RAG) es capaz de responder a las preguntas del usuario en función de los datos proporcionados mediante la integración de la recuperación de información en tiempo real con respuestas generativas.
Para acceder al código fuente y leer detalles detallados sobre la plantilla, consulte el repositorio agent-openai-python-prompty-langchain-pinecone de GitHub.
Esta plantilla muestra el uso de estas características.
Solución de hospedaje de Azure | Tecnologías | Modelos de IA |
---|---|---|
Azure Container Apps | Pinecone Microsoft Entra ID Identidad administrada de Microsoft Azure Monitor Azure Storage |
GPT 3.5 Turbo |
Asistente de API Analytics Copilot con Python y Azure AI Studio
Esta plantilla es una API de Assistant para chatear con datos tabulares y realizar análisis en lenguaje natural. Para acceder al código fuente y leer detalles detallados sobre la plantilla, consulte el repositorio de GitHub asistente-data-openai-python-promptflow.
Esta plantilla muestra el uso de estas características.
Solución de hospedaje de Azure | Tecnologías | Modelos de IA |
---|---|---|
Machine Learning Service | Azure AI Search Azure AI Studio Managed Integration Runtime (MIR) Azure OpenAI |
GPT 3.5 Turbo GPT 4 |
Chat empresarial con Java
Esta plantilla es una solución completa de un extremo a otro que muestra el patrón de generación aumentada de recuperación (RAG) que se ejecuta en Azure, mediante Azure AI Search para la recuperación y los modelos de lenguaje grande de Azure OpenAI para potenciar las experiencias de chatGPT y preguntas y respuestas. Este ejemplo admite diferentes estilos arquitectónicos. Se puede implementar como aplicación independiente sobre App de Azure Service o como una arquitectura controlada por eventos de microservicio con front-end web, orquestación de IA y aplicaciones de ingesta de documentos hospedadas por Azure Container Apps o Azure Kubernetes Service.
Para empezar a trabajar con esta plantilla, consulte Introducción al ejemplo de chat empresarial de Java mediante RAG. Para acceder al código fuente y leer detalles detallados sobre la plantilla, consulte el repositorio de GitHub azure-search-openai-demo-java .
Esta plantilla muestra el uso de estas características.
Solución de hospedaje de Azure | Tecnologías | Modelos de IA |
---|---|---|
Azure App Service Azure Container Apps Azure Kubernetes Service |
Azure OpenAI Azure AI Search Azure Storage Azure Monitor |
Chat empresarial con JavaScript
Esta plantilla es una solución completa de un extremo a otro que muestra el patrón de generación aumentada de recuperación (RAG) que se ejecuta en Azure, mediante Azure AI Search para la recuperación y los modelos de lenguaje grande de Azure OpenAI para potenciar las experiencias de chatGPT y preguntas y respuestas.
Para empezar a trabajar con esta plantilla, consulte Introducción al ejemplo de chat empresarial de JavaScript mediante RAG. Para acceder al código fuente y leer detalles detallados sobre la plantilla, consulte el repositorio de GitHub azure-search-openai-javascript .
Esta plantilla muestra el uso de estas características.
Solución de hospedaje de Azure | Tecnologías | Modelos de IA |
---|---|---|
Azure Container Apps Azure Static Web Apps |
Azure OpenAI Azure AI Search Azure Storage Azure Monitor |
text-embedding-ada-002 |
Front-end de chat de Azure OpenAI
Esta plantilla es un componente web de chat de OpenAI mínimo que se puede enlazar a cualquier implementación de back-end como cliente.
Para acceder al código fuente y leer detalles detallados sobre la plantilla, consulte el repositorio de GitHub azure-openai-chat-frontend .
Esta plantilla muestra el uso de estas características.
Solución de hospedaje de Azure | Tecnologías | Modelos de IA |
---|---|---|
Azure Static Web Apps | Azure AI Search Azure OpenAI |
GPT 3.5 Turbo GPT4 |
Chat de INTELIGENCIA artificial sin servidor con RAG mediante LangChain.js
La plantilla es un bot de chat de inteligencia artificial sin servidor con recuperación de generación aumentada mediante LangChain.js y Azure que usa un conjunto de documentos empresariales para generar respuestas a las consultas de usuario. Usa una empresa ficticia denominada Contoso Real Estate y la experiencia permite a sus clientes formular preguntas de soporte técnico sobre el uso de sus productos. Los datos de ejemplo incluyen un conjunto de documentos que describen sus términos de servicio, la directiva de privacidad y una guía de soporte técnico.
Para obtener información sobre cómo implementar y ejecutar esta plantilla, consulte Introducción al chat de IA sin servidor con RAG mediante LangChain.js. Para acceder al código fuente y leer detalles detallados sobre la plantilla, consulte el repositorio de GitHub serverless-chat-langchainjs .
Aprenda a implementar y ejecutar esta plantilla de referencia de JavaScript.
Esta plantilla muestra el uso de estas características.
Solución de hospedaje de Azure | Tecnologías | Modelos de IA |
---|---|---|
Azure Static Web Apps Funciones de Azure |
Azure AI Search Azure OpenAI Azure Cosmos DB Azure Storage Azure Managed Identity |
GPT4 Mistral Ollama |
Comentarios
https://aka.ms/ContentUserFeedback.
Próximamente: A lo largo de 2024 iremos eliminando gradualmente GitHub Issues como mecanismo de comentarios sobre el contenido y lo sustituiremos por un nuevo sistema de comentarios. Para más información, vea:Enviar y ver comentarios de