Cargas de trabajo de IA en Azure
Esta guía aborda los desafíos arquitectónicos del diseño de cargas de trabajo de inteligencia artificial, centrándose en la funcionalidad no determinista, los datos y el diseño de aplicaciones y las operaciones. Las recomendaciones se basan en los principios de Azure Well-Architected Framework (WAF) e incluyen información de implementaciones de Azure correctas.
Estos artículos están diseñados para propietarios de cargas de trabajo y partes interesadas técnicas, como arquitectos, responsables de desarrollo y líderes de TI. La inteligencia artificial especializada y los roles de datos, como los científicos de datos, también deben tener en cuenta esta guía, ya que la colaboración entre varios roles y equipos es un aspecto clave.
Nota
Microsoft Azure ofrece una variedad de servicios de inteligencia artificial que se pueden integrar en la carga de trabajo o compilarlos en torno a ella. En función de sus necesidades empresariales, puede elegir entre soluciones SaaS totalmente administradas, soluciones PaaS o crear su propia solución de inteligencia artificial. Los servicios específicos de Azure y sus funcionalidades no se tratan aquí. Para ellos, se recomienda hacer referencia a la documentación del producto correspondiente.
Además, algunas cargas de trabajo de IA no están en el ámbito, como:
- Cargas de trabajo que se realizan a través de ofertas de código bajo y sin código, como Microsoft Copilot Studio.
- Cargas de trabajo que requieren una informática de alto rendimiento.
- Cargas de trabajo que no implementan casos de uso de IA generativos o discriminativos.
En el contexto de WAF, una carga de trabajo de IA satisface las necesidades de tareas predictivas, discriminatorias o generativas. Se centra en la funcionalidad ética, la adaptación a las tecnologías de inteligencia artificial en evolución rápida y mantenerse relevante y explicable. Los pilares de WAF deben aplicarse en cada punto de decisión para garantizar que el sistema sea confiable, seguro, eficiente y rentable.
Las cargas de trabajo de inteligencia artificial son diferentes de las tradicionales porque reemplazan la funcionalidad determinista en partes de la carga de trabajo por un comportamiento no determinista que resuelve situaciones en las que los resultados fijos no son prácticos. En su lugar, combinan código y datos en una entidad, o un modelo, lo que permite experiencias únicas que los sistemas tradicionales no pueden proporcionar.
Antes de comenzar las estrategias de diseño, tenga en cuenta estos puntos clave en primer lugar.
La inteligencia artificial generativa usa el aprendizaje automático para crear contenido de forma autónoma. Incluye modelos de lenguaje que se pueden personalizar con datos de usuario o que se usan como servicios como Azure OpenAI. Por ejemplo, GPT, un tipo de modelo de lenguaje, se especializa en imitar el lenguaje conversacional humano y es ideal para experiencias de chat y lenguaje natural.
Casos de uso: la inteligencia artificial generativa puede generar artículos, historias, arte, generar datos sintéticos para equilibrar los conjuntos de datos y hacer que los bots de chat sean más similares a los humanos.
La inteligencia artificial discriminativa usa programación explícita para realizar tareas específicas basadas en reglas y algoritmos. Se puede dividir en:
Basado en modelos. Sistemas predictivos que encuentran patrones, basados en el entrenamiento realizado a partir de observaciones anteriores, para realizar predicciones, pero no pueden crear contenido nuevo ni adaptarse por sí mismos.
No basado en modelos. Agentes autónomos que siguen reglas predefinidas para interactuar con sistemas, como personajes de videojuegos.
Caso de uso: la inteligencia artificial discriminativa se usa para el análisis predictivo, los sistemas de recomendaciones y la detección de fraudes.
En esta serie de artículos se tratan diferentes cargas de trabajo de inteligencia artificial, centrándose en tipos específicos, como los modelos de lenguaje cuando sea necesario.
Importante
Al elegir entre modelos generativos y discriminativos, piense en la tarea que necesita realizar. Los modelos generativos crean nuevos datos, mientras que los modelos discriminativos clasifican los datos existentes en función de las características. Para las tareas de clasificación o regresión, elija los modelos que se ajusten al trabajo. Por ejemplo, un modelo de lenguaje que puede clasificar podría ser más versátil que uno que solo clasifica.
Si las respuestas genéricas son aceptables, un modelo precompilado o una solución basada en el servicio ai que usa el procesamiento opaco debe ser suficiente para la carga de trabajo. Pero si necesita datos específicos de su empresa o tiene requisitos de cumplimiento, deberá crear un modelo personalizado.
Al elegir entre un modelo personalizado, un modelo precompilado o un servicio, tenga en cuenta estos factores:
Control de datos. Los modelos personalizados proporcionan más control sobre los datos confidenciales. Los modelos creados previamente son más fáciles para tareas generales.
Personalización. Los modelos personalizados son mejores para necesidades únicas. Los modelos creados previamente pueden carecer de flexibilidad.
Costo y mantenimiento. Los modelos personalizados necesitan mantenimiento y recursos continuos. Los modelos precompilados suelen tener costos iniciales más bajos y menos carga de infraestructura.
Rendimiento. Los servicios creados previamente ofrecen una infraestructura y escalabilidad optimizadas. Son ideales para necesidades de baja latencia o alta escalabilidad.
Experiencia. Los modelos personalizados requieren un equipo cualificado. Los modelos creados previamente pueden ser más rápidos para implementar y facilitar su uso si la experiencia es limitada.
Importante
La creación y el mantenimiento de su propio modelo requiere una gran cantidad de recursos, tiempo y experiencia. Es importante investigar exhaustivamente antes de decidir. Normalmente, elegir un modelo precompilado o un servicio administrado es una mejor opción.
Costos de proceso. Las funciones de inteligencia artificial pueden ser costosas debido a las necesidades de proceso elevadas y las necesidades de proceso pueden variar según el diseño de la carga de trabajo. Comprenda sus requisitos y elija el servicio adecuado para administrar los costos.
Requisitos de seguridad y cumplimiento. Es posible que las soluciones fuera de la plataforma no satisfagan sus necesidades de seguridad y cumplimiento. Opciones de investigación para evitar cargas innecesarias.
Volumen de datos. El control de grandes volúmenes de datos en varios formatos conlleva desafíos para proteger la información confidencial y el procesamiento eficaz. Optimizar los costos de almacenamiento, procesamiento y transferencia debe ser una actividad continua.
Decaimiento del modelo. Los modelos pueden degradarse con el tiempo, lo que conduce a resultados inexactos. Probar los sistemas de inteligencia artificial es difícil debido a su aleatoriedad.
Desafíos de aptitudes. Las nuevas cargas de trabajo de IA pueden necesitar roles especializados y nuevos procesos de operaciones que requieren un entrenamiento extenso.
Ritmo de innovación en la inteligencia artificial. La adopción de las tecnologías más recientes puede ser tentadora para permanecer en la vanguardia. Evalúe cuidadosamente las nuevas tecnologías para asegurarse de que mejoran la experiencia del usuario y no solo agregan complejidad por motivos de actualización.
Requisitos éticos. Debe determinar claramente si el caso de uso es un objetivo ético para la inteligencia artificial. El mantenimiento de estándares éticos es necesario a lo largo de las fases de planificación e implementación para asegurarse de que está creando un sistema responsable.
✔ Comience con la metodología de diseño, que describe los temas racionales y periódicos en áreas técnicas y operativas. Este enfoque sistemático ayuda a definir requisitos y estrategias de diseño. Vuelva a consultar esta metodología cuando se enfrentan a opciones inciertas para mantenerse alineadas con los objetivos generales de la carga de trabajo. También proporciona un marco para colaborar con las partes interesadas para justificar decisiones técnicas e incorporar comentarios de los clientes para mejorar continuamente.
✔ Continúe con Los principios de diseño para ver cómo se alinea la metodología de diseño con los pilares principales del marco bien diseñado, considerando la evolución del crecimiento. Evalúe los principios subyacentes de todos los pilares colectivamente, incluidos los inconvenientes.
✔ Céntrese en las áreas de diseño que tienen el mayor efecto en la solución. Cada área incluye consideraciones y recomendaciones para guiarle a través de las decisiones de diseño.
✔ Use la herramienta de revisión de evaluación para evaluar la preparación de la carga de trabajo de INTELIGENCIA artificial optimizada en producción.
La arquitectura resalta la integración de diferentes componentes para habilitar el procesamiento de datos eficaz, la optimización del modelo y la implementación de aplicaciones en tiempo real en soluciones controladas por ia. Incluye varios módulos, como orígenes de datos, procesamiento de datos, entrenamiento de modelos, implementación de modelos e interfaces de usuario, que ilustran cómo fluyen los datos a través del sistema desde la recopilación inicial hasta la interacción final del usuario.
En la tabla siguiente se describen algunas áreas de diseño clave relacionadas con ese patrón.
Área de diseño |
---|
Diseño de aplicaciones. Obtenga información sobre las consideraciones exclusivas de las cargas de trabajo de IA que podrían tener un efecto significativo en los estándares de diseño de aplicaciones existentes. |
Plataforma de aplicaciones. Determine las mejores plataformas que se usarán para admitir funciones de carga de trabajo de IA, como el hospedaje de modelos, el entrenamiento del modelo y la inferencia. |
Diseño de datos de entrenamiento. Diseñar estrategias para la ingesta de datos, el preprocesamiento, la retención y los temas de gobernanza para controlar los datos de entrenamiento del modelo. |
Diseño de datos en tierra. Diseñe estrategias para optimizar la capacidad de búsqueda y recuperación, a la vez que cumple los requisitos de seguridad y cumplimiento de los datos de base. |
Plataforma de datos. Determine la mejor plataforma de hospedaje para controlar las grandes cantidades y potencialmente muchos formatos de datos que usa la carga de trabajo. |
Operaciones de aprendizaje automático y operaciones de inteligencia artificial generativa. Establezca prácticas modernas de DevOps para admitir las funciones y sistemas de inteligencia artificial generativa o de aprendizaje automático. |
Operaciones de carga de trabajo. Modernice sus prácticas operativas con nuevos enfoques y agregue roles y entrenamiento especializados. |
Pruebas y evaluación. Desarrolle estrategias de prueba y evaluación para medir características como la precisión, la precisión, la confidencialidad y la especificidad a través de métricas destinadas específicamente a las cargas de trabajo de inteligencia artificial. |
Roles de carga de trabajo. Comprenda cómo intervienen los roles en el ciclo de vida completo de la carga de trabajo de inteligencia artificial para ayudar a garantizar que el equipo es totalmente capaz de crearlo y apoyarlo. |
Inteligencia artificial responsable. La inteligencia artificial aporta increíbles oportunidades para nuevos productos y servicios, pero también conlleva un grado considerable de riesgo. Preste especial atención a la experiencia del usuario y las implicaciones éticas de la publicación de la solución de inteligencia artificial al público. |
Sugerencia
Cada decisión arquitectónica implica una serie de consideraciones y un conjunto de compromisos reconocidos que equilibran distintos aspectos del marco. Estos inconvenientes se indican mediante este icono .