Desarrollo de aplicaciones y características de IA generativa responsable en Windows

En este documento se proporciona información general sobre las prácticas de desarrollo responsables recomendadas para usarlas a medida que se crean aplicaciones y características en Windows con inteligencia artificial generativa.

Los modelos de inteligencia artificial generativa de Microsoft Foundry en Windows en dispositivos pueden ayudarte a aplicar características de seguridad de contenido local, como los motores de clasificación integrados para contenido dañino y una lista de bloqueados predeterminada. Microsoft da prioridad a los desarrolladores para crear experiencias de inteligencia artificial seguras y de confianza con modelos locales en Windows.

Directrices para el desarrollo responsable de las aplicaciones y características de IA generativa en Windows

Todos los equipos de Microsoft siguen los principios y procedimientos básicos para crear y enviar la inteligencia artificial de forma responsable, incluido Windows. Puede obtener más información sobre el enfoque de Microsoft para el desarrollo responsable en el Informe de transparencia de inteligencia artificial responsable de Microsoft. Windows sigue los pilares fundamentales del desarrollo RAI, que rigen, asignan, miden y administran, y que están alineados con el Marco de administración de riesgos de IA del Instituto Nacional de Estándares y Tecnología (NIST).

Gobernanza: directivas, prácticas y procesos

Los estándares son la base de los procesos de gobernanza y cumplimiento. Microsoft ha desarrollado nuestro propio estándar de IA responsable, incluidos seis principios que puede usar como punto de partida para desarrollar sus directrices para la IA responsable. Se recomienda crear principios de inteligencia artificial en el ciclo de vida de desarrollo de un extremo a otro, así como en los procesos y flujos de trabajo para el cumplimiento de las leyes y reglamentos en la privacidad, la seguridad y la inteligencia artificial responsable. Esto abarca desde la evaluación temprana de cada característica de inteligencia artificial, mediante herramientas como la Lista de Comprobación de Equidad de IA y las Directrices para la Interacción Human-AI - Microsoft Research, hasta la supervisión y revisión de referentes, pruebas y procesos de inteligencia artificial mediante herramientas como un Cuadro de Mandos de IA Responsable, así como la documentación pública sobre las capacidades y limitaciones de las características de IA y los controles para el usuario: aviso, consentimiento, recopilación de datos e información de procesamiento, etc., de acuerdo con las leyes de privacidad, los requisitos normativos y las políticas aplicables.

Asignación: identificación del riesgo

Entre los procedimientos recomendados para identificar riesgos se incluyen:

Pruebas de un extremo a otro

Las pruebas de un extremo a otro evalúan todo el sistema de inteligencia artificial de principio a fin para asegurarse de que funciona según lo previsto y cumple los estándares establecidos. Este enfoque integral puede incluir:

Red Teaming

El término Red Teaming (Equipo rojo en español) ha descrito históricamente ataques adversarios sistemáticos para probar vulnerabilidades de seguridad. Más recientemente, el término se ha ampliado más allá de la ciberseguridad tradicional y ha evolucionado en uso común para describir muchos tipos de sondeos, pruebas y ataques a sistemas de inteligencia artificial.

Con los modelos de lenguaje de gran tamaño (LLMs) y los modelos de lenguaje de pequeño tamaño (SLMs), tanto el uso benigno como el adversarial pueden producir salidas potencialmente perjudiciales que pueden adoptar muchas formas, como el discurso de odio, la incitación o la glorificación de la violencia, o el contenido sexual. La evaluación de amenaza exhaustiva le permite probar su sistema y refinar la estrategia de contenido para reducir la posibilidad de que su sistema provoque daños.

Todos los sistemas de inteligencia artificial deben someterse a pruebas de equipo rojo, en función de la función y el propósito, tanto para sistemas de alto riesgo que emplean inteligencia artificial generativa como sistemas de menor riesgo que usan inteligencia artificial no generativa:

Red Teaming normal: Debería llevarse a cabo la ejecución de Red Teaming independiente para todos los sistemas de alto riesgo que emplean inteligencia artificial generativa mediante modelos de lenguaje de gran tamaño (LLM). La formación de Red Teaming formal incluye la contratación de profesionales fuera de su organización para participar en actividades de Red Teaming.
Red Teaming interno: Como mínimo, planee un Red Teaming interno para todos los sistemas de inteligencia artificial no generativos y de menor riesgo. Esto lo pueden hacer personas de dentro de su organización.

Obtenga más información sobre el red teaming y cómo evaluar las necesidades de red teaming de su sistema: Microsoft AI Red Team

Evaluación del modelo

Como parte de las pruebas de un extremo a otro, es importante evaluar el propio modelo.

Tarjeta de modelo: para los modelos disponibles públicamente, como los de Hugging Face, puede comprobar la tarjeta modelo de cada modelo como una referencia útil para comprender si un modelo es el adecuado para su caso de uso. Obtenga más información sobre las tarjetas de modelo.
Pruebas manuales: los seres humanos realizan pruebas paso a paso sin scripts, lo que es un componente importante de la evaluación del modelo que admite...
- Medición del progreso en un pequeño conjunto de problemas de prioridad. Al mitigar daños específicos, a menudo es más productivo seguir comprobando manualmente el progreso en un conjunto de datos pequeño hasta que el daño ya no se observe antes de pasar a la medición automatizada.
- Definir e informar de métricas hasta que la medición automatizada sea lo suficientemente fiable como para usarla sola.
- Comprobación de acceso puntual periódicamente para medir la calidad de la medición automática.
Pruebas automatizadas: las pruebas ejecutadas automáticamente también son un componente importante de la evaluación del modelo que admite...
- La medición a gran escala con mayor cobertura para proporcionar resultados más completos.
- Medición continua para supervisar cualquier regresión a medida que evolucionan el sistema, el uso y las mitigaciones.
Selección de modelos: seleccione un modelo adecuado para su propósito y edúquese para comprender sus capacidades, limitaciones y posibles desafíos de seguridad. Al probar el modelo, asegúrese de que genera resultados adecuados para su uso. Para empezar, los destinos de los orígenes de modelos de Microsoft (y que no son de Microsoft o código abierto) incluyen:

Medida: evaluación de riesgos y mitigación

Procedimientos recomendados:

Asignación de Content Moderator: Content Moderator comprueba el contenido de texto, de imágenes y de vídeos para encontrar material que pueda ser ofensivo, conflictivo o inapropiado. Más información: Introducción a Content Moderator (Aprendizaje de Microsoft Learn).
- Usar filtros de seguridad de contenido: este conjunto de modelos de clasificación multiclase detecta cuatro categorías de contenido perjudicial (violencia, odio, sexual y autolesión) en varios niveles de gravedad (bajo, medio y alto). Más información: Cómo configurar los filtros de contenido con Azure OpenAI Service.
- Aplicar un meta aviso: un meta aviso es un mensaje del sistema que se incluye al principio de la solicitud y se usa para preparar el modelo con el contexto, las instrucciones y el resto de la información relevante para su caso de uso. Estas instrucciones se usan para guiar el comportamiento del modelo. Más información: Creación de barreras de seguridad eficaces con metaprompt / ingeniería de mensajes del sistema.
- Usar listas de bloqueados: esto bloquea el uso de determinados términos o patrones en un mensaje. Más información: Uso de una lista de bloqueados en Azure OpenAI.
- Familiarícese con la procedencia del modelo: la procedencia es el historial de propiedad de un modelo, o el quién-qué-dónde-cuándo, y es muy importante comprenderlo. ¿Quién recopiló los datos en un modelo? ¿A quién pertenecen los datos? ¿Qué tipo de datos se usan? ¿Dónde se recopilaron los datos? ¿Cuándo se recopilaron los datos? Saber de dónde proceden los datos del modelo puede ayudarle a evaluar su calidad y confiabilidad y evitar cualquier uso de datos no ético, injusto, sesgado o inexacto.
- Usar una canalización estándar: use una canalización de moderación de contenido en lugar de extraer partes por etapas. Más información: ¿Qué son las canalizaciones de Azure Machine Learning?.
Aplicarmitigacionesde la interfaz de usuario: Proporcionan claridad importante al usuario sobre las funcionalidades y limitaciones de una característica basada en IA. Para ayudar a los usuarios y proporcionar transparencia sobre la característica, puede hacer lo siguiente:
- Animar a los usuarios a editar salidas antes de aceptarlas
- Resaltar posibles inexactitudes en las salidas de IA
- Divulgar el papel de la IA en la interacción
- Citar referencias y fuentes
- Limitar la longitud de las entradas y salidas, cuando corresponda
- Proporcionar estructura de entrada o salida: las indicaciones deben seguir un formato estándar
- Preparar respuestas predeterminadas para solicitudes controvertidas.
Implementar bucles de comentarios de los clientes: anime a los usuarios a participar activamente en bucles de comentarios:
- Pida comentarios directamente en su aplicación o producto mediante un mecanismo de comentarios sencillo que esté disponible en contexto como parte de la experiencia del usuario.
- Aplique técnicas de escucha social en los canales que utilizan sus clientes para obtener conversaciones tempranas sobre problemas, preocupaciones y posibles perjuicios de las características.

Administración: mitigación de los riesgos de IA

Entre las recomendaciones para mitigar los riesgos de IA se incluyen:

Supervisión de abusos: esta metodología detecta y mitiga instancias de contenido periódico o comportamientos que sugieren el uso del servicio de una manera que puede infringir el Código de conducta u otros términos de producto aplicables. Más información: supervisión de abusos.
Entrega por fases: implemente la solución de IA lentamente para controlar los informes entrantes y los problemas.
Plan de respuesta a incidentes: para cada riesgo de alta prioridad, evalúe lo que ocurrirá y cuánto tiempo tardará en responder a un incidente y cuál será el aspecto del proceso de respuesta.
Capacidad para desactivar la característica o el sistema: proporcione funcionalidad para desactivar la característica si un incidente está a punto de producirse o se ha producido que requiere pausar la funcionalidad para evitar daños adicionales.
Controles y bloqueos de acceso de usuario: desarrolle una manera de bloquear a los usuarios que usan incorrectamente un sistema.
Comentarios del usuario: utilice mecanismos para detectar problemas del lado del usuario.
- Pida comentarios directamente en el producto, con un mecanismo de comentarios sencillo que está disponible en el contexto de un flujo de trabajo típico.
- Aplique técnicas de escucha social en los canales que utilizan sus clientes para obtener conversaciones tempranas sobre problemas, preocupaciones y posibles perjuicios de las características.
Implementación responsable de los datos de telemetría: identifique, recopile y supervise señales que indican la satisfacción del usuario o su capacidad de usar el sistema según lo previsto, asegurándose de seguir las leyes de privacidad, las directivas y los compromisos aplicables. Use datos de telemetría para identificar brechas y mejorar el sistema.

Herramientas y recursos

Microsoft Foundry en Windows: una plataforma unificada, confiable y segura que admite el ciclo de vida del desarrollador de IA a partir de la selección del modelo, la optimización, la optimización y la implementación en cpu, GPU, NPU y nube.
Cuadro de herramientas de IA responsable: la IA responsable es un enfoque para desarrollar, evaluar e implementar sistemas de IA de manera segura, fiable y ética. El cuadro de herramientas de IA responsable es un conjunto de herramientas que proporcionan una colección de interfaces de usuario y bibliotecas de exploración y evaluación de datos y modelos que permiten comprender mejor los sistemas de inteligencia artificial. Estas interfaces y bibliotecas permiten a los desarrolladores y a las partes interesadas de los sistemas de IA desarrollar y supervisar la IA de forma más responsable y tomar mejores acciones controladas por datos.
Depuración de modelos de panel de IA responsable: este panel puede ayudarle a identificar, diagnosticar y mitigar problemas mediante el uso de datos para realizar acciones informadas. Esta experiencia personalizable se puede tomar en una gran variedad de direcciones, desde analizar el modelo o los datos holísticamente, hasta realizar una profundización o comparación en cohortes de interés, explicar y generar predicciones del modelo para instancias individuales e informar a los usuarios sobre las decisiones y acciones empresariales. Realice el cuestionario de toma de decisiones de IA responsable.
Revise el resumen de Azure Machine Learning de ¿Qué es la IA responsable?
Lea el artículo de Brad Smith sobre la lucha contra el contenido abusivo generado por IA: un enfoque integral del 13 de febrero de 2024.
Lea el blog de seguridad de Microsoft.
Introducción a las prácticas de IA responsable para los modelos de Azure OpenAI - servicios de Azure AI
Cómo usar los filtros de contenido (versión preliminar) con Azure OpenAI Service
Uso de listas de bloqueados con Azure OpenAI Service
Planificación de red teaming para modelos de lenguaje grandes (LLM) y sus aplicaciones
Supervisión de abusos en Azure OpenAI Service
Modelado de amenazas en IA y ML, sistemas y dependencias
La IA y el ML se dinamizan en la seguridad. Barra de errores del ciclo de vida de desarrollo
Modos de error en el aprendizaje automático
Herramientas para administrar e idear mitigaciones de IA responsable: Microsoft Research
Planificación de errores de lenguaje natural con el cuaderno de estrategias de IA
Ingeniería de software para ML: caso práctico
Seguridad y aprendizaje automático en el mundo real
Dependencia excesiva de IA: revisión de literatura
Análisis de errores y compilación de IA responsable mediante el kit de herramientas de análisis de errores (youtube.com)
InterpretML y Cómo explicar modelos con IntepretML Deep Dive (youtube.com)
Explicación de caja negra y caja de vidrio en Machine Learning (youtube.com)

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2025-11-17