Desenvolvendo aplicativos e recursos de IA generativa responsável no Windows

Este documento fornece uma visão geral das práticas recomendadas de desenvolvimento responsável que devem ser usadas ao criar aplicativos e recursos no Windows com inteligência artificial generativa.

O Microsoft Foundry em modelos de IA geradores no dispositivo windows pode ajudá-lo a impor recursos de segurança de conteúdo local, como mecanismos de classificação no dispositivo para conteúdo prejudicial e uma lista de bloqueio padrão. A Microsoft prioriza o suporte aos desenvolvedores para criar experiências de IA seguras e confiáveis com modelos locais no Windows.

Diretrizes para o desenvolvimento responsável de aplicativos e recursos de IA generativa no Windows

Todas as equipes da Microsoft seguem princípios e práticas fundamentais para criar e entregar IA de forma responsável, incluindo o Windows. Você pode ler mais sobre a abordagem da Microsoft para o desenvolvimento responsável no Relatório de Transparência de IA Responsável da Microsoft. O Windows segue pilares fundamentais do desenvolvimento de IA responsável — governar, mapear, medir e gerenciar — que estão alinhados à Estrutura de Gerenciamento de Risco de IA do National Institute for Standards and Technology (NIST).

Governar – Políticas, práticas e processos

Os padrões são a base dos processos de governança e conformidade. A Microsoft desenvolveu nosso próprio Padrão de IA Responsável, incluindo seis princípios que você pode usar como ponto de partida para desenvolver suas diretrizes para IA responsável. Recomendamos a você integrar princípios de IA em seu ciclo de vida de desenvolvimento de ponta a ponta, bem como em seus processos e fluxos de trabalho, para ajudar a garantir a conformidade com leis e regulamentações em privacidade, segurança e IA responsável. Isso vai desde a avaliação inicial de cada recurso de IA, usando ferramentas como a Lista de Verificação de Imparcialidade de IA e as Diretrizes para Interação entre Humanos e IA – Microsoft Research, até o monitoramento e revisão de parâmetros de comparação de IA, testes e processos usando ferramentas como um scorecard de IA responsável, para documentação pública sobre os recursos e limitações de seus recursos de IA e divulgação e controles do usuário -- observe, consentimento, coleta de dados e informações de processamento etc. – de acordo com as leis de privacidade aplicáveis, requisitos regulatórios e políticas.

Mapear – Identificar riscos

As práticas recomendadas para identificar riscos incluem:

Testar ponta a ponta

Testes de ponta a ponta avaliam todo o sistema de IA do início ao fim para garantir que ele funcione conforme o esperado e siga os padrões estabelecidos. Essa abordagem abrangente pode incluir:

Equipe Vermelha

O termo agrupamento vermelho historicamente descreveu ataques sistemáticos de adversários para testar vulnerabilidades de segurança. Mais recentemente, o termo se estendeu para além da segurança cibernética tradicional e evoluiu no uso comum para descrever muitos tipos de investigação, teste e ataque de sistemas de IA.

Com grandes modelos de linguagem (LLMs) e pequenos modelos de linguagem (SLMs), o uso tanto favorável quanto controverso pode gerar saídas potencialmente prejudiciais que podem assumir muitas formas, incluindo discurso de ódio, incitação ou exaltação da violência ou conteúdo sexual. Uma equipe vermelha completa permite que você teste seu sistema e aprimore sua estratégia de conteúdo para diminuir as possibilidades de danos causados pelo sistema.

Todos os sistemas de IA devem passar por testes que verificam a eficácia da segurança cibernética, dependendo da função e da finalidade, para sistemas de alto risco que empregam a IA generativa e sistemas de menor risco que usam a IA não generativa:

Equipe vermelha formal: a equipe vermelha independente deve estar completa para todos os sistemas de alto risco que empregam IA generativa usando LLMs (grandes modelos de linguagem). O red teaming formal inclui o recrutamento de profissionais de fora de sua organização para participar de atividades de red teaming.
Equipe vermelha interna: no mínimo, planeje a formação de equipes vermelhas internas para todos os sistemas de IA de baixo risco e não generativos. Isso pode ser feito por pessoas de dentro da organização.

Saiba mais sobre o agrupamento vermelho e como avaliar as necessidades de agrupamento vermelho do seu sistema: Equipe Vermelha de IA da Microsoft

Avaliação de modelos

Como parte do teste de ponta a ponta, é importante avaliar o modelo propriamente dito.

Cartão de Modelo: para modelos disponíveis publicamente, como aqueles no "Abraçando o Rosto", você pode verificar o Cartão de Modelo de cada modelo como uma referência útil para entender se um modelo é o ideal para seu caso de uso. Leia mais sobre Cartões de Modelos.
Testes manuais: fazer com que pessoas realizem testes passo a passo sem scripts é um componente importante da avaliação de modelos que permite...
- Medir o progresso em um pequeno conjunto de questões prioritárias. Ao atenuar danos específicos, geralmente é mais produtivo continuar verificando manualmente o progresso em um pequeno conjunto de dados até que o dano não seja mais observado antes de passar para a medida automatizada.
- Definir e relatar métricas até que a medição automatizada seja confiável o suficiente para ser usada sozinha.
- Verificação pontual periódica para medir a qualidade das medições automáticas.
Teste automatizado: o teste executado automaticamente também é um componente importante da avaliação do modelo que permite...
- Medir em grande escala com cobertura aumentada para fornecer resultados mais abrangentes.
- Medições contínuas para monitorar qualquer regressão à medida que o sistema, o uso e as mitigações evoluem.
Seleção de modelo: selecione um modelo adequado ao seu propósito e eduque-se para entender suas capacidades e limitações e os possíveis desafios de segurança. Ao testar seu modelo, certifique-se de que ele produza resultados apropriados para seu uso. Para começar, os destinos para fontes de modelo da Microsoft (e não Microsoft/código aberto) incluem:

Medida – Avaliar riscos e mitigação

As práticas recomendadas incluem:

Atribuir um Content Moderator: o Content Moderator verifica o conteúdo de textos, imagens e vídeos a fim de detectar materiais potencialmente ofensivos, suspeitos ou indesejáveis. Saiba mais: Introdução ao Content Moderator (Treinamento do Microsoft Learn).
- Usar filtros de segurança de conteúdo: este conjunto de modelos de classificação de várias classes detecta quatro categorias de conteúdo prejudicial (violência, ódio, sexual e automutilação) em vários níveis de gravidade (baixo, médio e alto). Saiba mais: Como configurar filtros de conteúdo com o Serviço OpenAI do Azure.
- Aplicar um meta-prompt: um meta-prompt é uma mensagem do sistema incluída no início do prompt que é usada para preparar o modelo com contexto, instruções ou outras informações relevantes para seu caso de uso. Essas instruções são usadas para orientar o comportamento do modelo. Saiba mais: Criando guardrails de segurança eficazes com meta-prompts/engenharia de mensagens do sistema.
- Use listas de bloqueio: bloqueia o uso de certos termos ou padrões em um prompt. Saiba mais: Usar uma lista de bloqueio no Azure OpenAI.
- Familiarize-se com a procedência do modelo: proveniência é o histórico de propriedade de um modelo, ou "quem-o-que-onde-quando", e é muito importante entendê-la. Quem coletou os dados em um modelo? A quem os dados se referem? Que tipos de dados são usados? Onde os dados foram coletados? Quando os dados foram coletados? Saber de onde vieram os dados do modelo pode ajudar você a avaliar sua qualidade e confiabilidade e evitar qualquer uso de dados antiético, injusto, tendencioso ou impreciso.
- Use um pipeline padrão: use um pipeline de moderação de conteúdo em vez de reunir partes aos poucos. Saiba mais: O que são pipelines do Azure Machine Learning?.
Apliquemitigaçõesde UI: elas fornecem clareza importante para o usuário sobre os recursos e limitações de um recurso baseado em IA. Para ajudar os usuários e fornecer transparência sobre seu recurso, você pode:
- Incentivar os usuários a editar saídas antes de aceitá-las
- Destacar possíveis imprecisões nas saídas de IA
- Divulgar a função da IA na interação
- Citar referências e fontes
- Limitar o comprimento de entradas e saídas quando apropriado
- Fornecer entrada ou saída de estruturas – os prompts devem seguir um formato padrão
- Prepare respostas pré-determinadas para solicitações controversas.
Implementar loops de feedback do cliente: incentive os usuários a se envolverem ativamente nos loops de feedback:
- Solicite comentários diretamente no aplicativo/produto usando um mecanismo simples de feedback disponível no contexto como parte da experiência do usuário.
- Aplique técnicas de escuta social nos canais que os clientes usam para conversas iniciais sobre problemas em recursos, preocupações e possíveis danos.

Gerenciar – Mitigar riscos de IA

As recomendações para mitigar os riscos de IA incluem:

Monitoramento de abusos: essa metodologia detecta e mitiga instâncias de conteúdo recorrente e/ou comportamentos que sugerem que um serviço foi usado de uma maneira capaz de violar o Código de Conduta ou outros termos do produto aplicáveis. Saiba mais: Monitoramento de abusos.
Entrega em fases: implemente sua solução de IA lentamente para lidar com os relatórios recebidos e preocupações.
Plano de resposta a incidentes: para cada risco de alta prioridade, avalie o que acontecerá e quanto tempo levará para responder a um incidente e como será o processo de resposta.
Capacidade de desativar o recurso ou o sistema: forneça funcionalidade para desativar o recurso se um incidente que exija pausar a funcionalidade para evitar mais danos estiver prestes a ocorrer ou tiver ocorrido.
Controles/bloqueio de acesso de usuários: desenvolva uma maneira de bloquear usuários que estão usando indevidamente um sistema.
Comentários do usuário: utilize mecanismos para detectar problemas do lado do usuário.
- Peça feedback diretamente no produto, com um mecanismo simples de feedback disponível no contexto de um fluxo de trabalho típico.
- Aplique técnicas de escuta social nos canais que os clientes usam para conversas iniciais sobre problemas em recursos, preocupações e possíveis danos.
Implantação responsável de dados de telemetria: identifique, colete e monitore sinais que indicam a satisfação do usuário ou sua capacidade de usar o sistema conforme pretendido, garantindo que você siga as leis, políticas e compromissos de privacidade aplicáveis. Use dados de telemetria para identificar lacunas e melhorar o sistema.

Ferramentas e recursos

Microsoft Foundry no Windows: uma plataforma unificada, confiável e segura que dá suporte ao ciclo de vida do desenvolvedor de IA a partir da seleção de modelo, ajuste fino, otimização e implantação em CPU, GPU, NPU e nuvem.
Caixa de ferramentas de IA Responsável: a IA Responsável é uma abordagem à avaliação, ao desenvolvimento e à implantação de sistemas de IA de maneira segura, confiável e ética. A caixa de ferramentas de IA Responsável é um conjunto de ferramentas que fornece uma coleção de interfaces de usuário e bibliotecas de exploração e avaliação de modelos e dados que permitem uma melhor compreensão dos sistemas de IA. Essas interfaces e bibliotecas capacitam desenvolvedores e partes interessadas de sistemas de IA a desenvolver e monitorar a IA de forma mais responsável e a adotar ações mais eficientes orientadas por dados.
Depuração de modelo do dashboard de IA responsável: este dashboard pode ajudar você a identificar, diagnosticar e mitigar problemas usando dados para adotar ações informadas. Essa experiência personalizável pode ser feita em uma infinidade de direções, desde analisar o modelo ou os dados de forma holística, conduzir um mergulho profundo ou comparação em coortes de interesse, explicar e perturbar previsões de modelos para instâncias individuais e informar os usuários sobre decisões e ações de negócios. Fazer o teste de tomada de decisão de IA responsável.
Revise o resumo do Azure Machine Learning em O que é IA responsável?
Leia o artigo de Brad Smith sobre Combate ao conteúdo abusivo gerado por IA: uma abordagem abrangente de 13 de fevereiro de 2024.
Leia o Blog de Segurança da Microsoft.
Visão geral das práticas de IA responsável para modelos do OpenAI do Azure – Serviços de IA do Azure
Como usar os filtros de conteúdo (versão prévia) com o Serviço OpenAI do Azure
Como usar listas de bloqueio com o Serviço OpenAI do Azure
Planejando o red teaming para grandes modelos de linguagem (LLMs) e suas aplicações
Monitoramento de abusos do Serviço OpenAI do Azure
Modelagem de ameaças de sistemas e dependências de AI/ML
A virada da IA/ML para a segurança. Uma barra de bugs do ciclo de vida do desenvolvimento
Modos de falha em aprendizado de máquina
Ferramentas para gerenciar e identificar mitigações de IA responsável – Microsoft Research
Planejando-se para falhas de linguagem natural com o Guia Estratégico de IA
Engenharia de software para ML: um estudo de caso
Segurança e aprendizado de máquina no mundo real
Dependência excessiva da IA: revisão da literatura
Análise de erros e Construção de uma IA Responsável com o kit de ferramentas de Análise de Erros (youtube.com)
InterpretML e Como explicar modelos com IntepretML Deep Dive (youtube.com)
Explicação da caixa preta e da caixa de vidro em aprendizado de máquina (youtube.com)

Comentários

Esta página foi útil?

Last updated on 2025-11-17