Compartilhar via


Saiba mais sobre a análise de IA no Investigações de Segurança de Dados (pré-visualização)

Importante

Investigações de Segurança de Dados utiliza inteligência artificial gerada (IA), modelos de linguagem de grandes dimensões e orquestração na análise de dados na sua organização. Os resultados gerados pela IA podem nem sempre ser precisos ou completos. Embora nos esforcemos por fornecer informações fiáveis e úteis, os sistemas de IA podem produzir resultados incorretos ou falsos. É importante verificar as informações e utilizá-la com cuidado. A Microsoft não concede garantias, expressas, implícitas ou estatutárias relativamente às informações fornecidas pelos sistemas de IA.

Investigações de Segurança de Dados (pré-visualização) utiliza serviços e ferramentas de IA para ajudá-lo a rever e tomar medidas em itens associados a incidentes de segurança. Os serviços relacionados com IA incluem as seguintes ferramentas:

  • Pesquisa de vetores
  • Categorização
  • Exame

A pesquisa de vetores no Investigações de Segurança de Dados (pré-visualização) dá-lhe uma forma de procurar contextualmente através de dados que adiciona ao âmbito de investigação com orquestração e incorporações avançadas. A pesquisa de vetores é uma tecnologia de motor de busca que se foca em compreender o significado e o contexto subjacentes a palavras e expressões numa consulta, em vez de apenas corresponder a palavras-chave.

Alguns aspetos fundamentais da pesquisa de vetores são:

  • Compreensão contextual: a pesquisa de vetores interpreta o contexto dos seus termos de pesquisa, tendo em conta fatores como a sua organização, o histórico de pesquisas e o significado geral da consulta.
  • Reconhecimento de intenção: a pesquisa de vetores funciona para compreender a sua intenção, quer esteja à procura de informações, a tentar efetuar uma ação ou a procurar um tipo específico de conteúdo associado a uma pesquisa.
  • Relevância e precisão: ao focar-se na semântica (o significado e a intenção das palavras na consulta), a pesquisa de vetores fornece resultados mais precisos e relevantes e melhora a experiência de pesquisa geral.

Quando os investigadores na sua organização investigam conjuntos de dados comprometidos, a pesquisa de vetores no Investigações de Segurança de Dados (pré-visualização) pode melhorar significativamente a sua investigação ao abordar vários desafios principais:

  • Identificar informações relevantes: a pesquisa de vetores compreende o contexto e a intenção subjacentes às consultas. Este foco ajuda-o a localizar rapidamente documentos, e-mails ou registos relevantes, mesmo que não contenham as palavras-chave exatas que utilizou.
  • Lidar com ambiguidade: a pesquisa de vetores desambigua termos que têm múltiplos significados, garantindo que obtém resultados contextualmente adequados à sua investigação.
  • Reduzir o ruído: a pesquisa de vetores filtra informações irrelevantes, permitindo-lhe focar-se nos dados mais pertinentes e reduzir o tempo gasto a peneirar através de resultados não relacionados.
  • Melhorar a eficiência: a pesquisa de vetores simplifica o processo de pesquisa, tornando a sua investigação mais eficiente e eficaz ao apresentar rapidamente as informações mais relevantes.

Como funciona

Depois de criar uma investigação, definir o âmbito e preparar os dados para IA, pode executar pesquisas de vetores sobre o conjunto de dados. Embora os passos anteriores do processo permitam palavra-chave simples, metadados e pesquisa de intervalo de datas. A pesquisa de vetores utiliza incorporações de IA para procurar contextualmente através de dados. Este processo permite que os investigadores encontrem itens sem saberem os seus conteúdos exatos.

A pesquisa de vetores funciona ao executar primeiro todos os dados no âmbito de uma investigação através de um modelo de incorporações de IA. Este modelo extrai significado semântico de cada item no conjunto de dados e divide-os em partes mais pequenas. Isto chama-se incorporação e permite que Investigações de Segurança de Dados (pré-visualização) utilizem valores de dimensão para compreender os seus dados contextualmente. Um índice de pesquisa semântica é criado a partir destes valores que podem ser consultados.

Quando cria uma consulta de pesquisa de vetores numa investigação, a IA expande e alarga automaticamente a consulta e executa a consulta através do índice de pesquisa semântica. Investigações de Segurança de Dados (pré-visualização) corresponde, em seguida, ao significado semântico da consulta com significado semântico dos seus conteúdos e devolve todos os itens contextualmente relevantes.

Por exemplo, se procurar "Dados confidenciais incluídos no projeto De segurança da Contoso", o motor de busca de vetores compreende que está à procura de dados confidenciais neste projeto específico em vez de simplesmente corresponder a palavras-chave (confidenciais, dados, Contoso, etc.) contidas na consulta de pesquisa. Ao utilizar a pesquisa de vetores, pode consultar com impacto para localizar todos os itens de dados relacionados com um assunto específico, mesmo que as palavras-chave estejam em falta.

Para obter mais informações sobre os conceitos de pesquisa de vetores, veja a secção conceitos no artigo Vectors in Azure AI Search (Vetores na Pesquisa de IA do Azure ).

Categorização

Quando a sua organização é violada e os dados afetados são identificados, os investigadores têm de começar a priorizar os dados para começar a identificar riscos de segurança. As categorias no Investigações de Segurança de Dados (pré-visualização) removem a necessidade de atribuir manualmente categorias a itens em âmbitos de investigação grandes e complexos.

Pode utilizar a categorização com tecnologia de IA no Investigações de Segurança de Dados (pré-visualização) para identificar e priorizar dados potencialmente afetados mais rapidamente. Para categorizar dados, pode selecionar todas ou algumas opções de categoria predefinidas, utilizar categorias sugeridas por IA com base na respetiva investigação ou criar as suas próprias categorias personalizadas.

As categorias geradas pela IA são melhoradas com informações adicionais para conteúdo ao nível do assunto no âmbito:

  • Nome: o nome da categoria/área com base no conteúdo
  • Resumo: Uma breve descrição do conteúdo subjacente

Em cada categoria, pode utilizar ferramentas de pesquisa e análise de vetores em qualquer conteúdo.

Categorias predefinidas

Investigações de Segurança de Dados (pré-visualização) inclui categorias predefinidas para categorizar itens no âmbito da investigação. Ao executar a categorização, pode selecionar todas as categorias predefinidas ou apenas as categorias predefinidas aplicáveis ao âmbito da sua revisão. As categorias predefinidas não selecionadas são ignoradas na análise e os resultados destas categorias não estão disponíveis ao rever itens.

As categorias predefinidas iniciais determinadas pelo processamento de IA para itens de conteúdo são:

  • Informações comerciais: informações comerciais gerais. Normalmente, esta categoria contém um grande número de itens. Algumas áreas de exemplo nesta categoria podem incluir interação e análise digital, recursos de utilizador e humanos, comunicação administrativa de rotina, envolvimento/experiência do cliente e muito mais.
  • Registos de comunicação: informações gerais de comunicação. Normalmente, esta categoria também contém um grande número de itens. Os utilizadores podem utilizar esta categoria para ver as respetivas investigações com base em áreas de comunicações. Algumas áreas de exemplo nesta categoria podem incluir reclamações de clientes, saudações de feriados, memorandos internos, atualizações de projetos e muito mais.
  • Credenciais e informações de acesso Concentra-se em informações relacionadas com o acesso a recursos em investigações. Estas informações ajudam a identificar dados e comunicações potencialmente arriscados na sua organização. Algumas áreas de exemplo nesta categoria podem incluir credenciais de utilizador, acesso não autorizado à base de dados, exposição de dados e muito mais.
  • Informações do cliente: concentra-se nas informações partilhadas com os clientes. Esta categoria pode ser utilizada para compreender que dados de clientes podem estar em risco. Algumas áreas de exemplo nesta categoria podem incluir confirmações de pagamento, melhoramento da experiência do cliente, informações de entrega e muito mais.
  • Informações do utilizador: foca-se nas informações relacionadas com os utilizadores na sua organização. Normalmente, esta categoria também contém um grande número de itens. Algumas áreas de exemplo nesta categoria podem incluir informações de emprego dos utilizadores, estratégias de retenção de utilizadores, associações a grupos especializadas e muito mais.
  • Informações financeiras: centra-se nas informações financeiras numa investigação. Algumas áreas de exemplo nesta categoria podem incluir planeamento financeiro, oportunidades de concessão, orçamentos, demonstrações financeiras e muito mais.
  • Informações de saúde: foca-se em itens relacionados com a saúde e médicos numa investigação. Algumas áreas de exemplo nesta categoria podem incluir registos de estado de funcionamento e bem-estar, atualizações do protocolo de segurança COVID-19, afirmações de estado de funcionamento e relatórios de incidentes, etc.
  • Informações sobre incidentes e investigação: concentra-se em itens sobre incidentes e investigações numa investigação. Esta categoria inclui incidentes de segurança e investigações na sua organização. Algumas áreas de exemplo nesta categoria podem incluir falhas de segurança de dados, incidentes de registos de estado de funcionamento, monitorização de conta de cliente de alto risco, etc.
  • Propriedade intelectual: focada em dados de propriedade intelectual (IP) numa investigação. Algumas áreas de exemplo nesta categoria podem incluir futuras aplicações de patentes, trabalhos de investigação e desenvolvimento, métricas de resultados de experimentação e muito mais.
  • Informações de marketing Centra-se nos dados de marketing numa investigação. Algumas áreas de exemplo nesta categoria podem incluir comunicados de imprensa, campanhas publicitárias, planos de marketing e vendas, ou estratégias e muito mais.
  • Informações operacionais: concentra-se nos dados operacionais da sua organização. Algumas áreas de exemplo nesta categoria podem incluir logística, envio, inventário, conformidade, registos fiscais e muito mais.
  • Informações pessoais identificáveis: concentra-se em dados pessoais de grupo e itens relacionados numa investigação. Algumas áreas de exemplo nesta categoria podem incluir listas de convidados de eventos, sessões de docentes e formação, informações pessoais dos funcionários e muito mais.
  • Dados regulados: foca-se nos dados regulados numa investigação. Algumas áreas de exemplo nesta categoria podem incluir regulamentação, proteção de dados, registos regulamentares e muito mais.

Categorias sugeridas

Investigações de Segurança de Dados (pré-visualização) também fornece categorias sugeridas geradas por IA com base no conteúdo analisado no âmbito da investigação. Estas categorias sugeridas são criadas automaticamente para ajudar as investigações a rever itens agrupados em áreas inesperadas ou desconhecidas. Consoante o tipo de conteúdo incluído, as categorias sugeridas variam.

Se o conteúdo analisado se concentrar principalmente numa área de assunto específica fora das áreas de categoria predefinidas, as categorias sugeridas são personalizadas para essa área de conteúdo específica. Por exemplo, se o conteúdo analisado estiver focado num assunto altamente confidencial com termos e conceitos específicos apenas da sua organização, as categorias sugeridas são criadas automaticamente para estas áreas. Estas categorias são exclusivas da sua organização e dos conteúdos analisados.

Categorias personalizadas

Investigações de Segurança de Dados (pré-visualização) permite-lhe criar manualmente categorias personalizadas para o processo de IA gerador a utilizar ao analisar o conteúdo. Ao definir as categorias mais aplicáveis às suas necessidades de investigação, pode poupar tempo e permitir que o processo de IA categorize automaticamente os itens com base nestas categorias personalizadas.

As categorias personalizadas podem ser palavras ou expressões específicas que capturam a natureza específica do conteúdo de interesse na investigação. Por exemplo, as categorias personalizadas podem incluir Vulnerabilidade de segurança, Correção de erros, nomes de código de projeto específicos ou propriedade intelectual personalizada, como R&D relacionados com um medicamento específico ou candidatos a medicamentos.

Exame

À medida que identifica itens que requerem uma análise mais aprofundada, Investigações de Segurança de Dados (pré-visualização) fornece capacidades de exame baseadas em IA para o ajudar a concentrar-se na segurança fundamental e nos riscos de dados confidenciais.

  • Credenciais: utilize esta área de detalhe de exame para analisar e extrair credenciais de todos os itens selecionados num âmbito de investigação. Estas informações fornecem aos investigadores uma forma rápida de compreender que contas e credenciais estão associadas a um incidente de segurança e que podem ser potencialmente exfiltradas.

  • Risco: utilize esta área de foco de exame para classificar todas as áreas de risco em ficheiros selecionados para ajudar os investigadores a concentrarem-se e a priorizarem as investigações. Esta ferramenta fornece o risco geral para cada item, se o item for conteúdo privilegiado e outros riscos específicos para o item.

    Os tipos de áreas de risco incluem:

    • Identificadores de recursos
    • Credenciais e segredos
    • Provas de discussões sobre ameaças de ator violam discussões
    • Incidentes de segurança urgentes
    • Higiene de vulnerabilidades e segurança
    • Conteúdo pessoal e confidencial
    • Informações de rede e acesso
    • Conformidade de políticas e proteção de dados
    • Informações da infraestrutura
    • Informações do cliente
    • Informações governamentais
    • Informações privilegiadas
    • Segredos comerciais
  • Mitigar: utilize esta área de foco de exame para classificar o risco dos ficheiros selecionados e ativar Investigações de Segurança de Dados (pré-visualização) para lhe fornecer instruções de mitigação para o que fazer a seguir. Os ficheiros selecionados obtêm uma classificação de risco, um resumo do risco e recomendações de mitigação detalhadas para evitar mais danos de uma falha de conteúdo.

Recomendações de análise de IA

A tabela seguinte descreve recomendações, cenários de exemplo e melhores práticas ao utilizar as ferramentas de análise de IA no Investigações de Segurança de Dados (pré-visualização).

Recomendações Pesquisa de vetores Categorização Exame
Quando usar Procure exemplos de itens específicos num conjunto de dados vetorizado (faturas, correções de erros, etc.) para confirmar e investigar hipóteses adicionais.

Utilize a pesquisa de vetores para uma análise interativa rápida, os resultados são rapidamente preenchidos.
Ordene rapidamente grandes quantidades de dados em categorias predefinidas, personalizadas ou geradas por IA para priorizar o foco da investigação por sensibilidade e gravidade.

Consoante o tamanho do conjunto de dados, a categorização pode demorar algum tempo a concluir.
A análise direcionada ao nível do item de um conjunto de dados no âmbito ajuda a extrair informações de um recurso de dados confirmado para os próximos passos.

Utilize o exame para identificar itens para mitigação.
Cenário de exemplo Avaliação de atividade potencialmente fraudulenta. Atribuição de prioridades de itens para análise após falha de segurança grande. Extração de credenciais de um conjunto de dados validado e passos de mitigação recomendados.
Práticas recomendadas Procure em todo o conteúdo vetorizado itens de interesse para gerar categorias sugeridas de IA mais significativas. Selecione uma ou várias categorias e utilize a pesquisa de vetores para procurar na categoria.

Reveja as áreas geradas por IA em cada categoria para compreender conteúdos específicos dentro do conjunto de dados.
Utilize o exame para desagregar itens específicos com alta sensibilidade para obter resultados e pontuações individuais.

Pronto para começar?