Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Observação
Esta funcionalidade está atualmente em pré-visualização pública. Essa visualização é fornecida sem um contrato de nível de serviço e não é recomendada para cargas de trabalho de produção. Algumas funcionalidades poderão não ser suportadas ou poderão ter capacidades limitadas. Para obter mais informações, veja Termos Suplementares de Utilização para Pré-visualizações do Microsoft Azure.
As bases de dados de grafos oferecem uma forma poderosa de modelar e consultar dados ligados. Ao contrário das bases de dados relacionais tradicionais que armazenam dados em tabelas, as bases de dados de grafos representam a informação como nós (entidades) e arestas (relações), facilitando a exploração de ligações e padrões complexos de forma mais flexível.
O tipo mais comum de base de dados de grafos implementa o modelo de grafo de propriedades rotuladas (LPG): entidades (nós) e relações (arestas) podem ter rótulos e propriedades (pares chave-valor). Esse modelo flexível permite designs opcionais e controlados por esquema, além de permitir que você expresse semântica rica. Como as conexões são armazenadas explicitamente como bordas, as consultas atravessam relacionamentos seguindo bordas em vez de calcular junções caras no momento da consulta.
Importante
Este artigo utiliza exclusivamente o conjunto de dados gráfico de exemplo de redes sociais.
Conceitos principais do banco de dados gráfico
- Os nós representam entidades como pessoas, produtos ou lugares. Os nós podem ter rótulos e propriedades que descrevem seus atributos. Por exemplo, um nó Pessoa pode ter propriedades como primeiro nome, sobrenome e idade.
- As arestas representam como as entidades estão conectadas, por exemplo FRIENDS_WITH, COMPRADA ou LOCATED_IN. As bordas também podem carregar propriedades e rótulos para codificar metadados de relacionamento.
- Propriedades associam detalhes a nós e arestas (por exemplo, o nome de uma pessoa ou a data de início de uma aresta). Como as relações são armazenadas explicitamente como bordas, as consultas navegam no gráfico seguindo conexões em vez de calculá-las no momento da consulta.
Como funciona a consulta de relações
As consultas de grafos recuperam informações conectadas percorrendo de um nó inicial para os seus vizinhos, depois para os vizinhos destes e assim por diante. O esforço que uma travessia realiza está ligado ao número de bordas que toca (o bairro local), não ao tamanho total do conjunto de dados. Isso torna as perguntas sobre caminhos, conexões e padrões, como amigos de amigos, caminhos mais curtos ou dependências multi-hop, naturais e eficientes de expressar.
Os bancos de dados gráficos usam linguagens de consulta baseadas em padrões, como a GQL (Graph Query Language), cada vez mais adotada, para descrever essas travessias de forma concisa. O GQL está sendo padronizado pelo mesmo grupo de trabalho internacional que supervisiona o SQL (ISO/IEC 39075), alinhando a consulta de gráficos com os padrões de banco de dados estabelecidos.
Exemplo (correspondência de padrões com GQL):
MATCH (p:Person {firstName: "Annemarie"})-[:knows]->(friend)-[:likes]->(c:Comment)
RETURN c
ORDER BY c.creationDate
LIMIT 100
Este padrão lê-se como: começando no nó de Pessoa de Annemarie, seguir as arestas :knows até cada nó de amigo, depois seguir as arestas :likes até os nós relacionados :Comment. Devolva os 100 comentários mais recentes ordenados pela data de criação.
Modelagem e esquema
Os modelos de dados gráficos são de esquema opcional: pode trabalhar com um esquema fixo quando houver necessidade de uma sólida governança ou evoluir o modelo quando novos tipos de nós, relações ou propriedades surgirem. Essa abordagem reduz a necessidade de duplicação de dados e permite que as equipes unifiquem dados de várias fontes sem um grande redesenho inicial.
Usos comuns para bancos de dados gráficos
As bases de dados de grafos alinham-se estreitamente com domínios onde as ligações geram valor, tais como:
- Redes sociais
- Grafos de conhecimento
- Sistemas de recomendação
- Redes de fraude e risco
- Topologia de rede e TI
- Análise da dependência da cadeia de abastecimento
Nesses cenários, as perguntas são menos sobre registros únicos e mais sobre quantas entidades se relacionam e interagem ao longo de vários saltos.
Quando considerar um banco de dados gráfico
Escolha uma base de dados de grafos quando:
- As suas principais questões envolvem caminhos, bairros e padrões em dados interligados
- O número de saltos é variável ou não é conhecido antecipadamente
- É preciso combinar e navegar relações entre conjuntos de dados díspares
Se fizer regularmente este tipo de perguntas, um modelo gráfico é uma escolha natural.
Gráfico no Microsoft Fabric
Representar os seus dados como um grafo e armazená-los numa base de dados de grafos separada e autónoma introduz frequentemente ETL (extração, transformação, carga) e sobrecarga de governação. Por outro lado, o Graph no Microsoft Fabric opera diretamente no OneLake, o que reduz ou elimina a necessidade de pipelines ETL separados e duplicação de dados. Considere estas compensações:
- Movimentação e duplicação de dados: Bases de dados de grafos autónomas normalmente exigem extração, transformação e carregamento de dados para um armazenamento separado, o que aumenta a complexidade e pode levar à duplicação de conjuntos de dados. O Graph no Microsoft Fabric opera no OneLake para que você possa modelar e consultar dados conectados sem movê-los.
- Custos operacionais: pilhas de gráficos autónomos funcionam como clusters ou serviços separados e frequentemente acarretam custos associados à capacidade ociosa. As cargas de trabalho gráficas no Fabric consomem unidades de capacidade agrupadas (CUs) com redução automática e métricas centralizadas, o que simplifica as operações e pode reduzir os custos.
- Escalabilidade: Alguns bancos de dados gráficos autónomos dependem de aumento de escala ou clustering específico do fornecedor. O Graph do Microsoft Fabric foi projetado para gráficos de grande escala e usa fragmentação horizontal em vários trabalhadores para lidar com grandes volumes de dados de forma eficiente.
- Ferramentas e competências: Sistemas de grafos específicos de fornecedores podem exigir linguagens especializadas e frameworks analíticos separados. Graph no Microsoft Fabric fornece modelagem unificada, consultas baseadas em normas (GQL), algoritmos de análise de grafos integrados, integração de BI e IA, e ferramentas exploratórias com pouco ou nenhum código. Estas capacidades permitem que um conjunto mais vasto de utilizadores trabalhe com dados ligados.
- Governação e segurança: Implementações separadas de grafos precisam de configurações independentes de governação e segurança. O Graph no Microsoft Fabric usa o RBAC (controle de acesso baseado em função) de governança, linhagem e espaço de trabalho do OneLake para que a conformidade, a auditoria e as permissões permaneçam consistentes com o restante do ambiente do Fabric.