Ciclo de vida de dados de ponta a ponta no Microsoft Fabric

Normalmente, as organizações dependem de vários serviços desconectados para ingerir, armazenar, transformar, analisar e visualizar dados. Essa fragmentação cria silos de dados, aumenta a sobrecarga de integração e reduz o tempo de análise. O Microsoft Fabric aborda esses desafios unificando cada estágio do ciclo de vida de dados em uma única plataforma criada em uma base compartilhada.

No centro dessa arquitetura está o OneLake, um único data lake organizacional que armazena todos os dados no formato Delta Parquet aberto. O OneLake é provisionado automaticamente com cada locatário do Fabric. Como cada carga de trabalho do Fabric lê e grava no OneLake, os dados não se movem entre os mecanismos. Um conjunto de dados ingerido por meio de um pipeline, refinado em um notebook e visualizado em um relatório do Power BI permanece em um só lugar durante sua jornada.

O ciclo de vida de dados consiste em seis estágios e o Fabric fornece ferramentas criadas para cada um:

Obter dados: traga dados para o OneLake de centenas de fontes em tempo real, em um agendamento, por meio da replicação contínua do banco de dados ou fazendo referência ao armazenamento externo em vigor.
Armazenar dados: persistir dados em formatos de armazenamento otimizados para sua carga de trabalho, seja análise de Big Data flexível, consultas SQL estruturadas, análise de eventos em tempo real, processamento transacional ou relatórios de negócios controlados.
Preparar e transformar: limpar, remodelar e enriquecer dados através de transformações visuais com pouco código ou notebooks de code-first e funções reutilizáveis, sem mover dados para fora do OneLake.
Analisar e treinar: crie e operacionalize modelos de machine learning, execute análises avançadas, consulte dados programaticamente e explore insights por meio de agentes de IA de linguagem natural.
Acompanhar e visualizar: insights do Surface por meio de relatórios interativos, monitorar fluxos de dados ao vivo em painéis em tempo real e disparar ações automatizadas quando as condições forem atendidas.
Integração externa: conecte-se com segurança a serviços externos para automação, colaboração, governança, ferramentas de desenvolvedor e CI/CD.

O diagrama a seguir mostra como esses estágios se conectam e quais itens do Fabric participam em cada estágio. Cada estágio é abordado detalhadamente em um artigo dedicado. Use os links em cada seção para explorar os recursos e as ferramentas disponíveis nesse estágio.

Obter dados

Diferentes tipos de conjuntos de dados vêm de uma ampla variedade de fontes de dados em diferentes cenários de dados, incluindo replicação de dados, referências de armazenamento externo, conjuntos de dados em lote e fluxos de dados em tempo real. Você ingere e transforma esses conjuntos de dados por meio das ferramentas de integração do Fabric. Os dados chegam ao OneLake, o armazenamento de dados centralizado para todo o Fabric. Os principais métodos de ingestão incluem:

Fluxos de eventos para ingestão e roteamento de eventos em tempo real.
Pipelines de dados para movimentação de dados em lotes e programada com mais de 200 conectores.
Espelhamento para replicação contínua de bancos de dados operacionais sem criar pipelines ETL.
Atalhos para virtualização de dados sem cópia do armazenamento externo, como Azure Data Lake, Amazon S3 ou Google Cloud Storage.

Para obter mais informações, consulte Obter dados no Microsoft Fabric.

Armazenar dados

Uma vez ingeridos, todos os dados chegam ao OneLake no formato Delta Parquet aberto. O OneLake fornece um único data lake para toda a sua organização sem necessidade de provisionamento separado. O Fabric oferece vários itens de armazenamento otimizados para cargas de trabalho diferentes:

Lakehouse para armazenamento flexível de Big Data que combina arquivos e tabelas Delta gerenciadas com um endpoint SQL automático.
Warehouse para análises estruturadas e relacionais com suporte completo do T-SQL, procedimentos armazenados e transações ACID.
Eventhouse para análise em tempo real sobre dados de streaming e telemetria usando KQL (Linguagem de Consulta Kusto).
Banco de Dados SQL para cargas de trabalho transacionais e análise operacional.
Modelos semânticos para lógica de negócios, medidas e hierarquias que alimentam relatórios e IA.

Para obter mais informações, consulte Armazenar dados no Microsoft Fabric.

Preparar e transformar os dados

Uma vez no OneLake, você pode transformar ainda mais os dados usando mecanismos de código-primeiro ou ferramentas de baixo código, tudo dentro do Fabric sem movimentação de dados entre os mecanismos:

O Dataflow Gen2 fornece uma interface power query de baixo código para limpeza, transformação e enriquecimento de dados.
Os notebooks oferecem um ambiente semelhante a Jupyter para Python, T-SQL e engenharia de dados baseada em Scala.
As Funções de Dados do Usuário permitem inserir uma lógica de Python personalizada reutilizável que pode ser invocada de pipelines, notebooks e regras do Ativador.

Para obter mais informações, consulte Preparar e transformar dados.

Analisar dados e treinar modelos

Use os dados preparados para treinar modelos de ML e executar análises avançadas. A carga de trabalho de Ciência de Dados do Fabric fornece um ambiente para criar, treinar e operacionalizar modelos de ML:

Os experimentos do MLflow rastreiam execuções de treinamento de modelo com registro automático de hiperparâmetros, métricas e itens.
Os modelos de ML são registrados em um registro do MLflow para controle de versão, acompanhamento de metadados e reprodutibilidade.
Agentes de dados e agentes de operações permitem que você interaja com os dados usando linguagem natural e atue em condições e padrões encontrados.
As APIs do GraphQL fornecem uma camada flexível de acesso a dados para os desenvolvedores consultarem várias fontes de dados do Fabric por meio de um único ponto de extremidade.
O Copilot para Power BI usa IA generativa para análise ad hoc, geração DAX e exploração de dados em linguagem natural.

Para obter mais informações, consulte Analisar e treinar dados no Microsoft Fabric.

Acompanhar e visualizar dados

Use os dados preparados e modelados para criar relatórios, dashboards e alertas em tempo real:

Os relatórios do Power BI fornecem visualização interativa de dados baseada em modelos semânticos, com distribuição em aplicativos do Microsoft 365, como Teams, SharePoint, PowerPoint e Excel.
Os fluxos de tarefas translíticos permitem que os usuários tomem medidas diretamente dos relatórios do Power BI chamando funções de dados de usuário.
Painéis do Real-Time Intelligence monitoram dados de streaming com latência de sub-segundo usando consultas KQL e autoria visual.
O ativador detecta condições em dados de streaming e dispara ações automatizadas, como alertas do Teams, emails ou fluxos do Power Automate.
O Fabric IQ mapeia dados corporativos para uma ontologia de negócios compartilhada e permite que os agentes de IA raciocinam sobre seus dados com contexto de negócios completo.

Para obter mais informações, consulte Rastrear e visualizar dados.

Integração externa

O Fabric integra-se com sistemas externos para ingestão de dados e entrega de insights:

O Power Automate e o Data Activator habilitam a automação de fluxo de trabalho em tempo real com base em condições de dados.
A integração do Microsoft 365 apresenta insights no Teams, SharePoint, PowerPoint e Excel.
As APIs REST e as bibliotecas de cliente fornecem acesso programático aos recursos do Fabric.
A ID do Microsoft Entra lida com autenticação, acesso condicional e suporte à entidade de serviço.
A integração do Git com o Azure DevOps e o GitHub permite controle de versão e CI/CD para itens do Fabric.
O Microsoft Purview fornece governança de dados unificada, catalogação e conformidade em todo o conjunto de dados do Fabric.

Para obter mais informações, consulte Integração externa e conectividade de plataforma.

Idioma natural e suporte à IA

O suporte à linguagem natural vem na forma de Agentes de Operações, Agentes de Dados e Copilot do Power BI, que podem gerar motivos sobre dados corporativos no OneLake e produzir respostas com base nos itens de dados que os usuários podem acessar. Você pode integrar os Agentes de Dados ao Microsoft 365 Copilot, Microsoft Foundry e Copilot Studio para que os usuários possam obter informações do OneLake dentro de seus fluxos de trabalho existentes em diferentes aplicativos.

Comentários

Esta página foi útil?

Last updated on 2026-03-13