Descrever o SQL do Azure Synapse Analytics

Concluído

O SQL do Azure Synapse permite que você implemente soluções de data warehouse ou execute a virtualização de dados.

Um data warehouse é um componente fundamental das soluções de BI (Business Intelligence) que fornece um repositório central de dados armazenados em tabelas relacionais. Ele facilita as soluções em relação à análise descritiva. Os dados são recuperados, limpos e transformados por meio de uma série de sistemas de dados de origem e, depois, são servidos em um formato relacional estruturado normalmente chamado de esquema em estrela.

Relational star schema

Os dados de um data warehouse são armazenados em tabelas permanentes que são preenchidas usando um processo de ETL (extração, transformação e carregamento) por serviços como o Azure Synapse Pipelines ou o Azure Data Factory. Como resultado, você precisa entender os dados que são armazenados nos sistemas de origem e como eles devem chegar dentro do data warehouse, o qual, por sua vez, determina como você deve limpar ou transformar os dados.

A virtualização de dados permite que você interaja com os dados sem a necessidade de entender como os dados são formatados, estruturados ou qual é o tipo de dados. Ele permite que você explore os dados sem compreender as especificações técnicas dos dados de origem, o que pode ser muito útil ao executar análise de diagnóstico em que a necessidade de acessar dados em tempo hábil para responder a uma pergunta é mais importante.

A virtualização de dados também permite cenários de preparação de dados ad hoc, em que as organizações querem desbloquear insights dos próprios armazenamentos de dados sem passar pelos processos formais de configuração de um data warehouse. Você pode extrair dados de um sistema de origem em formato bruto e carregá-los em um data lake. Daqui em diante, as transformações podem ser aplicadas para apresentar os dados conforme necessário. Como a parte mais complexa do processo de ELT (extração, carregamento e transformação) está no final, isso significa que o acesso aos dados está muito mais rápido.

Data virtualization

Para atender à entrega desses tipos de soluções, o SQL do Azure Synapse oferece um modelo dedicado e sem servidor do serviço para atender às diferentes demandas de ambas as soluções.

O modelo dedicado é conhecido como pools de SQL dedicados. Ele se refere aos recursos do data warehouse que estão em disponibilidade geral no Azure Synapse Analytics. Os pools de SQL dedicados representam uma coleção de recursos de análise que estão sendo provisionados ao usar o SQL do Synapse. Quando você precisa de desempenho e custo previsíveis, criar pools de SQL dedicados para reservar poder de processamento para dados armazenados em tabelas do SQL em um data warehouse é a melhor abordagem a ser adotada.

O modelo sem servidor é ideal para cargas de trabalho não planejadas ou ad hoc que a abordagem de análise de diagnóstico geraria. Portanto, se você estiver executando a exploração de dados ou preparando os dados para a virtualização, o SQL sem servidor será o melhor modelo a ser usado.