Analise um cenário e mapeie-o para uma opção de configuração do HDInsight.

Concluído

Leia o estudo de caso a seguir e responda às perguntas para mapear um cenário para uma configuração de cluster do HDInsight.

Estudo de caso – bicicletas da AdventureWorks

A AdventureWorks vende bicicletas e peças para bicicletas diretamente para clientes e distribuidores. No momento, a empresa tem apenas um escritório nos Países Baixos. Ela vende bicicletas nos Estados Unidos, na Alemanha e na Espanha por meio de uma rede de distribuidores e vendas online pelo site. O cumprimento da entrega é feito por centros de distribuição locais.

A empresa está planejando uma expansão por meio da criação de novos escritórios, pois o crescimento das vendas nesses países/regiões aumentou nos últimos três anos. Os locais são:

  • Tóquio, Japão
  • Seattle, EUA
  • Chicago, EUA
  • Berlim, Alemanha
  • Barcelona, Espanha
  • Paris, França

A AdventureWorks está em um mercado altamente competitivo há 15 anos. Ela quer se tornar a empresa de bicicleta mais inovadora, fornecendo aos proprietários de bicicletas atuais e futuros as melhores tecnologia e serviços da categoria. O departamento de pesquisa e desenvolvimento da AdventureWorks concebeu com êxito o próximo ciclo de produtos inovadores. A empresa conta com engenheiros de dados, engenheiros de IA e cientistas de dados para auxiliar no design e na implementação da solução.

Considerando o maior nível de vendas e a expansão em escala global, a infraestrutura de dados existente não atenderá aos requisitos de negócios gerais ou ao crescimento futuro a que a AdventureWorks aspira. Os diretores executivos de informação e tecnologia manifestaram o desejo de abandonar os sistemas locais existentes e mudar para a nuvem para atender ao crescimento esperado. Esse plano tem apoio do CFO, pois houve uma solicitação de substituição de hardware considerando que a infraestrutura existente está chegando ao fim da vida útil. O CFO está ciente de que a nuvem pode oferecer alternativas mais econômicas.

Como engenheiro de dados sênior, você ajudará a AdventureWorks no design e na implementação da solução. Isso ajudará a empresa a atender aos requisitos corporativos, funcionais e técnicos estabelecidos para as estratégias de crescimento, expansão e inovação. Você executará esse plano de modo a minimizar os custos operacionais e possibilitar o monitoramento da eficácia.

Em um workshop de descoberta, você determina as seguintes informações:

Análise de dados

No momento, os relatórios empresariais estão sendo fornecidos por um só banco de dados local configurado como um data warehouse. Ele contém um banco de dados chamado AdventureWorksDW, que é usado para fornecer relatórios históricos e análises descritivas. Recentemente, esse servidor está com dificuldades para processar os dados de relatório rapidamente e sua equipe deve garantir que o acesso aos dados seja restrito.

A AdventureWorks também gostaria de aproveitar ainda mais sua análise de dados e começar a utilizar os recursos de análise preditiva. Essa atividade não está sendo executada no momento. A organização entende que uma recomendação ou um mecanismo de análise de texto pode ser criado. Ela gostaria que você a orientasse quanto à melhor tecnologia e à melhor abordagem a serem adotadas na implementação de uma solução que também seja resiliente e tenha bom desempenho.

Análise de mídia social

Nos últimos anos, o departamento de marketing da organização executou uma ampla variedade de campanhas do Twitter em vários momentos do ano. É muito útil medir o impacto de seu trabalho acompanhando ativos de mídia social, como hashtags, durante essas campanhas. A empresa gostaria de poder acompanhar qualquer hashtag de qualquer nome.

Bicicleta conectada

As bicicletas da AdventureWorks podem ser equipadas com um inovador computador de bicicleta integrado. Este computador consiste em recursos de bloqueio automático da bicicleta, bem como status operacional. As informações capturadas por esse computador de bicicleta incluem:

  • Modelo de bicicleta, número de série e proprietário registrado
  • Localização da bicicleta (longitude de latitude)
  • Status atual (estacionário, em movimento)
  • Velocidade atual em quilômetros por hora
  • Bicicleta bloqueada/desbloqueada
  • Informações sobre peças e componentes da bicicleta (em bicicletas elétricas)

Os aplicativos primários e de terceiros podem ter acesso às informações do computador de bicicleta, que devem ser seguras. Essas informações podem ser usadas para a integração a aplicativos móveis, exibição em tempo real de localização e informações de compartilhamento de percurso da bicicleta. Além disso, os dados de resumo diários podem ser salvos em arquivos simples. Esses dados incluem o modelo de bicicleta, o número de série, o proprietário registrado, um resumo do total de quilômetros pedalados por dia e a velocidade média.

Serviços de manutenção de bicicleta

Os proprietários de bicicletas existentes podem optar por receber notificações quando a bicicleta precisa de reparo com base em:

  • Telemetria de bicicleta elétrica com base nos dados do sensor
  • Informações de uso de bicicleta provenientes dos computadores da bicicleta integrados com base em quilometragem/desgaste médio e subdivisão
  • Esse cenário de manutenção preditiva é um serviço ao qual os proprietários de bicicletas podem aderir, oferecido como um serviço pago.

Perguntas

Com base no estudo de caso a seguir, responda às perguntas a seguir


Verificação de conhecimentos

1.

Qual tipo de configuração de cluster HDInsight seria apropriado para atender aos requisitos de streaming necessários para o cenário de bicicleta conectada?

2.

Qual tipo de configuração de cluster HDInsight seria apropriado para alojar a análise de dados executada pelo data warehouse no SQL Server local?

3.

Qual tipo de configuração de cluster HDInsight seria o tipo apropriado para executar o trabalho de manutenção preditiva no serviço de manutenção de bicicleta?

4.

Para atender a todos os cenários descritos nas perguntas anteriores, qual tipo de armazenamento de dados deve ser usado para lidar com todas essas cargas de trabalho?