Episódio

Ciência de dados reproduzível com Machine Learning

Ser capaz de explicar o seu próprio código alguns meses depois de o ter escrito é difícil. Imagine ter que explicar as decisões de algum algoritmo de IA alguns anos depois de ser executado! No entanto, é relativamente fácil configurar seu fluxo de trabalho de desenvolvimento para tornar isso possível, desde que você perceba que a maneira como construímos ML e IA é fundamentalmente diferente da engenharia de software tradicional. Em resumo, trata-se de: investigação, desenvolvimento e implantação reprodutíveis. Isso é possível graças a um uso inteligente de ambientes de notebook modernos, incluindo instâncias de computação do Azure ML, em oposição aos IDEs mais tradicionais, como o Visual Studio Code. Rafal Lukawiecki tem trabalhado ativamente em ciência de dados, aprendizado de máquina e mineração de dados por mais de uma década, e ele estudou e usou formalmente a inteligência artificial muito antes de ela ser popular, nos anos 90. Assista a este episódio para descobrir como ele organiza seu fluxo de trabalho reproduzível.

Ir para:

  • [02:30] Aprenda pesquisa reprodutível com Rafal Lukawiecki
  • [03:01] Modelação e exploração vs desenvolvimento de software
  • [09:28] Etapas para um fluxo de trabalho reproduzível
  • [15:20] Demonstração: Fluxo de trabalho usando RStudio e RMarkdown em execução local
  • [22:25] Demonstração: Blocos de notas RMarkdown numa Instância de Computação do Azure ML

Mais informações:

Não perca novos episódios,  assine o AI Show