Episódio

Ciência de dados reprodutível com Machine Learning

Poder explicar o seu próprio código alguns meses depois de ter escrito é difícil. Imagine ter de explicar as decisões de algum algoritmo de IA alguns anos depois de ter sido executado! No entanto, é relativamente fácil configurar o seu fluxo de trabalho de desenvolvimento para tornar isso possível, desde que perceba que a forma como construímos ML e IA é fundamentalmente diferente da engenharia de software tradicional. Em resumo, trata-se de: investigação, desenvolvimento e implantação reprodutíveis. É possível através de uma utilização inteligente de ambientes de cadernos modernos, incluindo Azure ML Compute Instances, em oposição aos IDEs mais tradicionais, como Visual Studio Código. Rafal Lukawiecki tem trabalhado ativamente na ciência dos dados, machine learning e mineração de dados há mais de uma década, e tem estudado e usado formalmente a inteligência artificial muito antes de ser popular, nos anos 90. Veja este episódio para saber como organiza o seu fluxo de trabalho reprodutível.

Salto para:

  • [02:30] Aprenda a pesquisa reprodutível com Rafal Lukawiecki
  • [03:01] Modelação e exploração vs desenvolvimento de software
  • [09:28] Passos para um fluxo de trabalho reprodutível
  • [15:20] Demo: Fluxo de trabalho utilizando RStudio e RMarkdown a funcionar localmente
  • [22:25] Demo: Cadernos RMarkdown inan  Azure ML Compute Instance

Mais informações:

Não perca novos episódios,subscreva  o AI Show