Compreender o problema do negócio
Imagine que está a trabalhar na Proseware, uma start-up focada em ajudar os profissionais de saúde a terem mais sucesso no seu trabalho. Para ajudar os profissionais, uma nova aplicação web está sendo desenvolvida para ajudar a diagnosticar os pacientes mais rapidamente com base em informações médicas.
Um modelo de classificação de diabetes é treinado e está pronto para ser integrado com o aplicativo web. Um objetivo importante a longo prazo do Proseware é melhorar continuamente o aplicativo e a precisão do modelo no futuro.
Você se juntou à equipe como engenheiro de aprendizado de máquina e é solicitado a padronizar a integração contínua do modelo com o aplicativo. Um aspeto importante da padronização é garantir que o código usado para treinar o modelo seja verificado.
Para verificar o código usado para treinar o modelo de classificação de diabetes, você vai querer executar:
- Linting: Verificação de erros programáticos ou estilísticos em scripts Python ou R.
- Teste de unidade: Verificar o desempenho do conteúdo do código.
Para ajudar a equipe de ciência de dados a entender os padrões de qualidade de código, eles poderão verificar seu código ao desenvolver localmente no Visual Studio Code.
No entanto, você deseja automatizar a verificação de código para verificar se todo o código enviado para produção não tem problemas e funciona conforme o esperado. Juntamente com a equipe de ciência de dados, você decide executar linting e testes de unidade sempre que uma solicitação pull é criada usando as Ações do GitHub.