Partilhar via


Pré-processar dados para machine learning e aprendizagem profunda

Pode utilizar o Arquivo de Funcionalidades do Databricks para criar novas funcionalidades, explorar e reutilizar funcionalidades existentes, selecionar funcionalidades para preparar e classificar modelos de machine learning e publicar funcionalidades em lojas online de baixa latência para inferência em tempo real.

Em conjuntos de dados de grandes dimensões, pode utilizar o Spark SQL e o MLlib para engenharia de funcionalidades. As bibliotecas de terceiros incluídas no Databricks Runtime ML, como o scikit-learn, também fornecem métodos auxiliares úteis. Para obter exemplos, veja os seguintes blocos de notas de machine learning para scikit-learn e MLlib:

Para um processamento de funcionalidades de aprendizagem profunda mais complexo, este bloco de notas de exemplo ilustra como utilizar a aprendizagem de transferência para caracterização: