Preparar Modelo
Importante
O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.
A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).
- Consulte informações sobre projetos de machine learning em movimento de ML Studio (clássico) para Azure Machine Learning.
- Saiba mais sobre Azure Machine Learning.
A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.
Treina um modelo de classificação ou regressão de forma supervisionada
Categoria: Machine Learning / Comboio
Nota
Aplica-se a: Machine Learning Studio (clássico) apenas
Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.
Visão geral do módulo
Este artigo descreve como usar o módulo Train Model em Machine Learning Studio (clássico) para treinar um modelo de classificação ou regressão. A formação ocorre depois de definir um modelo e definir os seus parâmetros, e requer dados marcados. Também pode utilizar o Train Model para retreinar um modelo existente com novos dados.
Como funciona o processo de formação
Em Machine Learning, criar e usar um modelo de aprendizagem automática é tipicamente um processo de três etapas.
Configura um modelo, escolhendo um tipo particular de algoritmo, e definindo os seus parâmetros ou hiperparímetros. Escolha qualquer um dos seguintes modelos:
- Modelos de classificação, baseados em redes neurais, árvores de decisão e florestas de decisão, e outros algoritmos.
- Modelos de regressão, que podem incluir regressão linear padrão, ou que usam outros algoritmos, incluindo redes neurais e regressão baysiana.
Forneça um conjunto de dados que seja rotulado e tenha dados compatíveis com o algoritmo. Ligação tanto os dados como o modelo para o Modelo de Treino.
O que o treino produz é um formato binário específico, o iLearner, que encapsula os padrões estatísticos aprendidos com os dados. Não é possível modificar ou ler diretamente este formato; no entanto, outros módulos em Studio (clássico) podem usar este modelo treinado.
Também pode ver as propriedades do modelo. Para mais informações, consulte a secção Resultados .
Após o treino concluído, utilize o modelo treinado com um dos módulos de pontuação, para fazer previsões sobre novos dados.
Nota
Outras tarefas especializadas de aprendizagem automática requerem diferentes métodos de treino, e o Studio (clássico) fornece módulos de treino separados para eles. Por exemplo, a deteção de imagem, o agrupamento e a desincção de anomalias utilizam métodos de treino personalizados. O Modelo de Comboio destina-se apenas a modelos de regressão e classificação.
Formação supervisionada e sem supervisão
Deve ter ouvido os termos supervisionados ou aprendizagem sem supervisão. Treinar um modelo de classificação ou regressão com o Train Model é um exemplo clássico de aprendizagem automática supervisionada. Isto significa que deve fornecer um conjunto de dados que contenha dados históricos para aprender padrões. Os dados devem conter tanto o resultado (rótulo) que está a tentar prever, como os fatores relacionados (variáveis). O modelo de aprendizagem automática precisa dos resultados para determinar as características que melhor preveem os resultados.
Durante o processo de treino, os dados são classificados por resultados e o algoritmo extrai padrões estatísticos para construir o modelo.
A aprendizagem não supervisionada indica que o resultado é desconhecido, ou opta por não usar rótulos conhecidos. Por exemplo, os algoritmos de agrupamento geralmente empregam métodos de aprendizagem não supervisionados, mas podem usar rótulos se disponíveis. Outro exemplo é a modelação de tópicos utilizando a LDA. Não pode usar o Modelo de Comboio com estes algoritmos.
Dica
Novo em aprendizagem automática? Este tutorial acompanha-o através do processo de obtenção de dados, configuração de um algoritmo, treino e, em seguida, usando um modelo: Crie a sua primeira experiência de aprendizagem automática
Como usar o Modelo de Comboio
Em Machine Learning Studio (clássico), configurar um modelo de classificação ou modelos de regressão.
Também pode treinar um modelo personalizado criado através do Create R Model.
Adicione o módulo Modelo de Comboio à experiência. Pode encontrar este módulo na categoria Machine Learning. Expanda o Comboio e, em seguida, arraste o módulo Train Model para a sua experiência.
Na entrada esquerda, fixe o modo destreinado. Ligue o conjunto de dados de treino à entrada direita do Modelo de Comboio.
O conjunto de dados de treino deve conter uma coluna de etiqueta. Quaisquer filas sem etiquetas são ignoradas.
Para a coluna Label, clique no seletor de colunas de lançamento e escolha uma única coluna que contenha resultados que o modelo possa utilizar para o treino.
Para problemas de classificação, a coluna de etiqueta deve conter valores categóricos ou valores discretos . Alguns exemplos podem ser uma classificação sim/não, um código de classificação da doença ou nome, ou um grupo de rendimentos. Se escolher uma coluna não-categórica, o módulo retornará um erro durante o treino.
Para problemas de regressão, a coluna do rótulo deve conter dados numéricos que representem a variável de resposta. Idealmente, os dados numéricos representam uma escala contínua.
Exemplos podem ser uma pontuação de risco de crédito, o tempo projetado para falhar para um disco rígido, ou o número previsto de chamadas para um call center em um determinado dia ou hora. Se não escolher uma coluna numérica, poderá ter um erro.
- Se não especificar qual coluna de etiqueta utilizar, Machine Learning tentará inferir qual é a coluna de etiqueta apropriada, utilizando os metadados do conjunto de dados. Se escolher a coluna errada, utilize o seletor de colunas para corrigi-la.
Dica
Se tiver problemas em utilizar o Seletor de Colunas, consulte o artigo Selecione colunas no conjunto de dados para obter dicas. Descreve alguns cenários e dicas comuns para a utilização das opções COM REGRAS e POR NOME .
Execute a experimentação. Se tiver muitos dados, isto pode demorar um pouco.
Resultados
Depois de o modelo ser treinado:
Para visualizar os parâmetros do modelo e os pesos de recurso, clique com o botão direito na saída e selecione Visualize.
Para utilizar o modelo noutras experiências, clique com o botão direito no modelo e selecione Save Model. Digite um nome para o modelo.
Isto guarda o modelo como um instantâneo que não é atualizado por repetições da experiência.
Para utilizar o modelo na previsão de novos valores, conecte-o ao módulo 'Modelo de Pontuação' , juntamente com novos dados de entrada.
Tarefas relacionadas
Se precisa de treinar um modelo não suportado pelo Modelo de Comboio, existem várias opções:
Crie um método de pontuação personalizado utilizando o script R ou use um dos muitos pacotes de pontuação R disponíveis.
Escreva o seu próprio script Python para treinar e marcar um modelo, ou use uma biblioteca Python existente:
Modelos de deteção de anomalias
- O Modelo de Deteção de Anomalias de Comboio suporta os módulos de deteção de anomalias em Studio (clássico).
Modelos de recomendação
Se o seu modelo utilizar a recomendação Matchbox fornecida em Machine Learning, utilize o módulo Deendador Train Matchbox.
Se estiver a utilizar um algoritmo diferente para análise ou recomendação de cesto de mercado, use os seus métodos de treino, em script R ou python script.
Modelos de agrupamento
Use o modelo de clustering do comboio para o algoritmo K-significa incluído.
Para outros modelos de agrupamento, utilize script R ou módulos de script Python para configurar e treinar os modelos.
Exemplos
Por exemplo, como o módulo Train Model é usado em experiências de machine learning, veja estas experiências na Galeria Azure AI:
- Previsão de Varejo: Demonstra como construir, treinar e comparar vários modelos.
- Previsão do atraso de voo: Demonstra como treinar vários modelos de classificação relacionados.
Entradas esperadas
Nome | Tipo | Description |
---|---|---|
Modelo destreinado | Interface ILearner | Aprendiz sem treino |
Conjunto de dados | Tabela de Dados | Dados de preparação |
Parâmetros do módulo
Nome | Intervalo | Tipo | Predefinição | Description |
---|---|---|---|---|
Coluna de etiqueta | qualquer | Seleção de Colunas | Selecione a coluna que contém a etiqueta ou coluna de resultados |
Saídas
Nome | Tipo | Description |
---|---|---|
Modelo treinado | Interface ILearner | Aprendiz treinado |
Exceções
Para obter uma lista de todos os erros do módulo, consulte códigos de erro do módulo.
Exceção | Description |
---|---|
Erro 0032 | A exceção ocorre se o argumento não for um número. |
Erro 0033 | A exceção ocorre se o argumento for infinito. |
Erro 0083 | A exceção ocorre se o conjunto de dados utilizado para a formação não puder ser utilizado para o tipo de aprendiz de concreto. |
Erro 0035 | A exceção ocorre se não forem fornecidas funcionalidades para um determinado utilizador ou item. |
Erro 0003 | A exceção ocorre se uma ou mais entradas forem nulas ou vazias. |
Erro 0020 | A exceção ocorre se o número de colunas em alguns dos conjuntos de dados passados para o módulo for demasiado pequeno. |
Erro 0021 | A exceção ocorre se o número de linhas em alguns dos conjuntos de dados passados para o módulo for demasiado pequeno. |
Erro 0013 | A exceção ocorre se a aprovação para o aprendiz de módulo tem um tipo inválido. |