O que são os modelos de machine learning?

Concluído

O modelo é o componente principal do machine learning e, em ultima análise, o que estamos tentando criar. Um modelo pode estimar a idade de uma pessoa com base em uma foto, prever o que você pode querer ver nas mídias sociais ou decidir para onde um braço robótico deve se mover. Em nosso cenário, queremos criar um modelo que possa estimar o melhor tamanho de bota para um cão com base no tamanho do cinto que ele usa.

Os modelos podem ser construídos de várias maneiras. Por exemplo, um modelo tradicional que simula como um avião voa é criado por pessoas, usando conhecimentos de física e engenharia. Os modelos de machine learning são especiais. Em vez de serem editados por pessoas para que funcionem bem, os modelos de machine learning são moldados por dados. Eles aprendem com a experiência.

Como pensar sobre os modelos

Pense em um modelo como uma função que aceita dados de entrada e produz uma saída. Mais especificamente, um modelo usa dados de entrada para estimar outra coisa. Por exemplo, em nosso cenário, queremos criar um modelo que receba um tamanho de cinto e estime o tamanho de bota:

Diagram showing a model without parameters.

O tamanho da coleira e o tamanho da bota para cães são dados; eles não fazem parte do modelo. O tamanho do cinto é a entrada, enquanto o tamanho da bota para cães é a saída.

Os modelos, geralmente, têm código simples

Os modelos, geralmente, não são significativamente diferentes das funções simples com as quais você já está familiarizado. Assim como outros códigos, eles contêm lógica e parâmetros. Por exemplo, a lógica pode ser "multiplicar o tamanho do cinto por parameter_1":

A diagram showing a model with a single unspecified parameter.

Se parameter_1 aqui fosse 2,5, nosso modelo multiplicaria o tamanho do cinto por 2,5 e retornaria o resultado:

Diagram showing a model with 2.5 as the only parameter.

Selecionar um modelo

Há muitos tipos de modelo, alguns simples e alguns complexos.

Como todos os códigos, modelos mais simples geralmente são os mais confiáveis e fáceis de entender, ao passo que modelos complexos podem executar reações incríveis. O tipo de modelo que deve ser escolhido depende da sua meta. Por exemplo, cientistas médicos geralmente trabalham com modelos relativamente mais simples, porque são confiáveis e intuitivos. Por outro lado, os robô baseados em IA normalmente contam com modelos complexos.

A primeira etapa do machine learning é selecionar o tipo de modelo que você gostaria de usar. Portanto, estamos escolhendo um modelo com base na lógica interna dele. Por exemplo, podemos selecionar um modelo com dois parâmetros para estimar o tamanho da bota para cães com base no tamanho do cinto:

Diagram showing a model with two unspecified parameters.

Observe como selecionamos um modelo com base na lógica como ele funciona, e não nos valores dos parâmetros do modelo. Na verdade, neste ponto, os parâmetros não foram definidos com nenhum valor específico.

Os parâmetros são descobertos durante o treinamento

O designer humano não seleciona valores de parâmetro. Em vez disso, os valores dos parâmetros são definidos com uma estimativa inicial, ajustados durante um processo de aprendizado automatizado chamado de treinamento.

Dada nossa seleção de um modelo com dois parâmetros, começamos fornecendo estimativas aleatórias para nossos parâmetros:

Diagram showing a model with 0.2 and 1.2 as the parameters.

Esses parâmetros aleatórios indicam que o modelo ainda não está bom para estimar o tamanho da bota, portanto, executamos o treinamento. Durante o treinamento, esses parâmetros são alterados automaticamente para dois novos valores que geram resultados melhores:

Diagram showing a model with 1.5 and 4 as the parameters.

A maneira exata como esse processo funciona é algo que explicamos progressivamente durante o seu percurso de aprendizado.