Compreender os princípios da aprendizagem automática

Concluído

Machine learning é uma técnica de programação usada para criar modelos preditivos. Ao contrário da programação típica, em que o código é usado para descrever etapas específicas para produzir um resultado; O aprendizado de máquina depende do uso de um algoritmo para explorar iterativamente a relação entre os recursos de uma entidade de dados e o rótulo que o modelo resultante deve prever. Os algoritmos de aprendizado de máquina são baseados na teoria da probabilidade e na estatística, e dependem de grandes volumes de dados para treinar o modelo.

Em um nível simplista, um modelo de aprendizado de máquina é uma função que pega as características de uma entidade observada (suas características) e executa um cálculo sobre elas para retornar um rótulo previsto. É comum referir-se em geral aos recursos como x e ao rótulo previsto como y, portanto, na verdade, um modelo de aprendizado de máquina é a função f na expressãoy = f(x).

A operação específica que a função executa nos recursos para calcular um valor para o rótulo é determinada pelo algoritmo usado para treinar o modelo.

Tipos de machine learning

Em termos gerais, existem dois tipos comuns de aprendizagem automática:

  • Aprendizado de máquina supervisionado no qual o modelo é treinado usando dados que incluem valores de rótulo conhecidos (assim, um algoritmo usa os dados existentes para estabelecer uma relação entre x e y, resultando em uma função que pode ser aplicada a x para calcular y).
  • Aprendizado de máquina não supervisionado no qual o modelo é treinado usando apenas valores de recurso (x) e agrupa (ou clusters) observações com recursos semelhantes.

Aprendizagem automática supervisionada

Este módulo se concentra no aprendizado de máquina supervisionado, pois esse é o cenário mais comum. Dentro da definição ampla de aprendizado de máquina supervisionado, existem dois tipos comuns de algoritmo de aprendizado de máquina:

  • Algoritmos de regressão em que o rótulo é um valor numérico, como um preço, temperatura, quantidade ou outro valor que pode ser medido. Os algoritmos de regressão produzem modelos nos quais a função (f) opera sobre as características (x) para calcular o valor numérico do rótulo (y).

    Por exemplo, um algoritmo de regressão pode ser usado para treinar um modelo que prevê o número esperado de sorvetes vendidos por um quiosque em um parque em um determinado dia com base em características como o mês do ano, o dia da semana, a temperatura, a umidade e assim por diante.

  • Algoritmos de classificação em que o rótulo é uma categoria (ou classe) discreta. Os algoritmos de classificação produzem modelos nos quais a função (f) opera sobre as características (x) para calcular um valor de probabilidade para cada classe possível, e retorna o rótulo (y) para a classe com a maior probabilidade.

    Por exemplo, um algoritmo de classificação poderia ser usado para treinar um modelo que prevê se um paciente tem ou não diabetes com base em características como nível de insulina no sangue, peso, altura, idade e assim por diante. Um modelo de classificação que identifica uma das duas classes possíveis (como true ou false) é um exemplo de classificação binária . Algoritmos que predizem a probabilidade para mais de duas classes (por exemplo, diferenciando entre pacientes sem diabetes, diabetes tipo 1 ou diabetes tipo 2) são usados para classificação multiclasse .

Aprendizagem automática não supervisionada

A forma mais comum de aprendizagem não supervisionada é o clustering, no qual as características dos casos de dados são consideradas como um vetor de pontos no espaço multidimensional. O objetivo de um algoritmo de agrupamento é definir clusters que agrupam os pontos para que casos com características semelhantes estejam próximos, mas os clusters sejam claramente separados uns dos outros.

O clustering é útil quando você precisa definir diferentes categorias de dados, mas não tem categorias predefinidas às quais as observações de dados existentes já estão atribuídas. Por exemplo, talvez você queira segmentar clientes com base em semelhanças em seus perfis. O clustering também pode ser usado como uma etapa inicial na criação de uma solução de classificação - essencialmente, você usa clustering para determinar as classes apropriadas para seus dados.