Descripción de los principios del aprendizaje automático

Completado

El aprendizaje automático es una técnica de programación que se usa para crear modelos predictivos. A diferencia de la programación típica, en la que se usa código para describir pasos específicos para generar un resultado; El aprendizaje automático se basa en el uso de un algoritmo para explorar de forma iterativa la relación entre las características de una entidad de datos y la etiqueta que debe predecir el modelo resultante. Los algoritmos de aprendizaje automático se basan en la teoría y las estadísticas de probabilidad, y se basan en grandes volúmenes de datos con los que entrenar el modelo.

En un nivel simplista, un modelo de aprendizaje automático es una función que toma las características de una entidad observada (sus características) y realiza un cálculo sobre ellos para devolver una etiqueta predicha. Es habitual hacer referencia en general a las características como x y la etiqueta predicha como y; por lo tanto, un modelo de aprendizaje automático es la función f de la expresión y = f(x).

La operación específica que realiza la función en las características para calcular un valor de la etiqueta viene determinada por el algoritmo usado para entrenar el modelo.

Tipos de aprendizaje automático

En términos generales, hay dos tipos comunes de aprendizaje automático:

  • Aprendizaje automático supervisado en el que el modelo se entrena mediante datos que incluyen valores de etiqueta conocidos (por lo que un algoritmo usa los datos existentes para establecer una relación entre x e y, lo que da lugar a una función que se puede aplicar a x para calcular y).
  • Aprendizaje automático no supervisado en el que el modelo se entrena con solo valores de características (x) y observaciones de grupos (o clústeres) con características similares.

Aprendizaje automático supervisado

Este módulo se centra en el aprendizaje automático supervisado, ya que es el escenario más común. Dentro de la amplia definición del aprendizaje automático supervisado, hay dos tipos comunes de algoritmo de aprendizaje automático:

  • Algoritmos de regresión en los que la etiqueta es un valor numérico, como un precio, temperatura, cantidad u otro valor que se puede medir. Los algoritmos de regresión generan modelos en los que la función (f) funciona en las características (x) para calcular el valor numérico de la etiqueta (y).

    Por ejemplo, se podría usar un algoritmo de regresión para entrenar un modelo que predice el número esperado de helados vendidos por un quiosco en un parque en un día determinado en función de características como el mes del año, el día de la semana, la temperatura, la humedad, etc.

  • Algoritmos de clasificación en los que la etiqueta es una categoría discreta (o clase). Los algoritmos de clasificación producen modelos en los que la función (f) opera en las características (x) para calcular un valor de probabilidad para cada clase posible y devuelve la etiqueta (y) de la clase con la mayor probabilidad.

    Por ejemplo, se podría usar un algoritmo de clasificación para entrenar un modelo que prediga si un paciente tiene diabetes en función de características como el nivel de insulina en sangre, el peso, la altura, la edad, etc. Un modelo de clasificación que identifica una de las dos clases posibles (como true o false) es un ejemplo de clasificación binaria . Los algoritmos que predicen la probabilidad de más de dos clases (por ejemplo, diferenciando entre pacientes sin diabetes, diabetes de tipo 1 o diabetes de tipo 2) se usan para la clasificación multiclase .

Aprendizaje automático no supervisado

La forma más común de aprendizaje no supervisado es la agrupación en clústeres, en la que las características de los casos de datos se consideran un vector de puntos en el espacio multidimensional. El objetivo de un algoritmo de agrupación en clústeres es definir clústeres que agrupan los puntos para que los casos con características similares estén cerca, pero los clústeres están claramente separados entre sí.

La agrupación en clústeres es útil cuando necesita definir diferentes categorías de datos, pero no tiene categorías predefinidas a las que ya están asignadas las observaciones de datos existentes. Por ejemplo, es posible que quiera segmentar a los clientes en función de las similitudes de sus perfiles. La agrupación en clústeres también se puede usar como paso inicial para crear una solución de clasificación: básicamente, se usa la agrupación en clústeres para determinar las clases adecuadas para los datos.