¿Qué son los modelos de aprendizaje automático?

Completado

El modelo es el componente principal del aprendizaje automático y, en definitiva, lo que estamos intentando crear. Un modelo podría calcular la edad de una persona a partir de una foto, predecir lo que le gustaría ver en las redes sociales o decidir dónde se debe mover un brazo robótico. En nuestro escenario, queremos crear un modelo que pueda calcular la talla de botas más adecuada para un perro en función de la talla de su arnés.

Los modelos se pueden crear de muchas maneras. Por ejemplo, son las personas las que crean un modelo tradicional que simula el vuelo de un avión, con conocimientos de física e ingeniería. Los modelos de aprendizaje automático son especiales, ya que en lugar de editarlos las personas para que sean eficaces, son los datos los que les dan forma. Aprenden de la experiencia.

Planteamientos sobre los modelos

Un modelo puede plantearse como una función que acepta datos como entrada y genera una salida. En concreto, un modelo usa los datos de entrada para calcular otra cosa. Por ejemplo, en nuestro escenario, queremos crear un modelo al que se le proporciona una talla de arnés y calcula la talla de unas botas:

Diagram showing a model without parameters.

Tenga en cuenta que tanto la talla del arnés como la de las botas para perros son datos, no forman parte del modelo. La talla del arnés es la entrada y la talla de las botas para perros es la salida.

Los modelos suelen ser código sencillo

Los modelos no se suelen diferenciar de un modo significativo de las funciones sencillas con las que ya está familiarizado. Al igual que otro código, contienen lógica y parámetros. Por ejemplo, la lógica podría ser "multiplicar la talla del arnés por parameter_1":

A diagram showing a model with a single unspecified parameter.

Si parameter_1 aquí fuese 2,5, nuestro modelo multiplicaría la talla del arnés por 2,5 y devolvería el resultado siguiente:

Diagram showing a model with 2.5 as the only parameter.

Selección de un modelo

Hay muchos tipos de modelo, algunos de ellos sencillos y otros complejos.

Al igual que sucede con cualquier código, los modelos más sencillos suelen ser los más fiables y fáciles de entender, mientras que los modelos complejos pueden llevar a cabo grandes hazañas. El tipo de modelo que debería elegir depende de su objetivo. Por ejemplo, los científicos médicos suelen trabajar con modelos relativamente sencillos porque son fiables e intuitivos. Por el contrario, los robots basados en inteligencia artificial suelen depender de modelos complejos.

El primer paso del aprendizaje automático es seleccionar el tipo de modelo que querría usar. Por tanto, el modelo se elige en función de su lógica interna. Por ejemplo, podríamos seleccionar un modelo de dos parámetros para calcular la talla de las botas para perros a partir de la talla del arnés:

Diagram showing a model with two unspecified parameters.

Observe cómo hemos seleccionado un modelo en función de cómo funciona lógicamente, pero no en función de sus valores de parámetro. De hecho, en este momento los parámetros no se han establecido en ningún valor concreto.

Detección de los parámetros durante el entrenamiento

El diseñador humano no selecciona los valores de parámetro. En lugar de esto, se define una estimación inicial de los valores de parámetro y, después, dichos valores de parámetro se ajustan durante un proceso de aprendizaje automatizado denominado entrenamiento.

Dada la selección de un modelo de dos parámetros, primero se proporcionan estimaciones aleatorias para los parámetros:

Diagram showing a model with 0.2 and 1.2 as the parameters.

Estos parámetros aleatorios significan que el modelo no es eficaz a la hora de calcular la talla de las botas, por lo que se lleva a cabo el entrenamiento. Durante el entrenamiento, estos parámetros son sustituidos de forma automática por dos nuevos valores que proporcionan mejores resultados:

Diagram showing a model with 1.5 and 4 as the parameters.

El funcionamiento exacto de este proceso es algo que se explica de forma progresiva a lo largo del recorrido de aprendizaje.