Cómo usar un modelo

Completado

A continuación, repasamos cómo encajan estas partes para entrenar un modelo.

Diferencias entre entrenar y usar un modelo

Es importante diferenciar el entrenamiento del uso de un modelo.

Usar un modelo significa proporcionar entradas y recibir una estimación o predicción. Realizamos este proceso tanto cuando entrenamos nuestro modelo como cuando nosotros, o nuestros clientes, lo usamos en el mundo real. Usar un modelo solo nos lleva unos pocos segundos.

Diagram showing a machine learning model with data going into the model, which then moves to an estimate.

Por el contrario, entrenar un modelo es el proceso de mejorar el funcionamiento de dicho modelo. El entrenamiento requiere que usemos el modelo, la función objetivo y el optimizador en un bucle específico. El entrenamiento puede tardar unos minutos o días en completarse. Solemos entrenar el modelo solo una vez. Una vez entrenado, podemos usarlo tantas veces como queramos sin realizar más cambios.

Diagram of the final training, showing the machine learning model lifecycle.

Por ejemplo, en nuestro escenario de tienda de perros de rescate en avalanchas, queremos entrenar un modelo con un conjunto de datos público. El conjunto de datos cambia el modelo para que pueda predecir la talla de la bota de un perro en función del tamaño de su arnés. Una vez entrenado, usaremos el modelo en nuestra tienda en línea para asegurarnos de que los clientes van a comprar las botas que se adaptarán mejor a sus perros.

Datos para usar, datos para entrenar

Recuerde que un conjunto de datos es una recopilación de información sobre objetos o cosas. Por ejemplo, un conjunto de datos puede contener información sobre perros:

Identificador del perro Talla de las botas Talla del arnés Color del perro Raza
0 27 12 Brown San Bernard
1 26 11 Negro Labrador
2 25 10 Blanco Labrador
3 29 14 Negro Pastor alemán negro

Cuando usamos nuestro modelo, solo necesitamos las columnas de datos que el modelo acepta como entrada. Estas columnas se denominan características. En nuestro escenario, si el modelo acepta la talla del arnés y calcula la talla de las botas, entonces nuestra característica es la talla del arnés.

Durante el entrenamiento, la función objetivo normalmente necesita saber tanto la salida del modelo como cuál es la respuesta correcta. Estos valores se denominan etiquetas. En nuestro escenario, si el modelo predice la talla de las botas, nuestra etiqueta será la talla de las botas.

Para usar un modelo solo necesitamos las características, mientras que durante el entrenamiento normalmente necesitamos tanto las características como las etiquetas. Durante el entrenamiento en nuestro escenario, necesitamos tanto la característica de la talla del arnés como la etiqueta de la talla de las botas. Cuando usamos el modelo en nuestro sitio web, solo necesitamos saber la característica de la talla del arnés. A continuación, nuestro modelo calculará la talla de las botas que debemos usar.

El entrenamiento ha finalizado. ¿Qué más?

Una vez que el modelo ha finalizado el entrenamiento, puede guardarlo en un archivo. Ya no necesitamos los datos originales, la función objetivo ni el optimizador del modelo. Cuando queramos usar el modelo, podemos cargarlo desde el disco, proporcionarle nuevos datos y obtener una predicción.

En el siguiente ejercicio, practicaremos cómo guardar un modelo, cargarlo desde el disco y usarlo como lo haríamos en el mundo real. Para completar nuestro escenario de la tienda en línea, también practicaremos cómo usar las salidas del modelo para advertir a los clientes si parece que van a comprar la talla equivocada de botas para perros.