Modelos de lenguaje grandes

7 minutos

Entender cómo funciona la IA generativa puede ayudar a los educadores a mantenerse a la vanguardia de los avances tecnológicos en educación. Profundicemos en el vocabulario de la IA.

¿Qué son los modelos de lenguaje grandes?

Los modelos de lenguaje grandes (LLM) son modelos de IA como GPT-3 (y futuras versiones) de OpenAI que se entrenan con grandes cantidades de texto y pueden generar respuestas similares a las humanas en el acto prediciendo qué palabras vienen a continuación en una frase, como si se tratara de crear un rompecabezas. Los modelos de lenguaje grandes pueden realizar diversas tareas de lenguaje natural, como:

Clasificación
Resumen
Traducción
Generar contenido
Diálogo (por ejemplo, asistentes virtuales)

Los modelos de lenguaje grandes se entrenan con miles de millones de ejemplos lingüísticos de diversas fuentes, como libros, artículos y sitios web, que les ayudan a responder con hechos, textos gramaticalmente correctos, argumentaciones y cierta apariencia de creatividad.

El popular sistema ChatGPT de OpenAI es un ejemplo de este tipo de IA generativa. ChatGPT se basa en un modelo de lenguaje grande inventado en OpenAI basado en el modelo GPT-3 (transformador generativo preentrenado). Piense en ChatGPT como una aplicación basada en un modelo de lenguaje grande que se ha optimizado para chats interactivos.

Las personas que utilizan una aplicación basada en un modelo de lenguaje grande pueden dirigir la salida del modelo mediante indicaciones, es decir, el texto que introducen en la interfaz de la aplicación. Las indicaciones pueden ser frases o preguntas en lenguaje natural, fragmentos de código o comandos, o cualquier combinación de texto o código.

Cuando una indicación es específica y detallada, los LLM pueden generar texto, ampliar los puntos principales, condensar la información en puntos clave y responder a las preguntas con eficacia. El arte de definir de forma creativa las indicaciones del LLM es un campo emergente conocido como "diseño de indicaciones" e "ingeniería de indicaciones". Se trata del proceso de elaboración de indicaciones eficaces y eficientes para obtener la respuesta deseada. Es posible que los educadores y los estudiantes tengan que experimentar con la elección de las palabras, frases, símbolos y formatos adecuados que guíen el modelo para generar textos pertinentes y de alta calidad.

Algunas recomendaciones para escribir indicaciones eficaces son:

Sea específico
Use el modelo adecuado para la tarea
Pida resultados con un determinado punto de vista
Guíe el modelo para generar la longitud deseada
Usar "nuevo tema" al cambiar de tema (El arte de la indicación: Cómo sacar el máximo partido de la inteligencia artificial generativa)

Microsoft usa la tecnología de modelos de lenguaje grandes para aumentar las capacidades de Copilot. Copilot es como tener un asistente de investigación, un planificador personal y un compañero creativo a su lado siempre que busque en Internet. Con este conjunto de características basadas en IA, puede:

Formule una pregunta real. Al formular preguntas complejas, Copilot le ofrece respuestas detalladas.
Obtener una respuesta real. Copilot examina los resultados de búsqueda en toda la web para ofrecer una respuesta resumida.
Sea creativo. Cuando necesite inspiración, Copilot puede ayudarle a escribir historias, historias o incluso a crearle una imagen completamente nueva.
En la experiencia de chat, también puedes formular preguntas de seguimiento, como "¿puede explicarlo de un modo más sencillo?" o "deme más opciones" para obtener respuestas diferentes o más detalladas en la búsqueda. Sin embargo, en el chat, cada conversación tiene un número limitado de interacciones para mantener las interacciones basadas en la búsqueda.

Nota:

Compruebe siempre los resultados. Aunque las respuestas del LLM parezcan convincentes, pueden ser inexactas, incompletas o inadecuadas. Los LLM no pueden entender ni evaluar la precisión de las respuestas. Es importante señalar que Copilot proporciona a educadores y estudiantes las fuentes de los contenidos en línea que recupera, para que puedan evaluarlos antes de utilizarlos como fuente fiable.

Un profesor de una universidad necesita redactar un nuevo programa para un curso de urbanismo. Empiezan pidiendo a Microsoft Copilot que escriba un resumen de un curso universitario sobre urbanismo. El resumen es detallado, pero no incluye todos los elementos del curso. A continuación, el profesor modifica la indicación para incluir el esquema del curso y especifica que el resumen es para un programa del curso. La segunda iteración se acerca más a lo que necesitan para el programa del curso. Copian el texto, lo pegan en un documento de Word y cambian solo unas palabras. El resumen está listo. A continuación, piden a Copilot que redacte los objetivos de aprendizaje del curso basándose en el esquema y el resumen. En cuestión de minutos, completan esta tarea y pueden pasar a crear los materiales del curso.

Aunque los LLM son impresionantes en muchos sentidos, son más adecuados para tareas de categorización, generación de nuevas ideas o resumen de texto que para recuperar detalles concretos de un gran conjunto de datos.

Continuar

Modelos de lenguaje grandes

¿Qué son los modelos de lenguaje grandes?

Comentarios