Evaluación de modelos de lenguaje con Azure Databricks

Intermedio
Ingeniero de datos
Azure Databricks

Aprenda a comparar los modelos de lenguaje grande (LLM) y las evaluaciones tradicionales de Machine Learning (ML), comprender su relación con la evaluación del sistema de IA y explorar varias métricas de evaluación de LLM y evaluaciones específicas relacionadas con tareas.

Objetivos de aprendizaje

En este módulo, aprenderá a:

  • Compare las evaluaciones de LLM y ML tradicionales.
  • Describir la relación entre la evaluación y evaluación de LLM de todos los sistemas de inteligencia artificial.
  • Describir métricas genéricas de evaluación de LLM, como la precisión, la perplejidad y la toxicidad.
  • Describir LLM-as-a-judge para la evaluación.

Requisitos previos

Antes de iniciar este módulo, debe estar familiarizado con Azure Databricks. Considere la posibilidad de completar Exploración de Azure Databricks antes de iniciar este módulo.