Evaluación de modelos de lenguaje con Azure Databricks
Intermedio
Ingeniero de datos
Azure Databricks
Aprenda a comparar los modelos de lenguaje grande (LLM) y las evaluaciones tradicionales de Machine Learning (ML), comprender su relación con la evaluación del sistema de IA y explorar varias métricas de evaluación de LLM y evaluaciones específicas relacionadas con tareas.
Objetivos de aprendizaje
En este módulo, aprenderá a:
- Compare las evaluaciones de LLM y ML tradicionales.
- Describir la relación entre la evaluación y evaluación de LLM de todos los sistemas de inteligencia artificial.
- Describir métricas genéricas de evaluación de LLM, como la precisión, la perplejidad y la toxicidad.
- Describir LLM-as-a-judge para la evaluación.
Requisitos previos
Antes de iniciar este módulo, debe estar familiarizado con Azure Databricks. Considere la posibilidad de completar Exploración de Azure Databricks antes de iniciar este módulo.