Evaluación de modelos de lenguaje con Azure Databricks

Módulo
8 Unidades

Intermedio

Ingeniero de datos

Azure Databricks

Aprenda a comparar los modelos de lenguaje grande (LLM) y las evaluaciones tradicionales de Machine Learning (ML), comprender su relación con la evaluación del sistema de IA y explorar varias métricas de evaluación de LLM y evaluaciones específicas relacionadas con tareas.

Objetivos de aprendizaje

En este módulo, aprenderá a:

Compare las evaluaciones de LLM y ML tradicionales.
Describir la relación entre la evaluación y evaluación de LLM de todos los sistemas de inteligencia artificial.
Describir métricas genéricas de evaluación de LLM, como la precisión, la perplejidad y la toxicidad.
Describir LLM-as-a-judge para la evaluación.

Requisitos previos

Antes de iniciar este módulo, debe estar familiarizado con Azure Databricks. Considere la posibilidad de completar Exploración de Azure Databricks antes de iniciar este módulo.

Introducción min
Comparación de evaluaciones de LLM y aprendizaje automático tradicional min
Evaluación de máquinas virtuales y sistemas de inteligencia artificial min
Evaluación de LLM con métricas estándar min
Describir LLM-as-a-judge para la evaluación min
Ejercicio: Evaluación de un modelo de Azure OpenAI min
Evaluación de módulos min
Resumen min