Comparación y selección de modelos mediante la tabla de clasificación del modelo en el portal de Azure AI Foundry (versión preliminar)

2025-05-19

Importante

Los elementos marcados (versión preliminar) en este artículo se encuentran actualmente en versión preliminar pública. Esta versión preliminar se ofrece sin acuerdo de nivel de servicio y no se recomienda para las cargas de trabajo de producción. Es posible que algunas características no sean compatibles o que tengan sus funcionalidades limitadas. Para más información, consulte Términos de uso complementarios de las Versiones Preliminares de Microsoft Azure.

En este artículo, aprenderá a simplificar el proceso de selección de modelos en el catálogo de modelos de Azure AI Foundry mediante la comparación de modelos en las tablas de clasificación del modelo (versión preliminar) disponibles en el portal de Azure AI Foundry. Esta comparación puede ayudarle a tomar decisiones fundamentadas sobre qué modelos cumplen los requisitos de su caso de uso o aplicación concretos. Puede comparar modelos mediante la visualización de las siguientes tablas de clasificación:

Tablas de clasificación de calidad, seguridad, costo y rendimiento para identificar rápidamente a los líderes del modelo a lo largo de un único criterio (calidad, costo o rendimiento);
Gráficos de compensación para ver cómo funcionan los modelos en una métrica frente a otra, como la calidad frente al costo, entre distintos criterios de selección;
Tablas de clasificación por escenario para encontrar las mejores tablas de clasificación que se ajusten a su escenario.

Prerrequisitos

Una suscripción de Azure con un método de pago válido. Las suscripciones gratuitas o de evaluación de Azure no funcionarán. Si no tiene una suscripción de Azure, cree una cuenta de Azure de pago para comenzar.
Un proyecto de Azure AI Foundry.

Tablas de clasificación del modelo de acceso

Inicie sesión en Azure AI Foundry.
Si aún no está en el proyecto, selecciónelo.
Seleccione Catálogo de modelos en el panel izquierdo.

Vaya a la sección Tablas de clasificación modelo del catálogo de modelos. En esta sección se muestran los tres principales líderes de modelos clasificados a lo largo de la calidad, el costo y el rendimiento. Puede seleccionar cualquiera de estos modelos para consultar más detalles.
En la sección Tablas de clasificación de modelos del catálogo de modelos, seleccione Examinar tablas de clasificación para ir a la página principal de tablas de clasificación del modelo para ver el conjunto completo de tablas de clasificación disponibles.

La página principal muestra los resaltados de la tabla de clasificación para los criterios de selección de modelos. La calidad es el criterio más común para la selección de modelos, seguido de seguridad, costo y rendimiento.

Comparar modelos en los gráficos de equilibrio

Los gráficos de compensación le permiten comparar modelos en función de los criterios que le interesen. Supongamos que le preocupa más el costo que la calidad y descubre que el modelo de mayor calidad no es el modelo más barato, es posible que tenga que compensar entre los criterios de calidad, costo y rendimiento. En los gráficos de compensación, puede comparar cómo los modelos rinden según dos métricas de un vistazo.

Seleccione el menú desplegable Modelos seleccionados para agregar o quitar modelos del gráfico de compensación.
Seleccione la pestaña Calidad frente a costo y la pestaña Calidad frente a rendimiento para ver esos gráficos de los modelos seleccionados.
Seleccione Comparar entre métricas para obtener acceso a los resultados más detallados de cada modelo.

Visualización de tablas de clasificación por escenario

Supongamos que tiene un escenario que requiere ciertas funcionalidades del modelo. Por ejemplo, supongamos que va a crear un bot de chat de preguntas y respuestas que requiere buenas capacidades de respuesta a preguntas y de razonamiento. Es posible que le resulte útil comparar modelos en estas tablas de clasificación respaldadas por pruebas comparativas específicas de la funcionalidad.

Una vez que haya explorado las tablas de clasificación, puede decidir sobre un modelo que se va a usar.

Visualización de pruebas comparativas desde la tarjeta de modelo

Seleccione un modelo a su gusto y seleccione Detalles del modelo. Puede seleccionar el modelo en una de las tablas de clasificación mostradas, como la tabla de clasificación de calidad en la parte superior de la página principal de las tablas de clasificación del modelo. En este ejemplo, seleccione gpt-4o. Esta acción abre la página de información general del modelo.
Vaya a la pestaña Bancos de pruebas para comprobar los resultados del banco de pruebas de modelo.
Seleccione Comparar con más modelos.
Cambie a la vista Lista para obtener acceso a los resultados más detallados de cada modelo.

Análisis de los resultados del banco de pruebas

Cuando se encuentra en la pestaña "Bancos de pruebas" de un modelo específico, puede recopilar información amplia para comprender e interpretar mejor los resultados del banco de pruebas, entre los que se incluyen:

Puntuaciones agregadas generales: estas puntuaciones de la calidad de la inteligencia artificial, el costo, la latencia y el rendimiento proporcionan una visión general rápida del rendimiento del modelo.
Gráficos comparativos: estos gráficos muestran la posición relativa del modelo en comparación con los modelos relacionados.
Tabla de comparación de métricas: esta tabla presenta resultados detallados de cada métrica.

De manera predeterminada, Azure AI Foundry muestra un índice promedio en varias métricas y conjuntos de datos para proporcionar información general de alto nivel sobre el rendimiento del modelo.

Para acceder a los resultados del banco de pruebas para una métrica y un conjunto de datos específicos:

Seleccione el botón Expandir del gráfico. El gráfico de comparación emergente revela información detallada y ofrece mayor flexibilidad para la comparación.
Seleccione la métrica de su interés y elija diferentes conjuntos de datos, en función de su escenario específico. Para obtener definiciones más detalladas de las métricas y descripciones de los conjuntos de datos públicos usados para calcular los resultados, seleccione Leer más.

Evalúe los resultados del banco de pruebas con sus datos

En las secciones anteriores, se muestran los resultados del banco de pruebas calculados por Microsoft mediante el uso de conjuntos de datos públicos. Sin embargo, puede probar a volver a generar el mismo conjunto de métricas con sus datos.

Vuelva a la pestaña Puntos de referencia en la tarjeta de modelo.
Seleccione Probar con sus propios datos para evaluar el modelo con sus datos. La evaluación con sus datos le ayuda a ver cómo funciona el modelo en sus escenarios específicos.

Compartir a través de