Compartir a través de


Comparación y selección de modelos mediante la tabla de clasificación del modelo en el portal de Azure AI Foundry (versión preliminar)

Importante

Los elementos marcados (versión preliminar) en este artículo se encuentran actualmente en versión preliminar pública. Esta versión preliminar se ofrece sin acuerdo de nivel de servicio y no se recomienda para las cargas de trabajo de producción. Es posible que algunas características no sean compatibles o que tengan sus funcionalidades limitadas. Para más información, consulte Términos de uso complementarios de las Versiones Preliminares de Microsoft Azure.

En este artículo, aprenderá a simplificar el proceso de selección de modelos en el catálogo de modelos de Azure AI Foundry mediante la comparación de modelos en las tablas de clasificación del modelo (versión preliminar) disponibles en el portal de Azure AI Foundry. Esta comparación puede ayudarle a tomar decisiones fundamentadas sobre qué modelos cumplen los requisitos de su caso de uso o aplicación concretos. Puede comparar modelos mediante la visualización de las siguientes tablas de clasificación:

Prerrequisitos

Tablas de clasificación del modelo de acceso

  1. Inicie sesión en Azure AI Foundry.
  2. Si aún no está en el proyecto, selecciónelo.
  3. Seleccione Catálogo de modelos en el panel izquierdo.
  1. Vaya a la sección Tablas de clasificación modelo del catálogo de modelos. En esta sección se muestran los tres principales líderes de modelos clasificados a lo largo de la calidad, el costo y el rendimiento. Puede seleccionar cualquiera de estos modelos para consultar más detalles.

    Captura de pantalla que muestra el modelo seleccionado desde el punto de entrada de las tablas de clasificación en la página principal del catálogo de modelos.

  2. En la sección Tablas de clasificación de modelos del catálogo de modelos, seleccione Examinar tablas de clasificación para ir a la página principal de tablas de clasificación del modelo para ver el conjunto completo de tablas de clasificación disponibles.

    Captura de pantalla que muestra el punto de entrada del catálogo de modelos en las tablas de clasificación del modelo.

    La página principal muestra los resaltados de la tabla de clasificación para los criterios de selección de modelos. La calidad es el criterio más común para la selección de modelos, seguido de seguridad, costo y rendimiento.

    Captura de pantalla que muestra las tablas de clasificación resaltadas en calidad, costo y rendimiento.

Comparar modelos en los gráficos de equilibrio

Los gráficos de compensación le permiten comparar modelos en función de los criterios que le interesen. Supongamos que le preocupa más el costo que la calidad y descubre que el modelo de mayor calidad no es el modelo más barato, es posible que tenga que compensar entre los criterios de calidad, costo y rendimiento. En los gráficos de compensación, puede comparar cómo los modelos rinden según dos métricas de un vistazo.

  1. Seleccione el menú desplegable Modelos seleccionados para agregar o quitar modelos del gráfico de compensación.
  2. Seleccione la pestaña Calidad frente a costo y la pestaña Calidad frente a rendimiento para ver esos gráficos de los modelos seleccionados.
  3. Seleccione Comparar entre métricas para obtener acceso a los resultados más detallados de cada modelo.

Captura de pantalla que muestra los gráficos de equilibrio en calidad, costo y rendimiento.

Visualización de tablas de clasificación por escenario

Supongamos que tiene un escenario que requiere ciertas funcionalidades del modelo. Por ejemplo, supongamos que va a crear un bot de chat de preguntas y respuestas que requiere buenas capacidades de respuesta a preguntas y de razonamiento. Es posible que le resulte útil comparar modelos en estas tablas de clasificación respaldadas por pruebas comparativas específicas de la funcionalidad.

Captura de pantalla que muestra las tablas de clasificación de calidad por escenarios.

Una vez que haya explorado las tablas de clasificación, puede decidir sobre un modelo que se va a usar.

Visualización de pruebas comparativas desde la tarjeta de modelo

  1. Seleccione un modelo a su gusto y seleccione Detalles del modelo. Puede seleccionar el modelo en una de las tablas de clasificación mostradas, como la tabla de clasificación de calidad en la parte superior de la página principal de las tablas de clasificación del modelo. En este ejemplo, seleccione gpt-4o. Esta acción abre la página de información general del modelo.

  2. Vaya a la pestaña Bancos de pruebas para comprobar los resultados del banco de pruebas de modelo.

    Recorte de pantalla que muestra la pestaña de bancos de pruebas para gpt-4o.

  3. Seleccione Comparar con más modelos.

  4. Cambie a la vista Lista para obtener acceso a los resultados más detallados de cada modelo.

    Recorte de pantalla que muestra un ejemplo de la vista de comparación de bancos de pruebas.

Análisis de los resultados del banco de pruebas

Cuando se encuentra en la pestaña "Bancos de pruebas" de un modelo específico, puede recopilar información amplia para comprender e interpretar mejor los resultados del banco de pruebas, entre los que se incluyen:

  • Puntuaciones agregadas generales: estas puntuaciones de la calidad de la inteligencia artificial, el costo, la latencia y el rendimiento proporcionan una visión general rápida del rendimiento del modelo.

  • Gráficos comparativos: estos gráficos muestran la posición relativa del modelo en comparación con los modelos relacionados.

  • Tabla de comparación de métricas: esta tabla presenta resultados detallados de cada métrica.

    Recorte de pantalla que muestra la pestaña de bancos de pruebas para gpt-4o.

De manera predeterminada, Azure AI Foundry muestra un índice promedio en varias métricas y conjuntos de datos para proporcionar información general de alto nivel sobre el rendimiento del modelo.

Para acceder a los resultados del banco de pruebas para una métrica y un conjunto de datos específicos:

  1. Seleccione el botón Expandir del gráfico. El gráfico de comparación emergente revela información detallada y ofrece mayor flexibilidad para la comparación.

    Recorte de pantalla que muestra el botón Expandir para seleccionar un gráfico de comparación detallado.

  2. Seleccione la métrica de su interés y elija diferentes conjuntos de datos, en función de su escenario específico. Para obtener definiciones más detalladas de las métricas y descripciones de los conjuntos de datos públicos usados para calcular los resultados, seleccione Leer más.

    Recorte de pantalla que muestra el gráfico de comparación con una métrica y un conjunto de datos específicos.

Evalúe los resultados del banco de pruebas con sus datos

En las secciones anteriores, se muestran los resultados del banco de pruebas calculados por Microsoft mediante el uso de conjuntos de datos públicos. Sin embargo, puede probar a volver a generar el mismo conjunto de métricas con sus datos.

  1. Vuelva a la pestaña Puntos de referencia en la tarjeta de modelo.

  2. Seleccione Probar con sus propios datos para evaluar el modelo con sus datos. La evaluación con sus datos le ayuda a ver cómo funciona el modelo en sus escenarios específicos.

    Recorte de pantalla que muestra el botón para seleccionar la evaluación con sus propios datos.