Porovnání a výběr modelů pomocí tabulky výsledků modelu na portálu Azure AI Foundry (Preview)

2025-06-19

Důležité

Položky označené (Preview) v tomto článku jsou aktuálně ve verzi Public Preview. Tato verze Preview je poskytována bez smlouvy o úrovni služeb a nedoporučujeme ji pro produkční úlohy. Některé funkce nemusí být podporované nebo můžou mít omezené možnosti. Další informace najdete v dodatečných podmínkách použití pro verze Preview v Microsoft Azure.

V tomto článku se naučíte zjednodušit proces výběru modelu v katalogu modelů Azure AI Foundry porovnáním modelů v tabulích výsledků modelů (Preview) dostupných na portálu Azure AI Foundry. Toto porovnání vám může pomoct učinit informovaná rozhodnutí o tom, které modely splňují požadavky pro váš konkrétní případ použití nebo aplikaci. Modely můžete porovnat zobrazením následujících tabulek výsledků:

Tabulky výsledků kvality, bezpečnosti, nákladů a výkonu , které vám pomůžou rychle identifikovat vedoucí modely podle jednoho kritéria (kvalita, náklady nebo propustnost);
Kompromisní grafy , které umožňují zjistit, jak modely fungují na jedné metrice a jiné, jako je kvalita a náklady, mezi různými kritérii výběru;
Tabulky výsledků podle scénářů k nalezení nejlepších tabulek výsledků, které nejlépe odpovídají vašemu scénáři.

Požadavky

Předplatné Azure s platným způsobem platby. Bezplatná nebo zkušební předplatná Azure nebudou fungovat. Pokud nemáte předplatné Azure, vytvořte si placený účet Azure, abyste mohli začít.
Projekt Azure AI Foundry.

Žebříčky modelu Access

Přihlaste se k Azure AI Foundry.
Pokud ještě nejste v projektu, vyberte ho.
V levém podokně vyberte Katalog modelů .

V katalogu modelů přejděte do části Tabulky výsledků modelu. Tato část zobrazuje tři nejlepší vůdčí modely seřazené podle kvality, nákladů a výkonu. Výběrem některého z těchto modelů si můžete prohlédnout další podrobnosti.
V části Tabulky výsledků modelu v katalogu modelů vyberte Procházet tabulky výsledků a přejděte na cílovou stránku tabulky výsledků modelu a zobrazte si celou sadu dostupných tabulek výsledků.

Domovská stránka zobrazuje zvýraznění tabulky výsledků pro kritéria výběru modelu. Kvalitu je nejběžnějším kritériem pro výběr modelu, po kterém následuje bezpečnost, náklady a výkon.

Porovnání modelů v grafech kompromisů

Obchodní grafy umožňují porovnávat modely na základě kritérií, o která vám záleží víc. Předpokládejme, že vás zajímá více nákladů než kvalita a zjistíte, že model s nejvyšší kvalitou není nejlevnějším modelem, možná budete muset udělat kompromisy mezi kritérii kvality, nákladů a výkonu. V grafech kompromisů můžete porovnat, jak modely fungují na první pohled ve dvou metrikách.

Výběrem rozevírací nabídky Modely přidáte nebo odeberete modely z obchodního grafu.
Vyberte kartu Kvalita vs. Náklady a kartu Kvalita a Propustnost a zobrazte grafy pro vybrané modely.
Vyberte Porovnat mezi metrikami pro přístup k podrobnějším výsledkům pro každý model.

Zobrazení tabulek výsledků podle scénáře

Předpokládejme, že máte scénář, který vyžaduje určité možnosti modelu. Řekněme například, že vytváříte chatovací robot pro otázky a odpovědi, který vyžaduje dobré schopnosti pro zodpovídání otázek a logické uvažování. Může být užitečné porovnat modely v těchto tabulích výsledků, které jsou založené na srovnávacích testech specifických pro funkce.

Po prozkoumání tabulek výsledků se můžete rozhodnout, jaký model se má použít.

Zobrazení srovnávacích testů z karty modelu

Vyberte model podle svých představ a vyberte Podrobnosti o modelu. Model můžete vybrat z jedné ze zobrazených tabulek výsledků, jako je například tabulka výsledků kvality v horní části domovské stránky tabulek výsledků modelu. V tomto příkladu vyberte gpt-4o. Tato akce otevře stránku přehledu modelu.
Přejděte na kartu Srovnávací testy a zkontrolujte výsledky srovnávacích testů modelu.
Vyberte Porovnat s dalšími modely.
Přejděte do zobrazení Seznam , abyste pro každý model mohli získat přístup k podrobnějším výsledkům.

Analýza výsledků srovnávacích testů

Když jste na kartě Srovnávací testy pro konkrétní model, můžete shromáždit rozsáhlé informace, abyste lépe porozuměli výsledkům srovnávacích testů a interpretovat je, včetně těchto:

Agregační skóre vysoké úrovně: Tato skóre pro kvalitu AI, náklady, latenci a propustnost poskytují rychlý přehled výkonu modelu.
Srovnávací grafy: Tyto grafy zobrazují relativní pozici modelu v porovnání se souvisejícími modely.
Tabulka porovnání metrik: Tato tabulka obsahuje podrobné výsledky pro každou metriku.

Azure AI Foundry ve výchozím nastavení zobrazuje průměrný index napříč různými metrikami a datovými sadami, aby poskytoval základní přehled výkonu modelu.

Přístup k výsledkům srovnávacího testu pro konkrétní metriku a datovou sadu:

Vyberte rozbalovací tlačítko na grafu. Automaticky otevíraný srovnávací graf ukazuje podrobné informace a nabízí větší flexibilitu pro porovnání.
Vyberte metriku, která vás zajímá, a na základě konkrétního scénáře zvolte různé datové sady. Pokud chcete podrobnější definice metrik a popisů veřejných datových sad používaných k výpočtu výsledků, vyberte Další informace.

Vyhodnoťte výsledky srovnávacích testů s vašimi daty

Předchozí části ukázaly výsledky srovnávacího testu vypočítané Microsoftem pomocí veřejných datových sad. Můžete se ale pokusit znovu vygenerovat stejnou sadu metrik s vašimi daty.

Vraťte se na kartu Srovnávací testy na kartě modelu.
Vyberte Vyzkoušet s vlastními daty a vyhodnoťte model s vašimi daty. Vyhodnocení dat vám pomůže zjistit, jak model funguje ve vašich konkrétních scénářích.

Sdílet prostřednictvím