Sdílet prostřednictvím


Porovnání a výběr modelů pomocí tabulky výsledků modelu na portálu Azure AI Foundry (Preview)

Důležité

Položky označené (Preview) v tomto článku jsou aktuálně ve verzi Public Preview. Tato verze Preview je poskytována bez smlouvy o úrovni služeb a nedoporučujeme ji pro produkční úlohy. Některé funkce nemusí být podporované nebo můžou mít omezené možnosti. Další informace najdete v dodatečných podmínkách použití pro verze Preview v Microsoft Azure.

V tomto článku se naučíte zjednodušit proces výběru modelu v katalogu modelů Azure AI Foundry porovnáním modelů v tabulích výsledků modelů (Preview) dostupných na portálu Azure AI Foundry. Toto porovnání vám může pomoct učinit informovaná rozhodnutí o tom, které modely splňují požadavky pro váš konkrétní případ použití nebo aplikaci. Modely můžete porovnat zobrazením následujících tabulek výsledků:

Požadavky

  • Předplatné Azure s platným způsobem platby. Bezplatná nebo zkušební předplatná Azure nebudou fungovat. Pokud nemáte předplatné Azure, vytvořte si placený účet Azure, abyste mohli začít.

  • Projekt Azure AI Foundry.

Žebříčky modelu Access

  1. Přihlaste se k Azure AI Foundry.
  2. Pokud ještě nejste v projektu, vyberte ho.
  3. V levém podokně vyberte Katalog modelů .
  1. V katalogu modelů přejděte do části Tabulky výsledků modelu. Tato část zobrazuje tři nejlepší vůdčí modely seřazené podle kvality, nákladů a výkonu. Výběrem některého z těchto modelů si můžete prohlédnout další podrobnosti.

    Snímek obrazovky znázorňující vybraný model ze vstupního bodu tabulek výsledků na domovské stránce katalogu modelů

  2. V části Tabulky výsledků modelu v katalogu modelů vyberte Procházet tabulky výsledků a přejděte na cílovou stránku tabulky výsledků modelu a zobrazte si celou sadu dostupných tabulek výsledků.

    Snímek obrazovky znázorňující vstupní bod z katalogu modelů do tabulek výsledků modelu

    Domovská stránka zobrazuje zvýraznění tabulky výsledků pro kritéria výběru modelu. Kvalitu je nejběžnějším kritériem pro výběr modelu, po kterém následuje bezpečnost, náklady a výkon.

    Snímek obrazovky se zvýrazněnými tabulkami výsledků ve kvalitě, nákladech a výkonu

Porovnání modelů v grafech kompromisů

Obchodní grafy umožňují porovnávat modely na základě kritérií, o která vám záleží víc. Předpokládejme, že vás zajímá více nákladů než kvalita a zjistíte, že model s nejvyšší kvalitou není nejlevnějším modelem, možná budete muset udělat kompromisy mezi kritérii kvality, nákladů a výkonu. V grafech kompromisů můžete porovnat, jak modely fungují na první pohled ve dvou metrikách.

  1. Výběrem rozevírací nabídky Modely přidáte nebo odeberete modely z obchodního grafu.
  2. Vyberte kartu Kvalita vs. Náklady a kartu Kvalita a Propustnost a zobrazte grafy pro vybrané modely.
  3. Vyberte Porovnat mezi metrikami pro přístup k podrobnějším výsledkům pro každý model.

Snímek obrazovky znázorňující grafy kompromisů v kvalitě, nákladech a výkonu

Zobrazení tabulek výsledků podle scénáře

Předpokládejme, že máte scénář, který vyžaduje určité možnosti modelu. Řekněme například, že vytváříte chatovací robot pro otázky a odpovědi, který vyžaduje dobré schopnosti pro zodpovídání otázek a logické uvažování. Může být užitečné porovnat modely v těchto tabulích výsledků, které jsou založené na srovnávacích testech specifických pro funkce.

Snímek obrazovky zobrazující tabulky výsledků kvality podle scénářů

Po prozkoumání tabulek výsledků se můžete rozhodnout, jaký model se má použít.

Zobrazení srovnávacích testů z karty modelu

  1. Vyberte model podle svých představ a vyberte Podrobnosti o modelu. Model můžete vybrat z jedné ze zobrazených tabulek výsledků, jako je například tabulka výsledků kvality v horní části domovské stránky tabulek výsledků modelu. V tomto příkladu vyberte gpt-4o. Tato akce otevře stránku přehledu modelu.

  2. Přejděte na kartu Srovnávací testy a zkontrolujte výsledky srovnávacích testů modelu.

    Snímek obrazovky zobrazující kartu srovnávacích testů pro gpt-4o

  3. Vyberte Porovnat s dalšími modely.

  4. Přejděte do zobrazení Seznam , abyste pro každý model mohli získat přístup k podrobnějším výsledkům.

    Snímek obrazovky znázorňující příklad zobrazení porovnání srovnávacích testů

Analýza výsledků srovnávacích testů

Když jste na kartě Srovnávací testy pro konkrétní model, můžete shromáždit rozsáhlé informace, abyste lépe porozuměli výsledkům srovnávacích testů a interpretovat je, včetně těchto:

  • Agregační skóre vysoké úrovně: Tato skóre pro kvalitu AI, náklady, latenci a propustnost poskytují rychlý přehled výkonu modelu.

  • Srovnávací grafy: Tyto grafy zobrazují relativní pozici modelu v porovnání se souvisejícími modely.

  • Tabulka porovnání metrik: Tato tabulka obsahuje podrobné výsledky pro každou metriku.

    Snímek obrazovky zobrazující kartu srovnávacích testů pro gpt-4o

Azure AI Foundry ve výchozím nastavení zobrazuje průměrný index napříč různými metrikami a datovými sadami, aby poskytoval základní přehled výkonu modelu.

Přístup k výsledkům srovnávacího testu pro konkrétní metriku a datovou sadu:

  1. Vyberte rozbalovací tlačítko na grafu. Automaticky otevíraný srovnávací graf ukazuje podrobné informace a nabízí větší flexibilitu pro porovnání.

    Snímek obrazovky znázorňující tlačítko rozbalení pro výběr podrobného srovnávacího grafu

  2. Vyberte metriku, která vás zajímá, a na základě konkrétního scénáře zvolte různé datové sady. Pokud chcete podrobnější definice metrik a popisů veřejných datových sad používaných k výpočtu výsledků, vyberte Další informace.

    Snímek obrazovky znázorňující srovnávací graf s konkrétní metrikou a datovou sadou

Vyhodnoťte výsledky srovnávacích testů s vašimi daty

Předchozí části ukázaly výsledky srovnávacího testu vypočítané Microsoftem pomocí veřejných datových sad. Můžete se ale pokusit znovu vygenerovat stejnou sadu metrik s vašimi daty.

  1. Vraťte se na kartu Srovnávací testy na kartě modelu.

  2. Vyberte Vyzkoušet s vlastními daty a vyhodnoťte model s vašimi daty. Vyhodnocení dat vám pomůže zjistit, jak model funguje ve vašich konkrétních scénářích.

    Snímek obrazovky znázorňující tlačítko, které se má vybrat pro vyhodnocení s vlastními daty