Utforska modellkatalogen

7 minuter

Katalogen Foundry Models fungerar som din centrala hubb för att identifiera och jämföra AI-modeller. Med över 1 900 tillgängliga modeller från olika leverantörer behöver du effektiva sätt att filtrera och hitta modeller som matchar dina specifika krav.

Modellkatalogen innehåller två breda modellkategorier:

Foundry Models säljs direkt av Azure

Dessa modeller faktureras direkt via din Azure-prenumeration och inkluderar Azure OpenAI-modeller samt modeller från Microsoft och andra leverantörer.
Foundry-modeller från partner och community

Dessa modeller tillhandahålls av betrodda partner och communityt; var och en med sin egen licensiering och prissättning.

Hitta modeller i modellkatalogen

Användargränssnittet för modellkatalogen i Foundry-portalen är ett enkelt sätt att söka efter rätt modell efter dina behov. Varje modell har ett modellkort som visar dess nyckelinformation. inklusive provider, funktioner, benchmark-mått, ansvarsfulla AI-överväganden och distributionsalternativ.

Skärmbild av modellkatalogen i Microsoft Foundry-portalen.

Du kan söka efter modeller efter nyckelord och du kan filtrera baserat på följande attribut:

Samling: Modeller är ordnade i samlingar, till exempel modeller som tillhandahålls direkt i Azure eller modeller i lagringsplatsen Hugging Face.
Funktioner: Specifika modellförmågor, inklusive resonemang (komplex problemlösning), verktygsanrop (API och funktionsintegrering) eller multimodal bearbetning (text, bilder, ljud).
Källa: Modellprovidern, inklusive Azure OpenAI, Microsoft, Cohere, Mistral, Meta, Anthropic och andra.
Slutsatsdragningsuppgifter: Specifika uppgifter som textgenerering, sammanfattning, översättning, bildgenerering, talsyntes eller andra vanliga AI-uppgifter.
Finjusteringsmetoder: Tekniker som stöds för finjustering av en modell.
Bransch: Modeller som tränats på branschspecifika datamängder. Dessa specialiserade modeller överträffar ofta allmänna modeller i sina respektive domäner.

Förstå generativa AI-modelltyper

När du utforskar katalogen stöter du på olika kategorier av modeller som är utformade för olika användningsfall. I stora drag kan du kategorisera språkmodeller som:

Stora språkmodeller (LLM: er) som GPT-5, Mistral Large och Llama 3 70B som är utformade för uppgifter som kräver djupgående resonemang, komplex innehållsgenerering och omfattande kontextförstängelse. Dessa modeller är utmärkta för avancerade program men kräver mer beräkningsresurser.
Små språkmodeller som Phi-4, Mistral OSS-modeller och Llama 3 8B som erbjuder effektivitet och kostnadseffektivitet vid hantering av vanliga bearbetningsuppgifter för naturligt språk. De är idealiska för scenarier där hastighet och kostnader är viktigare än att hantera de mest komplexa resonemangsuppgifterna. SLM:er kan köras på enklare maskinvara eller edge-enheter.

Modeller för chattens slutförande och resonemang

De flesta språkmodeller i katalogen är chattkompletteringsmodeller som är utformade för att generera sammanhängande, kontextuellt lämpliga textsvar. Dessa modeller driver konversationsgränssnitt och program för innehållsgenerering.

För scenarier som kräver högre prestanda i komplexa uppgifter som matematik, kodning, vetenskap, strategi och logistik ger resonemangsmodeller som Claude Opus 4.6 förbättrade problemlösningsfunktioner. Dessa modeller kan dela upp komplexa problem och visa deras resonemangsprocess.

Specialiserade modeller

Katalogen innehåller även uppgiftsspecifika modeller:

Inbäddningsmodeller som Ada och Cohere konverterar text till numeriska representationer. Dessa modeller möjliggör semantisk sökning, rekommendationssystem och RAG-scenarier (Retrieval Augmented Generation) där du behöver hitta relevant information baserat på innebörd snarare än exakta nyckelordsmatchningar.

Bildgenereringsmodeller som GPT-image-1 skapar bilder från textbeskrivningar. Använd dessa för att generera marknadsföringsmaterial, illustrationer eller designverktyg.

Videogenereringsmodeller som Sora 2 skapar videoinnehåll från textbeskrivningar.

Bildanalysmodeller som GPT-4.1 kan acceptera multimodala indata, inklusive text och bilder. och generera naturliga språkutdata baserat på uppmaningar som innehåller bilder för analys.

Text till talmodeller som GPT-4o-tts kan konvertera textbaserade indata till syntetiserat tal.

Tal-till-text-modeller som GPT-4o för transkribering används för att konvertera ljuddata som innehåller tal till textavskrifter.

Regionala och domänspecifika modeller

Vissa modeller är optimerade för specifika språk, regioner eller branscher. När du behöver särskilda prestanda i en viss domän eller ett visst språk överträffar dessa modeller ofta allmänna alternativ. Exempel är modeller som tränats på medicinsk litteratur, juridiska dokument eller specifika språkkorpusar.

Feedback

Var den här sidan till hjälp?