De modelcatalogus verkennen
De catalogus Foundry Models fungeert als uw centrale hub voor het detecteren en vergelijken van AI-modellen. Met meer dan 1900 modellen die beschikbaar zijn bij verschillende providers, hebt u effectieve manieren nodig om modellen te filteren en te vinden die voldoen aan uw specifieke vereisten.
De modelcatalogus bevat twee algemene categorieën modellen:
Foundry Models rechtstreeks verkocht door Azure
Deze modellen worden rechtstreeks gefactureerd via uw Azure-abonnement en bevatten Azure OpenAI-modellen, evenals modellen van Microsoft en andere providers.
Foundry-modellen van partners en de gemeenschap
Deze modellen worden geleverd door vertrouwde partners en de community; elk met hun eigen licentie en prijzen.
Modellen zoeken in de modelcatalogus
De gebruikersinterface van de modelcatalogus in de Foundry-portal biedt een eenvoudige manier om naar het juiste model voor uw behoeften te zoeken. Elk model heeft een modelkaart met de belangrijkste informatie; inclusief de provider, mogelijkheden, metrische benchmarkgegevens, verantwoorde AI-overwegingen en implementatieopties.
U kunt zoeken naar modellen op trefwoord en u kunt filteren op basis van de volgende kenmerken:
- Verzameling: Modellen zijn ingedeeld in verzamelingen, zoals modellen die rechtstreeks in Azure worden geleverd of modellen in de hugging Face-opslagplaats.
- Mogelijkheden: Specifieke modelmogelijkheden, waaronder redenering (complexe probleemoplossing), hulpprogramma-aanroepen (API- en functieintegratie) of multimodale verwerking (tekst, afbeeldingen, audio).
- Bron: De modelprovider, waaronder Azure OpenAI, Microsoft, Cohere, Mistral, Meta, Antropic en andere.
- Deductietaken: specifieke taken, zoals het genereren van tekst, samenvatting, vertaling, het genereren van afbeeldingen, spraaksynthese of andere algemene AI-taken.
- Verfijningsmethoden: Ondersteunde technieken voor het afstemmen van een model.
- Branche: Modellen die zijn getraind op branchespecifieke gegevenssets. Deze gespecialiseerde modellen presteren vaak beter dan modellen voor algemeen gebruik in hun respectieve domeinen.
Inzicht in generatieve AI-modeltypen
Terwijl u de catalogus verkent, ziet u verschillende categorieën modellen die zijn ontworpen voor verschillende use cases. In algemene termen kunt u taalmodellen categoriseren als:
- Grote taalmodellen (LLM's) zoals GPT-5, Mistral Large en Llama 3 70B die zijn ontworpen voor taken waarvoor grondige redenering, complexe inhoudsgeneratie en uitgebreid contextbegrip vereist zijn. Deze modellen excelleren bij geavanceerde toepassingen, maar vereisen meer rekenresources.
- Small Language Models (SLM's) zoals Phi-4, Mistral OSS-modellen en Llama 3 8B die efficiëntie en kosteneffectiviteit bieden bij het verwerken van algemene taken voor natuurlijke taalverwerking. Ze zijn ideaal voor scenario's waarbij snelheid en kosten belangrijker zijn dan het verwerken van de meest complexe redeneringstaken. SLM's kunnen worden uitgevoerd op minder krachtige hardware of randapparaten.
Voltooiings- en redeneringsmodellen voor chatten
De meeste taalmodellen in de catalogus zijn modellen voor chatvoltooiing die zijn ontworpen om coherente, contextafhankelijke tekstreacties te genereren. Deze modellen bieden kracht aan gespreksinterfaces en toepassingen voor het genereren van inhoud.
Voor scenario's die hogere prestaties vereisen in complexe taken, zoals wiskunde, codering, wetenschap, strategie en logistiek, bieden redeneringsmodellen zoals Claude Opus 4.6 verbeterde probleemoplossingsmogelijkheden. Deze modellen kunnen complexe problemen opsplitsen en hun redeneringsproces weergeven.
Gespecialiseerde modellen
De catalogus bevat ook taakspecifieke modellen:
Het insluiten van modellen zoals Ada en Cohere converteert tekst naar numerieke weergaven. Deze modellen maken semantische zoek-, aanbevelingssystemen en RAG-scenario's (Retrieval Augmented Generation) mogelijk, waarbij u relevante informatie moet vinden op basis van betekenis in plaats van exacte trefwoordovereenkomsten.
Modellen voor het genereren van afbeeldingen, zoals GPT-image-1, maken afbeeldingen op basis van tekstbeschrijvingen. Gebruik deze voor het genereren van marketingmaterialen, illustraties of ontwerpmodellen.
Videogeneratiemodellen zoals Sora 2 maken video-inhoud op basis van tekstbeschrijvingen.
Afbeeldingsanalysemodellen zoals GPT-4.1 kunnen multimodale invoer accepteren, inclusief tekst en afbeeldingen; en genereer uitvoer van natuurlijke taal op basis van prompts die afbeeldingen bevatten voor analyse.
Tekst-naar-spraakmodellen zoals GPT-4o-tts kunnen tekstgebaseerde invoer converteren naar gesynthetiseerde spraak.
Spraak-naar-tekstmodellen zoals GPT-4o-transcriberen kunnen audiogegevens met spraak converteren naar teksttranscripties.
Regionale en domeinspecifieke modellen
Sommige modellen zijn geoptimaliseerd voor specifieke talen, regio's of branches. Wanneer u gespecialiseerde prestaties in een bepaald domein of een bepaalde taal nodig hebt, presteren deze modellen vaak beter dan alternatieven voor algemeen gebruik. Voorbeelden hiervan zijn modellen die zijn getraind op medische literatuur, juridische documenten of specifieke taal corpora.