Poznámka
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Katalog modelů Azure AI nabízí velký výběr modelů Azure AI Foundry od široké škály poskytovatelů. Máte různé možnosti nasazení modelů z katalogu modelů. Tento článek obsahuje seznam modelů Azure AI Foundry, které je možné nasadit prostřednictvím nasazení bezserverového rozhraní API. U některých z těchto modelů je můžete také hostovat ve vaší infrastruktuře pro nasazení prostřednictvím spravovaných výpočetních prostředků.
Důležité
Modely, které jsou ve verzi Preview, jsou na kartách modelu v katalogu modelů označené jako náhled .
Aby bylo možné provádět inferenci s modely, některé modely, jako je Nixtla's TimeGEN-1 a Cohere rerank, vyžadují použití vlastních API od poskytovatelů modelů. Ostatní podporují odvozování pomocí rozhraní API pro odvozování modelů. Další podrobnosti o jednotlivých modelech najdete v katalogu modelů na portálu Azure AI Foundry.
Testovací prostředí AI21
Modely rodiny Jamba jsou produkčními velkými jazykovými modely (LLM) založenými na Mamba architektuře, které využívají hybridní architekturu Mamba-Transformer společnosti AI21. Jedná se o upravenou verzi modelu AI21 Jamba transformátor, která je nastavena na instrukce a využívá hybridní strukturovaný model prostoru stavů (SSM). Modely rodiny Jamba jsou vytvořeny pro spolehlivé komerční použití s ohledem na kvalitu a výkon.
Vzor | Typ | Schopnosti |
---|---|---|
AI21-Jamba-1.5-Mini | dokončení chatu |
-
Vstup: text (262 144 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text, JSON, strukturované výstupy |
AI21-Jamba-1.5-Large | dokončení chatu |
-
Vstup: text (262 144 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text, JSON, strukturované výstupy |
Podívejte se na tuto kolekci modelů na portálu Azure AI Foundry.
Azure OpenAI
Azure OpenAI in Foundry Models nabízí různorodou sadu modelů s různými možnostmi a cenovými body. Mezi tyto modely patří:
- Nejmodernější modely navržené tak, aby řešily úlohy uvažování a zaměřovaly se na řešení problémů s větším zaměřením a schopnostmi.
- Modely, které můžou porozumět přirozenému jazyku a kódu a generovat je
- Modely, které můžou přepisovat a překládat řeč na text
Vzor | Typ | Schopnosti |
---|---|---|
o3-mini | dokončení chatu |
-
Vstup: text a obrázek (200 000 tokenů) - Výstup: text (100 000 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text, JSON, strukturované výstupy |
o1 | dokončování chatu (s obrázky) |
-
Vstup: text a obrázek (200 000 tokenů) - Výstup: text (100 000 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text, JSON, strukturované výstupy |
o1-preview | dokončení chatu |
-
Vstup: text (128 000 token) - Výstup: text (32 768 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text, JSON, strukturované výstupy |
o1-mini | dokončení chatu |
-
Vstup: text (128 000 token) - Výstup: text (65 536 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
gpt-4o-realtime-preview | v reálném čase |
-
Vstup: ovládací prvek, text a zvuk (131 072 tokenů) - Výstup: text a zvuk (16 384 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
gpt-4o | dokončování chatu (s obrázkovým a zvukovým obsahem) |
-
Vstup: text, obrázek a zvuk (131 072 tokenů) - Výstup: text (16 384 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text, JSON, strukturované výstupy |
gpt-4o-mini | dokončování chatu (s obrázkovým a zvukovým obsahem) |
-
Vstup: text, obrázek a zvuk (131 072 tokenů) - Výstup: text (16 384 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text, JSON, strukturované výstupy |
text-embedding-3-large | vkládání |
-
Vstup: text (8 191 tokenů) - Výstup: Vektor (3 072 rozměrů) |
text-embedding-3-small | vkládání |
-
Vstup: text (8 191 tokenů) - Výstup: Vektor (1 536 rozměrů.) |
Podívejte se na tuto kolekci modelů na portálu Azure AI Foundry.
Koherence
Řada modelů Cohere zahrnuje různé modely optimalizované pro různé případy použití, včetně opětovného pořadí, dokončování chatu a modelů vkládání.
Příkaz Cohere a vložení
Následující tabulka uvádí modely Cohere, které můžete odvozovat prostřednictvím rozhraní API pro odvozování modelů.
Vzor | Typ | Schopnosti |
---|---|---|
Cohere-command-A | dokončení chatu |
-
Vstup: text (256 000 tokenů) - Výstup: text (8 000 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text |
Cohere-command-r-plus-08-2024 | dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
Cohere-command-r-08-2024 | dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
Cohere-command-r-plus (zastaralé) |
dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
Cohere-command-r (zastaralé) |
dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
Cohere-embed-v-4 |
vkládání vkládání obrázků |
-
Vstup: obrázek, text - Výstup: obrázek, text (128 000 tokenů) - Volání nástroje: Ano - Formáty odpovědí: obrázek, text |
Cohere-embed-v3-english |
vkládání vkládání obrázků |
-
Vstup: text (512 tokenů) - Výstup: Vektor (1 024 rozměrů) |
Cohere-embed-v3-multilingual |
vkládání vkládání obrázků |
-
Vstup: text (512 tokenů) - Výstup: Vektor (1 024 rozměrů) |
Příklady inference: Příkaz Cohere a embed
Další příklady použití modelů Cohere najdete v následujících příkladech:
Popis | Jazyk | Ukázka |
---|---|---|
Webové požadavky | Oslava |
Command-RCommand-R+ cohere-embed.ipynb |
Balíček odvozování Azure AI pro jazyk C# | C# | Odkaz |
Balíček odvozování Azure AI pro JavaScript | JavaScript | Odkaz |
Balíček odvozování Azure AI pro Python | Python | Odkaz |
OpenAI SDK (experimentální) | Python | Odkaz |
LangChain | Python | Odkaz |
Cohere SDK | Python |
Příkaz Vložit |
LiteLLM SDK | Python | Odkaz |
Rozšířená generace využívající načítání (RAG) a ukázky použití nástrojů: příkaz Cohere a embedování
Popis | Balíčky | Ukázka |
---|---|---|
Vytvořte místní index vektorového vyhledávání podobností pomocí AI na Facebooku (FAISS) s využitím vkládání od společnosti Cohere – Langchain |
langchain , langchain_cohere |
cohere_faiss_langchain_embed.ipynb |
Odpovídat na otázky z dat v místním indexu vektorů FAISS pomocí příkazu Cohere Command R/R+ – Langchain. |
langchain , langchain_cohere |
command_faiss_langchain.ipynb |
Použití příkazu Cohere Command R/R+ k zodpovězení otázek z dat v indexu vektoru vyhledávání AI – Langchain |
langchain , langchain_cohere |
cohere-aisearch-langchain-rag.ipynb |
Použití příkazu Cohere Command R/R+ k zodpovězení otázek z dat v indexu vektoru vyhledávání AI – Cohere SDK |
cohere , azure_search_documents |
cohere-aisearch-rag.ipynb |
Příkaz R+ pro volání nástroje/funkce pomocí LangChain |
cohere , langchain langchain_cohere |
command_tools-langchain.ipynb |
Cohere přeuspořádání
Následující tabulka uvádí modely přeřazení Cohere. Abyste mohli provádět odvozování s těmito modely řazení, musíte použít vlastní rozhraní API rerank Společnosti Cohere, která jsou uvedená v tabulce.
Vzor | Typ | Inferenční API |
---|---|---|
Cohere-rerank-v3.5 | změna pořadí klasifikace textu |
Rozhraní API v2/rerank společnosti Cohere |
Cohere-rerank-v3-anglicky (zastaralé) |
změna pořadí klasifikace textu |
Rozhraní API v2/rerank společnosti Cohere Rozhraní API společnosti Cohere (v1/rerank) |
Cohere-rerank-v3-multijazyčný (zastaralé) |
změna pořadí klasifikace textu |
Rozhraní API v2/rerank společnosti Cohere Rozhraní API společnosti Cohere (v1/rerank) |
Ceny pro modely Cohere pro přehodnocení
Dotazy, které se nezaměňují s dotazem uživatele, je cenový měřič, který odkazuje na náklady spojené s tokeny použitými jako vstup pro odvozování modelu Cohere Rerank. Společnost Cohere počítá jednu vyhledávací jednotku jako dotaz s až 100 dokumenty, které se mají seřadit. Dokumenty delší než 500 tokenů (pro cohere-rerank-rerank-v3.5) nebo delší než 4096 tokenů (pro Cohere-rerank-v3-English and Cohere-rerank-v3-multilingual) při zahrnutí délky vyhledávacího dotazu jsou rozděleny do více bloků dat, kde se každý blok dat počítá jako jeden dokument.
Podívejte se na kolekci modelů Cohere na portálu Azure AI Foundry.
Core42
Core42 zahrnuje autoregresivní dvojjazyčné LLMs pro arabštinu a angličtinu, s nejvyspělejšími schopnostmi v arabštině.
Vzor | Typ | Schopnosti |
---|---|---|
jais-30b-chat | dokončení chatu |
-
Vstup: text (8 192 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
Podívejte se na tuto kolekci modelů na portálu Azure AI Foundry.
Příklady odvození: Core42
Další příklady použití modelů Jais najdete v následujících příkladech:
Popis | Jazyk | Ukázka |
---|---|---|
Balíček odvozování Azure AI pro jazyk C# | C# | Odkaz |
Balíček odvozování Azure AI pro JavaScript | JavaScript | Odkaz |
Balíček odvozování Azure AI pro Python | Python | Odkaz |
DeepSeek
Řada modelů DeepSeek zahrnuje DeepSeek-R1, která exceluje při úvahách úkolů pomocí podrobného procesu trénování, jako je jazyk, vědecké odůvodnění a programovací úkoly, DeepSeek-V3-0324, model jazyka MoE (Mix-of-Experts) a další.
Vzor | Typ | Schopnosti |
---|---|---|
DeepSeek-R1-0528 |
dokončování chatu s odůvodněním obsahu |
-
Vstup: text (163 840 tokenů) - Výstup: text (163 840 tokenů) - Jazyky: en a zh - Volání nástroje: Ne - Formáty odpovědí: Text |
DeekSeek-V3-0324 | dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: (131 072 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text, JSON |
DeepSeek-V3 (Dědictví) |
dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: text (131 072 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text, JSON |
DeepSeek-R1 | dokončování chatu s odůvodněním obsahu |
-
Vstup: text (163 840 tokenů) - Výstup: text (163 840 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text. |
Návod k DeepSeek-R1 najdete v části Tutoriál: Začínáme s modelem odůvodnění DeepSeek-R1 v Foundry Models.
Podívejte se na tuto kolekci modelů na portálu Azure AI Foundry.
Příklady odvození: DeepSeek
Další příklady použití modelů DeepSeek najdete v následujících příkladech:
Popis | Jazyk | Ukázka |
---|---|---|
Balíček odvozování Azure AI pro Python | Python | Odkaz |
Balíček odvozování Azure AI pro JavaScript | JavaScript | Odkaz |
Balíček odvozování Azure AI pro jazyk C# | C# | Odkaz |
Balíček odvozování Azure AI pro Javu | Java | Odkaz |
Meta
Modely a nástroje Meta Llama představují kolekci předem natrénovaných a vyladěných generativních modelů AI pro zpracování textu a obrazů. Rozsah metamodelů je škálovatelný tak, aby zahrnoval:
- Malé jazykové modely (SLM), jako jsou 1B a 3B Base a Instruct modely, pro odvozování na zařízení a edge computing.
- Velké jazykové modely střední velikosti (LLM), jako jsou 7B, 8B a 70B Base a Instruct modely
- Vysoce výkonné modely, jako je Meta Llama 3.1-405B Instruct, pro generační a destilační případy použití syntetických dat.
- Vysoce výkonné nativně multimodální modely, Llama 4 Scout a Llama 4 Maverick, využívají kombinaci architektury expertů k zajištění špičkového výkonu v textu a porozumění obrázkům.
Vzor | Typ | Schopnosti |
---|---|---|
Llama-4-Scout-17B-16E-Instruct | dokončení chatu |
-
Vstup: text a obrázek (128 000 tokenů) - Výstup: text (8 192 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Llama 4-Maverick-17B-128E-Instruct-FP8 | dokončení chatu |
-
Vstup: text a obrázek (128 000 tokenů) - Výstup: text (8 192 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Llama-3.3-70B-Instruct | dokončení chatu |
-
Vstup: text (128 000 token) - Výstup: text (8 192 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Llama-3.2-90B-Vision-Instruct | dokončování chatu (s obrázky) |
-
Vstup: text a obrázek (128 000 tokenů) - Výstup: text (8 192 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Llama-3.2-11B-Vision-Instruct | dokončování chatu (s obrázky) |
-
Vstup: text a obrázek (128 000 tokenů) - Výstup: text (8 192 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Meta-Llama-3.1-8B-Instruct | dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: text (8 192 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Meta-Llama-3.1-405B-Instruct | dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: text (8 192 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Meta-Llama-3.1-70B-Instruct (zastaralé) | dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: text (8 192 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Meta-Llama-3-8B-Instruct (zastaralé) | dokončení chatu |
-
Vstup: text (8 192 tokenů) - Výstup: text (8 192 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Meta-Llama-3-70B-Instruct (zastaralé) | dokončení chatu |
-
Vstup: text (8 192 tokenů) - Výstup: text (8 192 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Podívejte se na tuto kolekci modelů na portálu Azure AI Foundry.
Příklady odvození: Meta Llama
Další příklady použití modelů Meta Llama najdete v následujících příkladech:
Popis | Jazyk | Ukázka |
---|---|---|
Žádost CURL | Oslava | Odkaz |
Balíček odvozování Azure AI pro jazyk C# | C# | Odkaz |
Balíček odvozování Azure AI pro JavaScript | JavaScript | Odkaz |
Balíček odvozování Azure AI pro Python | Python | Odkaz |
Webové požadavky Pythonu | Python | Odkaz |
OpenAI SDK (experimentální) | Python | Odkaz |
LangChain | Python | Odkaz |
LiteLLM | Python | Odkaz |
Microsoft
Modely Microsoftu zahrnují různé skupiny modelů, jako jsou modely MAI, modely Phi, modely AI pro zdravotnictví a další. Pokud chcete zobrazit všechny dostupné modely Microsoftu, podívejte se na kolekci modelů Microsoftu na portálu Azure AI Foundry.
Vzor | Typ | Schopnosti |
---|---|---|
MAI-DS-R1 | dokončování chatu s odůvodněním obsahu |
-
Vstup: text (163 840 tokenů) - Výstup: text (163 840 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text. |
Phi-4-reasoning | dokončování chatu s odůvodněním obsahu |
-
Vstup: text (32768 tokenů) - Výstup: text (32768 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Phi-4-mini-reasoning | dokončování chatu s odůvodněním obsahu |
-
Vstup: text (128 000 token) - Výstup: text (128 000 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Phi-4-multimodal-instruct | dokončování chatu (s obrázkovým a zvukovým obsahem) |
-
Vstup: text, obrázky a zvuk (131 072 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Phi-4-mini-instruct | dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Phi-4 | dokončení chatu |
-
Vstup: text (16,384 tokenů) - Výstup: text (16 384 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Phi-3.5-mini-instruct | dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Phi-3.5-MoE-instruct | dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Phi-3.5-vision-instruct | dokončování chatu (s obrázky) |
-
Vstup: text a obrázek (131 072 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Phi-3-mini-128k-instruct | dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Phi-3-mini-4k-instruct | dokončení chatu |
-
Vstup: text (4,096 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Phi-3-small-128k-instruct | dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Phi-3-small-8k-instruct | dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Phi-3-medium-128k-instruct | dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Phi-3-medium-4k-instruct | dokončení chatu |
-
Vstup: text (4,096 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Příklady odvozování: Modely Microsoftu
Další příklady použití modelů Microsoftu najdete v následujících příkladech:
Popis | Jazyk | Ukázka |
---|---|---|
Balíček odvozování Azure AI pro jazyk C# | C# | Odkaz |
Balíček odvozování Azure AI pro JavaScript | JavaScript | Odkaz |
Balíček odvozování Azure AI pro Python | Python | Odkaz |
LangChain | Python | Odkaz |
Llama-Index | Python | Odkaz |
Podívejte se na kolekci modelů Microsoftu na portálu Azure AI Foundry.
Mistral AI (umělá inteligence)
Mistral AI nabízí dvě kategorie modelů, konkrétně:
- Prémiové modely: Patří mezi ně Modely Mistral Large, Mistral Small, Mistral-OCR-2503, Mistral Medium 3 (25.05) a Ministral 3B a jsou k dispozici jako bezserverová rozhraní API s fakturací na základě tokenů založených na průběžných platbách.
- Otevřené modely: Patří mezi ně Mistral-small-2503, Codestral a Mistral Nemo (které jsou dostupné jako bezserverová rozhraní API s fakturací na základě tokenů založených na průběžných platbách) a Mixtral-8x7B-Instruct-v01, Mixtral-8x7B-v01, Mistral-7B-Instruct-v01 a Mistral-7B-v01 (které jsou dostupné ke stažení a spouštění na samoobslužných spravovaných koncových bodech).
Vzor | Typ | Schopnosti |
---|---|---|
Codestral-2501 | dokončení chatu |
-
Vstup: text (262 144 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Ministral-3B | dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
Mistral-Nemo | dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
Mistral-Large-2411 | dokončení chatu |
-
Vstup: text (128 000 token) - Výstup: text (4 096 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
Mistral-large-2407 (zastaralé) |
dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
Mistral-large (zastaralé) |
dokončení chatu |
-
Vstup: text (32 768 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
Mistral-střední-2505 | dokončení chatu |
-
Vstup: text (128 000 tokenů), obrázek - Výstup: text (128 000 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text, JSON |
Mistral-OCR-2503 | obrázek k textu |
-
Vstup: obrázek nebo pdf stránky (1 000 stránek, maximálně 50 MB PDF soubor) - Výstup: text - Volání nástroje: Ne - Formáty odpovědí: Text, JSON, Markdown |
Mistral-small-2503 | dokončování chatu (s obrázky) |
-
Vstup: text a obrázky (131 072 tokenů), Tokeny založené na imagích jsou 16px x 16px bloky původních obrázků - Výstup: text (4 096 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
Mistral-small | dokončení chatu |
-
Vstup: text (32 768 tokenů) - Výstup: text (4 096 tokenů) - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
Podívejte se na tuto kolekci modelů na portálu Azure AI Foundry.
Příklady odvozování: Mistral
Další příklady použití modelů Mistral najdete v následujících příkladech a kurzech:
Popis | Jazyk | Ukázka |
---|---|---|
Žádost CURL | Oslava | Odkaz |
Balíček odvozování Azure AI pro jazyk C# | C# | Odkaz |
Balíček odvozování Azure AI pro JavaScript | JavaScript | Odkaz |
Balíček odvozování Azure AI pro Python | Python | Odkaz |
Webové požadavky Pythonu | Python | Odkaz |
OpenAI SDK (experimentální) | Python | Mistral – Ukázka sady OpenAI SDK |
LangChain | Python | Mistral - LangChain ukázka |
Mistral AI (umělá inteligence) | Python | Mistral - ukázka Mistral AI |
LiteLLM | Python | Mistral – Ukázka LiteLLM |
Nixtla
Nixtla's TimeGEN-1 je generivní předem natrénovaný model prognózy a detekce anomálií pro data časových řad. TimeGEN-1 může vytvářet přesné předpovědi pro novou časovou řadu bez trénování, přičemž jako vstupy se používají pouze historické hodnoty a exogenní kovariance.
K odvozování vyžaduje TimeGEN-1 použití vlastního rozhraní API pro odvozování Nixtla.
Vzor | Typ | Schopnosti | Inferenční API |
---|---|---|---|
TimeGEN-1 | Prognostika |
-
Vstup: Data časových řad jako JSON nebo datové rámce (s podporou vícevariátového vstupu) - Výstup: Data časových řad jako JSON - Volání nástroje: Ne - Formáty odpovědí: JSON |
Klient pro předpovědi k interakci s rozhraním API Nixtla |
Odhad počtu potřebných tokenů
Před vytvořením nasazení TimeGEN-1 je užitečné odhadnout počet tokenů, které plánujete spotřebovat, a za které vám budou účtovány poplatky. Jeden token odpovídá jednomu datovému bodu ve vstupní datové sadě nebo výstupní datové sadě.
Předpokládejme, že máte následující vstupní datovou sadu časových řad:
Jedinečné ID | Časová značka | Cílová proměnná | Exogenózní proměnná 1 | Exogenní proměnná 2 |
---|---|---|---|---|
BÝT | 2016-10-22 00:00:00 | 70.00 | 49593.0 | 57253,0 |
BÝT | 2016-10-22 01:00:00 | 37.10 | 46073,0 | 51887,0 |
Pokud chcete zjistit počet tokenů, vynásobte počet řádků (v tomto příkladu dva) a počet sloupců použitých pro prognózování – nepočítá se sloupce unique_id a časového razítka (v tomto příkladu tři), abyste získali celkem šest tokenů.
S ohledem na následující výstupní datovou sadu:
Jedinečné ID | Časová značka | Předpověděná cílová proměnná |
---|---|---|
BÝT | 2016-10-22 02:00:00 | 46.57 |
BÝT | 2016-10-22 03:00:00 | 48.57 |
Počet tokenů můžete určit také tak, že spočítáte počet datových bodů vrácených po prognózování dat. V tomto příkladu je počet tokenů dva.
Odhad cen na základě tokenů
Existují čtyři cenové měřiče, které určují cenu, kterou platíte. Tyto měřiče jsou následující:
Cenový měřič | Popis |
---|---|
Vstupní tokeny pro platby s odloženou platbou při inferenci | Náklady spojené s tokeny použitými jako vstup pro odvozování při finetune_steps = 0 |
Zpracování platby za logické výstupní tokeny | Náklady spojené s tokeny použitými jako výstup pro odvozování při finetune_steps = 0 |
inference-vstupní-tokeny-zjemněného-modelu-paygo | Náklady spojené s tokeny použitými jako vstup pro odvozování při finetune_steps> 0 |
paygo-vyladěný-model-inference-výstup-tokeny | Náklady spojené s tokeny použitými jako výstup pro odvozování při finetune_steps> 0 |
Podívejte se na kolekci modelů Nixtla na portálu Azure AI Foundry.
NTT DATA
tsuzumi je autoregresivní transformátor optimalizovaný pro jazyk. Vyladěné verze používají řízené jemné ladění (SFT). tsuzumi zpracovává jak japonštinu, tak angličtinu s vysokou efektivitou.
Vzor | Typ | Schopnosti |
---|---|---|
tsuzumi-7b | dokončení chatu |
-
Vstup: text (8 192 tokenů) - Výstup: text (8 192 tokenů) - Volání nástroje: Ne - Formáty odpovědí: Text |
Stabilita AI
Kolekce modelů generování obrazů od Stability AI zahrnuje Stable Image Core, Stable Image Ultra a Stable Diffusion 3.5 Large. Stabilní Diffusion 3.5 Large umožňuje vstup obrázku a textu.
Vzor | Typ | Schopnosti |
---|---|---|
Stable Diffusion 3.5 Velká | Generování obrázků |
-
Vstup: text a obrázek (1 000 tokenů a 1 obrázek) - Výstup: 1 obrázek - Volání nástroje: Ne - Formáty odpovědí: Obrázek (PNG a JPG) |
Stabilní jádro obrazu | Generování obrázků |
-
Vstup: text (1000 tokenů) - Výstup: 1 obrázek - Volání nástroje: Ne - Formáty odpovědí: Obrázek (PNG a JPG) |
Stabilní obraz Ultra | Generování obrázků |
-
Vstup: text (1000 tokenů) - Výstup: 1 obrázek - Volání nástroje: Ne - Formáty odpovědí: Obrázek (PNG a JPG) |
xAI
Modely Grok 3 a Grok 3 Mini jsou navržené tak, aby excelovaly v různých podnikových doménách. Grok 3, nedůvodný model předem natrénovaný datovým centrem Colossus, je přizpůsobený pro případy obchodního použití, jako je extrakce dat, kódování a shrnutí textu, s výjimečnými možnostmi pro následující instrukce. Podporuje kontextové okno o velikosti 131 072 tokenů, které umožňuje zpracovávat rozsáhlé vstupy při zachování soudržnosti a hloubky, a je obzvláště schopný navazovat spojení napříč doménami a jazyky. Na druhou stranu je Grok 3 Mini lehký model zdůvodnění, který je natrénovaný k řešení agentických, kódovacích, matematických problémů a problémů v oblasti hluboké vědy s výpočetní kapacitou během testování. Podporuje také kontextové okno 131 072 tokenů pro pochopení kódové základny a podnikových dokumentů, exceluje při použití nástrojů k řešení složitých logických problémů v nových prostředích a nabízí neopracované záznamy ke kontrole uživateli s úpravou myšlenkových rozpočtů.
Vzor | Typ | Schopnosti |
---|---|---|
grok-3 | dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: text (131 072 tokenů) - Jazyky: en - Volání nástrojů: ano - Formáty odpovědí: text |
grok-3-mini | dokončení chatu |
-
Vstup: text (131 072 tokenů) - Výstup: text (131 072 tokenů) - Jazyky: en - Volání nástrojů: ano - Formáty odpovědí: text |
Příklady inferencí: Stability AI
Modely stability AI nasazené prostřednictvím nasazení bezserverového rozhraní API implementují rozhraní API pro odvozování modelů na trase /image/generations
.
Příklady použití modelů Stability AI najdete v následujících příkladech:
- Použijte OpenAI SDK s modely Stability AI pro požadavky na převod textu na obrázek
- Použijte knihovnu Requests s modely Stability AI pro převod textu na obrazové požadavky
- Použijte knihovnu Requests s modelem Stable Diffusion 3.5 Large pro požadavky na převod obrazu na obraz
- Příklad plně zakódované odpovědi na generování obrázků