Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Yalnızca şunlar için geçerlidir:Dökümhane (klasik) portalı. Bu makale yeni Dökümhane portalında kullanılamaz.
Yeni portal hakkında daha fazla bilgi edinin.
Not
Bu makaledeki bağlantılar, şu anda görüntülediğiniz Dökümhane (klasik) belgeleri yerine yeni Microsoft Foundry belgelerinde içerik açabilir.
Foundry model kataloğu, çok çeşitli sağlayıcılardan Microsoft Foundry Modellerinden oluşan geniş bir seçim sunar. Model kataloğundan model dağıtmak için çeşitli seçenekleriniz vardır. Bu makalede sunucusuz API dağıtımları için çıkarım örnekleri listelenmiştir.
Önemli
Önizleme aşamasında olan modeller, model kataloğundaki model kartlarında önizleme olarak işaretlenir.
Modellerle çıkarım yapmak için Nixtla TimeGEN-1 ve Cohere rerank gibi bazı modeller, model sağlayıcılarından özel API'ler kullanmanızı gerektirir. Diğerleri Model Çıkarımı API'sini kullanarak çıkarım gerçekleştirmeyi destekler. Dökümhane portalı için model kataloğunda model kartlarını gözden geçirerek tek tek modeller hakkında daha fazla ayrıntı bulabilirsiniz.
Cohere
Cohere model ailesi, yeniden düzenleme, sohbet tamamlamaları ve ekleme modelleri dahil olmak üzere farklı kullanım örnekleri için iyileştirilmiş çeşitli modeller içerir.
Çıkarım örnekleri: Cohere komutu ve gömme
Aşağıdaki tabloda, Cohere modellerinin nasıl kullanılacağına ilişkin örneklere bağlantılar sağlanmaktadır.
| Açıklama | Dil | Örnek |
|---|---|---|
| Web istekleri | Bash |
Command-RCommand-R+ cohere-embed.ipynb |
| C# için Azure AI Çıkarım paketi | C# | Link |
| JavaScript için Azure AI Çıkarım paketi | Javascript | Link |
| Python için Azure AI Çıkarım paketi | Python | Link |
| OpenAI SDK (deneysel) | Python | Link |
| LangChain | Python | Link |
| Cohere SDK | Python |
Komut Katıştır |
| LiteLLM SDK | Python | Link |
Bilgi Getirme Destekli Üretim (RAG) ve araç kullanım örnekleri: Cohere komutu ve gömme
| Açıklama | Paketler | Örnek |
|---|---|---|
| Cohere embeddings kullanarak yerel bir Facebook AI benzerlik araması (FAISS) vektör dizini oluşturma - Langchain |
langchain, langchain_cohere |
cohere_faiss_langchain_embed.ipynb |
| Yerel FAISS vektör dizinindeki verilerden gelen soruları yanıtlamak için Cohere Command R/R+ kullanma - Langchain |
langchain, langchain_cohere |
command_faiss_langchain.ipynb |
| Yapay zeka arama vektör dizinindeki verilerden gelen soruları yanıtlamak için Cohere Command R/R+ kullanma - Langchain |
langchain, langchain_cohere |
cohere-aisearch-langchain-rag.ipynb |
| Yapay zeka arama vektör dizinindeki verilerden gelen soruları yanıtlamak için Cohere Command R/R+'ı kullanma - Cohere SDK |
cohere, azure_search_documents |
cohere-aisearch-rag.ipynb |
| LangChain kullanarak R+ aracı/işlev çağrısı komutu |
cohere, langchain, langchain_cohere |
command_tools-langchain.ipynb |
Yeniden sıralamak
Cohere rerank modelleriyle çıkarım yapmak için Cohere'in özel rerank API'lerini kullanmanız gerekir. Cohere rerank modeli ve özellikleri hakkında daha fazla bilgi için bkz. Cohere rerank.
Cohere rerank modelleri için fiyatlandırma
Bir kullanıcının sorgusuyla karıştırılmaması gereken sorgular, Cohere Rerank modelinin çıkarımı için giriş olarak kullanılan belirteçlerle ilişkili maliyeti ifade eden bir fiyatlandırma ölçümüdür. Cohere, tek bir arama birimini, en fazla 100 belge sıralanmak üzere bir arama sorgusu olarak sayar. Arama sorgusunun uzunluğu dahil edildiğinde 500'den uzun belirteçler (Cohere-rerank-v3.5 için) veya 4096'dan uzun belirteçler (Cohere-rerank-v3-English ve Cohere-rerank-v3-multilingual için) arama sorgusunun uzunluğu birden çok öbeklere ayrılır ve her öbek tek bir belge olarak sayılır.
Foundry portalında Cohere model koleksiyonunu görün.
Core42
Aşağıdaki tabloda Jais modellerinin nasıl kullanılacağına ilişkin örneklere bağlantılar sağlanmaktadır.
| Açıklama | Dil | Örnek |
|---|---|---|
| C# için Azure AI Çıkarım paketi | C# | Link |
| JavaScript için Azure AI Çıkarım paketi | Javascript | Link |
| Python için Azure AI Çıkarım paketi | Python | Link |
DeepSeek
DeepSeek model ailesi, dil, bilimsel mantık ve kodlama görevleri, DeepSeek-V3-0324, Uzmanlar Karışımı (MoE) dil modeli ve daha fazlası gibi adım adım eğitim sürecini kullanarak akıl yürütme görevleri konusunda üstün başarıya sahip Olan DeepSeek-R1'i içerir.
Aşağıdaki tabloda DeepSeek modellerinin nasıl kullanılacağına ilişkin örneklerin bağlantıları verilmiştir.
| Açıklama | Dil | Örnek |
|---|---|---|
| Python için Azure AI Çıkarım paketi | Python | Link |
| JavaScript için Azure AI Çıkarım paketi | Javascript | Link |
| C# için Azure AI Çıkarım paketi | C# | Link |
| Java için Azure AI Çıkarım paketi | Java | Link |
Meta
Meta Lama modelleri ve araçları, önceden eğitilmiş ve ince ayarlı yapay zeka metni ve görüntü akıl yürütme modellerinden oluşan bir koleksiyon. Meta model aralığı şunları içerecek şekilde ölçeklendirilir:
- 1B ve 3B Base gibi küçük dil modelleri (SLM'ler) ve cihaz içi ve uç çıkarım modelleri için yönergeler
- 7B, 8B ve 70B Temel ve Yönerge modelleri gibi orta büyüklükteki büyük dil modelleri (LLM' ler)
- Meta Llama 3.1-405B gibi yüksek performanslı modeller Yapay veri oluşturma ve distilasyon kullanım örnekleri için talimat vermektedir.
- Yüksek performanslı yerel olarak çok modüllü modeller olan Llama 4 Scout ve Llama 4 Maverick, metin ve görüntü anlamada sektör lideri performans sunmak için uzmanlardan oluşan bir mimariden yararlanır.
Aşağıdaki tabloda Meta Llama modellerinin nasıl kullanılacağına ilişkin örneklere bağlantılar sağlanmaktadır.
| Açıklama | Dil | Örnek |
|---|---|---|
| CURL isteği | Bash | Link |
| C# için Azure AI Çıkarım paketi | C# | Link |
| JavaScript için Azure AI Çıkarım paketi | Javascript | Link |
| Python için Azure AI Çıkarım paketi | Python | Link |
| Python web istekleri | Python | Link |
| OpenAI SDK (deneysel) | Python | Link |
| LangChain | Python | Link |
| LiteLLM | Python | Link |
Microsoft
Microsoft modelleri MAI modelleri, Phi modelleri, sağlık yapay zekası modelleri ve daha fazlası gibi çeşitli model gruplarını içerir. Kullanılabilir tüm Microsoft modellerini görmek için, Foundry portalında Microsoft modeli koleksiyonunu
Aşağıdaki tabloda, Microsoft modellerinin nasıl kullanılacağına ilişkin örneklere bağlantılar sağlanmaktadır.
| Açıklama | Dil | Örnek |
|---|---|---|
| C# için Azure AI Çıkarım paketi | C# | Link |
| JavaScript için Azure AI Çıkarım paketi | Javascript | Link |
| Python için Azure AI Çıkarım paketi | Python | Link |
| LangChain | Python | Link |
| Llama-Index | Python | Link |
Bkz. Foundry portalında Microsoft modeli koleksiyonu.
Mistral AI
Mistral AI iki model kategorisi sunar:
- Premium modeller: Bunlar Mistral Large, Mistral Small, Mistral-OCR-2503, Mistral Medium 3 (25.05) ve Ministral 3B modelleridir ve kullandıkça öde belirteç tabanlı faturalama ile sunucusuz API'ler olarak kullanılabilir.
- Açık modeller: Mistral-small-2503, Codestral ve Mistral Nemo (kullandıkça öde belirteç tabanlı faturalama ile sunucusuz API'ler olarak kullanılabilir) ve Mixtral-8x7B-Instruct-v01, Mixtral-8x7B-v01, Mistral-7B-Instruct-v01 ve Mistral-7B-v01 (şirket içinde barındırılan yönetilen uç noktalarda indirilip çalıştırılarak kullanılabilir).
Aşağıdaki tabloda, Mistral modellerinin nasıl kullanılacağına ilişkin örneklerin bağlantıları verilmiştir.
| Açıklama | Dil | Örnek |
|---|---|---|
| CURL isteği | Bash | Link |
| C# için Azure AI Çıkarım paketi | C# | Link |
| JavaScript için Azure AI Çıkarım paketi | Javascript | Link |
| Python için Azure AI Çıkarım paketi | Python | Link |
| Python web istekleri | Python | Link |
| OpenAI SDK (deneysel) | Python | Mistral - OpenAI SDK örneği |
| LangChain | Python | Mistral - LangChain örneği |
| Mistral AI | Python | Mistral - Mistral AI örneği |
| LiteLLM | Python | Mistral - LiteLLM örneği |
Nixtla
Nixtla'nın TimeGEN-1, zaman serisi verileri için önceden eğitilmiş üretken bir tahmin ve anomali algılama modelidir. TimeGEN-1, yalnızca geçmiş değerler ve eksojen kovaryatları giriş olarak kullanarak eğitim olmaksızın yeni zaman serileri için doğru tahminler oluşturabilir.
Çıkarım yapmak için TimeGEN-1, Nixtla'nın özel çıkarım API'sini kullanmanızı gerektirir. TimeGEN-1 modeli ve özellikleri hakkında daha fazla bilgi için bkz. Nixtla.
Gereken belirteç sayısını tahmin edin
TimeGEN-1 dağıtımı oluşturmadan önce, tüketmeyi planladığınız ve faturalandırılacak belirteç sayısını tahmin etmek yararlı olur. Bir belirteç, giriş veri kümenizdeki veya çıkış veri kümenizdeki bir veri noktasına karşılık gelir.
Aşağıdaki giriş zamanı serisi veri kümenize sahip olduğunuzu varsayalım:
| Unique_id | Zaman damgası | Hedef Değişken | Eksojen Değişken 1 | Eksojen Değişken 2 |
|---|---|---|---|---|
| BE | 2016-10-22 00:00:00 | 70.00 | 49593.0 | 57253.0 |
| BE | 2016-10-22 01:00:00 | 37.10 | 46073.0 | 51887.0 |
Belirteç sayısını belirlemek için, toplam altı belirteç elde etmek için unique_id ve zaman damgası sütunlarını (bu örnekte üç) saymayarak, satır sayısını (bu örnekte iki) ve tahmin için kullanılan sütun sayısını çarpın.
Aşağıdaki çıkış veri kümesi göz önünde bulundurulduğunda:
| Unique_id | Zaman damgası | Tahmin Edilen Hedef Değişken |
|---|---|---|
| BE | 2016-10-22 02:00:00 | 46.57 |
| BE | 2016-10-22 03:00:00 | 48.57 |
Ayrıca, veri tahminlerinden sonra döndürülen veri noktalarını sayarak belirteç sayısını belirleyebilirsiniz. Bu örnekte belirteç sayısı ikidir.
Jetonlara göre fiyat değerlendirmesi
Ödediğiniz fiyatı belirleyen dört fiyatlandırma metresi vardır. Bu ölçümler aşağıdaki gibidir:
| Fiyatlandırma Ölçümü | Açıklama |
|---|---|
| paygo-inference-input-tokens | finetune_steps = 0 olduğunda çıkarım için giriş olarak kullanılan belirteçlerle ilişkili maliyetler |
| paygo-çıkarım-çıktı-jetonları | finetune_steps = 0 olduğunda çıkarım için çıkış olarak kullanılan belirteçlerle ilişkili maliyetler |
| paygo-fine-tune edilmiş model çıkarım giriş jetonları | finetune_steps> 0 olduğunda çıkarım için giriş olarak kullanılan belirteçlerle ilişkili maliyetler |
| paygo-finetuned-model-çıkarım-çıkış-tokens | finetune_steps> 0 olduğunda çıkarım için çıkış olarak kullanılan belirteçlerle ilişkili maliyetler |
Bkz. Foundry portalında Nixtla model koleksiyonu.
Kararlılık yapay zekası
Sunucusuz API dağıtımı aracılığıyla dağıtılan Stability AI modelleri, /image/generations yolunda Model Çıkarım API'sını uygular.
Kararlılık yapay zekası modellerini kullanma örnekleri için aşağıdaki örneklere bakın:
- Metinden görüntüye istekler için Kararlılık AI modelleriyle OpenAI SDK'sını kullanın
- Metinden görüntüye istekler için Kararlılık AI modelleri ile İstekler kitaplığını kullanın
- Stable Diffusion 3.5 Large ile görüntüden görüntüye istek için Requests kütüphanesini kullanın
- Tam olarak kodlanmış görüntü oluşturma yanıtının örneği
Gretel Navigator
Gretel Navigator, 10'dan fazla endüstri etki alanı arasında ince ayarlı en iyi açık kaynak küçük dil modellerini (SLM' ler) birleştirerek yapay veriler için özel olarak tasarlanmış bileşik bir yapay zeka mimarisi kullanır. Bu amaca yönelik oluşturulan sistem, yüzlerce ile milyonlarca örnek arasında farklı, etki alanına özgü veri kümeleri oluşturur. Sistem ayrıca karmaşık istatistiksel ilişkileri korur ve el ile veri oluşturmaya kıyasla daha yüksek hız ve doğruluk sunar.
| Açıklama | Dil | Örnek |
|---|---|---|
| JavaScript için Azure AI Çıkarım paketi | Javascript | Link |
| Python için Azure AI Çıkarım paketi | Python | Link |