DökümHane Modelleri için sunucusuz API çıkarım örnekleri (klasik)

Yalnızca şunlar için geçerlidir:Dökümhane (klasik) portalı. Bu makale yeni Dökümhane portalında kullanılamaz. Yeni portal hakkında daha fazla bilgi edinin.

Not

Bu makaledeki bağlantılar, şu anda görüntülediğiniz Dökümhane (klasik) belgeleri yerine yeni Microsoft Foundry belgelerinde içerik açabilir.

Foundry model kataloğu, çok çeşitli sağlayıcılardan Microsoft Foundry Modellerinden oluşan geniş bir seçim sunar. Model kataloğundan model dağıtmak için çeşitli seçenekleriniz vardır. Bu makalede sunucusuz API dağıtımları için çıkarım örnekleri listelenmiştir.

Önemli

Önizleme aşamasında olan modeller, model kataloğundaki model kartlarında önizleme olarak işaretlenir.

Modellerle çıkarım yapmak için Nixtla TimeGEN-1 ve Cohere rerank gibi bazı modeller, model sağlayıcılarından özel API'ler kullanmanızı gerektirir. Diğerleri Model Çıkarımı API'sini kullanarak çıkarım gerçekleştirmeyi destekler. Dökümhane portalı için model kataloğunda model kartlarını gözden geçirerek tek tek modeller hakkında daha fazla ayrıntı bulabilirsiniz.

Cohere

Cohere model ailesi, yeniden düzenleme, sohbet tamamlamaları ve ekleme modelleri dahil olmak üzere farklı kullanım örnekleri için iyileştirilmiş çeşitli modeller içerir.

Çıkarım örnekleri: Cohere komutu ve gömme

Aşağıdaki tabloda, Cohere modellerinin nasıl kullanılacağına ilişkin örneklere bağlantılar sağlanmaktadır.

Açıklama Dil Örnek
Web istekleri Bash Command-RCommand-R+
cohere-embed.ipynb
C# için Azure AI Çıkarım paketi C# Link
JavaScript için Azure AI Çıkarım paketi Javascript Link
Python için Azure AI Çıkarım paketi Python Link
OpenAI SDK (deneysel) Python Link
LangChain Python Link
Cohere SDK Python Komut
Katıştır
LiteLLM SDK Python Link

Bilgi Getirme Destekli Üretim (RAG) ve araç kullanım örnekleri: Cohere komutu ve gömme

Açıklama Paketler Örnek
Cohere embeddings kullanarak yerel bir Facebook AI benzerlik araması (FAISS) vektör dizini oluşturma - Langchain langchain, langchain_cohere cohere_faiss_langchain_embed.ipynb
Yerel FAISS vektör dizinindeki verilerden gelen soruları yanıtlamak için Cohere Command R/R+ kullanma - Langchain langchain, langchain_cohere command_faiss_langchain.ipynb
Yapay zeka arama vektör dizinindeki verilerden gelen soruları yanıtlamak için Cohere Command R/R+ kullanma - Langchain langchain, langchain_cohere cohere-aisearch-langchain-rag.ipynb
Yapay zeka arama vektör dizinindeki verilerden gelen soruları yanıtlamak için Cohere Command R/R+'ı kullanma - Cohere SDK cohere, azure_search_documents cohere-aisearch-rag.ipynb
LangChain kullanarak R+ aracı/işlev çağrısı komutu cohere, langchain, langchain_cohere command_tools-langchain.ipynb

Yeniden sıralamak

Cohere rerank modelleriyle çıkarım yapmak için Cohere'in özel rerank API'lerini kullanmanız gerekir. Cohere rerank modeli ve özellikleri hakkında daha fazla bilgi için bkz. Cohere rerank.

Cohere rerank modelleri için fiyatlandırma

Bir kullanıcının sorgusuyla karıştırılmaması gereken sorgular, Cohere Rerank modelinin çıkarımı için giriş olarak kullanılan belirteçlerle ilişkili maliyeti ifade eden bir fiyatlandırma ölçümüdür. Cohere, tek bir arama birimini, en fazla 100 belge sıralanmak üzere bir arama sorgusu olarak sayar. Arama sorgusunun uzunluğu dahil edildiğinde 500'den uzun belirteçler (Cohere-rerank-v3.5 için) veya 4096'dan uzun belirteçler (Cohere-rerank-v3-English ve Cohere-rerank-v3-multilingual için) arama sorgusunun uzunluğu birden çok öbeklere ayrılır ve her öbek tek bir belge olarak sayılır.

Foundry portalında Cohere model koleksiyonunu görün.

Core42

Aşağıdaki tabloda Jais modellerinin nasıl kullanılacağına ilişkin örneklere bağlantılar sağlanmaktadır.

Açıklama Dil Örnek
C# için Azure AI Çıkarım paketi C# Link
JavaScript için Azure AI Çıkarım paketi Javascript Link
Python için Azure AI Çıkarım paketi Python Link

DeepSeek

DeepSeek model ailesi, dil, bilimsel mantık ve kodlama görevleri, DeepSeek-V3-0324, Uzmanlar Karışımı (MoE) dil modeli ve daha fazlası gibi adım adım eğitim sürecini kullanarak akıl yürütme görevleri konusunda üstün başarıya sahip Olan DeepSeek-R1'i içerir.

Aşağıdaki tabloda DeepSeek modellerinin nasıl kullanılacağına ilişkin örneklerin bağlantıları verilmiştir.

Açıklama Dil Örnek
Python için Azure AI Çıkarım paketi Python Link
JavaScript için Azure AI Çıkarım paketi Javascript Link
C# için Azure AI Çıkarım paketi C# Link
Java için Azure AI Çıkarım paketi Java Link

Meta

Meta Lama modelleri ve araçları, önceden eğitilmiş ve ince ayarlı yapay zeka metni ve görüntü akıl yürütme modellerinden oluşan bir koleksiyon. Meta model aralığı şunları içerecek şekilde ölçeklendirilir:

  • 1B ve 3B Base gibi küçük dil modelleri (SLM'ler) ve cihaz içi ve uç çıkarım modelleri için yönergeler
  • 7B, 8B ve 70B Temel ve Yönerge modelleri gibi orta büyüklükteki büyük dil modelleri (LLM' ler)
  • Meta Llama 3.1-405B gibi yüksek performanslı modeller Yapay veri oluşturma ve distilasyon kullanım örnekleri için talimat vermektedir.
  • Yüksek performanslı yerel olarak çok modüllü modeller olan Llama 4 Scout ve Llama 4 Maverick, metin ve görüntü anlamada sektör lideri performans sunmak için uzmanlardan oluşan bir mimariden yararlanır.

Aşağıdaki tabloda Meta Llama modellerinin nasıl kullanılacağına ilişkin örneklere bağlantılar sağlanmaktadır.

Açıklama Dil Örnek
CURL isteği Bash Link
C# için Azure AI Çıkarım paketi C# Link
JavaScript için Azure AI Çıkarım paketi Javascript Link
Python için Azure AI Çıkarım paketi Python Link
Python web istekleri Python Link
OpenAI SDK (deneysel) Python Link
LangChain Python Link
LiteLLM Python Link

Microsoft

Microsoft modelleri MAI modelleri, Phi modelleri, sağlık yapay zekası modelleri ve daha fazlası gibi çeşitli model gruplarını içerir. Kullanılabilir tüm Microsoft modellerini görmek için, Foundry portalında Microsoft modeli koleksiyonunu görüntüleyin.

Aşağıdaki tabloda, Microsoft modellerinin nasıl kullanılacağına ilişkin örneklere bağlantılar sağlanmaktadır.

Açıklama Dil Örnek
C# için Azure AI Çıkarım paketi C# Link
JavaScript için Azure AI Çıkarım paketi Javascript Link
Python için Azure AI Çıkarım paketi Python Link
LangChain Python Link
Llama-Index Python Link

Bkz. Foundry portalında Microsoft modeli koleksiyonu.

Mistral AI

Mistral AI iki model kategorisi sunar:

  • Premium modeller: Bunlar Mistral Large, Mistral Small, Mistral-OCR-2503, Mistral Medium 3 (25.05) ve Ministral 3B modelleridir ve kullandıkça öde belirteç tabanlı faturalama ile sunucusuz API'ler olarak kullanılabilir.
  • Açık modeller: Mistral-small-2503, Codestral ve Mistral Nemo (kullandıkça öde belirteç tabanlı faturalama ile sunucusuz API'ler olarak kullanılabilir) ve Mixtral-8x7B-Instruct-v01, Mixtral-8x7B-v01, Mistral-7B-Instruct-v01 ve Mistral-7B-v01 (şirket içinde barındırılan yönetilen uç noktalarda indirilip çalıştırılarak kullanılabilir).

Aşağıdaki tabloda, Mistral modellerinin nasıl kullanılacağına ilişkin örneklerin bağlantıları verilmiştir.

Açıklama Dil Örnek
CURL isteği Bash Link
C# için Azure AI Çıkarım paketi C# Link
JavaScript için Azure AI Çıkarım paketi Javascript Link
Python için Azure AI Çıkarım paketi Python Link
Python web istekleri Python Link
OpenAI SDK (deneysel) Python Mistral - OpenAI SDK örneği
LangChain Python Mistral - LangChain örneği
Mistral AI Python Mistral - Mistral AI örneği
LiteLLM Python Mistral - LiteLLM örneği

Nixtla

Nixtla'nın TimeGEN-1, zaman serisi verileri için önceden eğitilmiş üretken bir tahmin ve anomali algılama modelidir. TimeGEN-1, yalnızca geçmiş değerler ve eksojen kovaryatları giriş olarak kullanarak eğitim olmaksızın yeni zaman serileri için doğru tahminler oluşturabilir.

Çıkarım yapmak için TimeGEN-1, Nixtla'nın özel çıkarım API'sini kullanmanızı gerektirir. TimeGEN-1 modeli ve özellikleri hakkında daha fazla bilgi için bkz. Nixtla.

Gereken belirteç sayısını tahmin edin

TimeGEN-1 dağıtımı oluşturmadan önce, tüketmeyi planladığınız ve faturalandırılacak belirteç sayısını tahmin etmek yararlı olur. Bir belirteç, giriş veri kümenizdeki veya çıkış veri kümenizdeki bir veri noktasına karşılık gelir.

Aşağıdaki giriş zamanı serisi veri kümenize sahip olduğunuzu varsayalım:

Unique_id Zaman damgası Hedef Değişken Eksojen Değişken 1 Eksojen Değişken 2
BE 2016-10-22 00:00:00 70.00 49593.0 57253.0
BE 2016-10-22 01:00:00 37.10 46073.0 51887.0

Belirteç sayısını belirlemek için, toplam altı belirteç elde etmek için unique_id ve zaman damgası sütunlarını (bu örnekte üç) saymayarak, satır sayısını (bu örnekte iki) ve tahmin için kullanılan sütun sayısını çarpın.

Aşağıdaki çıkış veri kümesi göz önünde bulundurulduğunda:

Unique_id Zaman damgası Tahmin Edilen Hedef Değişken
BE 2016-10-22 02:00:00 46.57
BE 2016-10-22 03:00:00 48.57

Ayrıca, veri tahminlerinden sonra döndürülen veri noktalarını sayarak belirteç sayısını belirleyebilirsiniz. Bu örnekte belirteç sayısı ikidir.

Jetonlara göre fiyat değerlendirmesi

Ödediğiniz fiyatı belirleyen dört fiyatlandırma metresi vardır. Bu ölçümler aşağıdaki gibidir:

Fiyatlandırma Ölçümü Açıklama
paygo-inference-input-tokens finetune_steps = 0 olduğunda çıkarım için giriş olarak kullanılan belirteçlerle ilişkili maliyetler
paygo-çıkarım-çıktı-jetonları finetune_steps = 0 olduğunda çıkarım için çıkış olarak kullanılan belirteçlerle ilişkili maliyetler
paygo-fine-tune edilmiş model çıkarım giriş jetonları finetune_steps> 0 olduğunda çıkarım için giriş olarak kullanılan belirteçlerle ilişkili maliyetler
paygo-finetuned-model-çıkarım-çıkış-tokens finetune_steps> 0 olduğunda çıkarım için çıkış olarak kullanılan belirteçlerle ilişkili maliyetler

Bkz. Foundry portalında Nixtla model koleksiyonu.

Kararlılık yapay zekası

Sunucusuz API dağıtımı aracılığıyla dağıtılan Stability AI modelleri, /image/generations yolunda Model Çıkarım API'sını uygular. Kararlılık yapay zekası modellerini kullanma örnekleri için aşağıdaki örneklere bakın:

Gretel Navigator

Gretel Navigator, 10'dan fazla endüstri etki alanı arasında ince ayarlı en iyi açık kaynak küçük dil modellerini (SLM' ler) birleştirerek yapay veriler için özel olarak tasarlanmış bileşik bir yapay zeka mimarisi kullanır. Bu amaca yönelik oluşturulan sistem, yüzlerce ile milyonlarca örnek arasında farklı, etki alanına özgü veri kümeleri oluşturur. Sistem ayrıca karmaşık istatistiksel ilişkileri korur ve el ile veri oluşturmaya kıyasla daha yüksek hız ve doğruluk sunar.

Açıklama Dil Örnek
JavaScript için Azure AI Çıkarım paketi Javascript Link
Python için Azure AI Çıkarım paketi Python Link