Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Foundry Aracı Servisi, aracı yapıtları, dosya yüklemeleri, iletiler ve araç kayıtları üzerinde kotaları ve sınırları uygular. Bu sınırları anlamak, hizmet sınırlarına erişmeden ölçeklendirilen uygulamalar tasarlamanıza yardımcı olur. Bu makalede varsayılan sınırlar, desteklenen bölgeler, uyumlu modeller ve sınır hatalarını işleme yönergeleri listelenmektedir.
Not
Döküm Aracı Servisi genel kullanıma sunuldu (GA). Barındırılan aracılar gibi bazı alt özellikler genel önizleme aşamasındadır ve farklı kısıtlamalara sahip olabilir.
Önkoşullar
- Azure aboneliği.
- A Microsoft Foundry projesi.
- Aracı Servisi ile uyumlu dağıtılmış bir model. Model ve bölge kullanılabilirliği farklılık gösterebilir.
Desteklenen bölgeler
Foundry aracısı hizmeti, yalnızca Azure OpenAI Yanıtları API'yi destekleyen bölgelerde oluşturulan Foundry projeleri için kullanılabilir. Foundry projenizin Agent Hizmeti'ni kullanmak için bu bölgelerden birinde olması gerekir. Bazı Azure OpenAI modelleri aynı bölgelerde kullanılamayabilir. Ayrıntılar için Azure tarafından satılan Foundry Modelleri için Bölge kullanılabilirliği bölümüne bakın.
Önemli
Tüm araçlar her bölgede kullanılamaz. Örneğin, İtalya Kuzey ve Brezilya Güney'de dosya arama kullanılamaz. Bölgeye göre tam araç matrisi için bkz. Bölgeye ve modele göre araç desteği.
Azure OpenAI modellerine ek olarak, Aracı Hizmeti Foundry model kataloğundaki modelleri destekler. Bu modeller Foundry aracılığıyla dağıtılır ve yönetilir ve ayrı kotaları izler. Temsilcilerinizin kullanması için aşağıdaki modeller mevcuttur.
Azure tarafından satılan Foundry Modeller:
- MAI-DS-R1: Belirleyici, duyarlık odaklı akıl yürütme.
- grok-4: Karmaşık, çok adımlı problem çözme için sınır ölçeğinde mantık.
- grok-4-fast-reasoning: İş akışı otomasyonu için iyileştirilmiş hızlandırılmış aracı mantık.
- grok-4-fast-non-reasoning: Yüksek aktarım hızı, düşük gecikmeli oluşturma ve sistem yönlendirme.
- grok-3: Karmaşık, sistem düzeyinde iş akışları için güçlü mantık.
- grok-3-mini: Etkileşimli, yüksek hacimli kullanım örnekleri için iyileştirilmiş basit model.
- Llama-3.3-70B-Instruct: Kurumsal Soru-Cevap, karar desteği ve sistem düzenleme için çok yönlü model.
- Llama-4-Maverick-17B-128E-Instruct-FP8: Hızlı, uygun maliyetli çıkarım sağlayan FP8 için iyileştirilmiş model.
- DeepSeek-V3-0324: Metin ve görüntüler arasında çokmodal anlayış.
- DeepSeek-V3.1: Gelişmiş çok modlu mantık ve gerçek dünya tabanlı geri çağırma.
- DeepSeek-R1-0528: Gelişmiş uzun biçimli ve çok adımlı akıl yürütme.
- gpt-oss-120b: Saydamlığı ve yeniden üretilebilirliği destekleyen açık ekosistem modeli.
Ipucu
Model kullanılabilirliği zaman içinde değişebilir. Projeniz ve bölgeniz için neleri dağıtabileceğinizi doğrulamak için Dökümhane portalı model deneyimini kullanın.
Sorun giderme
Bölgenizde bir model veya sürüm mevcut değil
- Dağıtım türünüz (genel standart ve sağlanan) için doğru sekmeyi seçtiğinizden emin olun.
- Modeli ve Yanıtlar API'sini destekleyen farklı bir bölge deneyin.
- gpt-5 modellerini kullanıyorsanız kayıt gereklidir. Erişim, Microsoft uygunluk ölçütlerine göre verilir.
Bölgenizde bir araç bulunmuyor.
- Tüm araçlar her bölgede desteklenmez. Örneğin, İtalya Kuzey ve Brezilya Güney'de dosya arama kullanılamaz ve kod yorumlayıcı tüm bölgelerde kullanılamaz.
- Dağıtımdan önce kullanılabilirliği onaylamak için bölgeye ve model tablosuna göre araç desteğini denetleyin.
- Araç kullanılamıyorsa desteklenen bir yer seçin veya farklı bir araç kullanın.
Sağlanan aktarım hızı dağıtımı başarısızlıkla sonuçlanıyor
- Bölgede yeterli SAYıDA PTU'nuz olduğunu onaylayın.
- Sağlanan aktarım hızı ve Taşma trafik yönetimini gözden geçirin.
Ajan hız sınırı (429) hataları alıyor
- Uygulama yeniden deneme mantığınızda rastgele gecikmelerle üstel gerileme uygulayın.
- Sürekli yüksek aktarım hızına sahip iş yükleri için sağlanan aktarım hızı dağıtımlarını göz önünde bulundurun.
- Dağıtımınızın dakika başına belirteçleri ve dakika başına istek üst sınırları için Azure OpenAI kotalarını ve sınırlarını gözden geçirin.
Kotalar ve sınırlar
Döküm Ajan Servisi iki yerde sınırları uygular.
- Aracı Hizmeti sınırları. Dosya yüklemeleri, vektör deposu ekleri, ileti sayıları ve araç kaydı gibi aracı ve iş parçacığı ile ilgili bileşenler için sınırlar.
- Model sınırları. Aracılarınızın çağrı yaptığı model dağıtımları için kotalar ve hız sınırları.
İş parçacıkları ve iletiler kullanıyorsanız bkz. Foundry Agent Service'te iş parçacıkları, çalıştırmalar ve iletiler. Dosya araması kullanıyorsanız bkz. Dosya arama için vektör depoları.
Hizmet için varsayılan kotalar ve sınırlar
Aşağıdaki tabloda Aracı Hizmeti tarafından zorunlu kılınan varsayılan sınırlar listelenir. Bu sınırlar, abonelik türüne veya bölgesine bakılmaksızın tüm Dökümhane projeleri için geçerlidir.
| Sınır adı | Sınır değeri |
|---|---|
| Aracı/iş parçacığı başına maksimum dosya sayısı | 10.000 |
| Aracılar için en büyük dosya boyutu | 512MB |
| Temsilciler için yüklenen tüm dosyaların maksimum boyutu | 300 GB |
| Vektör deposuna ekleme için belirteçlerle ifade edilen en büyük dosya boyutu | 2.000.000 belirteç |
| Konu başına en fazla ileti sayısı | 100,000 |
İleti başına içerik boyutu text üst sınırı |
1.500.000 karakter |
| Aracı başına kaydedilen en fazla araç sayısı | 128 |
Bu tablodaki Aracı Hizmeti sınırları sabittir ve tüm abonelik türlerine aynı şekilde uygulanır. Aracı Hizmeti, API çağrılarına ayrı hız sınırları getirmez. Hız sınırlama, model dağıtım düzeyinde uygulanır. Modele özgü hız sınırları için bkz. Azure OpenAI kotaları ve sınırları.
Hata başvurularını sınırla
Bir sınırı aştığınızda, Aracı Servisi bir hata döndürür. Bu hataları uygulamanızda düzgün bir şekilde işleyin.
| Hata senaryosu | HTTP durumu | Hata kodu | Önerilen eylem |
|---|---|---|---|
| Dosya çok büyük | 400 | file_size_exceeded |
İçeriği daha küçük dosyalara bölme |
| Vektör deposu belirteci sınırı | 400 | token_limit_exceeded |
Dosya içeriğini azaltma veya dosyaları bölme |
| İş parçacığı mesaj üst sınırı | 400 | message_limit_exceeded |
Yeni iş parçacığı oluşturma |
| İleti içeriği çok büyük | 400 | content_size_exceeded |
Büyük içerik için dosya arama kullanma |
| Çok fazla araç | 400 | tool_limit_exceeded |
Kullanılmayan araçları kaldırma |
| Hız sınırı aşıldı | 429 | rate_limit_exceeded |
Üstel geri çekilme uygulayın |
Örneğin:
- Dosya boyutu üst sınırını aşıyor. Dosyanın karşıya yüklenmesi başarısız oldu. karşıya yüklemeden önce içeriği daha küçük dosyalara bölün veya dosya boyutunu küçültün.
- Vektör deposu belirteç sınırı. Bir vektör deposuna dosya ekleme işlemi, dosya belirteç sınırını aşarsa başarısız olur. Dosya içeriğini azaltın veya birden çok dosyaya bölün.
- İleti üst sınırı. bir iş parçacığı ileti sınırına ulaştıktan sonra ileti ekleme işlemi başarısız olabilir. Yeni bir konuşma oturumu için yeni bir iş parçacığı oluşturun veya uygulama tasarımınızın bir parçası olarak iş parçacıklarını arşivleyip döndürün.
- İleti içerik boyutu. İçerik çok büyükse
textileti oluşturma işlemi başarısız olabilir. Daha küçük iletiler gönderin veya büyük içeriği dosyalara taşıyın ve dosya arama özelliğini kullanın. - Araç kayıt sınırı. Çok fazla araç kaydederseniz aracı oluşturma veya güncelleştirme işlemi başarısız olabilir. Yalnızca ihtiyacınız olan araçları kaydedin ve daha az, yeniden kullanılabilir araç tercih edin.
- Hız sınırı aşıldı. Model dağıtımına yapılan API çağrıları kısıtlanmıştır. Rastgelelik içeren üstel geri çekilme uygulayın.
Dosya arama senaryoları için vektör deposu büyümesini yönetme yönergeleri için bkz. Dosya arama için vektör depoları .
Sınırları aşmamak için en iyi yöntemler
Sınırla ilgili hataları azaltmak için aşağıdaki uygulamaları kullanın:
- Dosyaları küçük ve odaklanmış tutun. Tek bir büyük belge yerine birden çok küçük belgeyi tercih edin.
- Çok büyük iletilerden kaçının. Yüklenen dosyalara uzun içerik koyun ve dosya arama kullanarak sorgulayın.
- Uzun konuşmalar planlayın. İş parçacıklarını oturum durumu olarak değerlendirin ve konuşmalar çok uzun hâle geldiğinde yeni iş parçacıklarına geçin.
- Yalnızca gerekli araçları kaydedin. Kullanılmayan araçları aracı tanımlarından kaldırın.
- Kullanım eğilimlerini izleyin. Sınırlara ulaşmadan önce büyümeyi belirlemek için Foundry Aracı Hizmeti ölçümlerini kullanarak aracı etkinliğini izleyin.
Modeller için kotalar ve sınırlar
Ajanlar, kullandıkları model dağıtımları için kotaları ve oran sınırlarını izler.
Geçerli model kotaları ve sınırları için bkz:
Daha fazla model kotası görüntülemek veya istemek için bkz. Microsoft Foundry (Dökümhane projeleri) ile kaynaklar için kotaları yönetme ve artırma.
Sınır artışı isteme
Bu makaledeki sınırlar, Foundry Temsilci Hizmeti için varsayılan değerlerdir. İş yükünüz daha yüksek sınırlar gerektiriyorsa:
- Model kotaları. Model dağıtım kotaları için artış isteyebilirsiniz. Bkz. Microsoft Foundry ile kaynaklar için kotaları yönetme ve artırma.
- Aracı Hizmeti sınırları. Bu makalede listelenen dosya, ileti ve araç sınırları sabit hizmet sınırlarıdır ve artırılamaz. Daha önce açıklanan en iyi yöntemleri kullanarak uygulamanızı bu kısıtlamalar içinde çalışacak şekilde tasarlayın.