Döküm Aracı Servisi sınırları, kotaları ve bölgesel desteği

Foundry Aracı Servisi, aracı yapıtları, dosya yüklemeleri, iletiler ve araç kayıtları üzerinde kotaları ve sınırları uygular. Bu sınırları anlamak, hizmet sınırlarına erişmeden ölçeklendirilen uygulamalar tasarlamanıza yardımcı olur. Bu makalede varsayılan sınırlar, desteklenen bölgeler, uyumlu modeller ve sınır hatalarını işleme yönergeleri listelenmektedir.

Not

Döküm Aracı Servisi genel kullanıma sunuldu (GA). Barındırılan aracılar gibi bazı alt özellikler genel önizleme aşamasındadır ve farklı kısıtlamalara sahip olabilir.

Önkoşullar

  • Azure aboneliği.
  • A Microsoft Foundry projesi.
  • Aracı Servisi ile uyumlu dağıtılmış bir model. Model ve bölge kullanılabilirliği farklılık gösterebilir.

Desteklenen bölgeler

Foundry aracısı hizmeti, yalnızca Azure OpenAI Yanıtları API'yi destekleyen bölgelerde oluşturulan Foundry projeleri için kullanılabilir. Foundry projenizin Agent Hizmeti'ni kullanmak için bu bölgelerden birinde olması gerekir. Bazı Azure OpenAI modelleri aynı bölgelerde kullanılamayabilir. Ayrıntılar için Azure tarafından satılan Foundry Modelleri için Bölge kullanılabilirliği bölümüne bakın.

Önemli

Tüm araçlar her bölgede kullanılamaz. Örneğin, İtalya Kuzey ve Brezilya Güney'de dosya arama kullanılamaz. Bölgeye göre tam araç matrisi için bkz. Bölgeye ve modele göre araç desteği.

Azure OpenAI modellerine ek olarak, Aracı Hizmeti Foundry model kataloğundaki modelleri destekler. Bu modeller Foundry aracılığıyla dağıtılır ve yönetilir ve ayrı kotaları izler. Temsilcilerinizin kullanması için aşağıdaki modeller mevcuttur.

Azure tarafından satılan Foundry Modeller:

  • MAI-DS-R1: Belirleyici, duyarlık odaklı akıl yürütme.
  • grok-4: Karmaşık, çok adımlı problem çözme için sınır ölçeğinde mantık.
  • grok-4-fast-reasoning: İş akışı otomasyonu için iyileştirilmiş hızlandırılmış aracı mantık.
  • grok-4-fast-non-reasoning: Yüksek aktarım hızı, düşük gecikmeli oluşturma ve sistem yönlendirme.
  • grok-3: Karmaşık, sistem düzeyinde iş akışları için güçlü mantık.
  • grok-3-mini: Etkileşimli, yüksek hacimli kullanım örnekleri için iyileştirilmiş basit model.
  • Llama-3.3-70B-Instruct: Kurumsal Soru-Cevap, karar desteği ve sistem düzenleme için çok yönlü model.
  • Llama-4-Maverick-17B-128E-Instruct-FP8: Hızlı, uygun maliyetli çıkarım sağlayan FP8 için iyileştirilmiş model.
  • DeepSeek-V3-0324: Metin ve görüntüler arasında çokmodal anlayış.
  • DeepSeek-V3.1: Gelişmiş çok modlu mantık ve gerçek dünya tabanlı geri çağırma.
  • DeepSeek-R1-0528: Gelişmiş uzun biçimli ve çok adımlı akıl yürütme.
  • gpt-oss-120b: Saydamlığı ve yeniden üretilebilirliği destekleyen açık ekosistem modeli.

Ipucu

Model kullanılabilirliği zaman içinde değişebilir. Projeniz ve bölgeniz için neleri dağıtabileceğinizi doğrulamak için Dökümhane portalı model deneyimini kullanın.

Sorun giderme

Bölgenizde bir model veya sürüm mevcut değil

  • Dağıtım türünüz (genel standart ve sağlanan) için doğru sekmeyi seçtiğinizden emin olun.
  • Modeli ve Yanıtlar API'sini destekleyen farklı bir bölge deneyin.
  • gpt-5 modellerini kullanıyorsanız kayıt gereklidir. Erişim, Microsoft uygunluk ölçütlerine göre verilir.

Bölgenizde bir araç bulunmuyor.

  • Tüm araçlar her bölgede desteklenmez. Örneğin, İtalya Kuzey ve Brezilya Güney'de dosya arama kullanılamaz ve kod yorumlayıcı tüm bölgelerde kullanılamaz.
  • Dağıtımdan önce kullanılabilirliği onaylamak için bölgeye ve model tablosuna göre araç desteğini denetleyin.
  • Araç kullanılamıyorsa desteklenen bir yer seçin veya farklı bir araç kullanın.

Sağlanan aktarım hızı dağıtımı başarısızlıkla sonuçlanıyor

Ajan hız sınırı (429) hataları alıyor

  • Uygulama yeniden deneme mantığınızda rastgele gecikmelerle üstel gerileme uygulayın.
  • Sürekli yüksek aktarım hızına sahip iş yükleri için sağlanan aktarım hızı dağıtımlarını göz önünde bulundurun.
  • Dağıtımınızın dakika başına belirteçleri ve dakika başına istek üst sınırları için Azure OpenAI kotalarını ve sınırlarını gözden geçirin.

Kotalar ve sınırlar

Döküm Ajan Servisi iki yerde sınırları uygular.

  • Aracı Hizmeti sınırları. Dosya yüklemeleri, vektör deposu ekleri, ileti sayıları ve araç kaydı gibi aracı ve iş parçacığı ile ilgili bileşenler için sınırlar.
  • Model sınırları. Aracılarınızın çağrı yaptığı model dağıtımları için kotalar ve hız sınırları.

İş parçacıkları ve iletiler kullanıyorsanız bkz. Foundry Agent Service'te iş parçacıkları, çalıştırmalar ve iletiler. Dosya araması kullanıyorsanız bkz. Dosya arama için vektör depoları.

Hizmet için varsayılan kotalar ve sınırlar

Aşağıdaki tabloda Aracı Hizmeti tarafından zorunlu kılınan varsayılan sınırlar listelenir. Bu sınırlar, abonelik türüne veya bölgesine bakılmaksızın tüm Dökümhane projeleri için geçerlidir.

Sınır adı Sınır değeri
Aracı/iş parçacığı başına maksimum dosya sayısı 10.000
Aracılar için en büyük dosya boyutu 512MB
Temsilciler için yüklenen tüm dosyaların maksimum boyutu 300 GB
Vektör deposuna ekleme için belirteçlerle ifade edilen en büyük dosya boyutu 2.000.000 belirteç
Konu başına en fazla ileti sayısı 100,000
İleti başına içerik boyutu text üst sınırı 1.500.000 karakter
Aracı başına kaydedilen en fazla araç sayısı 128

Bu tablodaki Aracı Hizmeti sınırları sabittir ve tüm abonelik türlerine aynı şekilde uygulanır. Aracı Hizmeti, API çağrılarına ayrı hız sınırları getirmez. Hız sınırlama, model dağıtım düzeyinde uygulanır. Modele özgü hız sınırları için bkz. Azure OpenAI kotaları ve sınırları.

Hata başvurularını sınırla

Bir sınırı aştığınızda, Aracı Servisi bir hata döndürür. Bu hataları uygulamanızda düzgün bir şekilde işleyin.

Hata senaryosu HTTP durumu Hata kodu Önerilen eylem
Dosya çok büyük 400 file_size_exceeded İçeriği daha küçük dosyalara bölme
Vektör deposu belirteci sınırı 400 token_limit_exceeded Dosya içeriğini azaltma veya dosyaları bölme
İş parçacığı mesaj üst sınırı 400 message_limit_exceeded Yeni iş parçacığı oluşturma
İleti içeriği çok büyük 400 content_size_exceeded Büyük içerik için dosya arama kullanma
Çok fazla araç 400 tool_limit_exceeded Kullanılmayan araçları kaldırma
Hız sınırı aşıldı 429 rate_limit_exceeded Üstel geri çekilme uygulayın

Örneğin:

  • Dosya boyutu üst sınırını aşıyor. Dosyanın karşıya yüklenmesi başarısız oldu. karşıya yüklemeden önce içeriği daha küçük dosyalara bölün veya dosya boyutunu küçültün.
  • Vektör deposu belirteç sınırı. Bir vektör deposuna dosya ekleme işlemi, dosya belirteç sınırını aşarsa başarısız olur. Dosya içeriğini azaltın veya birden çok dosyaya bölün.
  • İleti üst sınırı. bir iş parçacığı ileti sınırına ulaştıktan sonra ileti ekleme işlemi başarısız olabilir. Yeni bir konuşma oturumu için yeni bir iş parçacığı oluşturun veya uygulama tasarımınızın bir parçası olarak iş parçacıklarını arşivleyip döndürün.
  • İleti içerik boyutu. İçerik çok büyükse text ileti oluşturma işlemi başarısız olabilir. Daha küçük iletiler gönderin veya büyük içeriği dosyalara taşıyın ve dosya arama özelliğini kullanın.
  • Araç kayıt sınırı. Çok fazla araç kaydederseniz aracı oluşturma veya güncelleştirme işlemi başarısız olabilir. Yalnızca ihtiyacınız olan araçları kaydedin ve daha az, yeniden kullanılabilir araç tercih edin.
  • Hız sınırı aşıldı. Model dağıtımına yapılan API çağrıları kısıtlanmıştır. Rastgelelik içeren üstel geri çekilme uygulayın.

Dosya arama senaryoları için vektör deposu büyümesini yönetme yönergeleri için bkz. Dosya arama için vektör depoları .

Sınırları aşmamak için en iyi yöntemler

Sınırla ilgili hataları azaltmak için aşağıdaki uygulamaları kullanın:

  • Dosyaları küçük ve odaklanmış tutun. Tek bir büyük belge yerine birden çok küçük belgeyi tercih edin.
  • Çok büyük iletilerden kaçının. Yüklenen dosyalara uzun içerik koyun ve dosya arama kullanarak sorgulayın.
  • Uzun konuşmalar planlayın. İş parçacıklarını oturum durumu olarak değerlendirin ve konuşmalar çok uzun hâle geldiğinde yeni iş parçacıklarına geçin.
  • Yalnızca gerekli araçları kaydedin. Kullanılmayan araçları aracı tanımlarından kaldırın.
  • Kullanım eğilimlerini izleyin. Sınırlara ulaşmadan önce büyümeyi belirlemek için Foundry Aracı Hizmeti ölçümlerini kullanarak aracı etkinliğini izleyin.

Modeller için kotalar ve sınırlar

Ajanlar, kullandıkları model dağıtımları için kotaları ve oran sınırlarını izler.

Geçerli model kotaları ve sınırları için bkz:

Daha fazla model kotası görüntülemek veya istemek için bkz. Microsoft Foundry (Dökümhane projeleri) ile kaynaklar için kotaları yönetme ve artırma.

Sınır artışı isteme

Bu makaledeki sınırlar, Foundry Temsilci Hizmeti için varsayılan değerlerdir. İş yükünüz daha yüksek sınırlar gerektiriyorsa:

  • Model kotaları. Model dağıtım kotaları için artış isteyebilirsiniz. Bkz. Microsoft Foundry ile kaynaklar için kotaları yönetme ve artırma.
  • Aracı Hizmeti sınırları. Bu makalede listelenen dosya, ileti ve araç sınırları sabit hizmet sınırlarıdır ve artırılamaz. Daha önce açıklanan en iyi yöntemleri kullanarak uygulamanızı bu kısıtlamalar içinde çalışacak şekilde tasarlayın.