Aracılığıyla paylaş


AI Gateway uç noktaları kullanımını izleme

Önemli

Bu özellik Beta sürümündedir. Hesap yöneticileri Bu özelliğe erişimi Önizlemeler sayfasından denetleyebilir.

Bu sayfada, kullanım izleme sistemi tablosu kullanılarak AI Gateway (Beta) uç noktaları için kullanımın nasıl izleneceği açıklanır.

Kullanım izleme tablosu, bir uç nokta için istek ve yanıt ayrıntılarını otomatik olarak yakalar ve belirteç kullanımı ile gecikme süresi gibi temel ölçümleri günlüğe kaydeder. Kullanımı izlemek, maliyetleri izlemek ve uç nokta performansı ve tüketimi hakkında içgörüler elde etmek için bu tablodaki verileri kullanabilirsiniz.

Gereksinimler

Kullanım tablosunu sorgulama

AI Gateway, kullanım verilerini sistem tablosuna system.ai_gateway.usage kaydeder. Tabloyu kullanıcı arabiriminde görüntüleyebilir veya Databricks SQL'den veya not defterinden sorgulayabilirsiniz.

Uyarı

Yalnızca hesap yöneticilerinin tabloyu görüntüleme veya sorgulama system.ai_gateway.usage izni vardır.

Tabloyu kullanıcı arabiriminde görüntülemek için uç nokta sayfasındaki kullanım izleme tablosu bağlantısına tıklayarak tabloyu Katalog Gezgini'nde açın.

Databricks SQL'den veya not defterinden tabloyu sorgulamak için:

SELECT * FROM system.ai_gateway.usage;

Yerleşik kullanım panosu

Yerleşik kullanım panosunu içeri aktarma

Hesap yöneticileri, kullanımı izlemek, maliyetleri izlemek ve uç nokta performansı ve tüketimi hakkında içgörüler elde etmek için AI Gateway sayfasındaki Pano Oluştur'a tıklayarak yerleşik bir Yapay Zeka Ağ Geçidi kullanım panosunu içeri aktarabilir. Pano, hesap yöneticisinin izinleriyle yayımlanır ve izleyicilerin yayımcı izinlerini kullanarak sorgu çalıştırmasına olanak tanır. Daha fazla ayrıntı için bkz. Pano yayımlama . Hesap yöneticileri, sonraki tüm sorgular için geçerli olan pano sorgularını çalıştırmak için kullanılan ambarı da güncelleştirebilir.

Panel oluşturma düğmesi

Uyarı

Gösterge Tablosu içeri aktarma işlemi, SELECT tabloda izinler gerektirdiğinden hesap yöneticileri tarafından system.ai_gateway.usage sınırlıdır. Panonun verileri usage tablonun saklama politikalarına tabidir. Bkz. Hangi sistem tabloları kullanılabilir?.

Panoyu en son şablondan yeniden yüklemek için hesap yöneticileri AI Gateway sayfasında Panoyu Yeniden İçeri Aktar'a tıklayabilir. Bu, ambar yapılandırmanızı korurken kontrol panelini şablondaki tüm yeni görselleştirmeler veya iyileştirmelerle güncelleştirir.

Kullanım panosunu görüntüleme

Panoyu görüntülemek için AI Gateway sayfasında Panoyu Görüntüle'ye tıklayın. Yerleşik pano, AI Gateway uç noktası kullanımı ve performansı hakkında kapsamlı görünürlük sağlar. Birden çok sayfa izleme isteği, belirteç tüketimi, gecikme süresi ölçümleri, hata oranları ve kodlama aracısı etkinliğini içerir.

Panoyu görüntüle düğmesi

AI Gateway kullanım panosu

Pano varsayılan olarak çalışma alanları arası analiz sağlar. Tüm pano sayfaları tarih aralığına ve çalışma alanı kimliğine göre filtrelenebilir.

  • Genel bakış sekmesi: Günlük istek hacmi, zaman içindeki belirteç kullanımı eğilimleri, belirteç tüketimine göre en çok kullanılan kullanıcılar ve toplam benzersiz kullanıcı sayısı gibi üst düzey kullanım ölçümlerini gösterir. Genel AI Gateway etkinliğinin hızlı bir anlık görüntüsünü almak ve en etkin kullanıcıları ve modelleri belirlemek için bu sekmeyi kullanın.
  • Performans sekmesi: Gecikme yüzdebirlik dilimleri (P50, P90, P95, P99), ilk bayt süresi, hata oranları ve HTTP durum kodu dağıtımları gibi önemli performans ölçümlerini izler. Uç nokta durumunu izlemek ve performans sorunlarını veya güvenilirlik sorunlarını belirlemek için bu sekmeyi kullanın.
  • Kullanım sekmesi: Uç nokta, çalışma alanı ve istek sahibine göre ayrıntılı tüketim dökümlerini gösterir. Bu sekmede maliyetleri analiz etmeye ve iyileştirmeye yardımcı olmak için belirteç kullanım düzenleri, istek dağıtımları ve önbellek isabet oranları gösterilir.
  • Kodlama Aracıları sekmesi: İmleç, Claude Code, Gemini CLI ve Codex CLI gibi tümleşik kodlama aracılarının etkinliğini izler. Bu sekmede etkin günler, kodlama oturumları, işlemeler ve geliştirici aracı kullanımını izlemek için eklenen veya kaldırılan kod satırları gibi ölçümler gösterilir. Daha fazla ayrıntı için Kodlama aracı gösterge paneli'ne bakın.

Kullanım tablosu şeması

Tabloda system.ai_gateway.usage aşağıdaki şema vardır:

Sütun adı Türü Description Example
account_id STRING Hesap kimliği. 11d77e21-5e05-4196-af72-423257f74974
workspace_id STRING Çalışma alanı kimliği. 1653573648247579
request_id STRING İstek için benzersiz bir tanımlayıcı. b4a47a30-0e18-4ae3-9a7f-29bcb07e0f00
schema_version INTEGER Kullanım kaydının şema sürümü. 1
endpoint_id STRING AI Gateway uç noktasının benzersiz kimliği. 43addf89-d802-3ca2-bd54-fe4d2a60d58a
endpoint_name STRING AI Gateway uç noktasının adı. databricks-gpt-5-2
endpoint_tags MAP Uç noktayla ilişkilendirilmiş etiketler. {"team": "engineering"}
endpoint_metadata Yapı Uç nokta metaverileri, creator, creation_time, last_updated_time, destinations, inference_table ve fallbacks dahil olmak üzere. {"creator": "user.name@email.com", "creation_time": "2026-01-06T12:00:00.000Z", ...}
event_time TIMESTAMP İsteğin alındığı zaman damgası. 2026-01-20T19:48:08.000+00:00
latency_ms LONG Milisaniye cinsinden toplam gecikme süresi. 300
time_to_first_byte_ms LONG İlk bayta ulaşma süresi, milisaniye cinsinden. 300
destination_type STRING Hedef türü (örneğin, dış model veya temel model). PAY_PER_TOKEN_FOUNDATION_MODEL
destination_name STRING Hedef modelin veya sağlayıcının adı. databricks-gpt-5-2
destination_id STRING Hedefin benzersiz kimliği. 507e7456151b3cc89e05ff48161efb87
destination_model STRING İstek için kullanılan belirli model. GPT-5.2
requester STRING İsteği yapan kullanıcı veya hizmet sorumlusunun kimliği. user.name@email.com
requester_type STRING İstek sahibinin türü (kullanıcı, hizmet sorumlusu veya kullanıcı grubu). USER
ip_address STRING İstekte bulunanın IP adresi. 1.2.3.4
url STRING İsteğin URL'si. https://<ai-gateway-url>/mlflow/v1/chat/completions
user_agent STRING İstekte bulunanın kullanıcı aracısı. OpenAI/Python 2.13.0
api_type STRING API çağrısının türü (örneğin, sohbet, tamamlamalar veya eklemeler). mlflow/v1/chat/completions
request_tags MAP İstekle ilişkili etiketler. {"team": "engineering"}
input_tokens LONG Giriş belirteçlerinin sayısı. 100
output_tokens LONG Çıkış belirteçlerinin sayısı. 100
total_tokens LONG Toplam belirteç sayısı (giriş + çıkış). 200
token_details Yapı Ayrıntılı belirteç dökümü, cache_read_input_tokens, cache_creation_input_tokens ve output_reasoning_tokens dahil. {"cache_read_input_tokens": 100, ...}
response_content_type STRING Yanıtın içerik türü. application/json
status_code INT Yanıtın HTTP durum kodu. 200
routing_information Yapı Geri dönüş girişimleri için yönlendirme ayrıntıları. İstek sırasında denenen her model için attempts, priority, action, destination, destination_id, status_code, error_code, latency_ms, start_time ve end_time içeren bir dizi içerir. {"attempts": [{"priority": "1", ...}]}

Sonraki Adımlar