Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Önemli
Bu özellik Beta sürümündedir. Hesap yöneticileri Bu özelliğe erişimi Önizlemeler sayfasından denetleyebilir.
Bu sayfada, kullanım izleme sistemi tablosu kullanılarak AI Gateway (Beta) uç noktaları için kullanımın nasıl izleneceği açıklanır.
Kullanım izleme tablosu, bir uç nokta için istek ve yanıt ayrıntılarını otomatik olarak yakalar ve belirteç kullanımı ile gecikme süresi gibi temel ölçümleri günlüğe kaydeder. Kullanımı izlemek, maliyetleri izlemek ve uç nokta performansı ve tüketimi hakkında içgörüler elde etmek için bu tablodaki verileri kullanabilirsiniz.
Gereksinimler
- AI Gateway (Beta) önizlemesi hesabınız için etkinleştirildi.
- AI Gateway (Beta) tarafından desteklenen bir bölgede Azure Databricks çalışma alanı.
- Çalışma alanınız için Unity Kataloğu etkinleştirildi. Bkz. Unity Kataloğu için bir çalışma alanını etkinleştirme.
Kullanım tablosunu sorgulama
AI Gateway, kullanım verilerini sistem tablosuna system.ai_gateway.usage kaydeder. Tabloyu kullanıcı arabiriminde görüntüleyebilir veya Databricks SQL'den veya not defterinden sorgulayabilirsiniz.
Uyarı
Yalnızca hesap yöneticilerinin tabloyu görüntüleme veya sorgulama system.ai_gateway.usage izni vardır.
Tabloyu kullanıcı arabiriminde görüntülemek için uç nokta sayfasındaki kullanım izleme tablosu bağlantısına tıklayarak tabloyu Katalog Gezgini'nde açın.
Databricks SQL'den veya not defterinden tabloyu sorgulamak için:
SELECT * FROM system.ai_gateway.usage;
Yerleşik kullanım panosu
Yerleşik kullanım panosunu içeri aktarma
Hesap yöneticileri, kullanımı izlemek, maliyetleri izlemek ve uç nokta performansı ve tüketimi hakkında içgörüler elde etmek için AI Gateway sayfasındaki Pano Oluştur'a tıklayarak yerleşik bir Yapay Zeka Ağ Geçidi kullanım panosunu içeri aktarabilir. Pano, hesap yöneticisinin izinleriyle yayımlanır ve izleyicilerin yayımcı izinlerini kullanarak sorgu çalıştırmasına olanak tanır. Daha fazla ayrıntı için bkz. Pano yayımlama . Hesap yöneticileri, sonraki tüm sorgular için geçerli olan pano sorgularını çalıştırmak için kullanılan ambarı da güncelleştirebilir.
Uyarı
Gösterge Tablosu içeri aktarma işlemi, SELECT tabloda izinler gerektirdiğinden hesap yöneticileri tarafından system.ai_gateway.usage sınırlıdır. Panonun verileri usage tablonun saklama politikalarına tabidir. Bkz. Hangi sistem tabloları kullanılabilir?.
Panoyu en son şablondan yeniden yüklemek için hesap yöneticileri AI Gateway sayfasında Panoyu Yeniden İçeri Aktar'a tıklayabilir. Bu, ambar yapılandırmanızı korurken kontrol panelini şablondaki tüm yeni görselleştirmeler veya iyileştirmelerle güncelleştirir.
Kullanım panosunu görüntüleme
Panoyu görüntülemek için AI Gateway sayfasında Panoyu Görüntüle'ye tıklayın. Yerleşik pano, AI Gateway uç noktası kullanımı ve performansı hakkında kapsamlı görünürlük sağlar. Birden çok sayfa izleme isteği, belirteç tüketimi, gecikme süresi ölçümleri, hata oranları ve kodlama aracısı etkinliğini içerir.
Pano varsayılan olarak çalışma alanları arası analiz sağlar. Tüm pano sayfaları tarih aralığına ve çalışma alanı kimliğine göre filtrelenebilir.
- Genel bakış sekmesi: Günlük istek hacmi, zaman içindeki belirteç kullanımı eğilimleri, belirteç tüketimine göre en çok kullanılan kullanıcılar ve toplam benzersiz kullanıcı sayısı gibi üst düzey kullanım ölçümlerini gösterir. Genel AI Gateway etkinliğinin hızlı bir anlık görüntüsünü almak ve en etkin kullanıcıları ve modelleri belirlemek için bu sekmeyi kullanın.
- Performans sekmesi: Gecikme yüzdebirlik dilimleri (P50, P90, P95, P99), ilk bayt süresi, hata oranları ve HTTP durum kodu dağıtımları gibi önemli performans ölçümlerini izler. Uç nokta durumunu izlemek ve performans sorunlarını veya güvenilirlik sorunlarını belirlemek için bu sekmeyi kullanın.
- Kullanım sekmesi: Uç nokta, çalışma alanı ve istek sahibine göre ayrıntılı tüketim dökümlerini gösterir. Bu sekmede maliyetleri analiz etmeye ve iyileştirmeye yardımcı olmak için belirteç kullanım düzenleri, istek dağıtımları ve önbellek isabet oranları gösterilir.
- Kodlama Aracıları sekmesi: İmleç, Claude Code, Gemini CLI ve Codex CLI gibi tümleşik kodlama aracılarının etkinliğini izler. Bu sekmede etkin günler, kodlama oturumları, işlemeler ve geliştirici aracı kullanımını izlemek için eklenen veya kaldırılan kod satırları gibi ölçümler gösterilir. Daha fazla ayrıntı için Kodlama aracı gösterge paneli'ne bakın.
Kullanım tablosu şeması
Tabloda system.ai_gateway.usage aşağıdaki şema vardır:
| Sütun adı | Türü | Description | Example |
|---|---|---|---|
account_id |
STRING | Hesap kimliği. | 11d77e21-5e05-4196-af72-423257f74974 |
workspace_id |
STRING | Çalışma alanı kimliği. | 1653573648247579 |
request_id |
STRING | İstek için benzersiz bir tanımlayıcı. | b4a47a30-0e18-4ae3-9a7f-29bcb07e0f00 |
schema_version |
INTEGER | Kullanım kaydının şema sürümü. | 1 |
endpoint_id |
STRING | AI Gateway uç noktasının benzersiz kimliği. | 43addf89-d802-3ca2-bd54-fe4d2a60d58a |
endpoint_name |
STRING | AI Gateway uç noktasının adı. | databricks-gpt-5-2 |
endpoint_tags |
MAP | Uç noktayla ilişkilendirilmiş etiketler. | {"team": "engineering"} |
endpoint_metadata |
Yapı | Uç nokta metaverileri, creator, creation_time, last_updated_time, destinations, inference_table ve fallbacks dahil olmak üzere. |
{"creator": "user.name@email.com", "creation_time": "2026-01-06T12:00:00.000Z", ...} |
event_time |
TIMESTAMP | İsteğin alındığı zaman damgası. | 2026-01-20T19:48:08.000+00:00 |
latency_ms |
LONG | Milisaniye cinsinden toplam gecikme süresi. | 300 |
time_to_first_byte_ms |
LONG | İlk bayta ulaşma süresi, milisaniye cinsinden. | 300 |
destination_type |
STRING | Hedef türü (örneğin, dış model veya temel model). | PAY_PER_TOKEN_FOUNDATION_MODEL |
destination_name |
STRING | Hedef modelin veya sağlayıcının adı. | databricks-gpt-5-2 |
destination_id |
STRING | Hedefin benzersiz kimliği. | 507e7456151b3cc89e05ff48161efb87 |
destination_model |
STRING | İstek için kullanılan belirli model. | GPT-5.2 |
requester |
STRING | İsteği yapan kullanıcı veya hizmet sorumlusunun kimliği. | user.name@email.com |
requester_type |
STRING | İstek sahibinin türü (kullanıcı, hizmet sorumlusu veya kullanıcı grubu). | USER |
ip_address |
STRING | İstekte bulunanın IP adresi. | 1.2.3.4 |
url |
STRING | İsteğin URL'si. | https://<ai-gateway-url>/mlflow/v1/chat/completions |
user_agent |
STRING | İstekte bulunanın kullanıcı aracısı. | OpenAI/Python 2.13.0 |
api_type |
STRING | API çağrısının türü (örneğin, sohbet, tamamlamalar veya eklemeler). | mlflow/v1/chat/completions |
request_tags |
MAP | İstekle ilişkili etiketler. | {"team": "engineering"} |
input_tokens |
LONG | Giriş belirteçlerinin sayısı. | 100 |
output_tokens |
LONG | Çıkış belirteçlerinin sayısı. | 100 |
total_tokens |
LONG | Toplam belirteç sayısı (giriş + çıkış). | 200 |
token_details |
Yapı | Ayrıntılı belirteç dökümü, cache_read_input_tokens, cache_creation_input_tokens ve output_reasoning_tokens dahil. |
{"cache_read_input_tokens": 100, ...} |
response_content_type |
STRING | Yanıtın içerik türü. | application/json |
status_code |
INT | Yanıtın HTTP durum kodu. | 200 |
routing_information |
Yapı |
Geri dönüş girişimleri için yönlendirme ayrıntıları. İstek sırasında denenen her model için attempts, priority, action, destination, destination_id, status_code, error_code, latency_ms, start_time ve end_time içeren bir dizi içerir. |
{"attempts": [{"priority": "1", ...}]} |