Brama sztucznej inteligencji Unity

Ważna

Ta strona obejmuje nową bramę sztucznej inteligencji (widoczną w lewym okienku nawigacyjnym interfejsu użytkownika), która jest obecnie w wersji beta. Administratorzy kont mogą włączyć dostęp do tej funkcji na stronie podglądów konsoli konta. Zobacz Zarządzanie podglądami Azure Databricks.

Aby uzyskać szczegółowe informacje na temat poprzedniej wersji Unity AI Gateway, zobacz Unity AI Gateway do obsługi endpointów.

Unity AI Gateway to centralna warstwa nadzoru AI w Databricks dla agentów, endpointów LLM, serwerów MCP i agentów kodowania. Użyj bramy AI Unity, aby analizować użycie, konfigurować uprawnienia, wymuszać ograniczenia i zarządzać pojemnością między dostawcami.

LLMs

Unity AI Gateway zapewnia zarządzanie na poziomie przedsiębiorstwa dla punktów końcowych, agentów i narzędzi do kodowania używanych w Twojej organizacji, w tym ujednolicony interfejs użytkownika, lepszą obserwowalność i rozszerzone pokrycie interfejsu API.

Temat Opis
Gateway AI Unity dla agentów i LLM Dowiedz się więcej o usłudze Unity AI Gateway dla agentów i punktów końcowych LLM oraz o tym, jak rozpocząć pracę.
Konfigurowanie punktów końcowych bramy AI Unity Tworzenie i konfigurowanie węzłów Unity AI Gateway dla dużych modeli językowych i agentów do kodowania.
Zapytania do punktów końcowych bramy AI Unity Wysyłanie zapytań do punktów końcowych bramy AI Unity przy użyciu klienta OpenAI i innych obsługiwanych interfejsów API.
Monitorowanie użycia punktów końcowych Bramki AI Unity Monitoruj użycie endpointów Unity AI Gateway za pomocą tabel systemowych.
Monitorowanie kosztów bramy Unity AI Gateway Analizuj koszty usługi Azure Databricks dla punktów końcowych Unity AI Gateway, modeli docelowych, tożsamości i tagów przy użyciu tabeli systemowej rozliczanego użycia oraz pulpitu nawigacyjnego użycia.
Monitorowanie modeli przy użyciu tabel wnioskowania Monitorowanie i audytowanie żądań i odpowiedzi w tabelach Delta w Unity Catalog.
Konfigurowanie limitów tempa dla punktów końcowych Gatewaya AI Unity Wymuszanie limitów użycia na punktach końcowych bramki Unity AI w celu zarządzania pojemnością i kosztami.
Konfigurowanie podziału ruchu dla punktów końcowych Unity AI Gateway Skonfiguruj podział ruchu dla punktów końcowych Unity AI Gateway, aby rozdzielać żądania między wiele backendów modeli.
Integracja z agentami kodowania Integrowanie agentów kodowania, takich jak Cursor, Gemini CLI, Codex CLI i Claude Code z usługą Unity AI Gateway.
Zarządzanie użyciem usługi LLM z poziomu agenta Kierowanie wywołań LLM od agentów utworzonych i wdrożonych w aplikacjach Databricks za pośrednictwem bramy Unity AI.

Uwaga / Notatka

Funkcje usługi Unity AI Gateway nie generują opłat podczas korzystania z wersji beta.

MCPs

Usługa Unity AI Gateway zapewnia zarządzanie dla serwerów MCP, zapewniając widoczność, kontrolę dostępu i rejestrowanie audytów we wszystkich interakcjach MCP.

Temat Opis
Protokół MCP (Model Context Protocol) w usłudze Databricks Dowiedz się więcej na temat typów serwerów MCP w usłudze Databricks i dowiedz się, jak rozpocząć pracę.
Instalowanie zewnętrznego serwera MCP Bezpiecznie nawiąż połączenie z serwerami MCP hostowanymi poza usługą Databricks przy użyciu połączeń zarządzanych.
Hostowanie niestandardowego serwera MCP Hostowanie niestandardowego serwera MCP jako aplikacji usługi Databricks.
Połącz klientów z MCP Databricks Połącz klientów MCP z klientami usługi Databricks.

Modelowanie obsługujących punkty końcowe (poprzednie)

Poprzednia wersja Bramy Sztucznej Inteligencji Unity udostępnia funkcje zarządzania dla punktów końcowych obsługujących modele, w tym zewnętrzne punkty końcowe modelu, punkty końcowe interfejsu API Modelu Foundation i niestandardowe punkty końcowe modelu.

Temat Opis
Brama sztucznej inteligencji Unity do obsługi punktów końcowych Dowiedz się więcej o funkcjach bramy AI Unity do obsługi punktów końcowych, w tym obsługiwane funkcje i ograniczenia.
Konfiguracja bramy Unity AI na końcówkach obsługi modelu Skonfiguruj funkcje bramy AI Unity, takie jak śledzenie użycia, rejestrowanie danych, limity zapytań i mechanizmy ochronne na końcowym punkcie obsługi modelu.
Monitoruj modele udostępniane za pomocą tabel wnioskowania obsługiwanych przez bramę AI Unity Monitoruj serwowane modele za pomocą tabel wnioskowania obsługiwanych przez bramkę AI Unity.