Omówienie narzędzia MCP

Ważna

Windows 365 dla agentów jest w publicznej wersji zapoznawczej. Funkcja jest w trakcie aktywnego opracowywania i może ulec zmianie przed ogólną dostępnością.

Windows 365 dla agentów udostępnia możliwości przez dwie uzupełniające się powierzchnie mapowane na cykl życia sesji agenta:

  • Interfejsy API programu Microsoft Graph do administrowania i zarządzania sesjami. Administratorzy IT, twórcy agentów i aplikacje partnerskie używają tych interfejsów API, aby wytrzymywać pojemność i zarządzać nią.
  • Narzędzia protokołu MCP (Model Context Protocol) do operacji w sesji. Agenci sztucznej inteligencji wywołują te narzędzia podczas sesji na żywo. W przypadku udostępniania ekranu aplikacja partnera wywołuje je w imieniu człowieka.

Razem te powierzchnie obejmują aprowizację puli, uzyskiwanie komputera w chmurze, wykonywanie pracy oraz obserwowanie lub pomoc w razie potrzeby.

Po stronie interfejs interfejs Graph API firmy Microsoft płaszczyzna Computer-Create używa interfejs interfejs Graph API W365A i portalu administracyjnego usługi W365. Dzięki tym obszarom administratorzy i niezależni dostawcy oprogramowania mogą:

  • Aprowizowanie pul agentów komputerów w chmurze.
  • Konfigurowanie zasad i obrazów.
  • Rejestrowanie zaufanych rozmówców partnerów.
  • Skalowanie liczby pul.
  • Dołączanie pomiarów za pośrednictwem rozliczeń mac.

Płaszczyzna Computer-Get to mała powierzchnia sterowania środowiska uruchomieniowego dla aplikacji partnerskich:

  • Wywołanie wyewidencjonowania rezerwuje komputer w chmurze i zwraca tożsamość sesji i adresy URL połączeń.
  • Wywołanie checkin zwalnia sesję i zwraca komputer w chmurze do puli.

Wyewidencjonowanie jest idempotentne, więc ponowne próby nie przydzielają zduplikowanych sesji.

Po uzyskaniu komputera w chmurze przez aplikację partnera agenci używają narzędzi MCP do jej obsługi. Te narzędzia są zgodne z otwartym protokołem kontekstowym modelu, dzięki czemu każdy agent obsługjący protokół może odnajdywać i wywoływać narzędzia bez integracji niestandardowej.

Computer-Do jest podstawową płaszczyzną do pracy w sesji. Agent wywołuje zestaw wbudowanych narzędzi do sterowania komputerem w chmurze. Te narzędzia obejmują:

  • Interakcja z pulpitem, w tym przechwytywanie myszy, klawiatury i zrzutu ekranu.
  • Zarządzanie oknami.
  • Wykonywanie polecenia.

Dostępnych lub planowanych jest więcej możliwości automatyzacji przeglądarki i ułatwień dostępu interfejsu użytkownika, które rozszerzają możliwości agenta w ramach sesji.

W przypadku nadzoru nad człowiekiem aplikacja partnera używa Computer-See do obserwowania i opcjonalnego współprowadzenia tej samej sesji komputera w chmurze, z których korzysta agent. Funkcja Screenshare obsługuje uruchamianie i zatrzymywanie udziału w czasie rzeczywistym, przekazywanie kontrolki myszy i klawiatury człowiekowi oraz zwracanie kontroli agentowi.

Przepływ przekierowania multimediów i urządzeń za pośrednictwem stosu pulpitu zdalnego: Azure Virtual Desktop i Remote Desktop Protocol (RDP) z nośnikami IC3. Ten stos zapewnia środowisko wyświetlania i sterowania porównywalne ze standardową sesją pulpitu zdalnego, podczas gdy agent nadal działa w tym samym kontekście sesji.

Powierzchni Płaszczyzny Punkty końcowe Wywoływane przez Celu
interfejs API Graph Computer-Create Portal administracyjny usługi W365A interfejs interfejs Graph API i W365 Administrator IT lub niezależny isv Kształtowanie i utrzymywanie puli.
interfejs API Graph Computer-Get sesje (Wyewidencjonuj) Aplikacja partnerów Zarezerwuj komputer w chmurze.
interfejs API Graph Computer-Get {sessionId} (Checkin) Aplikacja partnerów Zwolnij komputer w chmurze.
MCP Computer-Do MCP Agent sztucznej inteligencji Obsługa komputera w chmurze.
MCP Computer-See, Computer-TakeControl screenshare (Start, Stop, TakeControl, ReleaseControl) Aplikacja partnera w imieniu człowieka Obserwuj i co-drive.

Jak pasują do siebie

Obie powierzchnie działają w sekwencji, z wyraźnym przekazaniem między wywołującymi:

  1. Administratorzy i twórcy agentów używają Computer-Create do aprowizacji puli.
  2. Aplikacja partnerów wywołuje polecenie Checkout on Computer-Get, aby zarezerwować komputer w chmurze dla określonego elementu pracy agenta.
  3. Agent sztucznej inteligencji napędza komputer w chmurze za pośrednictwem narzędzi Windows 365 Computer-Use MCP. Większość wywołań przepływa przez tę płaszczyznę.
  4. W razie potrzeby aplikacja partnera otwiera Computer-See w imieniu człowieka w celu obserwowania lub przejęcia.
  5. Aplikacja partnera wywołuje funkcję Checkin na Computer-Get, aby zwolnić komputer w chmurze po zakończeniu pracy.

Następne kroki