Windows 365 for Agents MCP sunucu referansı (önizleme)

Important

  • Bu bir önizleme özelliğidir.
  • Önizleme özellikleri, üretimde kullanıma yönelik değildir ve sınırlı işlevselliğe sahip olabilir. Bu özellikler, ek kullanım koşullarına tabidir ve resmi sürümden önce kullanılabilir, böylece müşteriler erken erişim elde edebilir ve geri bildirim sağlayabilir.

Windows 365 for Agents, Windows 365 bulut PC'nin tam operasyonel kontrolü için bir MCP sunucusudur. Bu MCP sunucusunu masaüstü etkileşimi (fare, klavye, ekran yakalama, komut yürütme), Microsoft Edge üzerinden tarayıcı otomasyonu ve Windows UI Otomasyonu üzerinden anlamsal arayüz incelemesi yoluyla gerçek bir Windows ortamı sürmek için kullanın.

Note

  • Microsoft MCP sunucularının önceki sürümlerini kullanan mevcut bağlantılar desteklenmeye devam ediyor.
  • Tüm yeni bağlantılar için, masaüstü, tarayıcı ve erişilebilirlik yetenekleri arasında araçları açığa çıkaran en son Windows 365 Agents MCP sunucusunu kullanın.
  • Tarayıcı otomasyonu Microsoft Edge üzerinde çalışır. Edge, ilk tarayıcı araç çağrısında otomatik olarak açılıyor. focus_browser Chrome veya Firefox'u da hedefleyebilir, ancak DOM düzeyindeki tarayıcı araçları yalnızca Edge örneğinde çalışır.

Ajanlar için Windows 365 hakkında daha fazla bilgi edinmek için Windows 365 for Agents documentation sayfasına bakınız.

Overview

Server ID Display name Description
mcp_W365AServer Windows 365 for Agents MCP sunucusu Windows 365 bulut PC'nin tam operasyonel kontrolü, masaüstü etkileşimi, tarayıcı otomasyonu ve kullanıcı arayüzü denetimi dahil.

Available tools

mcp_desktop_move_mouse

İmleci ekran pozisyonuna getirin. Varış noktasına tıklamayı planlıyorsanız kullanın mcp_desktop_click .  Required parameters:

  • x: X koordinatı ekran piksellerinde
  • y: Y koordinatı ekran piksellerinde

mcp_desktop_click

Koordinatlar atlıysa bir konuma veya mevcut imleç konumuna tıklayın. Tek tıklama, çift tıklama ve tüm beş fare düğmesini destekler. 

Optional parameters:

  • x: X koordinatı ekran piksellerinde (mevcut konum hariç tutuluyor)

  • y: Y koordinatı ekran piksellerinde (mevcut konum çıkarıldı)

  • button: Sol, Sağ, Orta, İleri veya Geri (varsayılan Sol)

  • clickCount: 1 = tek tıklama, 2 = çift tıklama (varsayılan 1)

mcp_desktop_get_cursor_position

Mevcut imleç koordinatlarını döndür. No parameters. {cursorX, cursorY} döner.

mcp_desktop_drag_mouse

Bir pozisyondan diğerine sürükleyin. Nesneleri hareket ettirmek, pencerelerin boyutunu değiştirmek veya piksel hassasiyetinde kaydırmak için faydalı. Required parameters:

  • startX: X koordinatını başlat.
  • startY: Y koordinatını başlat.
  • endX: X koordinatını sona erdir.
  • endY: Y sonu koordinat. Optional parameters:
  • button: Sol, Sağ veya Orta (varsayılan olarak Sol)

mcp_desktop_scroll

Bir konumda çentik birimleri kullanarak (piksel değil) kaydırın. Üç çentik yaklaşık bir sayfa demek. 

Required parameters:

  • x: Scroll pozisyonu X

  • y: Scroll pozisyonu Y

Optional parameters:

  • deltaX: Yatay çentikler, pozitif = sağ (varsayılan 0)
  • deltaY: Dikey çentikler, pozitif = aşağı (varsayılan 0)

Note

Değerler aralığına sıkıştırılır [-20, 20]. 

mcp_desktop_type_text

Klavye simülasyonu ile metin yazın. Klavye kısayolları mcp_desktop_press_keysiçin . Web form alanları mcp_browser_typeiçin . 

Required parameters:

  • text: Metin yazılacak

mcp_desktop_press_keys

Aynı anda bir tuş kombinasyonuna basın. Modifikatör tuşları, fonksiyon tuşları ve standart tuşları destekler. 

Required parameters:

  • keys: Birlikte basılması gereken anahtar isimlerinin dizisi (örneğin, \["ctrl","c"\], \["alt","tab"\], \["ctrl","shift","s"\])

mcp_desktop_take_screenshot

Tam ekranı veya kırpılmış bir bölgeyi PNG görüntüsü olarak (base64 kodlu) yakalayın 

Optional parameters:

  • x: Kırım bölgesi sol kenar
  • y: Crop bölgesi üst kenarı
  • width: Ekin bölgesi genişliği
  • height: Ürün bölgesi yüksekliği

Note

Tüm dört kırpma parametresini birlikte ekleyin ya da tam ekran yakalama için hepsini çıkarın. 

mcp_desktop_analyze_screen

Tüm ekranda OCR yapın. No parameters. {fullText, averageConfidence, boxes[{text, confidence, x, y, width, height}], width, height} döndürür.

mcp_desktop_get_screen_size

Ekran çözünürlüğünü geri ver. No parameters. {width, height} döndürür.

mcp_desktop_list_windows

Tüm görünür pencereleri başlıkları, konumları ve boyutlarıyla birlikte listeleyin. No parameters. Bir diziyi döndürür {title, processName, handle, x, y, width, height}.

mcp_desktop_activate_window

Belirsiz bir unvan maçı kullanarak bir pencereyi ön plana çıkar.

Required parameters:

  • titlePattern: Kısmi pencere başlığı (kibe duyarsız alt dizi)

mcp_desktop_focus_browser

Bir tarayıcı penceresine (Edge, Chrome veya Firefox) odaklanın, isteğe bağlı olarak URL veya başlığa göre filtrelenir.

Optional parameters:

  • pattern: URL veya başlık alt dizisi eşleşmesi (herhangi bir tarayıcı penceresi için çıkarılma)

mcp_desktop_close_window

Bir pencereyi bulanık bir unvan maçıyla zarifçe kapatın. Sistem açısından kritik süreçler korunur ve kapatılamaz.

Required parameters:

  • titlePattern: Kısmi pencere başlığı (maç eşiği 80%). {matchedTitle, processName, closed} döndürür.

mcp_desktop_execute_shell_command

Sandbox ortamında shell komutu çalıştırın. Komutlar izin listesine göre doğrulanır ve tehlikeli kalıplar engellenir.

Required parameters:

  • command: Komut çalıştır

Optional parameters:

  • cwd: Çalışma dizini
  • timeoutMs: Zaman aşımı milisaniye cinsinden (varsayılan 30000, maksimum 30000)

Note

  • İzin verilen komutlar: git, npm, dotnet, python, cargo, node, pip, dir, mkdir, del, copy, move, robocopy, findstr, where, ve type.
  • Bloklanan desenler arasında kabuk metakarakterleri (|, ;, &, <, >), ortam değişken genişletme (%VAR%), yorumcu değerlendirme bayrakları (python -c veya node -e), git config --global, npm -g, , yol önekli yürütülebilirler, rm -rf, sudo, ve disk/sistem komutları bulunur.
  • stdout ve stderr her biri 32 KB olarak kısaltılmıştır. Keyfi hesaplama için kullanım mcp_desktop_execute_python_code . {stdout, stderr, exitCode, success, timedOut, resourceLimitsApplied} döndürür.

mcp_desktop_execute_python_code

Python kodunu kaynak sınırları olan sandbox ortamında çalıştırın. Veri işleme, hesaplamalar, dosya giriş/çıkış ve basit kabuk komutlarının ötesine geçen herhangi bir hesaplama için idealdir.

Required parameters:

  • code: Python kod (maksimum 262.144 karakter).

Optional parameters:

  • cwd: Çalışma dizini
  • timeoutMs: Zaman aşımı milisaniye cinsinden (varsayılan 30000, maksimum 30000).

Aynı şemayı döndürür mcp_desktop_execute_shell_command

mcp_desktop_wait_milliseconds

Animasyonların veya geçişlerin tamamlanması için uygulamayı durdurun. Anket döngülerinde kullanmayın—DOM anketi için kullanın mcp_browser_wait_for

Required parameters:

  • ms: Bekleme süresi milisaniye cinsinden ([0, 5000]'e sıkıştırılmış)

mcp_browser_navigate

Bir URL'ye gidin ve sayfanın yüklenmesini bekleyin. 

Required parameters:

  • url: Protokol dahil tam URL (örneğin, https://example.com)

mcp_browser_back

Tarayıcı geçmişine geri dön. No parameters.

mcp_browser_forward

Tarayıcı geçmişinde ilerleyin. No parameters.

mcp_browser_reload

Mevcut sayfayı yeniden yükleyin. No parameters.

mcp_browser_get_url

Mevcut sayfa URL'sini düz bir dizi olarak döndür. No parameters.

mcp_browser_get_title

Mevcut sayfa başlığını düz bir dizi olarak geri döndür. No parameters.

mcp_browser_get_text

Görünür sayfa metin içeriğini sade bir dizi olarak geri gönderin. No parameters. 512 KB'ye kısaltılmıştır.

mcp_browser_get_html

Tam sayfa HTML kaynağını sade bir dizi olarak geri döndür. No parameters. 512 KB'ye kısaltılmıştır.

mcp_browser_click

CSS seçicisi tarafından bir DOM öğesine tıklayın. Web içeriği için koordinat tabanlı tıklamalardan daha güvenilir.

Required parameters:

  • seçici: CSS seçici (örneğin, #submit-btn veya a.nav-link)

mcp_browser_type

CSS seçicisi ile form elemanına metin yazın.

Required parameters:

  • selector: CSS giriş elemanının seçicisi.
  • text: Metin yazılacak

mcp_browser_query_text

İlk elemanın metin içeriğini bir CSS seçiciyle eşleştirin.

Required parameters:

  • selector: CSS seçici

mcp_browser_wait_for

Bir DOM unsurunun ortaya çıkmasını bekleyin. Asenkron olarak yüklenen dinamik içerik için faydalı.

Required parameters:

  • selector: CSS seçici beklemek için

Optional parameters:

  • timeoutMs: Zaman aşımı milisaniye cinsinden (varsayılan 5000, maksimum 30000)

mcp_browser_eval_js

Sayfa bağlamında bir JavaScript ifadeyi değerlendirin ve sonucu bir dizi olarak döndürün.

Required parameters:

  • expression: JavaScript bir diziyi döndüren ifade.

Note

Eğer ifadeniz bir nesne veya sayı döndürüyorsa, onu açıkça bir diziye dönüştürün (örneğin, JSON.stringify(obj) veya .toString()).

mcp_browser_list_tabs

Açık olan tüm sekmeleri onların ve URL'leriyle index, title, listeleyin. No parameters. Bir diziyi döndürür {index, title, url}.

mcp_browser_switch_tab

Indeks bazında sekmeye geç.

Required parameters:

  • tabIndex: 0 tabanlı sekme indeksi

mcp_browser_new_tab

Yeni bir sekme açın, isteğe bağlı olarak bir URL'ye yönlendirin.

Optional parameters:

  • url: Açılacak URL (eksik boş sekme)

{index, title, url} döndürür.

mcp_browser_close_tab

Bir sekmeyi indeksle kapatın.

Required parameters:

  • tabIndex: 0 tabanlı sekme indeksi

mcp_browser_screenshot

Sadece tarayıcı görünümünün PNG ekran görüntüsünü (tam ekranı değil) yakalayın (tam ekran değil). No parameters. Base64 kodlu bir PNG döndürüyor.

mcp_accessibility_get_accessibility_tree

Ön plan penceresi için arayüz öğe ağacını alın. Her unsur kendi rolü, ismi, değeri ve ekran koordinatlarını içerir.

Optional parameters:

  • maxDepth: Maksimum ağaç geçiş derinliği, 1-10 (varsayılan 3)
  • maxElements: Geri dönecek maksimum eleman, 1-2000 (varsayılan 500)

{rol, isim, değer, x, y, genişlik, yükseklik, çocuklar[...]} hiyerarşik bir ağac döndürür.

mcp_accessibility_find_ui_element

Arayüz öğelerini metin içeriği, erişilebilirlik rolü veya isme (küçük harfe duyarsız alt dizi) göre arayın. Eşleşen öğeleri tıklanabilir ekran koordinatlarıyla döndürür.

Optional parameters:

  • text: Arama metni (isim atlıyorsanız isim olarak kullanılır)
  • role: Arayüz rol filtresi — Button, TextBox, CheckBox, MenuItem, ComboBox, , ve daha fazlası
  • name: Erişilebilir isim (her ikisi de sağlandığında metin üzerinde önceliklidir)
  • windowHandle: Hedef pencere kolu (null = ön plan penceresi)

Note

En az bir metin, rol veya isim belirtilmelidir. Bir diziyi döndürür {role, name, value, x, y, width, height}.

Key features

Desktop interaction

  • Tıklama, çift tıklama, sağ tıklama ve beş düğmeli fare kontrolü.
  • Piksel hassasiyetinde sürükle ve bırak.
  • Çentik tabanlı kaydırma (üç çentik ≈ bir sayfa).
  • Klavye yazısı ve çoklu tuşlu kısayol kombinasyonları.
  • İmleç konum takibi.
  • Ekran çözünürlüğü algılama.

Ekran yakalama ve analiz

  • Tam ekran veya kırpılmış PNG ekran görüntüleri.
  • Bölge başına güven puanları ve sıçrayış kutularıyla tam ekranın OCR'si.
  • Web içeriği için sadece tarayıcı görünümlü ekran görüntüleri.

Window management

  • Tüm görünür pencereleri konum ve boyutlarla sayın.
  • Pencereleri bulanık başlık eşleşmesiyle etkinleştir.
  • Focus tarayıcı pencereleri (Edge, Chrome, Firefox) isteğe bağlı olarak URL veya başlığa göre filtrelenir.
  • Sistem kritik süreçler için koruma ile zarif pencere kapanışı.

Command execution

  • Sandbox kabuk komutları ve izin listesi (git, npm, dotnet, python, cargo, node, pip, dir, mkdir, del, copy, move, robocopy, findstr, where, type).
  • Sandbox Python 262.144 karaktere kadar kod çalıştırmayı sağlar.
  • Çalışma dizini ve arama başına zaman aşımına bağlı kontrol (maksimum 30 saniye).
  • Kaynak sınırları ve shell metakarakterlerine, değerlendirme bayraklarına, ayrıcalık artışına ve yıkıcı operasyonlara karşı güçlendirilmiş engelleme listesi.

Browser automation

  • Navigasyon, geri, ileri, yeniden yükleme.
  • SayfaURL, başlık, görünür metin (512 KB cap) ve tam HTML (512 KB cap) okuyun.
  • CSS seçicisi tarafından DOM seviyesinde tıklama, yazı ve metin sorgusu.
  • Ayarlanabilir zaman aşımına sahip dinamik öğeleri bekleyin.
  • Sayfa bağlamında ifade değerlendirmelerini JavaScript yapın.
  • Çok sekmeli yönetim: listele, değiştir, aç, kapat.
  • Microsoft Edge'de çalışıyor, ilk kullanımda otomatik olarak açılıyor.

UI accessibility

  • Ön plan penceresi için yapılandırılabilir derinlik ve eleman sayısı olan Windows UI Otomasyonu tree'yi alın.
  • Kullanıcı arayüzü öğelerini metin, rol veya erişilebilir isim ile bul.
  • Düğmelerin, metin kutularının, kontrol kutularının, menü öğelerinin ve kombo kutularının hassas hedeflenmesi için tıklanabilir ekran koordinatlarını döndürüyor.

Zamanlama ve senkronizasyon

  • Kısa tek atışlık duraklamalar mcp_desktop_wait_milliseconds (en fazla beş saniye).
  • DOM düzeyinde anket ( mcp_browser_wait_for maksimum 30 saniye) ile yapılır.

Notes

  • Tüm koordinatlar ekran pikselleri içinde yer alır ve (0,0) sol üst köşede yer alır. , mcp_desktop_analyze_screen, mcp_accessibility_find_ui_element, ve mcp_desktop_list_windows koordinatları mcp_desktop_take_screenshotaynı koordinat uzayını paylaşır.
  • Bir imleç güvenlik sistemi aktiftir: İmleç herhangi bir ekran köşesine beş piksel mesafede hareket ederse, fare işlemleri iptal edilir. Ekranın en uç kenarlarını hedeflemekten kaçının.
  • Shell boru operatörleri (|), nokta virgül (;)), ampersandlar (&) ve çıkış yönlendirmesi (>, <) engellenmiştir. Komut çıktısını dönüştürmek için onu yakalayın ve işleyin.mcp_desktop_execute_python_code
  • Eğer yorumcu değerlendirme bayrakları engellenmişse veya python -c "..." ve node -e "..." reddedilirse, mcp_desktop_execute_python_code kodunu Python kod için kullanabilir veya önce bir dosyaya kod yazabilirsiniz.
  • Komut stdout/stderr her biri 32 KB olarak kısaltılmıştır. Ayrıntılı çıktıyı sınırlamak için bayraklar kullanın (örneğin, git log --oneline -20) veya bir dosyaya yönlendirip ayrı ayrı okuyun.
  • Ve için mcp_desktop_execute_shell_commandmcp_desktop_execute_python_code maksimum zaman aşımı, 30 saniyedir. Daha uzun çalışmalar için daha küçük adımlara böl veya Python'dan arka plan süreci başlatıp anket yap.
  • Özel bir dosya okuma/yazma aracı yok. type komutunu kullanarak mcp_desktop_execute_shell_command ile dosyaları okumak; Python'nin yerleşik dosya giriş/çıkışını kullanarak mcp_desktop_execute_python_code ile dosya yazmak. Kabuk çıkış yönlendirmesi (>, >>) engellenmiştir.
  • mcp_browser_eval_js Her zaman bir ip döndürür. Nesneleri veya sayıları geri dönmeden önce açıkça dönüştürün.
  • Tarayıcı DOM araçları (mcp_browser_click, mcp_browser_type, mcp_browser_eval_js vb.) yalnızca Microsoft Edge örneğinde çalışır.  mcp_desktop_focus_browser Chrome veya Firefox pencerelerine odaklanabilir, ancak DOM araçları onları hedef almıyor.
  • mcp_desktop_take_screenshot tam ekran görüntüsü için dört kırpma parametresinin (x, y, genişlik, yükseklik) birlikte olmasını veya hiç yapılmamasını gerektirir.
  • mcp_desktop_scroll Piksel değil, çentik birimleri ([-20, 20]'ye sıkıştırılmış) kullanır. Üç çentik yaklaşık bir sayfa demek.
  • mcp_accessibility_find_ui_element en az bir metin, rol veya isim gerektirir. Hem metin hem de isim sağlandığında, isim öncelikli olur.

Yaygın kullanım örnekleri

Bir web formu doldurun

  • Hedef sayfayı açmak için ara mcp_browser_navigate .
  • Formun yüklenmesini beklemek için arayın mcp_browser_wait_for .
  • Her alanı doldurmak için CSS seçicisi tarafından çağırış mcp_browser_type .
  • Formu göndermek için arayın mcp_browser_click .
  • Onay unsurunu beklemek için ara mcp_browser_wait_for .
  • Sonucu okumak ve doğrulamak için arayın mcp_browser_get_text .

Masaüstü uygulamasını otomatikleştirin

  • Başvuruyu ön plana çıkarmak için ara mcp_desktop_activate_window .
  • Mevcut durumu yakalamak için çağrı mcp_desktop_take_screenshot .
  • İsme göre bir düğme veya alanı bulmak için ara mcp_accessibility_find_ui_element .
  • Elementin bildirilen koordinatlarını çağırın mcp_desktop_click .
  • Veri girmek için ara mcp_desktop_type_text .
  • Kestirmeler mcp_desktop_press_keys çağırın (örneğin, kaydetmek için ["ctrl","s"] gibi).
  • Sonucu doğrulamak için arayın mcp_desktop_take_screenshot .

Bir web sayfasından veri çıkarın

  • Sayfayı açmak için ara mcp_browser_navigate .
  • Görünür metin içeriğini çıkarmak için ara mcp_browser_get_text .
  • Çıkarılan verileri ayrıştırmak ve işlemek için arama mcp_desktop_execute_python_code yapın.
  • Metin çıkarma yeterli olmadığında JavaScript üzerinden belirli değerleri sorgulamak için çağrı mcp_browser_eval_js .

Geliştirme görevlerini çalıştır

  • , , ve dotnet buildiçin çağrılın.mcp_desktop_execute_shell_commandgit pullnpm install
  • Build çıktısını yakalamak için çağrı mcp_desktop_take_screenshot .
  • Kayıtları veya test sonuçlarını analiz etmek için arayın mcp_desktop_execute_python_code .
  • Tarayıcıda yerel bir dev sunucusu açmak için ara mcp_browser_navigate .
  • Render edilen sayfayı yakalamak için çağrı mcp_browser_screenshot .

Dosyaları okuma ve yazma

  • Bir dosyayı kullanarak mcp_desktop_execute_shell_commandtype C:\path\to\file.txtokuyun.
  • Python'nin open(...) ve write(...) kullanarak mcp_desktop_execute_python_code ile bir dosya yaz.
  • Doğrulayın mcp_desktop_execute_shell_commanddir C:\path\to\output.txt.
  • Tam kullanıcı arayüzü yapısını anlamak için arayın mcp_accessibility_get_accessibility_tree .
  • Belirli bir kontrol bulmak için arama mcp_accessibility_find_ui_element yapın (örneğin, rol: "MenuItem", ad: "Settings").
  • Elementin bildirilen koordinatlarını kullanarak çağrı mcp_desktop_click .
  • Bir mcp_accessibility_find_ui_element sonraki kontrolü bulmak için tekrar arayın.
  • Onunla aramak mcp_desktop_type_text ya mcp_desktop_click da etkileşime girmek için.

Uzun süreli bir oturumu canlı tutun

  • Boşta tahliye önlemek için MCP taleplerini en az 30 dakikada bir gönderin.
  • mcp_desktop_get_screen_size hafif ve kalp atışı olarak iyi çalışır.