Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Important
- Bu bir önizleme özelliğidir.
- Önizleme özellikleri, üretimde kullanıma yönelik değildir ve sınırlı işlevselliğe sahip olabilir. Bu özellikler, ek kullanım koşullarına tabidir ve resmi sürümden önce kullanılabilir, böylece müşteriler erken erişim elde edebilir ve geri bildirim sağlayabilir.
Windows 365 for Agents, Windows 365 bulut PC'nin tam operasyonel kontrolü için bir MCP sunucusudur. Bu MCP sunucusunu masaüstü etkileşimi (fare, klavye, ekran yakalama, komut yürütme), Microsoft Edge üzerinden tarayıcı otomasyonu ve Windows UI Otomasyonu üzerinden anlamsal arayüz incelemesi yoluyla gerçek bir Windows ortamı sürmek için kullanın.
Note
- Microsoft MCP sunucularının önceki sürümlerini kullanan mevcut bağlantılar desteklenmeye devam ediyor.
- Tüm yeni bağlantılar için, masaüstü, tarayıcı ve erişilebilirlik yetenekleri arasında araçları açığa çıkaran en son Windows 365 Agents MCP sunucusunu kullanın.
- Tarayıcı otomasyonu Microsoft Edge üzerinde çalışır. Edge, ilk tarayıcı araç çağrısında otomatik olarak açılıyor.
focus_browserChrome veya Firefox'u da hedefleyebilir, ancak DOM düzeyindeki tarayıcı araçları yalnızca Edge örneğinde çalışır.
Ajanlar için Windows 365 hakkında daha fazla bilgi edinmek için Windows 365 for Agents documentation sayfasına bakınız.
Overview
| Server ID | Display name | Description |
|---|---|---|
mcp_W365AServer |
Windows 365 for Agents MCP sunucusu | Windows 365 bulut PC'nin tam operasyonel kontrolü, masaüstü etkileşimi, tarayıcı otomasyonu ve kullanıcı arayüzü denetimi dahil. |
Available tools
mcp_desktop_move_mouse
İmleci ekran pozisyonuna getirin. Varış noktasına tıklamayı planlıyorsanız kullanın mcp_desktop_click .
Required parameters:
- x: X koordinatı ekran piksellerinde
- y: Y koordinatı ekran piksellerinde
mcp_desktop_click
Koordinatlar atlıysa bir konuma veya mevcut imleç konumuna tıklayın. Tek tıklama, çift tıklama ve tüm beş fare düğmesini destekler.
Optional parameters:
x: X koordinatı ekran piksellerinde (mevcut konum hariç tutuluyor)
y: Y koordinatı ekran piksellerinde (mevcut konum çıkarıldı)
button: Sol, Sağ, Orta, İleri veya Geri (varsayılan Sol)
clickCount: 1 = tek tıklama, 2 = çift tıklama (varsayılan 1)
mcp_desktop_get_cursor_position
Mevcut imleç koordinatlarını döndür. No parameters. {cursorX, cursorY} döner.
mcp_desktop_drag_mouse
Bir pozisyondan diğerine sürükleyin. Nesneleri hareket ettirmek, pencerelerin boyutunu değiştirmek veya piksel hassasiyetinde kaydırmak için faydalı. Required parameters:
- startX: X koordinatını başlat.
- startY: Y koordinatını başlat.
- endX: X koordinatını sona erdir.
- endY: Y sonu koordinat. Optional parameters:
- button: Sol, Sağ veya Orta (varsayılan olarak Sol)
mcp_desktop_scroll
Bir konumda çentik birimleri kullanarak (piksel değil) kaydırın. Üç çentik yaklaşık bir sayfa demek.
Required parameters:
x: Scroll pozisyonu X
y: Scroll pozisyonu Y
Optional parameters:
- deltaX: Yatay çentikler, pozitif = sağ (varsayılan 0)
- deltaY: Dikey çentikler, pozitif = aşağı (varsayılan 0)
Note
Değerler aralığına sıkıştırılır [-20, 20].
mcp_desktop_type_text
Klavye simülasyonu ile metin yazın. Klavye kısayolları mcp_desktop_press_keysiçin . Web form alanları mcp_browser_typeiçin .
Required parameters:
- text: Metin yazılacak
mcp_desktop_press_keys
Aynı anda bir tuş kombinasyonuna basın. Modifikatör tuşları, fonksiyon tuşları ve standart tuşları destekler.
Required parameters:
-
keys: Birlikte basılması gereken anahtar isimlerinin dizisi (örneğin,
\["ctrl","c"\],\["alt","tab"\],\["ctrl","shift","s"\])
mcp_desktop_take_screenshot
Tam ekranı veya kırpılmış bir bölgeyi PNG görüntüsü olarak (base64 kodlu) yakalayın
Optional parameters:
- x: Kırım bölgesi sol kenar
- y: Crop bölgesi üst kenarı
- width: Ekin bölgesi genişliği
- height: Ürün bölgesi yüksekliği
Note
Tüm dört kırpma parametresini birlikte ekleyin ya da tam ekran yakalama için hepsini çıkarın.
mcp_desktop_analyze_screen
Tüm ekranda OCR yapın. No parameters.
{fullText, averageConfidence, boxes[{text, confidence, x, y, width, height}], width, height} döndürür.
mcp_desktop_get_screen_size
Ekran çözünürlüğünü geri ver. No parameters.
{width, height} döndürür.
mcp_desktop_list_windows
Tüm görünür pencereleri başlıkları, konumları ve boyutlarıyla birlikte listeleyin. No parameters. Bir diziyi döndürür {title, processName, handle, x, y, width, height}.
mcp_desktop_activate_window
Belirsiz bir unvan maçı kullanarak bir pencereyi ön plana çıkar.
Required parameters:
- titlePattern: Kısmi pencere başlığı (kibe duyarsız alt dizi)
mcp_desktop_focus_browser
Bir tarayıcı penceresine (Edge, Chrome veya Firefox) odaklanın, isteğe bağlı olarak URL veya başlığa göre filtrelenir.
Optional parameters:
- pattern: URL veya başlık alt dizisi eşleşmesi (herhangi bir tarayıcı penceresi için çıkarılma)
mcp_desktop_close_window
Bir pencereyi bulanık bir unvan maçıyla zarifçe kapatın. Sistem açısından kritik süreçler korunur ve kapatılamaz.
Required parameters:
-
titlePattern: Kısmi pencere başlığı (maç eşiği 80%).
{matchedTitle, processName, closed}döndürür.
mcp_desktop_execute_shell_command
Sandbox ortamında shell komutu çalıştırın. Komutlar izin listesine göre doğrulanır ve tehlikeli kalıplar engellenir.
Required parameters:
- command: Komut çalıştır
Optional parameters:
- cwd: Çalışma dizini
- timeoutMs: Zaman aşımı milisaniye cinsinden (varsayılan 30000, maksimum 30000)
Note
- İzin verilen komutlar: git, npm, dotnet, python, cargo, node, pip, dir, mkdir, del, copy, move, robocopy, findstr, where, ve type.
- Bloklanan desenler arasında kabuk metakarakterleri (|, ;, &, <, >), ortam değişken genişletme
(%VAR%), yorumcu değerlendirme bayrakları (python -cveyanode -e),git config --global,npm -g, , yol önekli yürütülebilirler,rm -rf,sudo, ve disk/sistem komutları bulunur. -
stdoutvestderrher biri 32 KB olarak kısaltılmıştır. Keyfi hesaplama için kullanımmcp_desktop_execute_python_code.{stdout, stderr, exitCode, success, timedOut, resourceLimitsApplied}döndürür.
mcp_desktop_execute_python_code
Python kodunu kaynak sınırları olan sandbox ortamında çalıştırın. Veri işleme, hesaplamalar, dosya giriş/çıkış ve basit kabuk komutlarının ötesine geçen herhangi bir hesaplama için idealdir.
Required parameters:
- code: Python kod (maksimum 262.144 karakter).
Optional parameters:
- cwd: Çalışma dizini
- timeoutMs: Zaman aşımı milisaniye cinsinden (varsayılan 30000, maksimum 30000).
Aynı şemayı döndürür mcp_desktop_execute_shell_command
mcp_desktop_wait_milliseconds
Animasyonların veya geçişlerin tamamlanması için uygulamayı durdurun. Anket döngülerinde kullanmayın—DOM anketi için kullanın mcp_browser_wait_for .
Required parameters:
- ms: Bekleme süresi milisaniye cinsinden ([0, 5000]'e sıkıştırılmış)
mcp_browser_navigate
Bir URL'ye gidin ve sayfanın yüklenmesini bekleyin.
Required parameters:
-
url: Protokol dahil tam URL (örneğin,
https://example.com)
mcp_browser_back
Tarayıcı geçmişine geri dön. No parameters.
mcp_browser_forward
Tarayıcı geçmişinde ilerleyin. No parameters.
mcp_browser_reload
Mevcut sayfayı yeniden yükleyin. No parameters.
mcp_browser_get_url
Mevcut sayfa URL'sini düz bir dizi olarak döndür. No parameters.
mcp_browser_get_title
Mevcut sayfa başlığını düz bir dizi olarak geri döndür. No parameters.
mcp_browser_get_text
Görünür sayfa metin içeriğini sade bir dizi olarak geri gönderin. No parameters. 512 KB'ye kısaltılmıştır.
mcp_browser_get_html
Tam sayfa HTML kaynağını sade bir dizi olarak geri döndür. No parameters. 512 KB'ye kısaltılmıştır.
mcp_browser_click
CSS seçicisi tarafından bir DOM öğesine tıklayın. Web içeriği için koordinat tabanlı tıklamalardan daha güvenilir.
Required parameters:
-
seçici: CSS seçici (örneğin,
#submit-btnveyaa.nav-link)
mcp_browser_type
CSS seçicisi ile form elemanına metin yazın.
Required parameters:
- selector: CSS giriş elemanının seçicisi.
- text: Metin yazılacak
mcp_browser_query_text
İlk elemanın metin içeriğini bir CSS seçiciyle eşleştirin.
Required parameters:
- selector: CSS seçici
mcp_browser_wait_for
Bir DOM unsurunun ortaya çıkmasını bekleyin. Asenkron olarak yüklenen dinamik içerik için faydalı.
Required parameters:
- selector: CSS seçici beklemek için
Optional parameters:
- timeoutMs: Zaman aşımı milisaniye cinsinden (varsayılan 5000, maksimum 30000)
mcp_browser_eval_js
Sayfa bağlamında bir JavaScript ifadeyi değerlendirin ve sonucu bir dizi olarak döndürün.
Required parameters:
- expression: JavaScript bir diziyi döndüren ifade.
Note
Eğer ifadeniz bir nesne veya sayı döndürüyorsa, onu açıkça bir diziye dönüştürün (örneğin, JSON.stringify(obj) veya .toString()).
mcp_browser_list_tabs
Açık olan tüm sekmeleri onların ve URL'leriyle index, title, listeleyin. No parameters. Bir diziyi döndürür {index, title, url}.
mcp_browser_switch_tab
Indeks bazında sekmeye geç.
Required parameters:
- tabIndex: 0 tabanlı sekme indeksi
mcp_browser_new_tab
Yeni bir sekme açın, isteğe bağlı olarak bir URL'ye yönlendirin.
Optional parameters:
- url: Açılacak URL (eksik boş sekme)
{index, title, url} döndürür.
mcp_browser_close_tab
Bir sekmeyi indeksle kapatın.
Required parameters:
- tabIndex: 0 tabanlı sekme indeksi
mcp_browser_screenshot
Sadece tarayıcı görünümünün PNG ekran görüntüsünü (tam ekranı değil) yakalayın (tam ekran değil). No parameters. Base64 kodlu bir PNG döndürüyor.
mcp_accessibility_get_accessibility_tree
Ön plan penceresi için arayüz öğe ağacını alın. Her unsur kendi rolü, ismi, değeri ve ekran koordinatlarını içerir.
Optional parameters:
- maxDepth: Maksimum ağaç geçiş derinliği, 1-10 (varsayılan 3)
- maxElements: Geri dönecek maksimum eleman, 1-2000 (varsayılan 500)
{rol, isim, değer, x, y, genişlik, yükseklik, çocuklar[...]} hiyerarşik bir ağac döndürür.
mcp_accessibility_find_ui_element
Arayüz öğelerini metin içeriği, erişilebilirlik rolü veya isme (küçük harfe duyarsız alt dizi) göre arayın. Eşleşen öğeleri tıklanabilir ekran koordinatlarıyla döndürür.
Optional parameters:
- text: Arama metni (isim atlıyorsanız isim olarak kullanılır)
-
role: Arayüz rol filtresi —
Button,TextBox,CheckBox,MenuItem,ComboBox, , ve daha fazlası - name: Erişilebilir isim (her ikisi de sağlandığında metin üzerinde önceliklidir)
- windowHandle: Hedef pencere kolu (null = ön plan penceresi)
Note
En az bir metin, rol veya isim belirtilmelidir. Bir diziyi döndürür {role, name, value, x, y, width, height}.
Key features
Desktop interaction
- Tıklama, çift tıklama, sağ tıklama ve beş düğmeli fare kontrolü.
- Piksel hassasiyetinde sürükle ve bırak.
- Çentik tabanlı kaydırma (üç çentik ≈ bir sayfa).
- Klavye yazısı ve çoklu tuşlu kısayol kombinasyonları.
- İmleç konum takibi.
- Ekran çözünürlüğü algılama.
Ekran yakalama ve analiz
- Tam ekran veya kırpılmış PNG ekran görüntüleri.
- Bölge başına güven puanları ve sıçrayış kutularıyla tam ekranın OCR'si.
- Web içeriği için sadece tarayıcı görünümlü ekran görüntüleri.
Window management
- Tüm görünür pencereleri konum ve boyutlarla sayın.
- Pencereleri bulanık başlık eşleşmesiyle etkinleştir.
- Focus tarayıcı pencereleri (Edge, Chrome, Firefox) isteğe bağlı olarak URL veya başlığa göre filtrelenir.
- Sistem kritik süreçler için koruma ile zarif pencere kapanışı.
Command execution
- Sandbox kabuk komutları ve izin listesi (git, npm, dotnet, python, cargo, node, pip, dir, mkdir, del, copy, move, robocopy, findstr, where, type).
- Sandbox Python 262.144 karaktere kadar kod çalıştırmayı sağlar.
- Çalışma dizini ve arama başına zaman aşımına bağlı kontrol (maksimum 30 saniye).
- Kaynak sınırları ve shell metakarakterlerine, değerlendirme bayraklarına, ayrıcalık artışına ve yıkıcı operasyonlara karşı güçlendirilmiş engelleme listesi.
Browser automation
- Navigasyon, geri, ileri, yeniden yükleme.
- SayfaURL, başlık, görünür metin (512 KB cap) ve tam HTML (512 KB cap) okuyun.
- CSS seçicisi tarafından DOM seviyesinde tıklama, yazı ve metin sorgusu.
- Ayarlanabilir zaman aşımına sahip dinamik öğeleri bekleyin.
- Sayfa bağlamında ifade değerlendirmelerini JavaScript yapın.
- Çok sekmeli yönetim: listele, değiştir, aç, kapat.
- Microsoft Edge'de çalışıyor, ilk kullanımda otomatik olarak açılıyor.
UI accessibility
- Ön plan penceresi için yapılandırılabilir derinlik ve eleman sayısı olan Windows UI Otomasyonu tree'yi alın.
- Kullanıcı arayüzü öğelerini metin, rol veya erişilebilir isim ile bul.
- Düğmelerin, metin kutularının, kontrol kutularının, menü öğelerinin ve kombo kutularının hassas hedeflenmesi için tıklanabilir ekran koordinatlarını döndürüyor.
Zamanlama ve senkronizasyon
- Kısa tek atışlık duraklamalar
mcp_desktop_wait_milliseconds(en fazla beş saniye). - DOM düzeyinde anket (
mcp_browser_wait_formaksimum 30 saniye) ile yapılır.
Notes
- Tüm koordinatlar ekran pikselleri içinde yer alır ve (0,0) sol üst köşede yer alır. ,
mcp_desktop_analyze_screen,mcp_accessibility_find_ui_element, vemcp_desktop_list_windowskoordinatlarımcp_desktop_take_screenshotaynı koordinat uzayını paylaşır. - Bir imleç güvenlik sistemi aktiftir: İmleç herhangi bir ekran köşesine beş piksel mesafede hareket ederse, fare işlemleri iptal edilir. Ekranın en uç kenarlarını hedeflemekten kaçının.
- Shell boru operatörleri (|), nokta virgül (;)), ampersandlar (&) ve çıkış yönlendirmesi (>, <) engellenmiştir. Komut çıktısını dönüştürmek için onu yakalayın ve işleyin.
mcp_desktop_execute_python_code - Eğer yorumcu değerlendirme bayrakları engellenmişse veya
python -c "..."venode -e "..."reddedilirse,mcp_desktop_execute_python_codekodunu Python kod için kullanabilir veya önce bir dosyaya kod yazabilirsiniz. - Komut
stdout/stderrher biri 32 KB olarak kısaltılmıştır. Ayrıntılı çıktıyı sınırlamak için bayraklar kullanın (örneğin,git log --oneline -20) veya bir dosyaya yönlendirip ayrı ayrı okuyun. - Ve için
mcp_desktop_execute_shell_commandmcp_desktop_execute_python_codemaksimum zaman aşımı, 30 saniyedir. Daha uzun çalışmalar için daha küçük adımlara böl veya Python'dan arka plan süreci başlatıp anket yap. - Özel bir dosya okuma/yazma aracı yok.
typekomutunu kullanarakmcp_desktop_execute_shell_commandile dosyaları okumak; Python'nin yerleşik dosya giriş/çıkışını kullanarakmcp_desktop_execute_python_codeile dosya yazmak. Kabuk çıkış yönlendirmesi (>, >>) engellenmiştir. -
mcp_browser_eval_jsHer zaman bir ip döndürür. Nesneleri veya sayıları geri dönmeden önce açıkça dönüştürün. - Tarayıcı DOM araçları (
mcp_browser_click,mcp_browser_type,mcp_browser_eval_jsvb.) yalnızca Microsoft Edge örneğinde çalışır.mcp_desktop_focus_browserChrome veya Firefox pencerelerine odaklanabilir, ancak DOM araçları onları hedef almıyor. -
mcp_desktop_take_screenshottam ekran görüntüsü için dört kırpma parametresinin (x, y, genişlik, yükseklik) birlikte olmasını veya hiç yapılmamasını gerektirir. -
mcp_desktop_scrollPiksel değil, çentik birimleri ([-20, 20]'ye sıkıştırılmış) kullanır. Üç çentik yaklaşık bir sayfa demek. -
mcp_accessibility_find_ui_elementen az bir metin, rol veya isim gerektirir. Hem metin hem de isim sağlandığında, isim öncelikli olur.
Yaygın kullanım örnekleri
Bir web formu doldurun
- Hedef sayfayı açmak için ara
mcp_browser_navigate. - Formun yüklenmesini beklemek için arayın
mcp_browser_wait_for. - Her alanı doldurmak için CSS seçicisi tarafından çağırış
mcp_browser_type. - Formu göndermek için arayın
mcp_browser_click. - Onay unsurunu beklemek için ara
mcp_browser_wait_for. - Sonucu okumak ve doğrulamak için arayın
mcp_browser_get_text.
Masaüstü uygulamasını otomatikleştirin
- Başvuruyu ön plana çıkarmak için ara
mcp_desktop_activate_window. - Mevcut durumu yakalamak için çağrı
mcp_desktop_take_screenshot. - İsme göre bir düğme veya alanı bulmak için ara
mcp_accessibility_find_ui_element. - Elementin bildirilen koordinatlarını çağırın
mcp_desktop_click. - Veri girmek için ara
mcp_desktop_type_text. - Kestirmeler
mcp_desktop_press_keysçağırın (örneğin, kaydetmek için ["ctrl","s"] gibi). - Sonucu doğrulamak için arayın
mcp_desktop_take_screenshot.
Bir web sayfasından veri çıkarın
- Sayfayı açmak için ara
mcp_browser_navigate. - Görünür metin içeriğini çıkarmak için ara
mcp_browser_get_text. - Çıkarılan verileri ayrıştırmak ve işlemek için arama
mcp_desktop_execute_python_codeyapın. - Metin çıkarma yeterli olmadığında JavaScript üzerinden belirli değerleri sorgulamak için çağrı
mcp_browser_eval_js.
Geliştirme görevlerini çalıştır
- , , ve
dotnet buildiçin çağrılın.mcp_desktop_execute_shell_commandgit pullnpm install - Build çıktısını yakalamak için çağrı
mcp_desktop_take_screenshot. - Kayıtları veya test sonuçlarını analiz etmek için arayın
mcp_desktop_execute_python_code. - Tarayıcıda yerel bir dev sunucusu açmak için ara
mcp_browser_navigate. - Render edilen sayfayı yakalamak için çağrı
mcp_browser_screenshot.
Dosyaları okuma ve yazma
- Bir dosyayı kullanarak
mcp_desktop_execute_shell_commandtype C:\path\to\file.txtokuyun. - Python'nin
open(...)vewrite(...)kullanarakmcp_desktop_execute_python_codeile bir dosya yaz. - Doğrulayın
mcp_desktop_execute_shell_commanddir C:\path\to\output.txt.
Erişilebilirlikle karmaşık arayüzde gezinme
- Tam kullanıcı arayüzü yapısını anlamak için arayın
mcp_accessibility_get_accessibility_tree. - Belirli bir kontrol bulmak için arama
mcp_accessibility_find_ui_elementyapın (örneğin, rol: "MenuItem", ad: "Settings"). - Elementin bildirilen koordinatlarını kullanarak çağrı
mcp_desktop_click. - Bir
mcp_accessibility_find_ui_elementsonraki kontrolü bulmak için tekrar arayın. - Onunla aramak
mcp_desktop_type_textyamcp_desktop_clickda etkileşime girmek için.
Uzun süreli bir oturumu canlı tutun
- Boşta tahliye önlemek için MCP taleplerini en az 30 dakikada bir gönderin.
-
mcp_desktop_get_screen_sizehafif ve kalp atışı olarak iyi çalışır.