مشاركة عبر


VM watch Collectors Suite

تم تصميم مجمعات ساعات الجهاز الظاهري لجمع بيانات صحة الجهاز الظاهري على موارد مختلفة مثل القرص والشبكة، عن طريق تشغيل عمليات التحقق من الصحة داخل الجهاز الظاهري. تساعد مجموعة المجمعين هذه في تحديد المشكلات ومراقبة اتجاهات الأداء وتحسين الموارد لتحسين تجربة المستخدم الشاملة.

توفر هذه المقالة ملخصا لجميع المجمعات المتوفرة في مراقبة الجهاز الظاهري، جنبا إلى جنب مع الفحوصات والمقاييس والسجلات وتكوينات المعلمات المقابلة. للحصول على أوصاف مفصلة لكل فحص ومقياس وسجل، راجع صفحة نظرة عامة على مراقبة الجهاز الظاهري .

المتطلبات الأساسية

تفترض هذه المقالة أنك على دراية بما يلي:

إشعار

الاسم الوصف
جامع التجميع المنطقي للاختبارات المماثلة حيث يمكنك جمع الفحوصات والمقاييس والسجلات لتحديد صحة مورد معين
اشارات ما يتم إصداره ليعكس الحالة الصحية للأجهزة الظاهرية. الأنواع الثلاثة من الإشارات المنبعثة هي الفحوصات والمقاييس والسجلات
مجموعة يشير إلى ما إذا كان المجمعون جزءا من المجموعة الأساسية أو الاختيارية. يتم تمكين مجمعات المجموعات الأساسية بشكل افتراضي، بينما يمكن تمكين مجمعات المجموعات الاختيارية أو تعطيلها استنادا إلى متطلباتك
العلامات يستخدم لتصنيف وتصفية عمليات التحقق والمقاييس والسجلات
الأهلية تحديد ما إذا كان المجمع مؤهلا للتنفيذ استنادا إلى سمات البيئة التي تحددها
السلوك الافتراضي الإعداد القياسي والإجراء الذي سيتم اتباعه إذا لم يتم توفير تكوينات مخصصة.
معلمات قابلة للكتابة فوق المعلمات المقترنة التي يمكن تخصيصها لتجاوز التكوين الافتراضي

المجموعات والعلامات والفحوصات والمقاييس وسجلات الأحداث المقابلة

اسم المجمع مجموعة العلامات الشيكات المقاييس سجلات الأحداث
outbound_connectivity لب الشبكة
  • outbound_connectivity
dns لب الشبكة
  • dns
tcp_stats لب الشبكة
  • المقاطع المرسلة
  • TCPSynRetransmits (Linux فقط)
  • تم تحويلها إلى NormalizedSegments
  • ConnectionResets
  • NormalizedConnectionResets
  • FailedConnectionAttempts
  • NormalizedFailedConnectionAttempts
  • عمليات ActiveConnection
  • عمليات الاتصال السلبي
  • الاتصالات الحالية
  • الشرائح التي تم إعادة تسجيلها
  • SegmentsSent
clock_skew لب ساعة
  • ساعة سكيو
disk_io لب القرص
  • disk_io
  • المسافة المستخدمة في وحدات البايت
  • FreeSpaceInBytes
  • CapacityInBytes
  • مركز المستخدم
disk_iops لب القرص
  • عمليات الكتابة
  • عمليات القراءة
imds لب IMDS
  • imds
عملية لب معالجة
  • عملية
process_memory لب معالجة
  • ProcessRSSPercent
  • عوامل الفرز ل ProcessPage
  • MachineMemoryTotalInBytes
  • MachineMemoryUsedPercent
  • TotalPageFaults
process_cpu لب معالجة
  • معالجة وحدة المعالجة المركزية (ProcessCPUCoreUsage)
  • معالجة CPUMachineUsage
  • MachineTotalCpuUsage
process_monitor اختياري معالجة
  • process_monitor
  • الجهوزيه
system_error لب نظام التشغيل
  • SystemErrors
az_storage_blob اختياري AzBlob
  • az_storage_blob
hardware_health_monitor اختياري الأجهزة
  • hardware_health_monitor
hardware_health_nvidia_smi اختياري الأجهزة
  • hardware_health_nvidia_smi

الأهلية والسلوك الافتراضي والمعلمات القابلة للكتابة فوقها

اسم المجمع الأهلية السلوك الافتراضي معلمات قابلة للكتابة فوق
outbound_connectivity مؤهل إذا لم يتم تعيين EnvironmentAttribute "OutboundConnectivityDisabled" أو تعيينه إلى "false" يتم تنفيذ هذا المجمع كل 60s. في كل تنفيذ، يرسل طلب http GET إلى http://www.msftconnecttest.com/connecttest.txt مع مهلة من 5s. إذا فشل الطلب، فإنه يعيد المحاولة مرتين إضافيتين على الأكثر مع وفاصل زمني من 10s. يتم وضع علامة "فشل" على التحقق إذا فشلت جميع عمليات إعادة المحاولة.
  • OUTBOUND_CONNECTIVITY_INTERVAL: الفاصل الزمني لتنفيذ Collector. الافتراضي: 60s
  • OUTBOUND_CONNECTIVITY_URLS: عناوين URL التي يرسل هذا المجمع طلبات http GET إليها. يتم توفير عناوين URL كسلسلة باستخدام , كفاصل. الافتراضي: http://www.msftconnecttest.com/connecttest.txt
  • OUTBOUND_CONNECTIVITY_TIMEOUT_IN_MILLISECONDS: مهلة طلب http GET بالمللي ثانية. الافتراضي: 5000
  • OUTBOUND_CONNECTIVITY_TOTAL_ATTEMPTS: العدد الإجمالي لمحاولات إرسال طلب http إذا فشل الطلب السابق. الافتراضي: 3
  • OUTBOUND_CONNECTIVITY_RETRY_INTERVAL_IN_SECONDS: الفاصل الزمني لإعادة المحاولة بالثوان إذا فشل طلب http السابق. الافتراضي: 10
dns مؤهل إذا لم يتم تعيين EnvironmentAttribute "OutboundConnectivityDisabled" أو تعيينه إلى "false" يتم تنفيذ هذا المجمع كل 180s. في كل تنفيذ، يحاول حل اسم www.msftconnecttest.com DNS . يتم وضع علامة "فشل" على التحقق إذا تعذر حل اسم DNS.
  • DNS_INTERVAL: الفاصل الزمني لتنفيذ المجمع. الافتراضي: 180s
  • DNS_NAMES: أسماء المجالات التي سيتم حلها مفصولة ب ,. الافتراضي: www.msftconnecttest.com
tcp_stats مؤهل دائما يتم تنفيذ هذا المجمع كل 180s. في كل تنفيذ، فإنه يجمع إحصائيات TCP لآخر 180s.
  • TCP_STATS_INTERVAL: الفاصل الزمني لتنفيذ المجمع. الافتراضي: 180s
  •   
clock_skew مؤهل إذا لم يتم تعيين EnvironmentAttribute "OutboundConnectivityDisabled" أو تعيينه إلى "false" يتم تنفيذ هذا المجمع كل 180s. في كل تنفيذ، فإنه يسترد إزاحة الساعة بين خادم time.windows.com NTP البعيد والجهاز الظاهري. يتم وضع علامة "فشل" على التحقق إذا كان انحراف الساعة أكبر من 5.0 ثوان. في Windows VM، إذا فشل الاتصال بخادم NTP البعيد، فإنه يتراجع للتحقق من Windows Time Service باستخدام الأمر w32tm. يتم وضع علامة على التحقق على أنه "فشل" إذا كان الأمر w32tm يرجع "مؤشر الكبس: 3 (غير متزامن)".
  • CLOCK_SKEW_INTERVAL: الفاصل الزمني لتنفيذ Collector. الافتراضي: 180s
  • CLOCK_SKEW_NTP_SERVER: خادم NTP البعيد المستخدم لحساب انحراف الساعة. الافتراضي: time.windows.com
  • CLOCK_SKEW_TIME_SKEW_THRESHOLD_IN_SECONDS: الحد في ثوان من إزاحة الساعة لوضع علامة على التحقق على أنه "فشل". الافتراضي: 5.0
disk_io مؤهل دائما إذا لم يتم تحديد نقاط التحميل. إذا تم تحديد نقاط التحميل بشكل صريح، فلا تكون مؤهلة إلا عند إرفاق أقراص البيانات بالجهاز الظاهري يتم تنفيذ هذا المجمع كل 180s. في كل تنفيذ، يتحقق من توفر القرص io في كل نقطة تحميل متوفرة عن طريق إنشاء مجلد وإنشاء ملف وكتابة وحدات البايت إليه وحذفه وحذف المجلد. ثم يجمع معلومات استخدام القرص بما في ذلك المساحة المستخدمة والمساحة الفارغة والسعة الإجمالية والنسبة المئوية المستخدمة من كل نقطة تحميل.
  • DISK_IO_INTERVAL: الفاصل الزمني لتنفيذ المجمع. الافتراضي: 180s
  • DISK_IO_MOUNT_POINTS: نقاط التحميل مفصولة ب ,. لا قيمة افتراضية
  • DISK_IO_IGNORE_FS_LIST: قائمة نظام الملفات التي يجب تجاهلها مفصولة ب ,. الافتراضي: tmpfs,devtmpfs,devfs,iso9660,overlay,aufs,squashfs,autofs
  • DISK_IO_FILENAME: اسم الملف المستخدم للتحقق من قراءة/كتابة الملف. الافتراضي: vmwatch-{timestamp}.txt
disk_iops مؤهل دائما يتم تنفيذ هذا المجمع كل 180s. في كل تنفيذ، فإنه يجمع عمليات قراءة وكتابة القرص في الثانية من كل جهاز قرص متاح.
  • DISK_IOPS_INTERVAL: الفاصل الزمني لتنفيذ المجمع. الافتراضي: 180s
  • DISK_IOPS_DEVICES: أسماء الأجهزة مفصولة ب ,. لا قيمة افتراضية
  • DISK_IOPS_IGNORE_DEVICE_REGEX: تعبير اسم الجهاز الذي يجب تجاهله. الافتراضي: تكرار حلقي
imds مؤهل دائما يتم تنفيذ هذا المجمع كل 180s. في كل تنفيذ، يستعلم عن نقطة http://169.254.169.254/metadata/instance/compute نهاية IMDS ويتحقق من أن نص الاستجابة يحتوي على المعلومات (SubscriptionId وResourceGroup وVMId وResourceId) للجهاز الظاهري. مهلة الاستعلام هي 10s. إذا فشل الاستعلام، فإنه يعيد المحاولة ثلاث مرات أخرى على الأكثر مع فاصل زمني من 15s و30s و45s.
  • IMDS_INTERVAL: الفاصل الزمني لتنفيذ المجمع. الافتراضي: 180s
  • IMDS_ENDPOINT: عنوان URL لنقطة نهاية IMDS. افتراضي:http://169.254.169.254/metadata/instance/compute
  • IMDS_TIMEOUT_IN_SECONDS: المهلة بالثوان لكل استعلام. الافتراضي: 10
  • IMDS_QUERY_TOTAL_ATTEMPTS: العدد الإجمالي لمحاولات إرسال طلب http إذا فشل الطلب السابق. الافتراضي: 4
  • IMDS_RETRY_INTERVAL_IN_SEONDS: الفاصل الزمني لإعادة المحاولة بالثوان إذا فشل طلب http السابق. الافتراضي: 15، 30، 45
عملية مؤهل دائما يتم تنفيذ هذا المجمع كل 180s. في كل تنفيذ، يقوم بإنشاء وتنفيذ الأمر ${SYTEM_DIR}\system32\cmd.exe /c echo hello في جهاز Windows وفي /bin/sh -c echo hello جهاز Linux. مهلة تنفيذ العملية هي 10s.
  • PROCESS_INTERVAL: الفاصل الزمني لتنفيذ المجمع. الافتراضي: 180s
  • PROCESS_TIMEOUT: مهلة تنفيذ العملية. الافتراضي: 10s
process_memory مؤهل دائما يتم تنفيذ هذا المجمع كل 180s. في كل تنفيذ، يحدد أعلى ثلاث عمليات مع معظم استخدام الذاكرة ويبلغ عن ProcessRSSPercent و ProcessPageFaults و MachineMemoryTotalInBytes و MachineMemoryUsedPercent و TotalPageFaults.
  • PROCESS_MEMORY_INTERVAL: الفاصل الزمني لتنفيذ المجمع. الافتراضي: 180s
  •   
process_cpu مؤهل دائما يتم تنفيذ هذا المجمع كل 180s. في كل تنفيذ، فإنه يحدد العمليات الثلاث الأولى مع استخدام وحدة المعالجة المركزية الأكثر والإبلاغ عن ProcessCoreUsage و ProcessMachineUsage و MachineTotalCpuUsage.
  • PROCESS_CPU_INTERVAL: الفاصل الزمني لتنفيذ المجمع. الافتراضي: 180s
  •   
process_monitor مؤهل دائما لم يتم تنفيذه. إذا تم تمكينه بشكل صريح من قبل المستخدم، يتحقق هذا المجمع مما إذا كانت العملية المحددة قيد التشغيل ويجمع وقت التشغيل الخاص بها في ثوان.
  • PROCESS_MONITOR_INTERVAL: الفاصل الزمني لتنفيذ المجمع. الافتراضي: 180s
  • PROCESS_MONITOR_PROCESS_NAMES: التعبير العادي لأسماء العمليات المراد مراقبتها مفصولة ب ,. لا قيمة افتراضية
system_error مؤهل في جهاز Windows يتم تنفيذ المجمع كل ثلاث دقائق. في كل تنفيذ، يشترك في قناة "النظام" ل Windows EventLog ويستعلم عن الأحداث ذات المستوى المحدد في SystemData <=2 (بما في ذلك LOG_ALWAYS، حرج، خطأ). يتم تعريف measurementTarget على أنه Source_EventId ل EventLog باستخدام الإعدادات المحلية الافتراضية ل Windows. يتم تطبيق حد أقصى لا يزيد عن 10 مقادير قياس مختلفة في كل مجموعة.
  • SYSTEM_ERROR_MEASUREMENT_TARGET_CAP: الحد الأقصى لإجمالي مقادير القياس المختلفة في كل مجموعة. الافتراضي: 10
az_storage_blob مؤهل إذا لم يتم تعيين EnvironmentAttribute "OutboundConnectivityDisabled" أو تعيينه إلى "false" لم يتم تنفيذه. إذا تم تمكينه بشكل صريح من قبل المستخدم، يتحقق هذا المجمع مما إذا كان يمكن للجهاز الظاهري الوصول إلى Azure Storage Blob المحدد باستخدام إما الهوية المدارة أو رمز SAS المميز.
  • AZ_STORAGE_BLOB_INTERVAL: الفاصل الزمني لتنفيذ المجمع. الافتراضي: 180s
  • AZ_STORAGE_ACCOUNT_NAME: اسم حساب Azure Storage. لا قيمة افتراضية
  • AZ_STORAGE_CONTAINER_NAME: اسم حاوية تخزين Azure. لا قيمة افتراضية
  • AZ_STORAGE_BLOB_NAME: اسم Azure Storage Blob. لا قيمة افتراضية
  • AZ_STORAGE_BLOB_DOMAIN_NAME: اسم مجال Azure Storage. لا قيمة افتراضية
  • AZ_STORAGE_SAS_TOKEN_BASE64: رمز SaS المميز ل Azure Storage المرمز Base64. لا قيمة افتراضية
  • AZ_STORAGE_USE_MANAGED_IDENTITY: إذا كان سيتم استخدام الهوية المدارة للمصادقة. الافتراضي: خطأ
  • AZ_STORAGE_MANAGED_IDENTITY_CLIENT_ID: معرف عميل الهوية المدارة للمصادقة. لا قيمة افتراضية
hardware_health_monitor مؤهل في جهاز Windows لم يتم تنفيذه. إذا تم تمكينه بشكل صريح من قبل المستخدم، يجمع هذا المجمع معلومات صحة الأجهزة من سجل أحداث Windows، ويتم حاليا جمع الأحداث الهامة ذات الصلة بالقرص فقط، بما في ذلك الأحداث ذات المعرف 7 و500 و504 و505 و512 و549.
  • HARDWARE_HEALTH_MONITOR_INTERVAL: الفاصل الزمني لتنفيذ المجمع. الافتراضي: 180s
  •   
hardware_health_nvidia_smi مؤهل في جهاز Linux Ubuntu لم يتم تنفيذه. إذا تم تمكينه بشكل صريح من قبل المستخدم، يجمع هذا المجمع معلومات صحة الأجهزة من سجل أحداث Windows، ويتم حاليا جمع الأحداث الهامة ذات الصلة بالقرص فقط، بما في ذلك الأحداث ذات المعرف 7 و500 و504 و505 و512 و549.
  • HARDWARE_HEALTH_NVIDIA_SMI_INTERVAL: الفاصل الزمني لتنفيذ المجمع. الافتراضي: 60s
  • HARDWARE_HEALTH_NVIDIA_SMI_INTERVAL: مهلة تشغيل أمر /usr/bin/nvidia-smi. الافتراضي: 10s
  •  

الخطوات التالية