适用于:Exchange Server 2013
Outlook Web App (OWA) 运行状况集监视Outlook Web App服务的整体运行状况。
如果收到一条警报,指出Outlook Web App运行不正常,则表示存在问题,可能会阻止用户使用 Outlook Web App 访问其邮箱。
解释
使用以下探测和监视器监视Outlook Web App服务。
探针 | 运行状况设置 | 相关性 | 关联监视器 |
---|---|---|---|
OwaCtpProbe | Outlook Web App | Active Directory 信息存储 |
OwaCtpMonitor |
有关探测和监视器的详细信息,请参阅 服务器运行状况和性能。
常见问题
该探测器无法运行的几个原因。 以下是一些更为常见的原因:
- 托管在受监视客户端访问服务器上的Outlook Web App应用程序池 (CAS) 未响应,或者邮箱服务器上托管的应用程序池未响应。
- CAS 遇到网络问题,无法连接到邮箱服务器或域控制器。
- 监视帐户的凭据不正确。
- 未装载用户的数据库,或者无法访问该邮箱的信息存储。
- 信息存储没有响应。
- 域控制器没有响应。
用户操作
发出警报后服务可能会恢复。 因此,当您接收到指示运行状况设置不正常的警报时,首先要验证该问题是否仍然存在。 若问题确实存在,执行以下部分介绍的相应恢复操作。
验证问题是否仍然存在
识别警报中的运行状况设置名称和服务器名称。
邮件详细信息提供了有关确切警报原因的信息。 大部分情况下,邮件详细信息会提供充足的故障排除信息,用于识别根本原因。 如果邮件详细信息不明确,请执行以下操作:
打开 Exchange 命令行管理程序,然后运行以下命令,检索生成警报的运行状况集的详细信息:
Get-ServerHealth <server name> | ?{$_.HealthSetName -eq "<health set name>"}
Outlook Web App有关 server1.contoso.com 的运行状况集详细信息,请运行以下命令:
Get-ServerHealth server1.contoso.com | ?{$_.HealthSetName -eq "OWA"}
检查命令输出,以确定报告了错误的监视器。 发出警报
Unhealthy
的监视器的 AlertValue 值为 。为处于不正常状态的监视器重新运行关联的探测。 请参阅Explanation部分中的表格,找到关联探测器。 为此,请运行下列命令:
Invoke-MonitoringProbe <health set name>\<probe name> -Server <server name> | Format-List
例如,若要在 server1.contoso.com 上创建Exchange ActiveSync监视探测,请运行以下命令:
Invoke-MonitoringProbe -Identity ActiveSync.Protocol\ActiveSyncSelfTestProbe -Server server1.contoso.com
在命令输出中,检查探测器的“结果”值。 如果值为“成功”,则该问题是暂时性错误,且不再存在。 否则,请参阅以下部分列出的恢复步骤。
POPCTPMonitor Recovery Actions
运行状况设置中的电子邮件警报包含以下信息:
发送警报的服务器名称
上一错误的完全异常跟踪,包括诊断数据和特定 HTTP 头信息
注意:可以使用完整异常跟踪中的信息来帮助排查问题。 探测器生成的异常中包含“失败原因”,它说明了探测失败的原因。 例如,异常包含以下信息:
MissingKeyword:在服务器响应中找不到预期的关键字 (keyword) 。 在这种情况下,异常包含预期关键字。
NameResolution:DNS 解析无法解析给定的服务器名称。
NetworkConnection:探测在尝试连接到 CAFE 上的 OWA 应用池时收到网络连接失败。
UnexpectedHttpResponseCode:响应具有意外的 HTTP 代码。 例如,服务器返回 HTTP 代码“503”。
RequestTimeout:服务器响应客户端请求的时间过长。
ScenarioTimeout:探测已成功完成,但需要花费超过一分钟的时间才能执行此作。 这通常表明系统超负荷。
OwaErrorPage:Outlook Web App返回错误页。 导致失败的错误名称通常在异常消息中提供。
OwaMailboxErrorPage:Outlook Web App返回包含邮箱存储相关错误的错误页。 这通常表示邮箱存储已关闭或正在卸载邮箱。
异常情况包括一个重要的名为 FailingComponent 的字段。 探测器尝试确认错误,如以下示例:
邮箱:探测可以到达Outlook Web App,但无法连接到邮箱存储。 这种情况下,探测器探测失败,或邮箱访问延迟导致探测器探测失败并产生 ScenarioTimeout 错误。 当这些失败出现时,应该检查邮箱服务器的运行状况。
Active Directory:探测可以到达Outlook Web App,但无法连接到 Active Directory。 在这种情况下,探测失败或 Active Directory 调用延迟可能导致探测超时。发生这些类型的故障时,应检查域控制器的运行状况,并检查 CA 和邮箱服务器以及域控制器之间的网络连接。
Owa:这通常意味着Outlook Web App层内发生错误。 发生这些故障时,必须验证 CA 和邮箱服务器上的Outlook Web App进程的运行状况,并检查网络连接。
该异常也包含探测器运行失败之前收到的最新 HTTP 请求和响应信息。 呈报正文包括探测日志的路径。 您可以使用该信息来确认全部 HTTP 网络请求和探测器运行失败时发生的响应。 此文件仅包含运行失败的探测器的数据,因为只会对失败的尝试进行记录。 可以使用此信息全面了解测试失败的原因。
可行性指标降低了多少 (x%)。
该文件夹的完整路径包括探测器的完整 HTTP 请求记录。 默认情况下,此信息位于 %ExchangeInstallPath%Logging\Monitoring\OWA\ClientAccessProbe 文件夹中。
警报发出的时间和日期
要解决此问题,请执行下列步骤:
创建测试用户帐户,然后使用该测试用户帐户登录 CAS。 例如,使用
https://<servername>/owa
登录。如果失败,可使用不同的 CA 服务器来验证该问题出于特定的 CAS,而不是邮箱服务器。
验证 CA 和邮箱服务器的网络连接情况。 使用 ping.exe 验证每个服务器是否都有响应。
检查针对 OWA.Protocol 运行状况设置发出的警报,其中可能指出存在影响特定邮箱服务器的问题。 有关详细信息,请参阅Troubleshooting OWA.Protocol Health Set。
启动 IIS 管理器,然后连接到报告问题的服务器,以验证 MSExchangeOwaAppPool 应用程序池是否在 CAS 上运行。
在 IIS 管理器中,验证默认网站是否正在运行。
查找失败探测器的邮箱数据库,并验证邮箱数据库在邮箱服务器上处于活动状态,且邮箱储存正常运行。 若要找到失败的数据库 GUID 信息,打开全部异常跟踪信息。 每一个失败应该包含一个与以下示例类似的条目:
Starting Owa probe with Target: https://localhost/owa/, Username: _HealthMailboxdf8b87828ab0427cb91e985bbdfcec62@yourdomain.com*
复制 HealthMailbox GUID,然后在命令行管理程序中运行以下命令:
Get-Mailbox -Monitoring -Identity <username>
例如,运行以下命令:
Get-Mailbox -Monitoring -Identity HealthMailboxdf8b87828ab0427cb91e985bbdfcec62@yourdomain.com
在返回的 对象中,可以找到用户的数据库名称,还可以确定当前活动数据库所在的位置。
如果在站点间配置了重定向,可能会出现探测器运行失败以及产生 MissingKeyword 的错误。 这个情况出现的原因是,默认情况下,CA 探测器会对任何位置的帐户都进行探测,也因为探测器在使用重定向时不会尝试对不同站点测试 CAS。 若要解决这个问题,应确保每个站点的服务器都包含在监视组中。 给定监视组中的 CA 服务器仅与同一组的邮箱服务器一起测试。
若要确认服务器的监视组,请运行以下命令:
Get-ExchangeServer | ft MonitoringGroup
若要修改服务器上的监视组,请结合使用 MonitoringGroup 参数和 Set-ExchangeServer cmdlet。 例如,可使用以下命令:
Set-ExchangeServer -Identity "ServerName" -MonitoringGroup "Primary"
在 IIS 管理器中,单击“ 应用程序池”,然后运行以下命令回收 MSExchangeOWAAppPool 应用程序池:
%SystemRoot%\System32\inetsrv\Appcmd recycle MSExchangeOWAAppPool
重新运行关联的探测,如验证问题仍然存在部分中的步骤 2c 所示。
如果问题仍然存在,使用 IISReset 实用程序或运行以下命令,对 IIS 服务进行再循环:
Iisreset /noforce
重新运行关联的探测,如验证问题仍然存在部分中的步骤 2c 所示。
如果问题仍存在,请重新启动服务器。
重新启动服务器后,按照Verifying the issue still exists部分步骤 2c 所示,重新运行相关联的探测器。
如果探测器仍然运行失败,可能需要寻求协助,以解决此问题。 若要解决此问题,请与 Microsoft 技术支持人员联系。 若要联系Microsoft 支持部门专业人员,请访问业务支持,然后选择“服务器>Exchange Server”。 由于你的组织可能已制定了直接与 Microsoft 产品支持服务联系的特定流程,因此,请务必先查看你组织的准则。