Aracılığıyla paylaş


SQL Server ile IaaS - yük devretme kümesi ağ eşiklerini ayarlama

Bu makalede yük devretme kümesi ağlarının eşiğini ayarlamaya yönelik çözümler verilmektedir.

Belirti

IaaS'de Windows yük devretme kümesi düğümlerini SQL Server AlwaysOn kullanılabilirlik grubuyla çalıştırdığınızda, küme ayarının daha rahat bir izleme durumuna değiştirilmesi önerilir. Kutudaki küme ayarları kısıtlayıcıdır ve gereksiz kesintilere neden olabilir. Varsayılan ayarlar, yüksek oranda ayarlanmış şirket içi ağlar için tasarlanmıştır ve Microsoft Azure (IaaS) gibi çok kiracılı bir ortamdan kaynaklanan gecikme olasılığını dikkate almaz.

Windows Server Yük Devretme Kümelemesi, bir Windows Kümesindeki düğümlerin ağ bağlantılarını ve sistem durumunu sürekli olarak izler. Bir düğüme ağ üzerinden erişilemiyorsa, uygulamaları ve hizmetleri kümedeki başka bir düğümde kurtarmak ve çevrimiçi duruma getirmek için kurtarma eylemi gerçekleştirilir. Küme düğümleri arasındaki iletişimin gecikmesi aşağıdaki hataya neden olabilir:

Hata 1135 (sistem olay günlüğü)

Küme düğümü Düğüm 1 etkin yük devretme kümesi üyeliğinden kaldırıldı. Bu düğümdeki Küme hizmeti durdurulmuş olabilir. Bunun nedeni, düğümün yük devretme kümesindeki diğer etkin düğümlerle iletişimi kaybetmesi de olabilir. Ağ yapılandırmanızı denetlemek için Yapılandırma doğrulama sihirbazını çalıştırın. Koşul devam ederse, bu düğümdeki ağ bağdaştırıcılarıyla ilgili donanım veya yazılım hatalarını denetleyin. Ayrıca hub'lar, anahtarlar veya köprüler gibi düğümün bağlı olduğu diğer ağ bileşenlerindeki hataları denetleyin.

Cluster.log örnek:

0000ab34.00004e64::2014/06/10-07:54:34.099 DBG   [NETFTAPI] Signaled NetftRemoteUnreachable event, local address 10.xx.x.xxx:3343 remote address 10.x.xx.xx:3343
0000ab34.00004b38::2014/06/10-07:54:34.099 INFO  [IM] got event: Remote endpoint 10.xx.xx.xxx:~3343~ unreachable from 10.xx.x.xx:~3343~
0000ab34.00004b38::2014/06/10-07:54:34.099 INFO  [IM] Marking Route from 10.xxx.xxx.xxxx:~3343~ to 10.xxx.xx.xxxx:~3343~ as down
0000ab34.00004b38::2014/06/10-07:54:34.099 INFO  [NDP] Checking to see if all routes for route (virtual) local fexx::xxx:5dxx:xxxx:3xxx:~0~ to remote xxx::cxxx:xxxd:xxx:dxxx:~0~ are down
0000ab34.00004b38::2014/06/10-07:54:34.099 INFO  [NDP] All routes for route (virtual) local fxxx::xxxx:5xxx:xxxx:3xxx:~0~ to remote fexx::xxxx:xxxx:xxxx:xxxx:~0~ are down
0000ab34.00007328::2014/06/10-07:54:34.099 INFO  [CORE] Node 8: executing node 12 failed handlers on a dedicated thread
0000ab34.00007328::2014/06/10-07:54:34.099 INFO  [NODE] Node 8: Cleaning up connections for n12.
0000ab34.00007328::2014/06/10-07:54:34.099 INFO  [Nodename] Clearing 0 unsent and 15 unacknowledged messages.
0000ab34.00007328::2014/06/10-07:54:34.099 INFO  [NODE] Node 8: n12 node object is closing its connections
0000ab34.00008b68::2014/06/10-07:54:34.099 INFO  [DCM] HandleNetftRemoteRouteChange
0000ab34.00004b38::2014/06/10-07:54:34.099 INFO  [IM] Route history 1: Old: 05.936, Message: Response, Route sequence: 150415, Received sequence: 150415, Heartbeats counter/threshold: 5/5, Error: Success, NtStatus: 0 Timestamp: 2014/06/10-07:54:28.000, Ticks since last sending: 4
0000ab34.00007328::2014/06/10-07:54:34.099 INFO  [NODE] Node 8: closing n12 node object channels
0000ab34.00004b38::2014/06/10-07:54:34.099 INFO  [IM] Route history 2: Old: 06.434, Message: Request, Route sequence: 150414, Received sequence: 150402, Heartbeats counter/threshold: 5/5, Error: Success, NtStatus: 0 Timestamp: 2014/06/10-07:54:27.665, Ticks since last sending: 36
0000ab34.0000a8ac::2014/06/10-07:54:34.099 INFO  [DCM] HandleRequest: dcm/netftRouteChange
0000ab34.00004b38::2014/06/10-07:54:34.099 INFO  [IM] Route history 3: Old: 06.934, Message: Response, Route sequence: 150414, Received sequence: 150414, Heartbeats counter/threshold: 5/5, Error: Success, NtStatus: 0 Timestamp: 2014/06/10-07:54:27.165, Ticks since last sending: 4
0000ab34.00004b38::2014/06/10-07:54:34.099 INFO  [IM] Route history 4: Old: 07.434, Message: Request, Route sequence: 150413, Received sequence: 150401, Heartbeats counter/threshold: 5/5, Error: Success, NtStatus: 0 Timestamp: 2014/06/10-07:54:26.664, Ticks since last sending: 36
0000ab34.00007328::2014/06/10-07:54:34.100 INFO    <realLocal>10.xxx.xx.xxx:~3343~</realLocal>
0000ab34.00007328::2014/06/10-07:54:34.100 INFO    <realRemote>10.xxx.xx.xxx:~3343~</realRemote>
0000ab34.00007328::2014/06/10-07:54:34.100 INFO    <virtualLocal>fexx::xxxx:xxxx:xxxx:xxxx:~0~</virtualLocal>
0000ab34.00007328::2014/06/10-07:54:34.100 INFO    <virtualRemote>fexx::xxxx:xxxx:xxxx:xxxx:~0~</virtualRemote>
0000ab34.00007328::2014/06/10-07:54:34.100 INFO    <Delay>1000</Delay>
0000ab34.00007328::2014/06/10-07:54:34.100 INFO    <Threshold>5</Threshold>
0000ab34.00007328::2014/06/10-07:54:34.100 INFO    <Priority>140481</Priority>
0000ab34.00007328::2014/06/10-07:54:34.100 INFO    <Attributes>2147483649</Attributes>
0000ab34.00007328::2014/06/10-07:54:34.100 INFO  </struct mscs::FaultTolerantRoute>
0000ab34.00007328::2014/06/10-07:54:34.100 INFO   removed
0000ab34.0000a7c0::2014/06/10-07:54:38.433 ERR   [QUORUM] Node 8: Lost quorum (3 4 5 6 7 8)
0000ab34.0000a7c0::2014/06/10-07:54:38.433 ERR   [QUORUM] Node 8: goingAway: 0, core.IsServiceShutdown: 0
0000ab34.0000a7c0::2014/06/10-07:54:38.433 ERR   lost quorum (status = 5925)

Neden

Kümenin bağlantı durumunu yapılandırmak için kullanılan iki ayar vardır.

Gecikme - Bu, düğümler arasında küme sinyallerinin gönderilme sıklığını tanımlar. Gecikme, sonraki sinyal gönderilmeden önceki saniye sayısıdır. Aynı kümede, aynı alt ağ üzerindeki düğümler ile farklı alt ağlardaki düğümler arasında farklı gecikmeler olabilir.

Eşik - Bu, küme kurtarma eylemi gerçekleştirmeden önce atlanan sinyal sayısını tanımlar. Eşik, bir dizi sinyaldir. Aynı küme içinde, aynı alt ağ üzerindeki düğümler ile farklı alt ağlardaki düğümler arasında farklı eşikler olabilir.

Varsayılan olarak Windows Server 2016 SameSubnetThreshold değeri 10, SameSubnetDelay değeri 1000 ms olarak ayarlanır. Örneğin, bağlantı izleme 10 saniye boyunca başarısız olursa yük devretme Eşiğine ulaşılır ve bu düğüme ulaşılamaz durumda küme üyeliğinden kaldırılır. Bu, kaynakların kümedeki başka bir kullanılabilir düğüme taşınmasına neden olur. Küme hataları bildirilir ve küme hatası 1135 (yukarıda) bildirilir.

Çözüm

Bu sorunu çözmek için Küme ağı yapılandırma ayarlarını gevşetin. Bkz . Sinyal ve eşik.

Başvurular

Windows Kümesi ağ yapılandırma ayarlarını ayarlama hakkında daha fazla bilgi için bkz. Yük Devretme Kümesi Ağ Eşiklerini Ayarlama.

Windows Kümesi ağ yapılandırma ayarlarını ayarlamak için cluster.exe kullanma hakkında bilgi için bkz. Yük Devretme Kümesi için Küme Ağlarını Yapılandırma.