Добро пожаловать в форум, Guest >> Войти | Регистрация | Поиск | Правила | | В избранное | Подписаться | ||
Все форумы / Microsoft SQL Server |
![]() ![]() |
MirrorSwitch
Guest |
всем привет. у нас настроен мирроринг витх витхесс mirroring_connection_timeout равен 45 сек. после того как упал примары сервер витнесс свинулcja сразу же. в чем проблема почему он сделал свич сразу? thanks |
6 ноя 17, 21:53 [20930841] Ответить | Цитировать Сообщить модератору |
Andy_OLAP Member Откуда: я знаю, что Хапоэль Беэр-Шева - чемпион Сообщений: 3151 |
Давайте поиграем в телепатов. Версия 2012, SP1 не установлен, CU1 после SP1 не установлен. Угадал? |
||
6 ноя 17, 22:09 [20930858] Ответить | Цитировать Сообщить модератору |
Andy_OLAP Member Откуда: я знаю, что Хапоэль Беэр-Шева - чемпион Сообщений: 3151 |
MirrorSwitch, Ну и конечно никто не ловит саботажников, которые могли запустить "ALTER DATABASE ваша_база SET PARTNER TIMEOUT 0". |
6 ноя 17, 22:10 [20930860] Ответить | Цитировать Сообщить модератору |
MirrorSwitch
Guest |
Microsoft SQL Server 2014 (SP2-CU6) (KB4019094) - 12.0.5553.0 (X64) Jun 28 2017 16:26:18 Copyright (c) Microsoft Corporation Enterprise Edition (64-bit) on Windows NT 6.3 <X64> (Build 9600: ) никакого саботажа, свичнулось 60+ серверов в пределах 1-20 сек после того как отвалился примары |
7 ноя 17, 00:15 [20931079] Ответить | Цитировать Сообщить модератору |
Eleanor Member Откуда: Сообщений: 3256 |
MirrorSwitch, Могу только предположить из определения mirroring_connection_timeout - the number of seconds to wait for a reply from a partner or witness before considering them unavailable. Что вы подразумеваете под "отвалился примари"? Не могло быть, что была ситуация не таймаута, а что ответ был сразу, но с какой-то ошибкой? |
7 ноя 17, 01:28 [20931146] Ответить | Цитировать Сообщить модератору |
Andy_OLAP Member Откуда: я знаю, что Хапоэль Беэр-Шева - чемпион Сообщений: 3151 |
Сколько сетевых карт на каждом из серверов? Установлена ли галочка "Register this connection's addresses in DNS" на каждой сетевой карте? |
||
7 ноя 17, 01:36 [20931153] Ответить | Цитировать Сообщить модератору |
Andy_OLAP Member Откуда: я знаю, что Хапоэль Беэр-Шева - чемпион Сообщений: 3151 |
MirrorSwitch, По-моему, Ваш случай - у вас witness случаем не в ВМ живет? |
7 ноя 17, 01:40 [20931155] Ответить | Цитировать Сообщить модератору |
Владислав Колосов Member Откуда: Сообщений: 8485 |
MirrorSwitch, каким это боком относится к переключению?
|
||
7 ноя 17, 11:10 [20931818] Ответить | Цитировать Сообщить модератору |
MirrorSwitch
Guest |
давайте заново. есть 60+ серверов чьи примары и зеркала находятся в разных датацентрах и есть витнесс. после того как отвалился датацентер на котором находятся примары сервера, витнесс не стал ждать 45 секунд согласно ALTER DATABASE myDB SET PARTNER TIMEOUT 45 for each DB и переключил все базы пределах 1-20 сек и да все сервера VM |
7 ноя 17, 17:01 [20933633] Ответить | Цитировать Сообщить модератору |
Andy_OLAP Member Откуда: я знаю, что Хапоэль Беэр-Шева - чемпион Сообщений: 3151 |
А как переключил - не оставив следов, или их руками затерли? Или все-таки что-то осталось в журналах? Поищите типа "DNS lookup failed" - есть такое? 2011-06-20 10:42:50.09 spid28s Error: 1474, Severity: 16, State: 1. 2011-06-20 10:42:50.09 spid28s Database mirroring connection error 2 'DNS lookup failed with error: '11001(No such host is known.)'.' for 'TCP://Prod01.xxx.xxx.xxx:5022'. |
||
7 ноя 17, 17:19 [20933730] Ответить | Цитировать Сообщить модератору |
MirrorSwitch
Guest |
da, все залогировано. такая запись в логах есть. мой вопрос почему переключение произошло cразу а ne по istechenii 45 сек ? |
7 ноя 17, 17:31 [20933815] Ответить | Цитировать Сообщить модератору |
Eleanor Member Откуда: Сообщений: 3256 |
MirrorSwitch, Если бы вы переключались по таймауту, у вас была бы другая ошибка: Error: 1479 The mirroring connection to ... has timed out for database ... after 45 seconds without a response Сработала другая причина для переключения. |
7 ноя 17, 18:06 [20934027] Ответить | Цитировать Сообщить модератору |
Andy_OLAP Member Откуда: я знаю, что Хапоэль Беэр-Шева - чемпион Сообщений: 3151 |
Повторяю тогда мой второй вопрос - сколько сетевых карточек на каждом из серверов. И мой третий вопрос - что насчет галочек в свойствах сетевых? Вы можете не ориентироваться на DNS, а в файле hosts железобетонно на всех 3 серверах прописать IP их самих и их соседа и witness? |
||
7 ноя 17, 18:10 [20934043] Ответить | Цитировать Сообщить модератору |
MirrorSwitch
Guest |
да галочка стоит (IP4 IP6). на каждом сервере один Ethernet Adapter. вы предлагаете прописывать IP на каждом сервере? на каком оcновании? переключение пары примари-зеркало происходит и так. у меня 500+ серверов на каждом прописывать hosts? |
7 ноя 17, 18:27 [20934096] Ответить | Цитировать Сообщить модератору |
Andy_OLAP Member Откуда: я знаю, что Хапоэль Беэр-Шева - чемпион Сообщений: 3151 |
Ну не хотите, как хотите - настраивайте DNS, чтобы не видеть его ошибок в журнале. Когда ошибки исчезнут - а witness будет внезапно переключать, тогда дальше продолжим думать :) |
||
7 ноя 17, 18:28 [20934099] Ответить | Цитировать Сообщить модератору |
MirrorSwitch
Guest |
Eleanor, где можно посмотреть другие причины приводящие к такому на мой взгляд недокументированному поведению? есть хороший линк на doc от MS? Andy_OLAP, spasibo za потраченное время, очень ценю ваш вклад в решение задачи |
7 ноя 17, 18:33 [20934112] Ответить | Цитировать Сообщить модератору |
Eleanor Member Откуда: Сообщений: 3256 |
MirrorSwitch, Хороший линк со всеми кодами ошибок не знаю. Поверхностно поведение описано в Possible Failures During Database Mirroring: soft errors - переключение произойдет по ожидаемому вами таймауту hard errors - переключение пойдет по другому механизму (упоминается ваш случай с DNS) |
7 ноя 17, 18:48 [20934156] Ответить | Цитировать Сообщить модератору |
Andy_OLAP Member Откуда: я знаю, что Хапоэль Беэр-Шева - чемпион Сообщений: 3151 |
Что же Вы так нервничаете? Дайте вывод ipconfig /all на каждом из 3 серверов - primary, witness, куда_переехало. "Primary DNS Suffix" - вот это интересует в основном. И как команду составили "ALTER DATABASE dbname SET PARTNER = ...". |
||
7 ноя 17, 18:51 [20934160] Ответить | Цитировать Сообщить модератору |
Andy_OLAP Member Откуда: я знаю, что Хапоэль Беэр-Шева - чемпион Сообщений: 3151 |
MirrorSwitch, От кого запущены службы SQL - от NETWORK SERVICE или от доменного пользователя? Базы Transparent Database Encryption или обычные? Чем больше подробностей - тем ближе решение проблемы. |
7 ноя 17, 18:58 [20934175] Ответить | Цитировать Сообщить модератору |
Andy_OLAP Member Откуда: я знаю, что Хапоэль Беэр-Шева - чемпион Сообщений: 3151 |
Предлагаю дальше попробовать телепатические возможности эксперта. VM - это VMWare ESX. А параметр isolation.tools.setinfo.disable Вы не смотрели. Рекомендую обратиться к администраторам ВМ и вместе с ними проверить работу DNS. |
||
7 ноя 17, 19:15 [20934209] Ответить | Цитировать Сообщить модератору |
MirrorSwitch
Guest |
Eleanor, Этот линк я видел, спасибо. там нет упоминания что произойдет моментальный свитч, буду звонить MS |
7 ноя 17, 19:36 [20934249] Ответить | Цитировать Сообщить модератору |
Eleanor Member Откуда: Сообщений: 3256 |
MirrorSwitch, По линку упоминается, что некоторые hard errors возвращаются мгновенно: Some hard errors, such as network failures are reported immediately. However, in some cases, component-specific time-out periods can delay the reporting of some hard errors. For soft errors, the length of the mirroring time-out period determines the speed of error detection. By default, this period is 10 seconds. А для срабатывания автоматического переключения достаточно (Conditions Required for an Automatic Failover), чтобы зеркало определило потерю принципала - hard или soft error. Мгновенный hard error - зеркало сразу определило потелю принципала - сразу переключается. |
7 ноя 17, 23:47 [20934909] Ответить | Цитировать Сообщить модератору |
Eleanor Member Откуда: Сообщений: 3256 |
MirrorSwitch, Кстати, вот еще подробно расписан процесс переключения, в подтверждение тому, что я написала: The failover process occurs as shown below: - Failure occurs - Time to detect failure. Hard failures are quick to detect (around a second), soft failures take longer (default 10 seconds, set by time-out value). - Failure detected - Coordinate with witness. (around a second) ... |
8 ноя 17, 00:24 [20934952] Ответить | Цитировать Сообщить модератору |
Все форумы / Microsoft SQL Server | ![]() |