Добро пожаловать в форум, Guest  >>   Войти | Регистрация | Поиск | Правила | В избранное | Подписаться
Все форумы / Microsoft SQL Server Новый топик    Ответить
Топик располагается на нескольких страницах: [1] 2   вперед  Ctrl      все
 оставшееся время жизни SSD  [new]
Alexander Us
Member

Откуда:
Сообщений: 1130
Поделитесь опытом: как вы на продакшинах контролируете оставшееся время жизни SSD?

Моя проблема:

SQL 2008, 64, Ent, перевели базы и систему на SSD, теперь думаем когда же они (SSD) умрут?
Поэтому хочется считать TBW с SSD дисков.

Особенность: диски в массиве, большинство тулов из из массива не читают.
Контроллер: Intel Integrated Raid Controller RMS3CC80, BBU

- есть ли возможность вычитать прямо из SQL?
- есть ли тулы, можно платные.
11 окт 17, 11:20    [20859974]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
StarikNavy
Member

Откуда: Москва
Сообщений: 2396
Alexander Us,

у вас все проблемы в оптимизации базы решены, и теперь можно фигней маятся? ))
11 окт 17, 11:53    [20860119]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
Alexander Us
Member

Откуда:
Сообщений: 1130
StarikNavy,

Так как SSD в массиве имеют одинаковый ресурс TBW, то и выпадают одновременно.
У людей такое случалось гораздо раньше, чем они могли себе представить.

Считаю такую проверку необходимой.
11 окт 17, 12:07    [20860200]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
o-o
Guest
некоторые товарищи тоже умирают гораздо раньше, чем они могли себе представить.
как бы узнать точную дату будущей неизбежной смерти, желательно используя SQL?
11 окт 17, 12:17    [20860286]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
alexeyvg
Member

Откуда: Moscow
Сообщений: 31371
StarikNavy
Alexander Us,

у вас все проблемы в оптимизации базы решены, и теперь можно фигней маятся? ))
Какие угодно действия с софтом не отменяют администрирование железа. UPS, охлаждение, состояние дисков нужно контролировать даже при неоптимальных базах.

Alexander Us
Поэтому хочется считать TBW с SSD дисков.
А разве в SMART нет этой информации?

ИМХО вам нужно поизучать администрирование этого контроллера.
11 окт 17, 12:21    [20860309]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
vborets
Member

Откуда:
Сообщений: 164
Alexander Us,

Раз в месяц подменяете один диск из массива на новый,
Юзаный подключаете к компу и родными утилитами смотрите как ему плохо. Соответственно уже есть информация по оставшимся.
Потом меняете взад, или не меняете.. :-)
11 окт 17, 12:40    [20860441]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
alexeyvg
Member

Откуда: Moscow
Сообщений: 31371
vborets
Alexander Us,

Раз в месяц подменяете один диск из массива на новый,
Юзаный подключаете к компу и родными утилитами смотрите как ему плохо. Соответственно уже есть информация по оставшимся.
Потом меняете взад, или не меняете.. :-)
Да в доке к контроллеру написано, что смарт дисков доступен
Не нужно таких сложностей...
11 окт 17, 12:43    [20860456]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
Alexander Us
Member

Откуда:
Сообщений: 1130
alexeyvg
Да в доке к контроллеру написано, что смарт дисков доступен
Не нужно таких сложностей...


alexeyvg,
спасибо за поддержку, хоть один человек на ветке понимает, что для проверки уровня масла может быть индикатор.

а то тут некоторые считают что масло вооооооообще проверять не надо,
другие советуют разборать мотор и смотреть глазами.

Остался вопрос:
кто посоветует испытанный тул, который работает с этим самым контроллером: (Intel Integrated Raid Controller RMS3CC80, BBU)

Или можно как легко то считывать без тула?
11 окт 17, 13:10    [20860587]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
Dimitry Sibiryakov
Member

Откуда:
Сообщений: 50860
Alexander Us
Или можно как легко то считывать без тула?

Вообще-то вся соль того совета не в "считываете", а в "периодически меняете". То есть в вашем массиве не должно быть дисков с одинаково выработанным ресурсом, всегда должен быть самый старый, который и выйдет из строя первым, но сделает это в одиночку. А лучше - RAID 6, чтобы пережить выход из строя сразу двух.
11 окт 17, 13:49    [20860811]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
o-o
Guest
Alexander Us
хоть один человек на ветке понимает, что для проверки уровня масла может быть индикатор.

не совсем понятно, при чем тут сервер?
ведь и дату смерти ДБА желательно знать наперед, иначе сервер пострадает.
про железо наверное надо в разделе железа спрашивать,
равно как и об анализах/здоровье интересоваться в более подходящем месте
11 окт 17, 14:10    [20860937]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
Alexander Us
Member

Откуда:
Сообщений: 1130
Dimitry Sibiryakov,

Ваш совет "периодически меняеть" премлим когда речь идёт об 1-2 дисках.
Если их больше, придётся заводить гнома, который будет заниматься заменой дисков.
Не говоря уже о неэффективном расходовании средств на диски для замены.

В идеале хочется иметь оповещение, что диск XYZ исчерпал свой TBW ресурс на, например, 80%.
Тогда и менять.
11 окт 17, 14:14    [20860961]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
a_shats
Member

Откуда: Москва
Сообщений: 814
Alexander Us,

Штатный Intel SSD Datacenter Tool, например
https://downloadcenter.intel.com/download/27144?v=t
Но он поддерживает только Intel SSD и только Enterprise серий.
11 окт 17, 14:23    [20861008]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
Владислав Колосов
Member

Откуда:
Сообщений: 7780
Если бэкапы не делать, то да, можно сидеть, трястись.
11 окт 17, 15:41    [20861319]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
Alexander Us
Member

Откуда:
Сообщений: 1130
a_shats
Alexander Us,

Штатный Intel SSD Datacenter Tool, например
https://downloadcenter.intel.com/download/27144?v=t
Но он поддерживает только Intel SSD и только Enterprise серий.

Спасибо, увы диски хотя Enterprise но не от Intel а от Samsung.
11 окт 17, 15:55    [20861373]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
Alexander Us
Member

Откуда:
Сообщений: 1130
Владислав Колосов
Если бэкапы не делать, то да, можно сидеть, трястись.

И при чём тут бэкапы???

Даже при их наличии, если у Вас вылетит ВЕСЬ массив сразу* что Вы будете делать?
*ну или отдельные диски, но один за другим так быстро, что вы их тупо не успеете поменять.
11 окт 17, 16:00    [20861396]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
Гавриленко Сергей Алексеевич
Member

Откуда: Moscow
Сообщений: 36989
Alexander Us
то Вы будете делать?
Переключусь на вторую ноду.
11 окт 17, 16:02    [20861412]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
Alexander Us
Member

Откуда:
Сообщений: 1130
Гавриленко Сергей Алексеевич
Alexander Us
то Вы будете делать?
Переключусь на вторую ноду.

Что означает скорее всего кратковременный но сбой в работе приложений.
Контролируя TBW этого можно было бы избежать.
11 окт 17, 16:10    [20861453]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
Zulus
Member

Откуда: Замкадье
Сообщений: 490
Гавриленко Сергей Алексеевич
Alexander Us
то Вы будете делать?
Переключусь на вторую ноду.
Извините что влезу, но мне это спор интересен, несколько с гипотетической точки зрения.
А на вторую ноду чего Вы планируете переключаться? Резервный ДЦ?
11 окт 17, 16:11    [20861456]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
o-o
Guest
у Гавриленко не гипотетический, а самый что ни на есть реальный Always On.
т.е. все миррорится на вообще другой сервер со своим собственным массивом
11 окт 17, 16:27    [20861507]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
Alexander Us
Member

Откуда:
Сообщений: 1130
o-o
у Гавриленко не гипотетический, а самый что ни на есть реальный Always On.
т.е. все миррорится на вообще другой сервер со своим собственным массивом


а переключение на вторую ноду происходит для приложение незаметно, без заметных зажержек или обрывов соединенией?
11 окт 17, 16:47    [20861578]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
Злой Гусак
Member

Откуда: у аклина дева ?
Сообщений: 3038
Осознать, что TBW это гадание на хрустальном шаре(да ещё и трудозатратное, так как вряд ли вы найдёте нормальную утилиту чекающую в массиве), а вот hot spare в raid'е, да ещё и с диском у которого заведомо меньший TBW именно то, что надо. Без вреда продуктивной среде раз в месяц\квартал\полгода\год диск hot spare изымается и чекается на обычном компе родной утилитой, вставляется обратно. Все спят спокойно. Диски в raid будут работать на 100% ресурса, пока не умрут своей смертью, а не будут отправляться в утиль раньше времени.
11 окт 17, 16:56    [20861613]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
alexeyvg
Member

Откуда: Moscow
Сообщений: 31371
Злой Гусак
Осознать, что TBW это гадание на хрустальном шаре(да ещё и трудозатратное, так как вряд ли вы найдёте нормальную утилиту чекающую в массиве), а вот hot spare в raid'е, да ещё и с диском у которого заведомо меньший TBW именно то, что надо
Совершенно правильно, тоже не понимаю акцент именно на TBW.

Заявленный производителем TBW вообще в десятки раз больше, чем реальный, и он (реальный) неодинаковый для разных экземпляров.
Так что все диски сразу не вылетят. И хот-свап диски, специально для этого придуманные, вполне помогут.

Что не отменяет желательность мониторинга, потому что понять исчерпание ресурса можно по другим параметрам.

Да, и нужно быть готовым немедленно покупать диски при переключении хот-свапа, не растягивать это на время полугодовых согласований бюджета.

В общем, итого: хот-свап, готовность менять диски, мониторинг оповещений от массива, ну и факутальтивно - искать утилиты.
11 окт 17, 17:10    [20861662]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
alexeyvg
Member

Откуда: Moscow
Сообщений: 31371
alexeyvg
Заявленный производителем TBW вообще в десятки раз больше, чем реальный
в десятки раз меньше, конечно, а не больше.
11 окт 17, 17:10    [20861663]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
Гавриленко Сергей Алексеевич
Member

Откуда: Moscow
Сообщений: 36989
Alexander Us
o-o
у Гавриленко не гипотетический, а самый что ни на есть реальный Always On.
т.е. все миррорится на вообще другой сервер со своим собственным массивом


а переключение на вторую ноду происходит для приложение незаметно, без заметных зажержек или обрывов соединенией?
Почитайте про AlwaysOn. Он сможет помочь не только когда вдруг все диски в массиве вылетели, но еще при куче других отказов, не чинящихся банальной заменой диска (например, из-за осадков сломалась система охлаждения в ДЦ или мать на сервере сгорела).
11 окт 17, 17:17    [20861694]     Ответить | Цитировать Сообщить модератору
 Re: оставшееся время жизни SSD  [new]
Zulus
Member

Откуда: Замкадье
Сообщений: 490
o-o
у Гавриленко не гипотетический, а самый что ни на есть реальный Always On.
т.е. все миррорится на вообще другой сервер со своим собственным массивом
В том, что AOn у товарища Гавриленко реален я не сомневаюсь :)
Мне просто было интересно что именно подразумевалось под переключением.
А почему я так спросил - в моём случае на системе хранения может висеть много чего и далеко не все данные, хранимые на сторэдже управляются сиквелом, а из сиквельных баз, далеко не все базы используют AOn.
И разбор массива из-за вылета нескольких SSD был бы неприятным приключением, так как защиту от таких дел я вижу только в мирроринге всего массива или отдельных его пулов средствами СХД в резервный датацентр. А это дело весьма затратное - позволить его могут не только лишь все. И индикатор состояния SSD, о котором спрашивает ТС - штука, на мой взгляд, полезная.
Ответ Сергея Алексеевича понятен, спасибо
11 окт 17, 17:24    [20861724]     Ответить | Цитировать Сообщить модератору
Топик располагается на нескольких страницах: [1] 2   вперед  Ctrl      все
Все форумы / Microsoft SQL Server Ответить