Добро пожаловать в форум, Guest  >>   Войти | Регистрация | Поиск | Правила | В избранное | Подписаться
Все форумы / Microsoft SQL Server Новый топик    Ответить
Топик располагается на нескольких страницах: Ctrl  назад   1 [2] 3 4 5 6   вперед  Ctrl      все
 Re: Помогите выбрать дисковый расклад  [new]
alkoln
Member

Откуда:
Сообщений: 67
vino
В данном случае RAID10 пишет никак не медленнее RAID0


С этим, если честно, я тоже не соглашусь. :) RAID0(x4) - это 4 доступных для записи диска, а RAID10(x4) - это всего лишь два диска, доступных для записи, и ещё два дублирующих диска.
21 апр 09, 12:52    [7091414]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
vino
Member

Откуда:
Сообщений: 1191
alkoln, ты прав, конечно, но я полагал, что, естественно, надо учитывать избыточность. Понятно вроде, что в RAID10 половина дисков задействована на избыточность
Но пока я уверен, что отдельные зеркала будут существенно медленнее. Возможно, Александр Гладченко убедит меня в обратном?
21 апр 09, 13:15    [7091634]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
Александр Гладченко
Member

Откуда:
Сообщений: 10802
Блог
Убеждать должен не я, а тесты реального железа, например с помощью SQLIO.
Те дисковые системы (от DAS до SAN) которыя мне попадались вели себя примерно одинаково, поэтому я осмелился предложить именно зеркала.
Почему RAID10 и RAID5 с одинаковым количетвом шпинделей сравнимы по производительности записи должно быть понятно и без тестов, сравните число дисковых операци в том и другом случае.
Надёжность от числа шпинделей лучше не становиться, это уже законы вероятности. Тем более, что избыточность у RAID10 и RAID1 одинаковая. Также можно поспорить и стем, что от увеличения числа шпинделей RAID10 будет работать быстрее... только до определённого парога, потом рост прекратиться, а потом и до деградации не далеко. Попробуйте это проверить на тестах, думаю, эффект станет заметен даже на двух полках.
Ещё про надёжность RAID10 - выход одного диска рушит всё зеркало. У RAID1 будет порушено только одно зеркало, а все другие массивы это не затронет. Теперь посмотрите, что будет проще устранить...
Потом, не смотрите на порождаемую СУБД нагрузку так просто... Кроме линейного и случайного чтения, есть ещё факторы многопоточности и очередей. К тому же, есть ещё характерные для СУБД размеры рабочей нагрузки и запросов воода вывода. Разные уровни RAID в этом многообразии режимов ведут себя не одинаково и надо сравнивать их не дифференцировано, а с учётом всех вариантов поведения. Именно такое сравнение я последний раз делал в прошлом месяце для дисковой подсистемы одного из известных вендоров, вот его окончательные результаты:

К сообщению приложен файл. Размер - 0Kb
21 апр 09, 14:22    [7092202]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
alkoln
Member

Откуда:
Сообщений: 67
Александр Гладченко,

Если я правильно интерпретировал приведённую Вами диаграмму, то большинство лидирующих позиций в ней занимают одиночные физические диски, что в корне противоречит концепции использования RAID-массивов, которые по определению предоставляют не только надёжность, но и повышенную производительность. Этот факт наводит меня на подозрения относительно Вашей методики тестирования. В частности меня очень интересует размер блоков чередования (stripe size) на тестировавшихся вами массивах, а также размер кластера файловой системы. Ещё один немаловажный аспект - это наличие выравнивания логического диска с границами блоков чередования, отсутствие которого, как известно, приводит к чувствительной деградации производительности в связи с тем, что при одной операции чтения блока фактически затрагиваются два физических блока RAID-массива. Без детальной по вышеуказанным аспектам результаты приведённого теста кажутся мне довольно сомнительными.
21 апр 09, 14:56    [7092486]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
alkoln
Member

Откуда:
Сообщений: 67
Александр Гладченко,

Хотя, если по вертикальной оси отложено время выполнения операции, а не скорость (как я изначально предположил), то всё встаёт на свои места.
21 апр 09, 15:03    [7092546]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
vino
Member

Откуда:
Сообщений: 1191
alkoln, вряд ли - RAID5 ни при каком раскладе не может быть лучшим по скорости - это всегда явный компромис в удешевлении избыточности за счет скорости.
Полагаю, в данном тесте количество шпинделей одинаково, по вертикальной оси скорость в Мб/с или количество каких-либо операций, а БД в столбце noRAID сама оптимизирует I/O.
В любом случае, от ссылки на методику я бы не отказался
21 апр 09, 15:08    [7092578]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
alkoln
Member

Откуда:
Сообщений: 67
Александр Гладченко,

И всё же, меня по-прежнему интересует вышеописанная информация, а также количество физических дисков в каждом из массивов.

Например, вот одно из явно бросающихся в глаза несоответствий:

Массив RAID0 по определению не может проигрывать в скорости записи массиву RAID5 с таким же количеством дисков, т.к. в нём вообще отсутствует избыточность, а RAID5 она есть. В противном же случае RAID5 представляется эдакой панацеей от всех бед (и быстрый, и надёжный, и вообще просто сказка, а не массив), однако такого мнения я до сих пор нигде не встречал, даже в официальных мануалах Мелкософта по дисковой оптимизации SQL Server :)

Так что, коллега, чего-то Вы недоговариваете ;)
21 апр 09, 15:11    [7092603]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
alkoln
Member

Откуда:
Сообщений: 67
vino,

Судя по последним двум сообщениям, наши с Вами мнения совпали, только аргументы разные приведены :)
21 апр 09, 15:13    [7092620]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
vino
Member

Откуда:
Сообщений: 1191
alkoln, в общем, да. К тому же здесь тест всего лишь одного неизвестного устройства.
В принципе, как раз той же утилитой SQLIO можете потестить разные конфигурации на своем оборудовании. Потом можно будет обсудить результаты.
21 апр 09, 15:36    [7092818]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
DeColo®es
Member

Откуда: Москва
Сообщений: 5503
Блог
vino
alkoln, в общем, да. К тому же здесь тест всего лишь одного неизвестного устройства.
В принципе, как раз той же утилитой SQLIO можете потестить разные конфигурации на своем оборудовании. Потом можно будет обсудить результаты.
Для начала - нужно понять характер нагшрузки, которую нужно эмулировать при помощи SQLIO. ;)
21 апр 09, 17:52    [7094024]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
vino
Member

Откуда:
Сообщений: 1191
DeColo®es, да-да, спасибо, я уже читаю
21 апр 09, 17:54    [7094047]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
Александр Гладченко
Member

Откуда:
Сообщений: 10802
Блог
alkoln
Александр Гладченко,

Если я правильно интерпретировал приведённую Вами диаграмму, то большинство лидирующих позиций в ней занимают одиночные физические диски, что в корне противоречит концепции использования RAID-массивов, которые по определению предоставляют не только надёжность, но и повышенную производительность. Этот факт наводит меня на подозрения относительно Вашей методики тестирования. В частности меня очень интересует размер блоков чередования (stripe size) на тестировавшихся вами массивах, а также размер кластера файловой системы. Ещё один немаловажный аспект - это наличие выравнивания логического диска с границами блоков чередования, отсутствие которого, как известно, приводит к чувствительной деградации производительности в связи с тем, что при одной операции чтения блока фактически затрагиваются два физических блока RAID-массива. Без детальной по вышеуказанным аспектам результаты приведённого теста кажутся мне довольно сомнительными.


Замеры без RAID нужны для того, чтобы понять масштаб потерь производительности, вызванных использованием дисковых RAID. Я уже говорил, что SQL Server балансирует ввод-вывод намного лучше любого контроллера. Ксати, это доказывает ущербность концепции использования RAID-массивов которые, как показывает практика, не обеспечивают нужный уровень надёжности и, тем более, производительности. К тому же, требования ACID не обязывают использовать избыточность для файлов баз данных, это скорее требование, относящееся к доступности данных.
Размер сегмента для массивов был 128Кб
Файловая система не использовалось, как и какое-либо кэширование. Естественно, и выравнивания никакого делать не приходилось...

В формате форума трудно расказать все особенности и детали используемой мной методики. 26 мая в московском офисе Майкрософт должен будет состояться семинар, одним из докладов на котором будет мой расказ о методах тестирования дисковых подсистем для нужд SQL Server. Приходите, там я про всё это раскажу продробно и отвечу на любые связанные с методикой вопросы.

Сообщение было отредактировано: 23 апр 09, 13:52
22 апр 09, 11:35    [7096867]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
Александр Гладченко
Member

Откуда:
Сообщений: 10802
Блог
alkoln
Александр Гладченко,

Хотя, если по вертикальной оси отложено время выполнения операции, а не скорость (как я изначально предположил), то всё встаёт на свои места.


Упс, извените, что обрезал метрику, по вертикальной оси Mbs/sec
22 апр 09, 11:36    [7096883]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
Александр Гладченко
Member

Откуда:
Сообщений: 10802
Блог
alkoln

И всё же, меня по-прежнему интересует вышеописанная информация, а также количество физических дисков в каждом из массивов.

Тестировалась полка из 12 дисков.
Сравнивались группы массивов с одинаковыс суммарным числом шпинделей. Например, 12 одиночных дисков можно сравнивать с тремя массивами RAID5 по 4 шпинделя в каждом. Почему сравнения проводились так, а не иначе, я расскажу на семинаре, поскольку методика разрабатывалась не один год ни базируется не на одной сотне экспериментов...

alkoln

Например, вот одно из явно бросающихся в глаза несоответствий:

Массив RAID0 по определению не может проигрывать в скорости записи массиву RAID5 с таким же количеством дисков, т.к. в нём вообще отсутствует избыточность, а RAID5 она есть. В противном же случае RAID5 представляется эдакой панацеей от всех бед (и быстрый, и надёжный, и вообще просто сказка, а не массив), однако такого мнения я до сих пор нигде не встречал, даже в официальных мануалах Мелкософта по дисковой оптимизации SQL Server :)

Так что, коллега, чего-то Вы недоговариваете ;)


На графике RAID0 нигде не проигрывает по записи RAID5. Поясните Ваш вопрос?
22 апр 09, 11:44    [7096977]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
Александр Гладченко
Member

Откуда:
Сообщений: 10802
Блог
DeColo®es
vino
alkoln, в общем, да. К тому же здесь тест всего лишь одного неизвестного устройства.
В принципе, как раз той же утилитой SQLIO можете потестить разные конфигурации на своем оборудовании. Потом можно будет обсудить результаты.
Для начала - нужно понять характер нагшрузки, которую нужно эмулировать при помощи SQLIO. ;)


Резонный вопрос, вот свежая таблица размеров запросов ввода-вывода:

К сообщению приложен файл. Размер - 0Kb
22 апр 09, 11:49    [7097025]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
Любитель форумов
Guest
Александр Гладченко
...26 мая в московском офисе Майкрософт должен будет состояться семинар...

Я извиняюсь за оффтоп, но можно несколько подробнее:
- где
- свободный ли вход и нужна ли регистрация
- есть ли где программа семинара
22 апр 09, 11:57    [7097120]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
Александр Гладченко
Member

Откуда:
Сообщений: 10802
Блог
Любитель форумов
Александр Гладченко
...26 мая в московском офисе Майкрософт должен будет состояться семинар...

Я извиняюсь за оффтоп, но можно несколько подробнее:
- где
- свободный ли вход и нужна ли регистрация
- есть ли где программа семинара


Точную информацию Майкрософт скоро опубликует (по моим сведениям). Информация должна появиться здесь: http://sql.ineta.ru/Events/Events.aspx
Я её обязательно продублирую в клубном блоге: http://www.itcommunity.ru/blogs/rsug/default.aspx
22 апр 09, 12:06    [7097238]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
vino
Member

Откуда:
Сообщений: 1191
Александр Гладченко, На самом деле очень странные проседания по записи на RAID10 по сравнению с RAID5. Я еще понимаю, что чтение с RAID5 сравнимо с RAID0 просто по количеству дисков, но по записи уж слишком радужно как-то.
Насколько понял, кэширование не задействуется, но это не характеризует преимуществ контроллеров со встроенным буфером. Ведь, фактически, кэширование проводится сервером в случае noRAID. Какие-нибудь сравнения с кэшированием есть?
22 апр 09, 12:08    [7097253]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
Александр Гладченко
Member

Откуда:
Сообщений: 10802
Блог
vino
Александр Гладченко, На самом деле очень странные проседания по записи на RAID10 по сравнению с RAID5. Я еще понимаю, что чтение с RAID5 сравнимо с RAID0 просто по количеству дисков, но по записи уж слишком радужно как-то.
Насколько понял, кэширование не задействуется, но это не характеризует преимуществ контроллеров со встроенным буфером. Ведь, фактически, кэширование проводится сервером в случае noRAID. Какие-нибудь сравнения с кэшированием есть?


Кэш контроллера - штука непредсказуемая.... В бою его стоит включать, но под нагрузкой он чаще всего бесполезен. К тому же, от кэша выиграет не только RAID5 или 10.
Использование RAID10 предлагают многие, причём, ни разу не видел внятных аргументов. Его преимущества - это один из популярных мифов вендоров. Когда то меня его реальная производительность тоже удивляла. Я долго думал, что это ошибки или неточности тестов. Но практика, увы, показывает именно то, что вы видите на графике. Дерьмовенький это способ размещения файлов данных и журналов. Однако, если журнал транзакций у вас может достигать терабайта (т.е. RAID1 такой не подобрать), то альтернатив RAID10 может не оказаться... Журнал на несколько фалов делить не очень гуманно.
Ещё один аспект, это всё-таки тесты не SQL Server, а SQLIO. СУБД кроме балансировки на уровне приложения ещё и мозг свой включает :), т.е. она осознанно будет страницы по дискам распихивать, или наученная людьми, будет их ещё и секционировать... т.ч. реальный выигрыш от балансировки не средствами RAID может оказаться на порядки больше того, что вы можете наблюдать на этом злополучном графике... RAID-контроллер работает как тупая машина, ему по барабану чьи и куда страницы сгружать, даже если у него мозги SAN.
22 апр 09, 12:24    [7097420]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
alkoln
Member

Откуда:
Сообщений: 67
Александр Гладченко
СУБД кроме балансировки на уровне приложения ещё и мозг свой включает :), т.е. она осознанно будет страницы по дискам распихивать, или наученная людьми, будет их ещё и секционировать... т.ч. реальный выигрыш от балансировки не средствами RAID может оказаться на порядки больше того, что вы можете наблюдать на этом злополучном графике... RAID-контроллер работает как тупая машина, ему по барабану чьи и куда страницы сгружать, даже если у него мозги SAN.


С этим утверждением я не спорю, но рассматриваю размещение объектов БД по файловым группам и секционирование таблиц отдельно от концепции RAID-массивов, т.к. подход к разбиению в таких случаях сугубо индивидуальный, и его успех определяется смекалкой и аналитическими способностями админа/оптимизатора БД. При этом ничто не мешает нам использовать и тот и другой подход одновременно. Например, у нас уже реализовано секционирование таблиц на фрагменты и размещение разных таблиц по разным файловым группам. При этом в каждой файловой группе находится всего по одному файлу данных. Насколько я представляю себе архитектуру SQL Server, по-настоящему равноправными перед I/O-логикой движка в плане балансирования нагрузки являются лишь файлы данных в рамках одной файловой группы; файлы же из разных групп сравнивать нельзя, т.к. потоки данных определяются конкретными запросами к конкретным таблицам и индексам.

Принимая во внимание всё вышесказанное, а также Ваши, Александр, доводы, мы приходим к утверждению, что два равноправных файла (в рамках одной файловой группы), будучи размещёнными на разных физических устройствах со средней скоростью чтения(записи) N, способны дать выигрыш в производительности относительно одного файла, размещённого на одном физическом устройстве со скоростью 2N.

Я правильно понял Вашу мысль, Александр?
22 апр 09, 12:49    [7097688]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
Александр Волок (def1983)
Member

Откуда: Rotterdam
Сообщений: 4959
В тему:
Disk Performance Hands On, Part 5: RAID 10 vs. RAID 5

Disk Performance Hands On, Part 3: RAID 5 Performance

Disk Performance Hands On, Part 2: RAID 10 Performance

И на моей памяти был пост, в котором очень доступно доказано, что райд0 из 2 дисков по производительности был равен 2 отдельным дискам, на которых располагались файлы одной файловой группы SQL Server.
22 апр 09, 13:38    [7098179]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
vino
Member

Откуда:
Сообщений: 1191
Александр Гладченко, теоретически массив 2N*RAID0 (со встроенным чередованием и максимальной избыточностью) имеет производительность не хуже N*RAID0 (именно N дисков!), а надежность не хуже N*RAID1.
Но могу предположить, что производители контроллеров не утруждают себя качественной реализацией чередования ни RAID0 ни RAID10 (неужели все так плохо?). Иначе объяснить столь низкие результаты этих технологий с чередованием можно только слишком узким каналом между контроллером и сервером. В принципе, согласен, с Вами: если сервер БД не манипулирует медийным контентом, то сегодня N*RAID будет лучшим вариантом, если иное не покажет тестирование конкретного контроллера.
А насчет буфера пока не соглашусь. Вспоминая тот же RAID7, чьи алгоритмы очень эффективны только при условии буфера с батарейкой, становится понятно, что алгоритмы более эффективного распределения данных с оглядкой на защищенную буферизацию существуют - дело за производителями. Неужели по контроллерам высокого класса такой облом?!
22 апр 09, 13:53    [7098330]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
Александр Гладченко
Member

Откуда:
Сообщений: 10802
Блог
alkoln,

Да, именно это показывают тесты. По крайней мере, не хуже.
22 апр 09, 13:56    [7098366]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
alkoln
Member

Откуда:
Сообщений: 67
vino
2N*RAID0 (со встроенным чередованием и максимальной избыточностью)


Позволю себе поправить vino. Видимо, он имел в виду 2N*RAID10.
22 апр 09, 13:57    [7098370]     Ответить | Цитировать Сообщить модератору
 Re: Помогите выбрать дисковый расклад  [new]
alkoln
Member

Откуда:
Сообщений: 67
Крайне полезная дискуссия получается, господа. Во всяком случае, лично для меня :)
22 апр 09, 14:04    [7098460]     Ответить | Цитировать Сообщить модератору
Топик располагается на нескольких страницах: Ctrl  назад   1 [2] 3 4 5 6   вперед  Ctrl      все
Все форумы / Microsoft SQL Server Ответить