Наш первый сервер на SSD

Блог им. LiO /
И так после примерки, присмотре, настройке и обдумывании – вчера вечером перевели сервер базы данных на ssd диск.

3-4 раза переставляли систему – подбирая оптимальное решение. И минимум пол года обдумывания – а не рискуем ли?
Схема такова — 1 ssd диск, зеркало на простой диск, бекап базы на отдельный сервер для бекапов.

Взяли ssd intel 320. на 120 гб. на всяк случай взяли 2 ssd диска — 1 на горячую замену. Скорость не то что радует — она поразила. В разы!!! Хотя сам сервер, откуда тащили базы на рейд 10, сас 10к.

Постараюсь вернуться к этой теме через пол года или год. Самому интересно, насколько хватит ресурсов ssd харда.

2й день – полет нормальный :)
7й день – полет нормальный :)
30 дней – полет нормальный :)
60 дней – полет нормальный :)

29 комментариев

heat
у меня несколько вопросов:
-как устроено зеркало на простой второй диск?
-какая скорость отдачи данных с сервера (при линейном чтении с SSD)
LiO
1. на основе софтрейд. приоритет на сам ssd, слейф — hdd. могу и ошибаться в точной формулировке. я не админ. у нас в штате есть админ
2. 7-10 тыс iops.
heat
размещать базы на SDD это швах полный. Даже при использовании умного распределения перезаписываемых фрагментов.

SSD можно использовать только для размещения статичных данных.
LiO
ну вот и посмотримс. если диск год прослужит — то это будет отличный результат!!! ну пол года — тоже нормуль.
heat
он прослужит и 5 лет, но его объем будет уменьшаться частями в месте с фрагментами вашей базы данных. Причем первые бед кластера могут появится уже через месяц, если SSD имеет 25 000 циклов перезаписи, база может схавать их очень быстро (если будет перезаписывать тот же кластер)
LiO
«худенье» просчитали
там всего 10-20гб из 120гб. нам этого хватает по самое не балуй. да и за смартом следим. как только 50% потерь будет — можно смело менять.

«но его объем будет уменьшаться частями в месте с фрагментами вашей базы данных»? чтот вы путаете. у него есть логика — если блок скоро исчерпает свой ресурс — он его исключает из списка и делает подмену. данные останутся невредимыми. только есть 2 правила – не заполнять на 100% весь хард, и при разбивки разделов (кто как говорит) оставлять хх% для «кеша»
heat
если блок скоро исчерпает свой ресурс — он его исключает из списка и делает подмену
Можно продолжить по теме: если весь диск выйдет из строя он сам пойдет в магазин купит новый и сделает подмену =))

Вообще я буду только рад если он прослужит долго и не создаст проблем, потому что сам хочу собрать сервак на SSD

Вам только совет следите за логами, делайте побольше бекапов.
LiO
ирония не к месту
даже в HDD давным-давно идет исключение бед блоков из списка. и эту инфу можно в смарте глянуть.

максимум что плохого может быть — заводской брак и вылет всего диска. но на этот случай есть запасной и зеркало.

спс. беки пишутся и зеркало есть.

только в рейд 10-5 и т.д. ssd нет смысла ставить. износ у 2х хардов одЫн в АдЫн :) хотя с 5й чуть лучше. но в 5ке надо продумать о архитектура.
heat
для SSD уже есть рейд контроллеры? или обычные подходят?
LiO
даже не интересовался. гугля в помощь.

но на делл сайте можно собрать машинку чисто на ssd и скорее всего и рейд под них. хотя по идеи рейду пофигу что к нему цеплять. желательно чтоб trim держал.
kit
у меня один клиент как-то по незнанию(не знал, что количество циклов перезаписей ограниченно) взял сервер в аренду в европе на ssd для базы данных. В общем несмотря на всякие исключения бэдов и прочее через 2 месяца все легло.
LiO
ну отчет предоставлю. самому интересно что получится из этой затеи.
LiO
по смарту время работы ssd харда — 163 часа (~7 дней)
блоков подмены — 0
полет нормальный
erla
у нас уже больше 8 месяцев стоит SSD
полет нормальный
LiO
ооо!!! а как готовили его к работе? и что крутиться на нем?
erla
воткнули диск, поставили ФРИ БиэСДи %)
особого ничего нет, туды сюды кидаем инфу :)
LiO
модель какая? на сервере стоит?

интересно по smart замены блоков были?
erla
не помню уже 80 гб по моему фуджитсу
что означает smart, в терминах не разбираюсь :)
да и у каждого свой лексикон ))
kit
А может Вы просто вообще не в курсе, что у ssd ограниченное количество перезаписей и поэтому думаете, что полет нормальный, а по факту там уже куча замен блоков было?
LiO
и меня еще тут называют писимюгой!!? :) Никита, отдаю первенство тебе.

для erla
вот по этому и есть S.M.A.R.T. который и пишит о ресурсах устройства. поищите прогу — гляньте что там. №5 пункт показывает подмену секторов. в % отношении. от 100% и ниже.
erla
теперь я понял, что такое смарт — смарт это демон по линукс или юникс. не имею привычки устанавливать различные программы, а пользуюсь стандартными программы, которые входят в состав дистрибутива.
пишет 0 битых секторов. да и думаю для веб сервера особого значения не имеет какой винт, так как происходит запись, а затем постоянное считывание. другое дело когда скажем постоянно перезапись идет, тогда возможно, но опять таки думаю что это страшилки придуманные от производителей стандартных жестких дисков, дабы не потерять клиентов распуская слухи о ненадежности SSD. Да и еще чуть не забыл, если брать по честноку, то мне непонятна логика предугадывания выхода из строя винта.
LiO
ну на самом деле смарт это не демон в юнихе, а мат часть харда. он считает почти все — время работы, блоки подмены, остановку шпинделя и т.д.

нельзя предугадать поломку? от чего же. вы когда ездите на авто, тоже знаете когда и что ремонтировать — по косвенным признакам. загремел передок, аморы плохо работают, рулевая рейка скоро сломается и т.д. тут тоже самое.
LiO
еще один рубеж пройдет.
30 дней работы ssd
количество блоков подмены — 0!!!
LiO
60 дней. полет нормальный. подмены — 0
делаем ставки — сколько мес выдержит ssd? :)
Denisc
Цитата отсюда:
blog.aboutnetapp.ru/archives/669

В группе LinkedIn “Storage Professionals” (кстати рекомендую обратить внимание на существование дискуссионных групп в LinkedIn, бывает интересно) вот уже которую неделю обсуждается тема:
SSD drives failure rates

Некоторые цитаты оттуда, которые я приведу без перевода, благо все понятно (каждый абзац – цитата-фрагмент из сообщения отдельного человека в данном треде).

I’m working as a contractor at a bank in the midwest and we have SSD’s in EMC VMAX’s for about 9 months. We haven’t seen any failures yet

I once ran a multi week attempt to burn out various vendors’ SSDs. I ran them flat out 100% random writes for about a month. Fusion IOs at something like 30k IOPs per drive, STECs / Intels around 7k. Never was able to get any of them to fail.
The Fusion IO did as many writes that month as a single SAS drive could do in over a decade.

We have approximately 150 SSD drives and have seen 1 failure during the past 12 months.

I’ve been using SSDs in a cx4-960 clariion for just under 12 months with no failures ( covering large ms sql tempdb).
From my own experience ( first shipped SSD systems 2 and half years ago), SLC SSD failure rate is in the same range as rotating drives.

Вот такие дела. Есть над чем подумать тем кто до сих пор считает, что ресурс SSD на запись ужасно ограничен, что SSD ненадежен, и при работе Enterprise Flash Drives дохнет как паленая китайская USB-флешка Kinqston.
LiO
да. тоже уверенность появилась за эти 2 месяца.
спамить более тут не буду. отмечусь постом, когда ssd умрет. вот и будет интересный опыт. а то наши хостеры пока еще в панике от ssd
Denisc
А кто эти «ваши хостеры» которые в панике от ssd?
kit
Тоже интересно, кто в панике? :)
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.