Выбор дисков и конфигурация RAID массива

Автор | 06.02.2015

Выбор дисков и конфигурация RAID массива

Выбор жесткого диска и конфигурация RAID

В большинстве случаев сервер, на котором будут располагаться какие-либо сервисы, службы или данные, должен иметь аппаратный RAID контроллер для организации отказоустойчивого массива из используемых дисков. Ознакомиться со статистикой отказоустойчивости HDD можно по ранее представленным данным на сайте gotoADM.ru. По указанной ссылке представлена информация в первую очередь по «обычным» SATA винчестерам со скоростью вращения шпинделя 7200 rpm. По большому счету из указанных дисков можно строить хранилище большого объема  для статических либо мало используемых данных, т.е. в тех случаях, когда от дисковой подсистемы не требуется высокой производительности. Напоминаю, производительность HDD/дисковой подсистемы определяется параметром IOPS (в бОльшей степени зависит от скорости вращения шпинделя) и максимальной скоростью записи/чтения. Ниже представлена таблица, в которой можно сравнить производительность HDD с наиболее популярными характеристиками скорости вращения шпинделя:

Число оборотов в минута (rpm)

IOPS

15 000

170

10 000

120

7200

около 70

 

В остальных случаях, а именно, когда требуется повышенная надежность и производительность дисковой подсистемы, необходимо использовать СХД — системы хранения данных. В настоящее время представлен широкий круг готовых решений отличных по мощности и цене, а также доступны различные варианты самосборных систем. Ввод в эксплуатацию и дальнейшее использование СХД позволит более рационально использовать дисковое пространство и, как уже говорилось выше, повысить надежность и отказоустойчивость системы в целом.

В свою очередь, при переходе на СХД, в рядовых/рабочих серверах есть смысл оставлять лишь по два производительных диска — для организации отказоустойчивого массива (RAID1) для операционной системы.

Конечно, выбор дисковой подсистемы и конфигурация RAID массива определяется множеством параметров — начиная от используемых сервисов, программного обеспечения, типа данных, и заканчивается бюджетом ИТ-службы или предприятия в целом. Таким образом, перед покупкой оборудования стоит тщательно ознакомиться с требованиями к создаваемой системе, используемому ПО и рекомендациями по конфигурированию дисковой подсистемы от разработчиков.

Если данные будут храниться локально, то стоит использовать максимальное число дисков, доступных для данной модели сервера. Это повысит производительность системы. Также конкретное число HDD может быть определено непосредственно конфигурацией RAID. Подробнее о вариантах RAID.

Как можно уже говорить сейчас — «в прошлом» очень популярной была схема реализации дисковых массивов RAID5. В первую очередь такая конфигурация оправдывалась рациональностью использования дискового пространства. В настоящее время все большее число системных администраторов и технических специалистов отказываются от такой схемы, переходя к более простым конфигурациям,  а точнее — RAID1/RAID1+0. Обусловлено это несколькими параметрами — высокая производительность и отказоустойчивость. При этом используется минимум 4 диска (для RAID10) и теряется половина объема. Для удобства разработки схемы будущей дисковой подсистемы используйте онлайн конфигуратор RAID массивов. Обратите внимание — по указанной ссылке представлена информация для «классических» RAID, а также конфигураторы IOPS и Array estimator.

Рассмотрим сейчас самые популярные размеры блоков HDD, которые используются для операций записи/чтения:

Файловый сервер

Размер блока

% размера

% прочитанных

% случайных

512

10

80

100

1024

5

80

100

2048

5

80

100

4096b

60

80

100

8192

2

80

100

16384

4

80

100

32768

4

80

100

65535

10

80

100

 

Базы данных

Размер блока

% размера

% прочитанных

% случайных

8192b

100

67

100

Рабочая станция

Размер блока

% размера

% прочитанных

% случайных

8192b

100

80

80

 

WEB-сервер

Размер блока

% размера

% прочитанных

% случайных

512

22

100

100

1024

15

100

100

2048

8

100

100

4096b

23

100

100

8192

15

100

100

16384

2

100

100

32768

6

100

100

65535

7

100

100

131072

1

100

100

524288

1

100

100

Таким образом, очевидно, что для файлового сервера лучше всего использовать размер блока 4k. Аналогично из приведенных таблиц можно сделать соответствующие выводы и для других сервисов.

Вместо заключения. Обращаю внимание еще раз — выше представлена обобщенная информация, для достижения наилучшего результата стоит использовать рекомендуемые параметры массивов от разработчиков ПО и сервисов при построении дисковых подсистем в вашей организации. 

  • Hobby Stufff

    Как лучше организовать хранилище для бекапов, какой вариант RAID выбрать?