Создание raid массивов реферат

Обновлено: 02.07.2024

RAID-массивы. Информатика ( реферат , курсовая , диплом , контрольная )

Термин RAID (Redundant Array of Independent/Inexpensive Disks — избыточный массив независимых/недорогих дисководов) появился в 1987 г. Массив RAID объединяет два или более дисководов с целью создания системы дисков с новыми свойствами: максимально возможный объем с увеличением скорости и надежности работы, превосходящие параметры самых дорогих дисководов. Затем к этим основным целям добавилась третья — сохранение данных в случае отказа части оборудования, поэтому современные RAID-массивы необходимы для создания крупномасштабных хранилищ данных.

Массив дисков состоит из двух или более накопителей, которые централизованно настраиваются, форматируются и управляются. Для операционной системы массив является одним большим диском.

Технология зеркалирования (отображения) означает параллельную одновременную запись информации на два жестких магнитных диска, т. е. создаются две точные копии данных на дисках, и производительность системы не возрастает.

Технология четности является альтернативным решением, соединяющим в себе достоинства зеркалирования (высокая надежность) и чередования (высокая скорость работы). Для определенного числа блоков данных вычисляется дополнительный экстраблок, для создания нормального RAID-массива в этом случае требуется (I + 1) жесткий диск. Блоки распределяются по аналогии с чередованием, а экстраблок записывается на отдельный накопитель либо раскидывается по дискам.

Каждый бит экстраблока состоит из результата операции XOR над битами всех исходных блоков. При повторном наложении оператора XOR получается первоначальный результат:

Технология четности требует применения дорогостоящих RAID-контроллеров, которые будут вычислять экстраблоки.

RAID-массивы делятся на простые (single) и составные (multiple), которые объединяют два или более простых массива. В табл. 7.3 дана сводная характеристика различных технологий RAID-массивов.

Массив RAID 0 использует как минимум два диска, чередование осуществляется без четности (рис. 7.2). Блоки файлов.

Технология записи массива RAID О.

Рис. 7.2. Технология записи массива RAID О фиксированной длины (16 Кбайт) записываются на имеющиеся диски.

Для построения RAID 0 применяют недорогие RAID-контроллеры, он экономичен, обеспечивает выигрыш в скорости передачи данных (при условии включения 2−4 дисков), но не гарантирует надежности хранения данных.

Массив RAID 1 предусматривает обычное зеркалирование на два диска (рис. 7.3).

В этом случае можно применять недорогие RAID-контроллеры, выигрыш в скорости отсутствует.

Массив RAID 2 основан на побитовом чередовании и коде Хэмминга для восстановления ошибок. Он практически не применяется, поскольку требует сложных RAID-контроллеров и большого числа дисков (14 или 39), среди которых только часть используется для хранения собственно данных (10 или 32).

Массив RAID 4 отличается размером блока для чередования от RAID 3. Запись информации на RAID идет медленно в связи.

Технология записи массива RAID 1.

Рис. 7.3. Технология записи массива RAID 1.

Технология записи массива RAID 3.

Рис. 7.4. Технология записи массива RAID 3.

с вычислениями экстраблоков, но улучшена скорость случайного чтения. Данный массив практически не используется.

Массив RAID 5 — наиболее распространенный вариант, характеризуется применением чередования и четности, но при этом контрольные суммы (экстраблоки) разбрасываются по всем дискам (кроме диска, содержащего исходные блоки). Существенно возрастает скорость записи информации на диск при обеспечении высокого уровня надежности (рис. 7.5).

Надежность и скорость работы такой системы оказываются очень даже высокими. При восстановлении информации всю работу на себя берет RAID-контроллер, так что операция проходит довольно быстро.

Массив RAID 6 используется для критичных по надежности приложений. Применяются технологии чередования и четности, но экстраблоки вычисляются дважды и копируются на два разных диска. Данные не могут быть восстановлены в случае выхода трех дисков одновременно. Это более дорогостоящее и медленное решение, на практике почти не используется.

Технология записи массива RAID 5.

Рис. 7.5. Технология записи массива RAID 5.

В массиве RAID 7 по сравнению с RAID 3 выполняется асинхронное чередование, используется кэш-память и высокопроизводительный микропроцессор. По сравнению с RAID 3 достигается тот же уровень надежности, но возрастают скорости записи и чтения. Отличительной особенностью является высокая стоимость массива.

Неотъемлемую роль в нашем компьютере играют жесткие диски, ведь на них хранится вся информация, с них запускается операционная система, в них обитает файл подкачки и прочее, прочее, прочее, прочее. Как известно, эти самые жесткие диски так же имеют некий запас прочности после которого выходят из строя, а так же характеристики влияющие на производительность. RAID — это дисковый массив (т.е. комплекс или связка) из нескольких устройств, – жестких дисков.

Прикрепленные файлы: 1 файл

Что такое RAID-массивы и зачем они нужны.docx

Что такое RAID-массивы и зачем они нужны

Неотъемлемую роль в нашем компьютере играют жесткие диски, ведь на них хранится вся информация, с них запускается операционная система, в них обитает файл подкачки и прочее, прочее, прочее, прочее. Как известно, эти самые жесткие диски так же имеют некий запас прочности после которого выходят из строя, а так же характеристики влияющие на производительность.

RAID — это дисковый массив (т.е. комплекс или связка) из нескольких устройств, – жестких дисков. Как я и говорил выше, этот массив служит для повышения надёжности хранения данных и/или для повышения скорости чтения/записи информации. Собственно, то чем именно занимается оная связка из дисков, – ускорением работы или повышением безопасности данных, зависит от Вас, а точнее, от выбора текущей конфигурации рейда. Разные типы этих конфигураций как раз и отмечаются разными номерами, – 1, 2, 3, 4 и пр, – и выполняют разные функции.

Рейды ощутимо удобнее и эффективнее использования одного диска в системе. Я бы даже рекомендовал их всем поголовно, не смотря на то, что приходится использовать два (а то и все четыре) устройства вместо одного.

Просто, например, в случае построения 0-вой версии (описание вариаций 0, 1, 2, 3 и пр., – читайте ниже) Вы получите ощутимый прирост производительности. Да и вообще жесткий диск нынче как раз таки узкий канал в быстродействии системы. Почему? Ну судите сами, – процессоры обзаводятся ядрам и, частотами, кэшем и архитектурой; видеокарты, – числом пиксельных конвейеров, количеством и разрядностью памяти, шейдерными блоками, частотами видеопроцессоров и кое-где даже количеством этих процессоров;оперативная память, – частотами и таймингами; жесткие диски же растут разве что в объеме ибо скорость оборота головки оных (за исключением редких моделей типа Raptor’ов) замерла уже довольно давно на отметке в 7200, кэш тоже не то чтобы растет, архитектура остается почти прежней.. В общем в плане производительности диски стоят на месте (ситуацию могут спасти разве что развивающиеся SSD), а ведь они играют весомую роль в работе системы и, местами, полновесных приложений.

В случае же построения единичного (в смысле за номером 1) рейда Вы чуток потеряете в производительности, но зато получите почти 100%-ую гарантию безопасности Ваших данных, ибо оные будут до байтика полностью дублироваться и даже в случае выхода из строя одного диска, – все целиком и полностью будет находится на втором без всяких потерь.

В общем, повторюсь, рейды будут полезны всем и каждому. Я бы даже сказал, – обязательны.

Физически RAID-массив представляет собой от двух до n-го количества жестких дисков подключенных к материнской плате поддерживающей возможность создания RAID (или к соответствующему контроллеру, что реже ибо оные дороги для рядового пользователя (контроллеры обычно используются на серверах в силу повышенной надежности и производительности)), т.е. на глаз ничего внутри системника не изменяется, никаких лишних подключений или соединений дисков между собой или с чем-то еще попросту нет. В общем в аппаратной части всё почти как всегда, а изменяется лишь программный подход, который, собственно, и задает, путем выбора типа рейда, как именно должны работать подключенные диски.

Программно, в системе, после создания рейда, тоже не появляется никаких особенных причуд. По сути, вся разница в работе с рейдом заключается только в небольшой настройке в биосе, которая собственно организует рейд (см.ниже) и в использовании драйвера. В остальном ВСЁ совершенно тоже самое – в “Мой компьютер” те же C, D и прочие диски, всё те же папки, файлы.. В общем и программно, на глаз, полная идентичность.

Установка массива не представляет собой ничего сложного: просто берем мат.плату, которая поддерживает технологию RAID, берем два полностью идентичных, – это важно!, – как по характеристикам (размеру, кэшу, интерфейсу и пр) так и по производителю и модели, диска и подключаем их к оной мат.плате. Далее просто включаем компьютер, заходим в BIOS и выставляем параметр SATA Configuration: RAID. После этого в процессе загрузки компьютера (как правило, до загрузки Windows) появляется панель отображающая информацию о диска в рейде и вне него, где, собственно нужно нажать CTR-I, чтобы настроить рейд(добавить диски в него, удалить и тд и тп). Собственно, вот и все. Дальше идет установка Windows и прочие радости жизни, т.е, опять же, всё как всегда.

Важно: при создании или удалении рейда (1-го рейда это вроде не касается, но не факт) неизбежно удаляется вся информация с дисков, а посему просто проводить эксперимент, создавая и удаляя различные конфигурации, явно не стоит. Посему, перед созданием рейда предварительно сохраните всю нужную информацию (если она есть), а потом уже экспериментируйте.

Что до конфигураций.. Как я уже говорил, RAID массивов существует несколько видов (как минимум из основного базиса, – это RAID 1, RAID 2, RAID 3, RAID 4, RAID 5, RAID 6). Для начала я расскажу о двух, наиболее понятных и популярных среди обычных пользователей:

RAID 0 – дисковый массив для увеличения скорости\записи.

RAID 1 – зеркальный дисковый массив.

А в конце статьи быстренько пробегусь по прочим.

В общем при использовании такого рейд-массива настоятельно рекомендуется делать постоянные бэкапыценной информации на внешний носитель. Рейд действительно обеспечивает ощутимую скорость – это я Вам говорю на собственном опыте, т.к у меня дома уже годами установлено такое счастье.

При подобном подходе в жертву приносится производительность и, по личным ощущениям, оная даже меньше чем при использовании одного диска без всяких там рейдов. Впрочем, для некоторых надежность куда важнее производительности.

Описание этих массивов тут по стольку по скольку, т.е. чисто для справки, да и то в сжатом (по сути описан только второй) виде. Почему так? Как минимум в силу низкой популярности этих массивов среди рядового(да и в общем-то любого другого) пользователя и, как следствие, малого опыта использования оных мною.

RAID 2 зарезервирован для массивов, которые применяют некий код Хемминга (не интересовался что это, посему рассказывать не буду). Принцип работы примерно такой: данные записываются на соответствующие устройства так же, как и в RAID 0, т.е они разбиваются на небольшие блоки по всем дискам, которые участвуют в хранении информации. Оставшиеся же (специально выделенные под оное) диски хранят коды коррекции ошибок, по которым в случае выхода какого-либо винчестера из строя возможно восстановление информации. Тобишь в массивах такого типа диски делятся на две группы — для данных и для кодов коррекции ошибок Например, у Вас два диска являют собой место под систему и файлы, а еще два будут полностью отведены под данные коррекции на случай выхода из строя первых двух дисков. По сути это что-то вроде нулевого рейда, только с возможностью хоть как-то спасти информацию в случае сбоев одного из винчестеров. Редкостно затратно, – четыре диска вместо двух с весьма спорным приростом безопасности.

RAID 3, 4, 5, 6.. Про них, как бы странно это не звучало на страницах этого сайта, попробуйте почитать на Википедии. Дело в том, что я в жизни сталкивался с этими массивами крайне редко (разве что пятый попадался под руку чаще остальных) и описать доступными словами принципы их работы не могу, а перепечатывать статью, с выше предложенного ресурса решительно не желаю, как минимум, в силу наличия в оных зубодробительных формулировок, которые даже мне понятны со скрипом.

“Какой рейд все же выбрать” или “Маленькие выводы”.

Если вы играете в игры, часто копируете музыку, фильмы, устанавливаете ёмкие ресурсопотребляющие программы, то Вам безусловно пригодиться RAID 0. Но будьте внимательны при выборе жестких дисков, – в этом случае их качество особенно важно, – или же обязательно делайте бэкапы на внешний носитель.

Если же вы работаете с ценной информацией, которую потерять равносильно смерти, то Вам безусловно нужен RAID 1 – с ним потерять информацию крайне сложно.

Важно, чтобы диски устанавливаемые в RAID-массив были полностью идентичны. Размер, фирма, серия, объём кэша – всё должно быть одинаковым..

В конце XX века невозможно представить себе жизнь без компьютера. Компьютер прочно вошел в нашу жизнь, став главным помощником человека. С развитием информационных технологии перед человеком стала задача о надёжном хранении информации и её быстрой передачи. Для этого стали применять технологию RAID – (Redundant Array of Independent Disks) – избыточный массив независимых дисков. С помощью RAID массива можно построить эффективную и надёжную систему хранения данных.

Цель курсовой работы является разработка систем хранения информации на RAID – массивах.

Задачи курсовой работы:

– изучение основы создания RAID – массивов;

– принцип работы и функционирование RAID-массива;

– достоинства и недостатки каждой RAID системы.

При написании курсовой работы будет протестирована технология создание массива Intel Matrix RAID который объединил две системы RAID 0 и RAID 1. Данные тестирования будут отражены на графиках.

1. Разработка систем хранения информации на RAID – массивах

1.1 Основные понятия RAID – массива

При создании RAID – массива необходимо учитывать, то не каждая материнская плата поддерживает эту функцию. К примеру можно привести материнскую плату MA790FXT-UD5F компании Gigabyte (Рисунок 1).


Рисунок 1 – Схема расположения RAID-контроллера JMicron JM322 и встроенного RAID – контроллера в северном мосту

Материнская плата построена на чипсете AMD 790FX/SB750 и поддерживает все процессоры Socket AM3 и память DDR3. Хотя чипсет поддерживает шесть портов SATA/300, Gigabyte решила увеличить возможности установки накопителей, добавив контроллер JMicron JM322. Он даёт четыре дополнительных порта SATA/300 (белые разъёмы). В данной материнской плате поддерживают RAID – массивы 0,1и 5.

При записи данных на диск компьютер записывает контрольную сумму и при дальнейшем обращении к этим данным он проверяет начальное значение контрольной суммы и конечное, если результат проверки совпадает значит данные в целостности и их можно использовать по назначению. В RAID – массивах контрольная сумма хранится по разному. В некоторых RAID массивах выделяется специально отдельный диск и даже если какой-то из дисков откажет то информацию можно будет восстановить. Но большинство RAID – массивов хранит контрольную суммы на том же диски где хранится информация.

В основе разработки RAID лежат пять основных принципов. Это Массив (Array), Зеркалирование (Mirroring), Дуплекс (Duplexing), Чередование (Striping) и Четность (Parity).

Массивом называют несколько накопителей, которые централизованно настраиваются, форматируются и управляются. Логический массив – это уже более высокий уровень представления, на котором не учитываются физические характеристики системы. Соответственно, логические диски могут по количеству и объему не совпадать с физическими. Но лучше все-таки соблюдать соответствие: физический диск – логический диск. Для операционной системы вообще весь массив является одним большим диском.


Рисунок 2 – Способ зеркалирования

Дуплекс – развитие идеи зеркалирования (Рисунок 3). В этом случае так же высок уровень надежности и требуется в два раза больше жестких дисков. Но появляются дополнительные затраты: для повышения надежности в систему устанавливаются два независимых RAID контроллера. Выход из строя одного диска или контроллера не сказывается на работоспособности системы.


Рисунок 3 – Дуплексный способ

Столь дорогое решение используется только во внешних RAID-массивах, предназначенных для ответственных приложений.

Чередование – Повышение быстродействия системы (Рисунок 4). Если чтение и запись вести параллельно на нескольких жестких дисках, можно получить выигрыш в скорости.


Рисунок 4 – Способ чередования

Четность является альтернативным решением, соединяющим в себе достоинства зеркалирования (высокая надежность) и чередования (высокая скорость работы). Используется тот же принцип, что и в контроле четности оперативной памяти. Если имеется I блоков данных и на их основе вычисляется еще один дополнительный экстраблок, из получившихся (I+1) блоков всегда можно восстановить информацию даже при повреждении одного из них. Соответственно, для создания нормального RAID-массива в этом случае требуется (I+1) жесткий диск. Распределение блоков по дискам точно такое же, как при чередовании. Экстраблок может записываться на отдельный накопитель, либо раскидываться по дискам.

Обычно каждый бит экстраблока состоит из суммы бит всех I блоков, точнее из результата выполнения логической операции XOR. Многие помнят со школы, что XOR – удивительный оператор, при его повторном наложении мы можем получить первоначальный результат. То есть (A XOR B) XOR B = A. Это правило распространяется на любое количество операндов.

Раздел: Информатика, программирование
Количество знаков с пробелами: 28426
Количество таблиц: 0
Количество изображений: 13

Что нужно для построения RAID-массива? Прежде всего, RAID-контроллер и, как минимум, два жестких диска (в зависимости от уровня — например, для массива RAID 5 требуется не менее трех HDD).

До недавнего времени RAID-технологии были прерогативой серверного сегмента рынка. Но ситуация начала потихоньку меняться после того как производители стали интегрировать RAID-контроллеры на несерверные материнские платы. А ведь и правда — почему бы не использовать то, что достается практически даром.

Принцип функционирования RAID-системы заключается в следующем: из набора дисковых накопителей создается массив, который управляется специальным контроллером и определяется компьютером как единый логический диск большой емкости. За счет параллельного выполнения операций ввода-вывода обеспечивается высокое быстродействие системы, а повышенная надежность хранения информации достигается дублированием данных или вычислением контрольных сумм. Следует отметить, что применение RAID-массивов защищает от потерь данных только в случае физического отказа жестких дисков.

Различают несколько основных уровней RAID-массивов: RAID 0, 1, 2, 3, 4, 5, 6, 7. Также существуют комбинированные уровни, такие как RAID 10, 0+1, 30, 50, 53 и т.п. Рассмотрим вкратце принципы функционирования, достоинства и недостатки основных уровней.

Дисковый массив без отказоустойчивости (Striped Disk Array without Fault Tolerance)

Дисковый массив без избыточного хранения данных. Информация разбивается на блоки, которые одновременно записываются на отдельные диски, что обеспечивает повышение производительности. Такой способ хранения информации ненадежен, поскольку поломка одного диска приводит к потере всей информации, поэтому уровнем RAID как таковым не является.

За счет возможности одновременного ввода/вывода с нескольких дисков массива RAID 0 обеспечивает максимальную скорость передачи данных и максимальную эффективность использования дискового пространства, так как не требуется места для хранения контрольных сумм. Реализация этого уровня очень проста. RAID 0, как правило, применяется в тех областях, где требуется быстрая передача большого объема данных. Для реализации массива требуется не меньше двух винчестеров.

RAID 0 – дешевый и производительный, но ненадежный

— наивысшая производительность в приложениях, требующих интенсивной обработки запросов ввода/вывода и данных большого объема;

— максимальная эффективность использования дискового пространства — 100%.

— отказ одного диска влечет за собой потерю всех данных массива.

Дисковый массив с зеркалированием (Mirroring & Duplexing)

Дисковый массив с дублированием информации (зеркалированием данных). В простейшем случае два накопителя содержат одинаковую информацию и являются одним логическим диском. При выходе из строя одного диска его функции выполняет другой. Для реализации массива требуется не меньше двух винчестеров.

RAID 1 – простейший отказоустойчивый массив

— простота восстановления массива в случае отказа (копирование).

— высокая стоимость — 100-процентная избыточность;

— невысокая скорость передачи данных.

Отказоустойчивый дисковый массив с использованием кода Хемминга (Hamming Code ECC)

Схема резервирования данных с использованием кода Хэмминга (Hamming code) для коррекции ошибок. Поток данных разбивается на слова — причем размер слова соответствует количеству дисков для записи данных. Для каждого слова вычисляется код коррекции ошибок, который записывается на диски, выделенные для хранения контрольной информации. Их число равно количеству бит в слове контрольной суммы.

RAID 2 не получил коммерческого применения

— достаточно простая реализация;

— очень высокая скорость передачи данных;

— при увеличении количества дисков накладные расходы уменьшаются.

— низкая скорость обработки запросов;

Отказоустойчивый дисковый массив с параллельной передачей данных и четностью (Parallel Transfer Disks with Parity)

Отказоустойчивый массив с параллельным вводом/выводом данных и диском контроля четности. Поток данных разбивается на порции на уровне байт (хотя возможно и на уровне бит) и записывается одновременно на все диски массива, кроме одного. Один диск предназначен для хранения контрольных сумм, вычисляемых при записи данных. Поломка любого из дисков массива не приведет к потере информации.

В RAID 3 информация разбивается на порции одинакового размера

Этот уровень имеет намного меньшую избыточность, чем RAID 2. Во втором рэйде большинство дисков, хранящих контрольную информацию, нужны для определения неисправного разряда. Как правило, RAID-контроллеры могут получить данные об ошибке с помощью механизмов отслеживания случайных сбоев. За счет разбиения данных на порции RAID 3 имеет высокую производительность. Поскольку при каждой операции ввода/вывода производится обращение практически ко всем дискам массива, то одновременная обработка нескольких запросов невозможна.

Этот уровень подходит для приложений с файлами большого объема и малой частотой обращений (в основном это сфера мультимедиа). Использование только одного диска для хранения контрольной информации объясняет тот факт, что коэффициент использования дискового пространства достаточно высок (как следствие этого — относительно низкая стоимость). Для реализации массива требуется не меньше трех винчестеров.

— отказ диска мало влияет на скорость работы массива;

— высокая скорость передачи данных;

— высокий коэффициент использования дискового пространства.

— низкая производительность при большой интенсивности запросов данных небольшого объема.

Отказоустойчивый массив независимых дисков с общим диском четности (Independent Data Disks with Shared Parity Disk)

Этот массив очень похож на уровень RAID 3. Поток данных разделяется не на уровне байтов, а на уровне блоков информации, каждый из которых записывается на отдельный диск. После записи группы блоков вычисляется контрольная сумма, которая записывается на выделенный для этого диск.

В RAID 4 поток данных разделяется на блоки

У RAID 4 возможно одновременное выполнение нескольких операций чтения. Этот массив повышает производительность передачи файлов малого объема (за счет распараллеливания операции считывания). Но поскольку при записи должна изменяться контрольная сумма на выделенном диске, одновременное выполнение операций невозможно (налицо асимметричность операций ввода и вывода). Этот уровень имеет почти все недостатки RAID 3 и не обеспечивает преимущества в скорости при передаче данных большого объема. Схема хранения разрабатывалась для приложений, в которых данные изначально разбиты на небольшие блоки, поэтому нет необходимости разбивать их дополнительно. Эта схема хранения данных имеет невысокую стоимость, но ее реализация достаточно сложна, как и восстановление данных при сбое.

— высокая скорость передачи данных;

— отказ диска мало влияет на скорость работы массива;

— высокий коэффициент использования дискового пространства.

— достаточно сложная реализация;

— очень низкая производительность при записи данных;

— сложное восстановление данных.

Отказоустойчивый массив независимых дисков с распределенной четностью (Independent Data Disks with Distributed Parity Blocks)

Самый распространенный уровень. Блоки данных и контрольные суммы циклически записываются на все диски массива, отсутствует выделенный диск для хранения информации о четности, нет асимметричности конфигурации дисков.

В случае RAID 5 все диски массива имеют одинаковый размер — но один из них невидим для операционной системы. Например, если массив состоит из пяти дисков емкостью 10 Гб каждый, то фактически размер массива будет равен 40 Гб — 10 Гб отводится на контрольные суммы. В общем случае полезная емкость массива из N дисков равна суммарной емкости N–1 диска.

В RAID 5 отсутствует выделенный диск для хранения информации о четности

Самый большой недостаток уровней RAID от 2-го до 4-го — это наличие отдельного диска (или дисков), хранящего информацию о четности. Скорость выполнения операций считывания достаточно высока, так как не требует обращения к этому диску. Но при каждой операции записи на нем изменяется информация, поэтому схемы RAID 2-4 не позволяют проводить параллельные операции записи. RAID 5 не имеет этого недостатка, так как контрольные суммы записываются на все диски массива, что делает возможным выполнение нескольких операций чтения или записи одновременно. RAID 5 имеет достаточно высокую скорость записи/чтения и малую избыточность.

— высокая скорость записи данных;

— достаточно высокая скорость чтения данных;

— высокая производительность при большой интенсивности запросов чтения/записи данных;

— высокий коэффициент использования дискового пространства.

— низкая скорость чтения/записи данных малого объема при единичных запросах;

— достаточно сложная реализация;

— сложное восстановление данных.

Отказоустойчивый массив независимых дисков с двумя независимыми распределенными схемами четности (Independent Data Disks with Two Independent Distributed Parity Schemes)

RAID 6 — это отказоустойчивый массив независимых дисков с распределением контрольных сумм, вычисленных двумя независимыми способами. Этот уровень во многом схож с RAID 5. Только в нем используется не одна, а две независимые схемы контроля четности, что позволяет сохранять работоспособность системы при одновременном выходе из строя двух накопителей. Для вычисления контрольных сумм в RAID 6 используется алгоритм, построенный на основе кода Рида-Соломона (Reed-Solomon).

RAID 6 использует две независимые схемы контроля четности

Этот уровень имеет очень высокую отказоустойчивость, большую скорость считывания (данные хранятся блоками, нет выделенных дисков для хранения контрольных сумм). В то же время из-за большого объема контрольной информации RAID 6 имеет низкую скорость записи. Он очень сложен в реализации, характеризуется низким коэффициентом использования дискового пространства: для массива из пяти дисков он составляет всего 60%, но с ростом числа дисков ситуация исправляется.

RAID 6 по многим характеристикам проигрывает другим уровням, поэтому на сегодня не получил коммерческого применения.

— достаточно высокая скорость обработки запросов;

— низкая скорость чтения/записи данных малого объема при единичных запросах;

— очень сложная реализация;

— сложное восстановление данных;

— низкая скорость записи данных.

Отказоустойчивый массив, оптимизированный для повышения производительности (Optimized Asynchrony for High I/O Rates as well as High Data Transfer Rates)

Блок вычисления контрольных сумм интегрирован с блоком буферизации; для хранения информации о четности используется отдельный диск, который может быть размещен на любом канале. RAID 7 имеет высокую скорость передачи данных и обработки запросов, хорошую масштабируемость. Самым большим недостатком этого уровня является стоимость его реализации.

— очень высокая скорость передачи данных и высокая скорость обработки запросов (в 1,5…6 раз выше других стандартных уровней RAID);

— значительно возросшая (благодаря наличию кэша) скорость чтения данных небольшого объема;

— отсутствие необходимости в дополнительной передаче данных для вычисления четности.

— собственность одной компании;

— очень высокая стоимость на единицу объема;

— не может обслуживаться пользователем;

— необходимость использования блока бесперебойного питания для предотвращения потери данных из кэш-памяти;

— короткий гарантийный срок.

С теорией немного разобрались — перейдем к практике. В качестве основы тестовой системы мы использовали материнскую плату Intel D925XCV, в южный мост которой встроена поддержка Intel Matrix Storage Technology.

Конфигурация стенда включала также:

процессор Intel P4 3,6 ГГц;

оперативную память Micron DDR2-533 512 Мб;

видеоадаптер ATI Radeon X300 128 Мб.

Эффективность RAID-массива тестировали на двух разных парах винчестеров:

Seagate Barracuda 7200.7 SATA NCQ емкостью 160 Гб (ST3160827AS);

WD Caviar SE Serial ATA емкостью 120 Гб (WD1200JD).

Тестирование проводилось под операционной системой MS Windows XP Professional ENG SP1.

Но сейчас нас больше интересует RAID 0. Для установки и настройки этого RAID'а существует два пути.

Первый: создать массив с помощью RAID BIOS'а и установить ОС на него. При этом важно не пропустить при инсталляции системы момент, когда со специальной дискеты нужно установить драйвер RAID-контроллера, без которого установщик Windows просто не увидит винчестеры.

Intel Storage Utility

Приветствие. Описание того места, куда вы попали, и того, что вам здесь предлагают сделать. Указывается, что на превращение ваших дисков в RAID-массив понадобится до двух часов — в зависимости от размера винчестеров. Пользователь также извещается о том, что процесс будет проходить в фоновом режиме, то есть во время превращения можно продолжать работать с компьютером.

Выбор источника данных, то есть винчестера, на котором установлена система. С этого накопителя информация будет дублироваться (RAID 1) или частично копироваться (распределятся между HDD — для RAID 0).

Выбор второго участника массива. На этот HDD будет копироваться информация с источника. (Предупреждение! все данные на выбранном винчестере будут удалены.)

Завершение подготовки и начало миграции данных с источника на второй диск.

После выполнение всех шести шагов на экране появляется окно состояния прогресса. Во время преобразования действительно можно работать с другими приложениями — процесс создания массива практически не сказывается на работе системы.

Но это все теория, а как оно будет на практике? Для реального тестирования мы использовали пакет WorldBench 5, в состав которого входит множество популярных приложений. Однако, хотя программ в состав пакета входит действительно много, не у всех быстродействие реально зависит от дисковой системы.

ACD Systems ACDSee PowerPack 5.0

В этом тесте находится и открывается каталог, который содержит 155 файлов формата JPG. Затем все файлы конвертируются в формат PCX. Процедура повторяется несколько раз, причем каждый раз меняется тип формата, в который преобразуются JPG-файлы: GIF, BMP, TIFF, TGA, PNG.

Для винчестера производства Seagate прирост производительности в этом приложении при использовании RAID-массива составил около 5%. Причем показатели всех RAID’ов почти не отличаются — вне зависимости от значения strip size.

Совсем другая картина наблюдается с представителем WD. Во-первых, отчетливо видна разница в производительности у RAID-массивов с разными значениями strip size. Худший результат у массива с размером блока 128 Кб. При переходе на 64 Кб производительность возрастает на 2%, а для блока размером 16 Кб прирост равен почти 5%.

Что же касается сравнения одиночного диска с RAID-массивом, то здесь разница еще более существенна: дисковая подсистема с 16-килобайтным блоком обогнала безрэйдовый вариант более чем на 10% — а это уже можно назвать хорошим приростом.

Adobe Premiere 6.5

В ходе тестирования открывается демонстрационный проект Z-TOUR, который содержит аудиоклип и различные видеоклипы. Выполняется рендеринг проекта. Затем проект экспортируется в форматы DVAVI, FLC и FLM, после чего пролистывается приблизительно на 500 кадров вперед, а затем назад. Последняя операция (пролистывание) выполняется дважды. Наконец, проект с измененными настройками (широкий экран) экспортируется в формат DVAVI.

Среди RAID-массивов лучшее время показала система с размером блока 16 Кб. В этом тесте преимущество системы с RAID’ом над системой с одиночным диском оказалось не таким значительным, как в предыдущем тестировании. Для винчестеров Seagate прирост составил чуть меньше 3%, а для накопителей производства WD производительность возросла на 3,5%.

Ahead Software Nero Express 6.0.0.3

В ходе данного теста создается проект, состоящий из файлов общим объемом около 538 Мб, и записывается восемь изображений (image) этого проекта в формате ISO.

Вот это уже действительно похоже на реальный прирост производительности. У систем, построенных на винчестерах производства WD, разница составила почти 16%. Зато RAID-массив, составленный из накопителей Seagate, обогнал одиночный винчестер того же производителя почти на 22%, что, согласитесь, довольно солидно.

WinZip Computing WinZip 8.1

В этом тесте создается пять ZIP-архивов (приблизительно по 538 Мб каждый). Здесь мы наблюдаем, хотя и не столь значительный, как предыдущем тестировании, но все же вполне ощутимый прирост производительности. Для систем построенных на винчестерах WD разница составила почти 6%. У RAID-массива на основе накопителей Seagate прирост равен 8,5%.

Как видно из результатов, прирост производительности в реальных приложениях оказался не столь значительным, как в теоретических тестах. Понятно, что мы протестировали лишь некоторые программы из широчайшего спектра ПО. Можно предположить, что существенный прирост производительности будет наблюдаться, например, при использовании RAID-массива для обработки больших объемов аудио- или видеофайлов.

Не будем забывать также, что мы тестировали не просто RAID, а дисковый массив, построенный при помощи технологии Intel Matrix Storage Technology. При использовании этой технологии, помимо прироста производительности, мы получаем еще и другие преимущества. Во-первых, дешевый (почти даровой) RAID-контроллер, встроенный в материнскую плату. Во-вторых, возможность построения на двух HDD двух массивов: RAID 0 для повышения производительности системы и RAID 1 для надежности хранения информации. В-третьих, имеем утилиту Intel Storage Utility, с помощью которой можно легко и просто создать RAID-массив на основе уже работающего винчестера, не потеряв при этом существующие данные.

И в заключение отметим, что Intel Matrix Storage Technology — это интересная и перспективная технология, которая найдет свое применение как в домашних рабочих станциях, так и в серверах начального уровня.

Читайте также: