Кластер это в информатике кратко

Обновлено: 02.07.2024

Вычислительный кластер – это набор соединенных между собой компьютеров (серверов), которые работают вместе и могут рассматриваться как единая система. В отличие от грид-вычислений, все узлы компьютерного кластера выполняют одну и ту же задачу и управляются одной системой управления.

Серверы кластера обычно соединяются между собой по быстродействующей локальной сети, причем на каждом из серверов работает собственный экземпляр операционной системы. В большинстве случаев все вычислительные узлы кластера используют одинаковое оборудование и одну и ту же операционную систему. Однако в некоторых инсталляциях, например, с использованием платформы приложений для организации кластеров OSCAR (Open Source Cluster Application Resources), могут использоваться различные операционные системы или разное серверное оборудование.

Кластеры обычно развертываются для большей производительности и доступности, чем то, что можно получить от одного компьютера, пусть даже очень мощного. Часто такое решение более экономично, чем отдельные компьютеры.

Компоненты кластера

Вычислительные кластеры обычно состоят из следующих компонентов:

узел доступа;
вычислительные узлы;
файловый сервер;
файловая или объектная СХД с общим доступом;
локальная сеть LAN.

Виды кластеров

Различают следующие основные виды кластеров:

кластеры высокой доступности (High-availability clusters, HA);
кластеры с балансировкой нагрузки (Load balancing clusters);
высокопроизводительные кластеры (High performance computing clusters, HPC).

Кластеры высокой доступности

Чрезвычайно высокая доступность в НА-кластерах достигается за счет использования специального программного обеспечения и аппаратных решений со схемами обнаружения отказов, а также благодаря работе по подготовке к отказам.

ПО для НА-кластеров обычно заблаговременно конфигурирует узел на резервном сервере и запускает на нем приложение в фоновом режиме так, чтобы основной экземпляр приложения мог немедленно переключиться на свою реплику на резервном компьютере при отказе основного.

Но не следует думать, что технология кластера высокой доступности, или вообще кластеризация, могут служить заменой резервному копированию (backup), а также решениям катастрофоустойчивости (disaster recovery).

Кластеры с балансировкой нагрузки

Балансировка нагрузки – это эффективное распределение входящего сетевого трафика в группе (кластере) серверов.

Современные веб-сайты должны одновременно обслуживать сотни тысяч и даже миллионы запросов от пользователей или клиентов и не слишком задерживать их в получении контента: текста, видео или данных приложений. Чем больше серверов будут обслуживать эти запросы, тем лучше будет качество воспринимаемого сервиса для клиентов. Однако может возникнуть ситуация, когда одни серверы сайта будут работать с перегрузкой, а другие будут почти простаивать.

Балансировщик нагрузки направляет запросы клиентов равномерно на все серверы кластера, которые способны ответить на те или иные запросы. Таким образом, балансировщик максимизирует процент использования вычислительной емкости, а также обеспечивает то, что ни один сервер не оказывается перегруженным, вызывая общую деградацию производительности кластера.

Если какой-то сервер отказывает, то балансировщик перенаправляет трафик на оставшиеся серверы. Когда новый сервер добавляется к группе (кластеру), то балансировщик автоматически перераспределяет нагрузку на всех серверах с учетом вновь вступившего в работу.

Таким образом, балансировщик нагрузки выполняет следующие функции:

Распределяет запросы клиентов и нагрузку сети эффективным образом в во всем кластере серверов.
Обеспечивает высокую доступность и надежность посылкой запросов только на те серверы, которые находятся в режиме онлайн.
Обеспечивает гибкость, добавляя или удаляя серверы по мере надобности.

Работа балансировщика нагрузки

Алгоритмы балансировки нагрузки

Различные алгоритмы балансировки предназначены для разных целей и достижения разных выгод. Можно назвать следующие алгоритмы балансировки:

Round Robin – запросы распределяются по кластеру серверов последовательно.
Least Connections – новый запрос посылается на сервер с наименьшим числом подключений клиентов, однако при этом учитывается и вычислительная мощность каждого сервера.
Least Time – запросы посылаются на сервер, выбираемый по формуле, которая комбинирует быстроту ответа и наименьшее число активных запросов.
Hash – распределяет запросы на основании определяемого пользователем ключа, например, IP-адреса клиента или URL запрашиваемого сайта.
Random with Two Choices – выбираются два сервера по методу произвольного выбора и затем запрос посылается на один из них, который выбирается по критерию наименьшего числа подключений.

Программная и аппаратная балансировка нагрузки

Балансировщики нагрузки бывают двух типов: программные и аппаратные. Программные балансировщики можно установить на любой сервер достаточной для задачи емкости. Поставщики аппаратных балансировщиков просто загружают соответствующее программное обеспечение балансировки нагрузки на серверы со специализированными процессорами. Программные балансировщики менее дорогие и более гибкие. Можно также использовать облачные решения сервисов балансировки нагрузки, такие как AWS EC2.

Высокопроизводительные кластеры (HPC)

Высокопроизводительные вычисления HPC (High-performance computing) – это способность обрабатывать данные и выполнять сложные расчеты с высокой скоростью. Это понятие весьма относительное. Например, обычный лэптоп с тактовой частотой процессора в 3 ГГц может производить 3 миллиарда вычислений в секунду. Для обычного человека это очень большая скорость вычислений, однако она меркнет перед решениями HPC, которые могут выполнять квадриллионы вычислений в секунду.

Одно из наиболее известных решений HPC – это суперкомпьютер. Он содержит тысячи вычислительных узлов, которые работают вместе над одной или несколькими задачами, что называется параллельными вычислениями.

HPC очень важны для прогресса в научных, промышленных и общественных областях.

Такие технологии, как интернет вещей IoT (Internet of Things), искусственный интеллект AI (artificial intelligence), и аддитивное производство (3D imaging), требуют значительных объемов обработки данных, которые экспоненциально растут со временем. Для таких приложений, как живой стриминг спортивных событий в высоком разрешении, отслеживание зарождающихся тайфунов, тестирование новых продуктов, анализ финансовых рынков, – способность быстро обрабатывать большие объемы данных является критической.

Чтобы создать HPC-кластер, необходимо объединить много мощных компьютеров при помощи высокоскоростной сети с широкой полосой пропускания. В этом кластере на многих узлах одновременно работают приложения и алгоритмы, быстро выполняющие различные задачи.

Чтобы поддерживать высокую скорость вычислений, каждый компонент сети должен работать синхронно с другими. Например, компонент системы хранения должен быть способен записывать и извлекать данные так, чтобы не задерживать вычислительный узел. Точно так же и сеть должна быстро передавать данные между компонентами НРС-кластера. Если один компонент будет подтормаживать, он снизит производительность работы всего кластера.

Существует много технических решений построения НРС-кластера для тех или иных приложений. Однако типовая архитектура НРС-кластера выглядит примерно так, как показано на рисунке ниже.

Примеры реализации вычислительного кластера

В лаборатории вычислительного интеллекта создан вычислительный кластер для решения сложных задач анализа данных, моделирования и оптимизации процессов и систем.

Кластер представляет собой сеть из 11 машин с распределенной файловой системой NFS. Общее число ядер CPU в кластере – 61, из них высокопроизводительных – 48. Максимальное число параллельных высокоуровневых задач (потоков) – 109. Общее число ядер графического процессора CUDA GPU – 1920 (NVidia GTX 1070 DDR5 8Gb).

На оборудовании кластера успешно решены задачи анализа больших данных (Big Data): задача распознавания сигнала от процессов рождения суперсимметричных частиц, задача классификации кристаллических структур по данным порошковой дифракции, задача распределения нагрузки электросетей путем определения выработки электроэнергии тепловыми и гидроэлектростанциями с целью минимизации расходов, задача поиска оптимального расположения массива кольцевых антенн и другие задачи.

Архитектура вычислительного кластера

Другой вычислительный НРС-кластер дает возможность выполнять расчеты в любой области физики и проводить многодисциплинарные исследования.

На рисунке показана визуализация результатов расчета реактивного двигателя, зависимость скорости расчетов и эффективности вычислений от количества ядер процессора.

Скорее всего вам нужно вот такое определение:
Кластер (англ. cluster) — в некоторых типах файловых систем логическая единица хранения данных в таблице размещения файлов, объединяющая группу секторов. Например, на дисках с размером секторов в 512 байт, 512-байтный кластер содержит один сектор, тогда как 4-килобайтный кластер содержит восемь секторов.

Как правило, это наименьшее место на диске, которое может быть выделено для хранения файла.

Понятие кластер используется в файловых системах FAT и NTFS. Другие файловые системы оперируют схожими понятиями (зоны в Minix, блоки в Unix).

Кла́стер (англ. cluster — скопление) — объединение нескольких однородных элементов, которое может рассматриваться как самостоятельная единица, обладающая определёнными свойствами.

Кластер (англ. cluster ) — в некоторых типах файловых систем логическая единица хранения данных в таблице размещения файлов, объединяющая группу секторов. Например, на дисках с размером секторов в 512 байт, 512-байтный кластер содержит один сектор, тогда как 4-килобайтный кластер содержит восемь секторов.

Как правило, это наименьшее место на диске, которое может быть выделено для хранения файла.

Понятие кластер используется в файловых системах FAT, NTFS, a так же HFS Plus. Другие файловые системы оперируют схожими понятиями (зоны в Minix, блоки в Unix).

Оптимизация

Это заготовка статьи о компьютерах. Вы можете помочь проекту, исправив и дополнив её.
Это примечание по возможности следует заменить более точным.

Найти и оформить в виде сносок ссылки на авторитетные источники, подтверждающие написанное.

Файловые системы
Носители информации

Wikimedia Foundation . 2010 .

Полезное

Смотреть что такое "Кластер (единица хранения данных)" в других словарях:

Кластер — в вычислительной технике группа компьютеров, объединенных высокоскоростными каналами связи и представляющая с точки зрения пользователя одну многопроцессорную вычислительную машину. По английски: Cluster См. также: Мультипроцессорная обработка… … Финансовый словарь

Кластер — (англ. cluster скопление) объединение нескольких однородных элементов, которое может рассматриваться как самостоятельная единица, обладающая определёнными свойствами. В информационных технологиях: Кластер как подмножество… … Википедия

кластер — Термин кластер Термин на английском cluster Синонимы суператом Аббревиатуры Связанные термины магические кластеры, наночастица, фуллерен, эндоэдральный, матричная изоляция Определение (от англ. cluster рой, скопление) компактная группа связанных… … Энциклопедический словарь нанотехнологий

КЛАСТЕР — Объединение в систему однородных единиц. При этом данная система может считаться самостоятельным элементом обладающим определенными свойствами. Понятие кластер входит во многие области науки химию, физику, социологию, астрономию и т.д. В… … Словарь бизнес-терминов

Кластеры — Кластер (англ. cluster скопление) объединение нескольких однородных элементов, которое может рассматриваться как самостоятельная единица, обладающая определёнными свойствами. В информационных технологиях: Кластер (единица хранения данных) … … Википедия

ГОСТ Р 54136-2010: Системы промышленной автоматизации и интеграция. Руководство по применению стандартов, структура и словарь — Терминология ГОСТ Р 54136 2010: Системы промышленной автоматизации и интеграция. Руководство по применению стандартов, структура и словарь оригинал документа: 4.1 абстрактная деталь (abstract part): Деталь, которая определена только своей… … Словарь-справочник терминов нормативно-технической документации

картографирование науки — КАРТОГРАФИРОВАНИЕ НАУКИ. В эпистемологии и философии науки интерес к тематическому строению науки был вызван общей эволюцией научного знания. К 70 80 гг. 20 в. фронт таких исследований значительно расширяется, интенсивное развитие… … Энциклопедия эпистемологии и философии науки

Самара — У этого термина существуют и другие значения, см. Самара (значения). Городской округ Самара … Википедия

Кластер — это группа компьютеров (узлов), которые объединены высокоскоростными каналами связи. Кластер также является совокупностью нескольких вычислительных систем для выполнения общих приложений. Пользователь видит эту совокупность как единую систему.

Схема кластера

Какие бывают кластеры: основные виды

Кластер — это разновидность параллельной системы (обработка данных идет на всех узлах параллельно), которая состоит из нескольких связанных между собой компьютеров, а также используется как единый вычислительный ресурс. Кластеры подразделяются на следующие категории:

Кластеры высокой доступности (High Availability, HA), которые имеют избыточное количество узлов, тем самым гарантируя непрерывную работу кластера в случае отказа одного или нескольких узлов. Таким образом, кластеры высокой доступности являются самыми отказоустойчивыми. Кластеры HA делятся на 3 типа:

с холодным резервом: активный узел выполняет поступающие запросы, а пассивный ждет его отказа. Пассивный узел включается в работу только при выходе из строя активного;
с горячим резервом: все узлы выполняют запросы до тех пор, пока не произойдет сбой. В случае сбоя нагрузка перераспределяется между оставшимися рабочими узлами;
с модульной избыточностью — это кластеры, которые не допускают простоя системы. Все узлы одновременно выполняют один и тот же запрос. Таким образом, необходима гарантия того, что результаты работы различных узлов всегда будут одинаковы.

Кластеры распределения нагрузки (Network Load Balancing, NLB): принцип работы основан на распределении запросов через один или несколько входных узлов, которые перенаправляют их на обработку в остальные рабочие узлы. Основная цель NLB — достижение наибольшей производительности.
Вычислительные кластеры — это кластеры, использующиеся для больших вычислений, в частности для каких-либо научных исследований. Для вычислительных кластеров характерно наличие очень мощного процессора, так как требуется высокая производительность в операциях над большими числами, в частности над числами с плавающей точкой (float). Такие кластеры позволяют уменьшить время расчетов, разбивая задание на параллельные ветки вычислительных узлов, которые обмениваются данными по сети.
Кластер серверов — это группа серверов, которые логически объединены между собой и используются как единый ресурс. Чаще всего серверы в таком кластере группируются посредством локальной сети. Кластер серверов активно используется при разработке и тестировании кластерных или серверных приложений.

Как появились кластеры: краткая история

Причиной появления кластеров служат разработки в области компьютерных сетей. Так, в начале 1970-х годов группой разработчиков протокола TCP/IP и лабораторией Xerox PARC были закреплены стандарты сетевого взаимодействия, и уже в 1971 году в США (штат Пенсильвания) появился первый кластер C.mpp. Однако, механизмы для распределения задач были созданы только в 1983 году. Этим занималась компания Sun Microsystems. Первым коммерческим проектом является кластер ARCnet, созданный компанией Datapoint в 1977 году. Он стал настолько прибыльным, что это затормозило развитие кластеров до 1984 года, когда компания DEC создала VAXcluster на основе операционной системы VAX. В 1989 году вышел в свет готовый проект под названием Parallel Virtual Machine (PVM). Благодаря PVM появилась возможность мгновенного создания кластеров. В 1995 году было создано семейство кластеров Beowulf, позволяющее объединить компьютеры единой сетью передачи данных.

Таким образом, основными достоинствами кластеров считают возможность распределенных вычислений, высокую производительность и отказоустойчивость, благодаря которым возрастает скорость работы с данными и уменьшается риск их потери в случае выхода из строя одного из компьютеров. Поэтому кластеры являются неотъемлемой частью технологий работы с большими данными (Big Data), включая различные направления Data Science, такие как аналитические системы на базе алгоритмов машинного обучения (Machine Learning) и других методов искусственного интеллекта. Например, здесь мы рассказываем о структуре и принципах работы кластеров Apache Kafka.

Читайте также: