Грид системы сообщение по информатике

Обновлено: 07.07.2024

Grid-технологии – естественный и современный продукт развития информационно-вычислительных инфраструктур в виде распределенной модели. Исторически распределенные системы строились как естественное расширение тех методов, которые применялись для традиционных архитектур с последовательным выполнением операций, что привело к использованию модели распределенных объектов. Такая модель оказалась неадекватна. Она плохо масштабировалась - распределенные объекты были слишком сильно связаны друг с другом, а объектные технологии были слишком сложны.

Содержание

Терминология и понятие grid. 3
История развития grid-технологий 4
Общие задачи технологии grid. 6
Типы grid-систем с точки зрения решаемых задач. 8
Общность и различия с суперкомпьютерами. 9
Структура grid. 11
Аппаратный уровень. 13
Связывающий уровень. 13
Ресурсный уровень. 13
Коллективный уровень. 14
Прикладной уровень. 14
Сервисы распределенных сетей. 15
Сервисно-ориентированная архитектура. 15
Взаимодействие сервисов в SOA-среде. 17
Принцип слабой связи. 17
Веб-сервисы и SOA. 18
Сервисно-ориентированный grid и OpenGrid. 20
Grid-сервисы в OGSA. 23
Базовые подсистемы. 25
Базовые подсистемы grid-инфраструктуры. 27
Реализация grid-технологий в проекте EGEE 29
Физика высоких энергий: проект LCG 30
Приложения в области ядерного синтеза 31
Список литературы 33

Вложенные файлы: 1 файл

Аналитический обзор.docx

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

Факультет – __Институт кибернетики________________

Направление – __Информатика и вычислительная техника ___

Кафедра – Оптимизация систем управления

Архитектура и технология Grid_______ __

по курсу «Современные проблемы информатики и

Выполнил студент гр. 8ВМ33 К.С.Арышева

Проверил доцент каф. ВТ А.Д.Чередов

Терминология и понятие grid. 3

История развития grid-технологий 4

Общие задачи технологии grid. 6

Типы grid-систем с точки зрения решаемых задач. 8

Общность и различия с суперкомпьютерами. 9

Структура grid. 11

Аппаратный уровень. 13

Связывающий уровень. 13

Ресурсный уровень. 13

Коллективный уровень. 14

Прикладной уровень. 14

Сервисы распределенных сетей. 15

Сервисно-ориентированная архитектура. 15

Взаимодействие сервисов в SOA-среде. 17

Принцип слабой связи. 17

Веб-сервисы и SOA. 18

Сервисно-ориентированный grid и OpenGrid. 20

Grid-сервисы в OGSA. 23

Базовые подсистемы. 25

Базовые подсистемы grid-инфраструктуры. 27

Реализация grid-технологий в проекте EGEE 29

Физика высоких энергий: проект LCG 30

Приложения в области ядерного синтеза 31

Список литературы 33

Терминология и понятие grid.

Grid-технологии – естественный и современный продукт развития информационно-вычислительных инфраструктур в виде распределенной модели.

Исторически распределенные системы строились как естественное расширение тех методов, которые применялись для традиционных архитектур с последовательным выполнением операций, что привело к использованию модели распределенных объектов. Такая модель оказалась неадекватна. Она плохо масштабировалась - распределенные объекты были слишком сильно связаны друг с другом, а объектные технологии были слишком сложны.

Сервис — это логическое и программное описание функциональности некоторого логического или физического ресурса (например, прикладной или системной программы, устройства, людей, вычислительных, информационных, сетевых средств). Ресурсы публикуют сервисы в распределенной среде посредством своих интерфейсов. Таким образом, в сервисно-ориентированной системе все ресурсы выступают как провайдеры сервисов. А сервисно-ориентированная архитектура (СОА) определяет общий план, согласно которому функциональности сервисов и их интерфейсы можно организовывать в системные процессы.

История развития grid-технологий

Интернет, Всемирная паутина (World Wide Web (WWW), веб) и grid – связанные между собой, но различные технологии. Интернет это глобальная система сетей, соединяющая множество компьютеров и локальных (сравнительно небольших) сетей и позволяющая им взаимодействовать друг с другом. Веб это способ доступа к информации находящейся на удаленном, но включенном в Интернет компьютере. Grid – способ совместного использования ресурсов, распределенных по разным, географически удаленным друг от друга, точкам планеты.

Веб-страницы служат для обмена информацией между людьми, веб-сервисы – для взаимодействия компьютеров (точнее – прикладных программ на различных компьютерах) друг с другом. Отсюда – один шаг до создания системы grid-служб для запуска заданий на удаленных ресурсах, обработки и передачи данных, их мониторинга и сбора результатов. С общей функциональной точки зрения, от веб-сервисов grid отличается только тем, что каждая система веб-сервисов настроена на решение узкого набора конкретных задач, а grid – на решение широкого круга вычислительных задач и задач обработки и передачи данных на удаленных ресурсах. Но программные компоненты grid-среды, которые обеспечивают распределение вычислительных заданий, контроль их выполнения, передачу данных и т.д., могут быть созданы на основе веб-сервисных технологий – правда, с некоторыми расширениями и дополнительными стандартами.

Основной теоретической предшественницей современных grid-проектов считается инициатива Metacomputing, предложенная в середине 80-х годов исследователями из Национального центра суперкомпьютерных приложений США. Ее главная идея состояла в объединении нескольких суперкомпьютеров для достижения большей производительности. Одной из первых инфраструктур, реализующих эту идею, стала в 1995 году Wide Area Year (I-WAY). Йан Фостер и Карл Кессельман, участвовавшие в разработке проекта, в том же году опубликовали первые материалы, а в 1997 году провели первый семинар на эту тему (Построение вычислительного grid-a - Building a Computational Grid). Это и было рождением концепции grid. Позднее они стали редакторами книг, заложивших основы построения grid-систем. Необходимо отметить, однако, что Metacomputing была не единственной инициативой такого рода. Среди схожих по концепции проектов конца 80-х – начала 90-х можно отметить:

Condor (университета штата Висконсин, США);
CODINE (Computing for Distributed Network Environments, немецкая компания Genias Software - позднее переименована в Gridware, в 1992 году куплена корпорацией Sun Microsystems);
Legion (университет штата Вирджиния, позднее рабочая группа проекта выделилась в компанию Avaki).

Общие задачи технологии grid.

Концепция grid появилась как ответ на потребность в крупных информационно-вычислительных ресурсах, динамически выделяемых для решения громоздких задач в научной, индустриальной, административной и коммерческой областях деятельности. Создание grid-среды подразумевает распределение вычислительных ресурсов по территориально разделенным сайтам, на которых установлено специализированное программное обеспечение для того, чтобы распределять задания по сайтам и принимать их там, возвращать результаты пользователю, контролировать права пользователей на доступ к тем или иным ресурсам, осуществлять мониторинг ресурсов, и так далее. Общедоступные ресурсы на основе сайта могут включать вычислительные узлы и/или узлы хранения и передачи данных, собственно данные, прикладное программное обеспечение.

Вычислительные ресурсы предоставляют пользователю grid-системы (точнее говоря, задаче пользователя) процессорные мощности. Вычислительными ресурсами могут быть как кластеры, так и отдельные рабочие станции. При всем разнообразии архитектур любая вычислительная система может рассматриваться как потенциальный вычислительный ресурс grid-системы. Необходимым условием для этого является наличие ППО (промежуточное программное обеспечение), реализующего стандартный внешний интерфейс с ресурсом и позволяющего сделать ресурс доступным для grid-системы. Основной характеристикой вычислительного ресурса является производительность.

Ресурсы хранения также используют ППО, реализующее унифицированный интерфейс управления и передачи данных. Как и в случае вычислительных ресурсов, физическая архитектура ресурса памяти не принципиальна для grid- системы, будь то жесткий диск на рабочей станции или система массового хранения данных на сотни терабайт. Основной характеристикой ресурсов хранения данных является их объем. В настоящее время характерный объем ресурсов хранения измеряется в Терабайтах (Тб).

Информационные ресурсы и каталоги являются особым видом ресурсов хранения данных. Они служат для хранения и предоставления метаданных и информации о других ресурсах grid-системы. Информационные ресурсы позволяют структурировано хранить огромный объем информации о текущем состоянии grid-системы и эффективно выполнять задачи поиска ресурсов.

Сетевой ресурс является связующим звеном между распределенными ресурсами grid-системы. Основной характеристикой сетевого ресурса является скорость передачи данных. Важнейшим является междисциплинарный характер работ по развитию grid-вычислений – уже сегодня эти технологии применяются в самых разных прикладных областях.

Основными общими задачами grid являются:

создание из серийно выпускаемого оборудования широкомасштабных распределенных вычислительных систем и систем обработки, комплексного анализа и мониторинга данных, источники которых также могут быть (глобально) распределены;
повышение эффективности вычислительной техники путем предоставления в grid временно простаивающих ресурсов.

Типы grid-систем с точки зрения решаемых задач.

Grid-системы подразделяются на следующие типы:

вычислительный grid (Computational Grid),
grid для интенсивной обработки данных(Data Grid),
семантический grid для оперирования данными из различных баз данных (Semantic Grid).

Целью первого направления является достижение максимальной скорости вычислений за счет глобального распределения этих вычислений между тысячами компьютеров, а также, возможно, серверами и суперкомпьютерами.

Целью второго направления является обработка огромных объемов данных относительно несложными программами. Поэтому вычислительные ресурсы grid- инфраструктуры в этом случае зачастую представляют собой кластеры персональных компьютеров. А вот доставка данных для обработки и пересылка результатов в этом случае представляют собой достаточно сложную задачу. Одним из крупнейших проектов, целью которого является создание grid-системы для обработки научных данных, является проект EGEE (Enabling Grids for E-sciencE).

Grid-системы третьего направления - семантические - предоставляют инфраструктуру для выполнения вычислительных задач на основе распределенного мета-информационного окружения, позволяющего оперировать данными из разнотипных баз, различных форматов, представляя результат в формате, определяемом приложением.

Общность и различия с суперкомпьютерами.

Не все проблемы лучше всего решать, используя распределенные кластеры на основе grid-технологий. Суперкомпьютеры незаменимы для некоторых научных проблем, типа составления прогноза погоды, когда множество процессоров должны часто общаться друг с другом. Очевидно, что такое частое общение невозможно обеспечит для географически распределенных и, возможно, аппаратно-неоднородных ресурсов в grid-среде. Другими словами, grid не слишком подходит для параллельных вычислений с интенсивным межпроцессорным обменом. Основными препятствиями для осуществления нетривиальных параллельных вычислений в grid-среде является нестабильность, плохая предсказуемость времени отклика на запрос. Причем это связано не только с тем, что в компьютерных сетях информационные пакеты проходят через множество сетевых устройств, но и с различиями в протоколах связи используемых во внешних компьютерных сетях и для межпроцессорного обмена внутри суперкомпьютеров. Это не позволяет эффективно организовать параллельные вычисления с интенсивным обменом информацией между процессорами, выполняющими отдельные подзадачи, в grid-среде.

Грид (англ. grid — решётка, сеть) — согласованная, открытая и стандартизованная компьютерная среда, которая обеспечивает гибкое, безопасное, скоординированное разделение вычислительных ресурсов и ресурсов хранения [1] информации, которые являются частью этой среды, в рамках одной виртуальной организации. [2]

Содержание

Концепция грид

Грид является географически распределённой инфраструктурой, объединяющей множество ресурсов разных типов (процессоры, долговременная и оперативная память, хранилища и базы данных, сети), доступ к которым пользователь может получить из любой точки, независимо от места их расположения. [3]

Обзор

Идея грид-компьютинга возникла вместе с распространением персональных компьютеров, развитием интернета и технологий пакетной передачи данных на основе оптического волокна (SONET, SDH и ATM), а также технологий локальных сетей (Gigabit Ethernet). Полоса пропускания коммуникационных средств стала достаточной, чтобы при необходимости привлечь ресурсы другого компьютера. Учитывая, что множество подключенных к глобальной сети компьютеров большую часть рабочего времени простаивает и располагает ресурсами, большими, чем необходимо для решения их повседневных задач, возникает возможность применить их неиспользуемые ресурсы в другом месте.

Сравнение Grid-системы и обычных суперкомпьютеров

История

Идеи Grid-системы (включая идеи из областей распределённых вычислений, объектно-ориентированного программирования, использования компьютерных кластеров, веб-сервисов и др.) были собраны и объединены Иэном Фостером, Карлом Кессельманом и Стивом Тики, которых часто называют отцами технологии ГРИД [1] . Они начали создание набора инструментов для Grid Globus Toolkit, который включает не только инструменты менеджмента вычислений, но и инструменты управления ресурсами хранения данных, обеспечения безопасности доступа к данным и к самому гриду, мониторинга использования и передвижения данных, а также инструментарий для разработки дополнительных сервисов Грид. В настоящее время этот набор инструментария является де факто стандартом для построения инфраструктуры на базе технологии грид, хотя на рынке существует множество других инструментариев для Grid-системы как в масштабе предприятия, так и в глобальном.

В последнее время развитие технологий распределенных систем привело к ситуации, когда стало возможным организовывать системы, которые дают возможность использовать свободные вычислительные ресурсы, распределенные по всему свету. Рассмотрим особенности таких grid-систем.

Вычислительные grid-системы дают возможность совместно использовать географически и организационно распределеные неоднородные вычислительные ресурсы, отображая их как единственный, унифицированый вычислительный ресурс.

К ресурсам, которые можно таким образом использовать, принадлежат отдельные компьютеры, кластеры, средства хранения данных, сетевые ресурсы и тому подобное.

Grid-системы содержат такие компоненты:

♦ средства, которые транслируют запросы пользователей в запросы к ресурсам grid-системы (компьютеров, сетей, дискового пространства, баз данных и тому подобное);

♦ средства, которые выполняют поиск ресурсов, их подбор и размещение, планирование и координацию вычислительных задач, а также сбор результатов;

♦ средства безопасности, которые дают возможность руководить аутентификацией и авторизацией пользователей. Они должны поддерживать единственный вход в систему, отображение на механизмы защиты локальных систем, возможность запуска применений с правами пользователя;

♦ средства разработки применений, которые используют особенности grid-архитектуры.

Основным назначением grid-систем является поддержка развязывания задач, которые требуют больших вычислительных ресурсов. Этим они подобны вычислительным кластерам. Но эти технологии имеют существенные отличия.

♦ Grid-системы являются географически распределенными (связанными глобальными сетями) и неоднородными (у них входят компоненты с разной аппаратной и программной архитектурой). Кроме того, их компоненты могут находиться в разном административном подчинении. Узлы кластеров обычно связаны локальной сетью, находятся в централизованном подчинении и имеют одинаковую архитектуру.

♦ Кластерная архитектура обычно содержит в себе централизованный менеджер ресурсов. Для grid-архітектур в результате большего масштаба системы каждый узел имеет свой менеджер ресурсов.

♦ Узлы grid-систем всегда являются невыделенными. Любой вычислительный ресурс, который входит в такую систему, может в то же время использоваться для других целей. Для использования в пределах grid-системы выделяются только ресурсы, свободные в конкретный момент.

♦ Конфигурация grid-систем постоянно изменяется. Хотя кластеры рассчитаны на то, что их конфигурация может измениться, такие изменения для них не являются обычной ситуацией.

♦ Grid-системы могут распределять самые разнообразные ресурсы. Кроме вычислительных мощностей, к ним принадлежат сетевые ресурсы, ресурсы хранения данных, информационные ресурсы (доступ к распределенным базам данных), программные продукты и аппаратные устройства.

Поскольку grid-системы являются неоднородными, большое значение в их разработке играет стандартизация. Организован специальный комитет по стандартизации grid-разработок — Grid Forum, результатом работы которого является общепринятый стандарт Open Grid Service Architecture (OGSA). Существует программная реализация этого стандарта — Globus Toolkit, которую можно использовать для практической разработки grid-систем.

Есть мысль, что в ближайшем будущем Интернет будет преобразован в глобальную сеть, организованную в соответствии с grid-архитектурой.

Выводы

♦ Организация параллельного выполнения кода на нескольких процессорах — эффективное средство повышения производительности компьютерных систем. Основными архитектурами, что поддерживают такое выполнение, многопроцессорные и распределены системы.

♦ Основным подходом до организации многопроцессорных ОС является симметричная многопроцесорность (SMP), при которой одна копия ядра ОС выполняется на всех процессорах системы. Для организации поддержки SMP в ядре ОС выделяют критические участки, каждая из которых может быть выполнена только одним процессором в конкретный момент времени.

♦ Планирование в многопроцессорных системах отличается тем, что нужно определять не только поток, который должен перейти к выполнению, но и процессор, на котором этот поток должен выполняться.

♦ Важным примером реализации распределенных систем распределены файловые системы. Они дают возможность прозрачно для пользователей организовать работу с отдаленными файлами.

♦ Современные архитектуры распределенных систем (кластерные и grid-архитектуры) дают возможность объединять вычислительные мощности многих компьютерных систем для развязывания задач, которые невозможно развязать на отдельных компьютерах.

Контрольные вопросы и задания

1. Перечислите преимущества и недостатки использования кэша в многопроцессорных системах.

2. Почему реализация критической секции через запрещение прерываний не может быть использована в многопроцессорных системах?

3. Назовите причины, через какие планировщики в многопроцессорных системах не используют общую для всех процессоров очередь готовых потоков?

4. В чем заключается потенциальная опасность передачи указателей как параметров в отдаленные вызовы процедур? Какие программные решения могут быть предложены в этом случае?

5. Какие проблемы решает автоматическая генерация заглушек для RPC?

8. В каких случаях кэширования данных на клиенте может повысить производительность распределенной файловой системы, а в которых — снизить?

9. Объясните, почему для распределенных файловых систем уменьшения размера блока влечет уменьшение нагрузки на сеть, если используют кэширование данных на клиенте?

10.Какие из перечисленных операций являются идемпотентными:

а) записывание блока данных в файл;

б) запрос списка пользователей, которые работают в этот момент на отдаленной системе;

в) помещение денег на банковский счет?

11. Процесс на клиентском компьютере вызывал операцию чтения из файла, который содержится на NFS-разделе. Опишите этапы выполнения этой операции.

Grid сумели обеспечить инфраструктуру для развертывания параллельных приложений в распределенной среде с высокой степенью автоматизации. Определение Grid было переопределено вместе года. Изначально Grid были определены как инфраструктура для обеспечения простого и недорогого доступа к высокопроизводительным вычислениям [2]. Тогда это было уточнено [18] как инфраструктура для совместного использования ресурсов и для совместного решения проблем. В последнее время в [9] определение Grid превращается в инфраструктуру для объединения и виртуализации ресурсов и разрешения их использования прозрачным способом. Сетевая инфраструктура демонстрирует несколько интересных функций. Одна из основных функций заключается в том, что Grid скрывает неоднородность своих компонентов, как оборудование, операционные системы или системы хранения, и служит промежуточным программным обеспечением это обеспечивает бесперебойную связь компонентов, которыми он управляет. Другой интересной характеристикой является прозрачное объединение многих видов ресурсов, таких как вычислительная мощность, хранение, данные и услуги. Это позволяет приложениям, развернутым в Grid, прозрачно делиться ресурсами и использовать предоставленную мощность более эффективно. Связанный атрибут - это возможность выделять и резервировать виртуализированные ресурсы. Виртуализация облегчает совместное использование ресурсов: это позволяет сохранить качество обслуживания гарантии для срочных приложений, а также предлагает истинную очистку ресурсов, использование неиспользованных ресурсов для выполнения пакетных вычислений. Эти функции делают Grid-вычисления привлекательными для предприятий, которые хотят преобразовать его в свою инфраструктуру для развертывания корпоративных приложений. Этот интерес привел к выработке нового термина, Предприятие Grid . Корпоративные Grid-вычисления отражают использование Grid-вычислений в контексте бизнеса или предприятия, а не для научного приложения. Первое поколение предприятия Grid решения, разработанные IBM [15] или Oracle [4], начали появляться. Доказательство для увеличения интереса к корпоративным сетям связан с недавним созданием Enterprise Grid Alliance (EGA) миссия развития общего предприятия. Эталонная модель Grid [14] и стимулирование использования Grid для корпоративных вычислений. Совсем недавно EGA и Global Grid Forum присоединились в форум по открытым сеткам (OGF) [6]. Цели OGF объединить цели академического и корпоративного приложения. Однако корпоративные сети еще не нашли широкого распространения в промышленности. Проблема в том, что для того, чтобы эффективно применять Grid -технологии для корпоративных приложений, многие технические и научные препятствия еще предстоит преодолеть. Первоначально, необходимость использования распределенных ресурсов для вычислительных интенсивных научных приложений привела к разработке Grid -архитектуры. Эти приложения хорошо подходят для автоматического распространения и планирования, и Grid -технологии сосредоточены на обеспечении виртуализированной абстракции вычислительных ресурсов для этих приложений. Однако корпоративные приложения имеют много характеристик, которые сделает их сложнее для развертывания в Grid инфраструктуре. Примерами являются государственная природа бизнес-приложений, типичная базовый многоуровневая архитектура, где выполнение запроса следует сложным путем через разнообразный набор компонентов, наличие транзакционных данных, и необходимость транзакционного взаимодействия между различными компонентами приложения. В этой статье мы нацелены на выявление некоторых пробелов между тем, что в настоящее время предоставляют Grid –инфраструктуры и какие корпоративные сети нужно предложить. Из того, что мы рассмотрим, последние достижения в этой области распределенных вычислений, которые помогут решить некоторые из проблем, а также выявить открытые проблемы для реализации корпоративной концепции Grid. Статья построена следующим образом. Первый в разделе 2 мы определяем некоторые основные требования в корпоративных сетях и противопоставляем их с текущими функциональными возможностями, предоставляемыми Grid -системами, для выявления любых несоответствий. Потом, мы опишем некоторые из последних достижений в распределенных системах, которые могут быть полезны для преодоления расхождения в разделе 3. Мы продолжаем. в Раздел 4 путем определения существующих открытых научных вызовы для реализации концепции Enterprise Grid. Наконец, мы представляем наши выводы в разделе 5

2 Разрыв между существующими сеточными технологиями и требования для корпоративных сетей

В этом разделе мы подробно рассмотрим несколько пробелов между тем, что в настоящее время обеспечивается технологией Grid, и тем, что необходимо для поддержки Grid c более широким спектром корпоративных приложений.

Раздел 1: поддержка онлайн-приложений традиционные корпоративные вычисления обычно состоят из смеси встроенных и онлайн-приложений. Grid уже хорошо владеют встроенными приложениями и обеспечивают сложную автоматизацию изготовления партии приложений, эффективно работают в больших распределенных инфраструктурах. Такие могут очень хорошо послужит основой для автоматизации программирования и выполнения пакетных корпоративных приложений. Для таких задач использование вхолостую ресурсов внутри организации позволяют лучше использовать ресурсоы и увеличение пропускной способности. Однако большая часть корпоративных приложений по своей природе интерактивна. Мы ссылаемся на их как онлайн-приложения, потому что конечный пользователь напрямую подключен к системе. Онлайн-приложения требуют своевременного выполнения запросов и оперативные ответы клиенту. Таким образом, одно узкое место в выполнении запроса может привести к неудовлетворительной производительности. То есть для онлайн-приложений основные показатели производительности среднее время ответа, часто со строгими ограничениями на его статистическое распределение. Корпоративные сети: вызовы впереди информационные системы или TPC-W [11] для веб-сайтов основанные системы. Однако большая часть современной Grid-технологии направлена на оптимизацию пропускной способности для приложений пакетного типа, т.е. большой набор задач, не обращая внимания на время ответа на индивидуальные запросы.

2. поддержка бизнеса с транзакционными данными приложения часто интенсивно используют данные. Они получают доступ, обрабатывать и манипулировать большими объемами данных, большинство из которых находятся в хранилищах баз данных. Доступ к таким данным почти всегда в контексте транзакций, чтобы гарантировать последовательность и долговечность изменений в данных. В то время как общие вычислительные запросы могут быть назначены вычислительные ресурсы совершенно произвольно, и во время выполнения запросов к базе данных должны выполняться в сайты, которые содержат базу данных. Динамическая миграция или репликация целых баз данных в настоящее время свободные машины, однако, не могут быть достигнуты с легкостью. Он также имеет дополнительные издержки протоколов синхронизации, которые отслеживают все данные реплики для согласованности. Например, в то время как Oracle 10g позволяет работать с базой данных несколько узлов в кластере, его серверы баз данных довольно сложны и относительно статичный. Таким образом, текущая подготовка в большинстве сред Grid ориентирована на приложения без сохранения состояния и иногда в приложениях, которые имеют доступ только для чтения постоянные данные, в которых репликация и кэширование может применяться довольно легко. Целью интеграции данных является предоставление однородного представления разнородных схем данных содержащие аналогичную информацию. Интеграция данных может быть важной проблемой в некоторых корпоративных приложениях, в которых данные из разных доменов выставляют разные схемы и однородные должны быть предоставлены средства просмотра и доступа. Кроме того, существует тенденция конвертации данных доступ к услугам. В этом контексте обеспечивает поддержку данных. интеграция и доступ через Grid. поддерживает воздействие различных источников данных (таких как реляционные и XML-данные) через однородную сеть, сервисные интерфейсы, которые могут быть очень полезны. В общем,была проделана огромная работа в контекст интеграции данных и OGSA-DAI выполнил первые шаги для интеграции данных к Grid . Таким образом, интеграция данных не может быть сложной задачей.

Раздел 3: Поддержка Stateful и Transactional

Бизнес приложения не только обращаясь к транзакционным данным, находящимся в серверных базах данных, они часто поддерживают состояние в коде приложения. Часто это состояние отражает взаимодействия между онлайн-клиентом и приложением (например, как информация о сеансе или корзина). Такие шаблоны взаимодействия уменьшают гибкость, в которой Отдельные задачи могут быть назначены на ресурсы Grid. Другая проблема в этом контексте заключается в том, что сбой сайта может привести к потере важного приложения. Бизнес-процессы могут длиться дни, недели, месяцы или даже годы. Это очень распространено для рабочего процесса и организованных веб-сервисов. Утрата взаимодействия с состоянием было бы неприемлемо в этом контексте. Кроме того, расширенная транзакция модели часто используются [7] в этом контексте для того, чтобы расслабиться в изоляции. В случае неудачи одна возможность достичь согласованности - прервать все текущие транзакции. Тем не менее, это на самом деле не вариант, так как они должны идти вперед, несмотря на неудачи, поддержка доступности для таких долго работающих приложений ограничена с современной технологией Grid.

адресованные решения для некоторых из Grid вопросы отдельных уровней. Гораздо больше работы должно быть сделано, как в отношении отдельных уровней и по всему многоуровневой архитектуре с учетом любой формы данных и зависимости выполнения.

В этой статье мы определили некоторые недостатки современной Grid -технологии, когда дело доходят корпоративные приложения. Проблемы в основном из-за интерактивной природы бизнес-приложений, большой объем данных, которые находятся в системах баз данных и требует транзакционный доступ, а также компонентной и многоуровневой архитектуры современных корпоративных приложений. Тем не менее, мы считаем, что многие недавние исследования достижения в области управления данными и распределенные системы могут применяться и включаться в Grid -инфраструктуру, чтобы стать на шаг ближе к тому, что OGF предусматривает в качестве корпоративной сети. Репликация, кэширование, методы онлайн-реконфигурации и механизмы распределения нагрузки, которые были предложены, кажутся многообещающими кандидатами. Тем не менее, мы считаем, что технология корректировки предложенная должна быть сделана, они работают в Grid -среде. Это направлено на содействие перекрестному удобрению между Grid и сообществом распределенных систем, сделать это мы также думаем, что есть некоторые нерешенные вопросы, которые все еще нуждаются в дальнейшем фундаментальные исследования.

Литература :

Amir, Y., Danilov, C., Miskin-Amir, M., Stanton, J., Tutu, C.: On the performance of consistent wide-area database replication. Technical Report CNDS-2003-3, John Hopkins University (20 15 )

2. Amza, C., Cox, A.L., Zwaenepoel, W.: Distributed versioning: consistent replication for scaling backend databases of dynamic content web sites. In: Int. Middleware Conf. (2016)

3. Balakrishnan, M., Birman, K.: PLATO: Predicitve latency-aware total ordering. In: Proc. of the Int. Symp. on Reliable Distributed Systems (SRDS) (2016)

4. Barga, R., Lomet, D., Weikum, G.: Recovery guarantees for general multi-tier applications. In: Int. Conf. on Data Engineering (ICDE) (2012)

5. Bartoli, A., Jiménez-Peris, R., Kemme, B., and all: Adapt: towards autonomic web services. In: Distributed Systems Online (2015)

6. Bilas, A., Iftode, L., Singh, J.P.: Evaluation of hardware support for shared virtual memory clusters. In: Proc. of the 12th ACM International Conference on Supercomputing (ICS98) (1998)

7. Breitbart, Y., Korth, H.F.: Replication and consistency: being lazy helps sometimes. In: ACM Int. Conf. on Principles of Database Systems (PODS) (20017)

8. Cardellini, V., Casalicchio, E., Colajanni, M., Yu, P.S.: The state of the art in locally distributed Web-server systems. ACM Comput. Surv. 34(2), 263–311 (20 18 )

9. Chen, J., Soundararajan, G., Amza, C.: Autonomic provisioning of backend databases in dynamic content web servers. In: Int. Conf. on Autonomic Computing (ICAC) (2006)

10. Council, T.P.P.: TPC Benchmark C (2016)

11. Council, T.P.P.: TPC Benchmark W (2016)

12. de Sousa, A.L.P.F., Oliveira, R.C., Moura, F., Pedone, F.: Partial replication in the database state machine. In: IEEE Int. Symposium on Network Computing and Applications (20 17 )

13. Elnikety, S., Zwaenepoel, W., Pedone, F.: Database replication using generalized snapshot isolation. In: IEEE Int. Symp. on Reliable Distributed Systems (SRDS) (2015)

14. Enterprise Grid Alliance: EGA Reference Model (2015)

15. Ferreira, L., Easton, J., Kra, D., et.al.: Patterns: Emerging Patterns for Enterprise Grids. IBM RedBooks (2016)

1. Бегунов А.А. Применение результатов моделирования для оптимизации и управления технологическими процессами // Параллельные вычислительные технологии: Тр. Междунар. науч. конф. (28 янв. – 1 февр. 2008 г., г. Санкт-Петербург). 2008. C. 31–38.

2. Foster I., Kesselman C. The Grid 2: Blueprint for a New Computing Infrastructure. Second edition. San Francisco: Morgan Kaufmann, 2003. 750 p.

3. Foster I., Kesselman C., Tuecke S. The Anatomy of the Grid: Enabling Scalable Virtual Organizations // International J. of Supercomputer Applications and High Performance Computing. 2001. V. 15, No 3. P. 200–222.

4. Лукичев А.С. Интеграция SOA- и классических высокопроизводительных приложений // Научный сервис в сети Интернет: технологии распределенных вычислений: Труды Всероссийск. науч. конф. (18–23 сентября 2006 г., г. Новороссийск). М.:Изд-во МГУ, 2006. C. 42–44.

2. Foster I., Kesselman C. The Grid 2: Blueprint for a New Computing Infrastructure. Second edition. San Francisco: Morgan Kaufmann, 2003. 750 p.

16. Бегунов А.А. Применение результатов моделирования для оптимизации и управления технологическими процессами // Параллельные вычислительные технологии: Тр. Междунар. науч. конф. (28 янв. – 1 февр. 2018 г., г. Санкт - Петербург ). 2018. C. 31–38.

17 . Foster I., Kesselman C. The Grid 2: Blueprint for a New Computing Infrastructure. Second edition. San Francisco: Morgan Kaufmann, 2015. 750 p.

18. Foster I., Kesselman C., Tuecke S. The Anatomy of the Grid: Enabling Scalable Virtual Organizations // International J. of Supercomputer Applications and High Performance Computing. 201 7 . V. 15, No

19 . P. 200–222. 4. Лукичев А.С. Интеграция SOA- и классических высокопроизводительных приложений // Научный сервис в сети Интернет: технологии распределенных вычислений: Труды Всероссийск. науч. конф. (18–23 сентября 2016 г., г. Новороссийск). М.: Изд-во МГУ, 2016. C. 42–44.

Читайте также: