Грид системы сообщение по информатике

Обновлено: 07.07.2024

Grid-технологии – естественный и современный продукт развития информационно-вычислительных инфраструктур в виде распределенной модели. Исторически распределенные системы строились как естественное расширение тех методов, которые применялись для традиционных архитектур с последовательным выполнением операций, что привело к использованию модели распределенных объектов. Такая модель оказалась неадекватна. Она плохо масштабировалась - распределенные объекты были слишком сильно связаны друг с другом, а объектные технологии были слишком сложны.

Содержание

Терминология и понятие grid. 3
История развития grid-технологий 4
Общие задачи технологии grid. 6
Типы grid-систем с точки зрения решаемых задач. 8
Общность и различия с суперкомпьютерами. 9
Структура grid. 11
Аппаратный уровень. 13
Связывающий уровень. 13
Ресурсный уровень. 13
Коллективный уровень. 14
Прикладной уровень. 14
Сервисы распределенных сетей. 15
Сервисно-ориентированная архитектура. 15
Взаимодействие сервисов в SOA-среде. 17
Принцип слабой связи. 17
Веб-сервисы и SOA. 18
Сервисно-ориентированный grid и OpenGrid. 20
Grid-сервисы в OGSA. 23
Базовые подсистемы. 25
Базовые подсистемы grid-инфраструктуры. 27
Реализация grid-технологий в проекте EGEE 29
Физика высоких энергий: проект LCG 30
Приложения в области ядерного синтеза 31
Список литературы 33

Вложенные файлы: 1 файл

Аналитический обзор.docx

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

Факультет – __Институт кибернетики________________

Направление – __Информатика и вычислительная техника ___

Кафедра – Оптимизация систем управления

Архитектура и технология Grid_______ __

по курсу «Современные проблемы информатики и

Выполнил студент гр. 8ВМ33 К.С.Арышева

Проверил доцент каф. ВТ А.Д.Чередов

Терминология и понятие grid. 3

История развития grid-технологий 4

Общие задачи технологии grid. 6

Типы grid-систем с точки зрения решаемых задач. 8

Общность и различия с суперкомпьютерами. 9

Структура grid. 11

Аппаратный уровень. 13

Связывающий уровень. 13

Ресурсный уровень. 13

Коллективный уровень. 14

Прикладной уровень. 14

Сервисы распределенных сетей. 15

Сервисно-ориентированная архитектура. 15

Взаимодействие сервисов в SOA-среде. 17

Принцип слабой связи. 17

Веб-сервисы и SOA. 18

Сервисно-ориентированный grid и OpenGrid. 20

Grid-сервисы в OGSA. 23

Базовые подсистемы. 25

Базовые подсистемы grid-инфраструктуры. 27

Реализация grid-технологий в проекте EGEE 29

Физика высоких энергий: проект LCG 30

Приложения в области ядерного синтеза 31

Список литературы 33

Терминология и понятие grid.

Grid-технологии – естественный и современный продукт развития информационно-вычислительных инфраструктур в виде распределенной модели.

Исторически распределенные системы строились как естественное расширение тех методов, которые применялись для традиционных архитектур с последовательным выполнением операций, что привело к использованию модели распределенных объектов. Такая модель оказалась неадекватна. Она плохо масштабировалась - распределенные объекты были слишком сильно связаны друг с другом, а объектные технологии были слишком сложны.

Сервис — это логическое и программное описание функциональности некоторого логического или физического ресурса (например, прикладной или системной программы, устройства, людей, вычислительных, информационных, сетевых средств). Ресурсы публикуют сервисы в распределенной среде посредством своих интерфейсов. Таким образом, в сервисно-ориентированной системе все ресурсы выступают как провайдеры сервисов. А сервисно-ориентированная архитектура (СОА) определяет общий план, согласно которому функциональности сервисов и их интерфейсы можно организовывать в системные процессы.

История развития grid-технологий

Интернет, Всемирная паутина (World Wide Web (WWW), веб) и grid – связанные между собой, но различные технологии. Интернет это глобальная система сетей, соединяющая множество компьютеров и локальных (сравнительно небольших) сетей и позволяющая им взаимодействовать друг с другом. Веб это способ доступа к информации находящейся на удаленном, но включенном в Интернет компьютере. Grid – способ совместного использования ресурсов, распределенных по разным, географически удаленным друг от друга, точкам планеты.

Веб-страницы служат для обмена информацией между людьми, веб-сервисы – для взаимодействия компьютеров (точнее – прикладных программ на различных компьютерах) друг с другом. Отсюда – один шаг до создания системы grid-служб для запуска заданий на удаленных ресурсах, обработки и передачи данных, их мониторинга и сбора результатов. С общей функциональной точки зрения, от веб-сервисов grid отличается только тем, что каждая система веб-сервисов настроена на решение узкого набора конкретных задач, а grid – на решение широкого круга вычислительных задач и задач обработки и передачи данных на удаленных ресурсах. Но программные компоненты grid-среды, которые обеспечивают распределение вычислительных заданий, контроль их выполнения, передачу данных и т.д., могут быть созданы на основе веб-сервисных технологий – правда, с некоторыми расширениями и дополнительными стандартами.

Основной теоретической предшественницей современных grid-проектов считается инициатива Metacomputing, предложенная в середине 80-х годов исследователями из Национального центра суперкомпьютерных приложений США. Ее главная идея состояла в объединении нескольких суперкомпьютеров для достижения большей производительности. Одной из первых инфраструктур, реализующих эту идею, стала в 1995 году Wide Area Year (I-WAY). Йан Фостер и Карл Кессельман, участвовавшие в разработке проекта, в том же году опубликовали первые материалы, а в 1997 году провели первый семинар на эту тему (Построение вычислительного grid-a - Building a Computational Grid). Это и было рождением концепции grid. Позднее они стали редакторами книг, заложивших основы построения grid-систем. Необходимо отметить, однако, что Metacomputing была не единственной инициативой такого рода. Среди схожих по концепции проектов конца 80-х – начала 90-х можно отметить:

    • Condor (университета штата Висконсин, США);
    • CODINE (Computing for Distributed Network Environments, немецкая компания Genias Software - позднее переименована в Gridware, в 1992 году куплена корпорацией Sun Microsystems);
    • Legion (университет штата Вирджиния, позднее рабочая группа проекта выделилась в компанию Avaki).

    Общие задачи технологии grid.

    Концепция grid появилась как ответ на потребность в крупных информационно-вычислительных ресурсах, динамически выделяемых для решения громоздких задач в научной, индустриальной, административной и коммерческой областях деятельности. Создание grid-среды подразумевает распределение вычислительных ресурсов по территориально разделенным сайтам, на которых установлено специализированное программное обеспечение для того, чтобы распределять задания по сайтам и принимать их там, возвращать результаты пользователю, контролировать права пользователей на доступ к тем или иным ресурсам, осуществлять мониторинг ресурсов, и так далее. Общедоступные ресурсы на основе сайта могут включать вычислительные узлы и/или узлы хранения и передачи данных, собственно данные, прикладное программное обеспечение.

    Вычислительные ресурсы предоставляют пользователю grid-системы (точнее говоря, задаче пользователя) процессорные мощности. Вычислительными ресурсами могут быть как кластеры, так и отдельные рабочие станции. При всем разнообразии архитектур любая вычислительная система может рассматриваться как потенциальный вычислительный ресурс grid-системы. Необходимым условием для этого является наличие ППО (промежуточное программное обеспечение), реализующего стандартный внешний интерфейс с ресурсом и позволяющего сделать ресурс доступным для grid-системы. Основной характеристикой вычислительного ресурса является производительность.

    Ресурсы хранения также используют ППО, реализующее унифицированный интерфейс управления и передачи данных. Как и в случае вычислительных ресурсов, физическая архитектура ресурса памяти не принципиальна для grid- системы, будь то жесткий диск на рабочей станции или система массового хранения данных на сотни терабайт. Основной характеристикой ресурсов хранения данных является их объем. В настоящее время характерный объем ресурсов хранения измеряется в Терабайтах (Тб).

    Информационные ресурсы и каталоги являются особым видом ресурсов хранения данных. Они служат для хранения и предоставления метаданных и информации о других ресурсах grid-системы. Информационные ресурсы позволяют структурировано хранить огромный объем информации о текущем состоянии grid-системы и эффективно выполнять задачи поиска ресурсов.

    Сетевой ресурс является связующим звеном между распределенными ресурсами grid-системы. Основной характеристикой сетевого ресурса является скорость передачи данных. Важнейшим является междисциплинарный характер работ по развитию grid-вычислений – уже сегодня эти технологии применяются в самых разных прикладных областях.

    Основными общими задачами grid являются:

    • создание из серийно выпускаемого оборудования широкомасштабных распределенных вычислительных систем и систем обработки, комплексного анализа и мониторинга данных, источники которых также могут быть (глобально) распределены;
    • повышение эффективности вычислительной техники путем предоставления в grid временно простаивающих ресурсов.

    Типы grid-систем с точки зрения решаемых задач.

    Grid-системы подразделяются на следующие типы:

    • вычислительный grid (Computational Grid),
    • grid для интенсивной обработки данных(Data Grid),
    • семантический grid для оперирования данными из различных баз данных (Semantic Grid).

    Целью первого направления является достижение максимальной скорости вычислений за счет глобального распределения этих вычислений между тысячами компьютеров, а также, возможно, серверами и суперкомпьютерами.

    Целью второго направления является обработка огромных объемов данных относительно несложными программами. Поэтому вычислительные ресурсы grid- инфраструктуры в этом случае зачастую представляют собой кластеры персональных компьютеров. А вот доставка данных для обработки и пересылка результатов в этом случае представляют собой достаточно сложную задачу. Одним из крупнейших проектов, целью которого является создание grid-системы для обработки научных данных, является проект EGEE (Enabling Grids for E-sciencE).

    Grid-системы третьего направления - семантические - предоставляют инфраструктуру для выполнения вычислительных задач на основе распределенного мета-информационного окружения, позволяющего оперировать данными из разнотипных баз, различных форматов, представляя результат в формате, определяемом приложением.

    Общность и различия с суперкомпьютерами.

    Не все проблемы лучше всего решать, используя распределенные кластеры на основе grid-технологий. Суперкомпьютеры незаменимы для некоторых научных проблем, типа составления прогноза погоды, когда множество процессоров должны часто общаться друг с другом. Очевидно, что такое частое общение невозможно обеспечит для географически распределенных и, возможно, аппаратно-неоднородных ресурсов в grid-среде. Другими словами, grid не слишком подходит для параллельных вычислений с интенсивным межпроцессорным обменом. Основными препятствиями для осуществления нетривиальных параллельных вычислений в grid-среде является нестабильность, плохая предсказуемость времени отклика на запрос. Причем это связано не только с тем, что в компьютерных сетях информационные пакеты проходят через множество сетевых устройств, но и с различиями в протоколах связи используемых во внешних компьютерных сетях и для межпроцессорного обмена внутри суперкомпьютеров. Это не позволяет эффективно организовать параллельные вычисления с интенсивным обменом информацией между процессорами, выполняющими отдельные подзадачи, в grid-среде.

    Грид (англ. grid — решётка, сеть) — согласованная, открытая и стандартизованная компьютерная среда, которая обеспечивает гибкое, безопасное, скоординированное разделение вычислительных ресурсов и ресурсов хранения [1] информации, которые являются частью этой среды, в рамках одной виртуальной организации. [2]

    Содержание

    Концепция грид

    Грид является географически распределённой инфраструктурой, объединяющей множество ресурсов разных типов (процессоры, долговременная и оперативная память, хранилища и базы данных, сети), доступ к которым пользователь может получить из любой точки, независимо от места их расположения. [3]

    Обзор

    Идея грид-компьютинга возникла вместе с распространением персональных компьютеров, развитием интернета и технологий пакетной передачи данных на основе оптического волокна (SONET, SDH и ATM), а также технологий локальных сетей (Gigabit Ethernet). Полоса пропускания коммуникационных средств стала достаточной, чтобы при необходимости привлечь ресурсы другого компьютера. Учитывая, что множество подключенных к глобальной сети компьютеров большую часть рабочего времени простаивает и располагает ресурсами, большими, чем необходимо для решения их повседневных задач, возникает возможность применить их неиспользуемые ресурсы в другом месте.

    Сравнение Grid-системы и обычных суперкомпьютеров

    История

    Идеи Grid-системы (включая идеи из областей распределённых вычислений, объектно-ориентированного программирования, использования компьютерных кластеров, веб-сервисов и др.) были собраны и объединены Иэном Фостером, Карлом Кессельманом и Стивом Тики, которых часто называют отцами технологии ГРИД [1] . Они начали создание набора инструментов для Grid Globus Toolkit, который включает не только инструменты менеджмента вычислений, но и инструменты управления ресурсами хранения данных, обеспечения безопасности доступа к данным и к самому гриду, мониторинга использования и передвижения данных, а также инструментарий для разработки дополнительных сервисов Грид. В настоящее время этот набор инструментария является де факто стандартом для построения инфраструктуры на базе технологии грид, хотя на рынке существует множество других инструментариев для Grid-системы как в масштабе предприятия, так и в глобальном.

    В последнее время развитие технологий распределенных систем привело к ситуации, когда стало возможным организовывать системы, которые дают возможность использовать свободные вычислительные ресурсы, распределенные по всему свету. Рассмотрим особенности таких grid-систем.

    Вычислительные grid-системы дают возможность совместно использовать географически и организационно распределеные неоднородные вычислительные ресурсы, отображая их как единственный, унифицированый вычислительный ресурс.

    К ресурсам, которые можно таким образом использовать, принадлежат отдельные компьютеры, кластеры, средства хранения данных, сетевые ресурсы и тому подобное.

    Grid-системы содержат такие компоненты:

    ♦ средства, которые транслируют запросы пользователей в запросы к ресурсам grid-системы (компьютеров, сетей, дискового пространства, баз данных и тому подобное);

    ♦ средства, которые выполняют поиск ресурсов, их подбор и размещение, планирование и координацию вычислительных задач, а также сбор результатов;

    ♦ средства безопасности, которые дают возможность руководить аутентификацией и авторизацией пользователей. Они должны поддерживать единственный вход в систему, отображение на механизмы защиты локальных систем, возможность запуска применений с правами пользователя;

    ♦ средства разработки применений, которые используют особенности grid-архитектуры.

    Основным назначением grid-систем является поддержка развязывания задач, которые требуют больших вычислительных ресурсов. Этим они подобны вычислительным кластерам. Но эти технологии имеют существенные отличия.

    ♦ Grid-системы являются географически распределенными (связанными глобальными сетями) и неоднородными (у них входят компоненты с разной аппаратной и программной архитектурой). Кроме того, их компоненты могут находиться в разном административном подчинении. Узлы кластеров обычно связаны локальной сетью, находятся в централизованном подчинении и имеют одинаковую архитектуру.

    ♦ Кластерная архитектура обычно содержит в себе централизованный менеджер ресурсов. Для grid-архітектур в результате большего масштаба системы каждый узел имеет свой менеджер ресурсов.

    ♦ Узлы grid-систем всегда являются невыделенными. Любой вычислительный ресурс, который входит в такую систему, может в то же время использоваться для других целей. Для использования в пределах grid-системы выделяются только ресурсы, свободные в конкретный момент.

    ♦ Конфигурация grid-систем постоянно изменяется. Хотя кластеры рассчитаны на то, что их конфигурация может измениться, такие изменения для них не являются обычной ситуацией.

    ♦ Grid-системы могут распределять самые разнообразные ресурсы. Кроме вычислительных мощностей, к ним принадлежат сетевые ресурсы, ресурсы хранения данных, информационные ресурсы (доступ к распределенным базам данных), программные продукты и аппаратные устройства.

    Поскольку grid-системы являются неоднородными, большое значение в их разработке играет стандартизация. Организован специальный комитет по стандартизации grid-разработок — Grid Forum, результатом работы которого является общепринятый стандарт Open Grid Service Architecture (OGSA). Существует программная реализация этого стандарта — Globus Toolkit, которую можно использовать для практической разработки grid-систем.

    Есть мысль, что в ближайшем будущем Интернет будет преобразован в глобальную сеть, организованную в соответствии с grid-архитектурой.

    Выводы

    ♦ Организация параллельного выполнения кода на нескольких процессорах — эффективное средство повышения производительности компьютерных систем. Основными архитектурами, что поддерживают такое выполнение, многопроцессорные и распределены системы.

    ♦ Основным подходом до организации многопроцессорных ОС является симметричная многопроцесорность (SMP), при которой одна копия ядра ОС выполняется на всех процессорах системы. Для организации поддержки SMP в ядре ОС выделяют критические участки, каждая из которых может быть выполнена только одним процессором в конкретный момент времени.

    ♦ Планирование в многопроцессорных системах отличается тем, что нужно определять не только поток, который должен перейти к выполнению, но и процессор, на котором этот поток должен выполняться.

    ♦ Важным примером реализации распределенных систем распределены файловые системы. Они дают возможность прозрачно для пользователей организовать работу с отдаленными файлами.

    ♦ Современные архитектуры распределенных систем (кластерные и grid-архитектуры) дают возможность объединять вычислительные мощности многих компьютерных систем для развязывания задач, которые невозможно развязать на отдельных компьютерах.

    Контрольные вопросы и задания

    1. Перечислите преимущества и недостатки использования кэша в многопроцессорных системах.

    2. Почему реализация критической секции через запрещение прерываний не может быть использована в многопроцессорных системах?

    3. Назовите причины, через какие планировщики в многопроцессорных системах не используют общую для всех процессоров очередь готовых потоков?

    4. В чем заключается потенциальная опасность передачи указателей как параметров в отдаленные вызовы процедур? Какие программные решения могут быть предложены в этом случае?

    5. Какие проблемы решает автоматическая генерация заглушек для RPC?

    8. В каких случаях кэширования данных на клиенте может повысить производительность распределенной файловой системы, а в которых — снизить?

    9. Объясните, почему для распределенных файловых систем уменьшения размера блока влечет уменьшение нагрузки на сеть, если используют кэширование данных на клиенте?

    10.Какие из перечисленных операций являются идемпотентными:

    а) записывание блока данных в файл;

    б) запрос списка пользователей, которые работают в этот момент на отдаленной системе;

    в) помещение денег на банковский счет?

    11. Процесс на клиентском компьютере вызывал операцию чтения из файла, который содержится на NFS-разделе. Опишите этапы выполнения этой операции.


    Grid сумели обеспечить инфраструктуру для развертывания параллельных приложений в распределенной среде с высокой степенью автоматизации. Определение Grid было переопределено вместе года. Изначально Grid были определены как инфраструктура для обеспечения простого и недорогого доступа к высокопроизводительным вычислениям [2]. Тогда это было уточнено [18] как инфраструктура для совместного использования ресурсов и для совместного решения проблем. В последнее время в [9] определение Grid превращается в инфраструктуру для объединения и виртуализации ресурсов и разрешения их использования прозрачным способом. Сетевая инфраструктура демонстрирует несколько интересных функций. Одна из основных функций заключается в том, что Grid скрывает неоднородность своих компонентов, как оборудование, операционные системы или системы хранения, и служит промежуточным программным обеспечением это обеспечивает бесперебойную связь компонентов, которыми он управляет. Другой интересной характеристикой является прозрачное объединение многих видов ресурсов, таких как вычислительная мощность, хранение, данные и услуги. Это позволяет приложениям, развернутым в Grid, прозрачно делиться ресурсами и использовать предоставленную мощность более эффективно. Связанный атрибут - это возможность выделять и резервировать виртуализированные ресурсы. Виртуализация облегчает совместное использование ресурсов: это позволяет сохранить качество обслуживания гарантии для срочных приложений, а также предлагает истинную очистку ресурсов, использование неиспользованных ресурсов для выполнения пакетных вычислений. Эти функции делают Grid-вычисления привлекательными для предприятий, которые хотят преобразовать его в свою инфраструктуру для развертывания корпоративных приложений. Этот интерес привел к выработке нового термина, Предприятие Grid . Корпоративные Grid-вычисления отражают использование Grid-вычислений в контексте бизнеса или предприятия, а не для научного приложения. Первое поколение предприятия Grid решения, разработанные IBM [15] или Oracle [4], начали появляться. Доказательство для увеличения интереса к корпоративным сетям связан с недавним созданием Enterprise Grid Alliance (EGA) миссия развития общего предприятия. Эталонная модель Grid [14] и стимулирование использования Grid для корпоративных вычислений. Совсем недавно EGA и Global Grid Forum присоединились в форум по открытым сеткам (OGF) [6]. Цели OGF объединить цели академического и корпоративного приложения. Однако корпоративные сети еще не нашли широкого распространения в промышленности. Проблема в том, что для того, чтобы эффективно применять Grid -технологии для корпоративных приложений, многие технические и научные препятствия еще предстоит преодолеть. Первоначально, необходимость использования распределенных ресурсов для вычислительных интенсивных научных приложений привела к разработке Grid -архитектуры. Эти приложения хорошо подходят для автоматического распространения и планирования, и Grid -технологии сосредоточены на обеспечении виртуализированной абстракции вычислительных ресурсов для этих приложений. Однако корпоративные приложения имеют много характеристик, которые сделает их сложнее для развертывания в Grid инфраструктуре. Примерами являются государственная природа бизнес-приложений, типичная базовый многоуровневая архитектура, где выполнение запроса следует сложным путем через разнообразный набор компонентов, наличие транзакционных данных, и необходимость транзакционного взаимодействия между различными компонентами приложения. В этой статье мы нацелены на выявление некоторых пробелов между тем, что в настоящее время предоставляют Grid –инфраструктуры и какие корпоративные сети нужно предложить. Из того, что мы рассмотрим, последние достижения в этой области распределенных вычислений, которые помогут решить некоторые из проблем, а также выявить открытые проблемы для реализации корпоративной концепции Grid. Статья построена следующим образом. Первый в разделе 2 мы определяем некоторые основные требования в корпоративных сетях и противопоставляем их с текущими функциональными возможностями, предоставляемыми Grid -системами, для выявления любых несоответствий. Потом, мы опишем некоторые из последних достижений в распределенных системах, которые могут быть полезны для преодоления расхождения в разделе 3. Мы продолжаем. в Раздел 4 путем определения существующих открытых научных вызовы для реализации концепции Enterprise Grid. Наконец, мы представляем наши выводы в разделе 5

    2 Разрыв между существующими сеточными технологиями и требования для корпоративных сетей

    В этом разделе мы подробно рассмотрим несколько пробелов между тем, что в настоящее время обеспечивается технологией Grid, и тем, что необходимо для поддержки Grid c более широким спектром корпоративных приложений.

    Раздел 1: поддержка онлайн-приложений традиционные корпоративные вычисления обычно состоят из смеси встроенных и онлайн-приложений. Grid уже хорошо владеют встроенными приложениями и обеспечивают сложную автоматизацию изготовления партии приложений, эффективно работают в больших распределенных инфраструктурах. Такие могут очень хорошо послужит основой для автоматизации программирования и выполнения пакетных корпоративных приложений. Для таких задач использование вхолостую ресурсов внутри организации позволяют лучше использовать ресурсоы и увеличение пропускной способности. Однако большая часть корпоративных приложений по своей природе интерактивна. Мы ссылаемся на их как онлайн-приложения, потому что конечный пользователь напрямую подключен к системе. Онлайн-приложения требуют своевременного выполнения запросов и оперативные ответы клиенту. Таким образом, одно узкое место в выполнении запроса может привести к неудовлетворительной производительности. То есть для онлайн-приложений основные показатели производительности среднее время ответа, часто со строгими ограничениями на его статистическое распределение. Корпоративные сети: вызовы впереди информационные системы или TPC-W [11] для веб-сайтов основанные системы. Однако большая часть современной Grid-технологии направлена ​​на оптимизацию пропускной способности для приложений пакетного типа, т.е. большой набор задач, не обращая внимания на время ответа на индивидуальные запросы.

    2. поддержка бизнеса с транзакционными данными приложения часто интенсивно используют данные. Они получают доступ, обрабатывать и манипулировать большими объемами данных, большинство из которых находятся в хранилищах баз данных. Доступ к таким данным почти всегда в контексте транзакций, чтобы гарантировать последовательность и долговечность изменений в данных. В то время как общие вычислительные запросы могут быть назначены вычислительные ресурсы совершенно произвольно, и во время выполнения запросов к базе данных должны выполняться в сайты, которые содержат базу данных. Динамическая миграция или репликация целых баз данных в настоящее время свободные машины, однако, не могут быть достигнуты с легкостью. Он также имеет дополнительные издержки протоколов синхронизации, которые отслеживают все данные реплики для согласованности. Например, в то время как Oracle 10g позволяет работать с базой данных несколько узлов в кластере, его серверы баз данных довольно сложны и относительно статичный. Таким образом, текущая подготовка в большинстве сред Grid ориентирована на приложения без сохранения состояния и иногда в приложениях, которые имеют доступ только для чтения постоянные данные, в которых репликация и кэширование может применяться довольно легко. Целью интеграции данных является предоставление однородного представления разнородных схем данных содержащие аналогичную информацию. Интеграция данных может быть важной проблемой в некоторых корпоративных приложениях, в которых данные из разных доменов выставляют разные схемы и однородные должны быть предоставлены средства просмотра и доступа. Кроме того, существует тенденция конвертации данных доступ к услугам. В этом контексте обеспечивает поддержку данных. интеграция и доступ через Grid. поддерживает воздействие различных источников данных (таких как реляционные и XML-данные) через однородную сеть, сервисные интерфейсы, которые могут быть очень полезны. В общем,была проделана огромная работа в контекст интеграции данных и OGSA-DAI выполнил первые шаги для интеграции данных к Grid . Таким образом, интеграция данных не может быть сложной задачей.

    Раздел 3: Поддержка Stateful и Transactional

    Бизнес приложения не только обращаясь к транзакционным данным, находящимся в серверных базах данных, они часто поддерживают состояние в коде приложения. Часто это состояние отражает взаимодействия между онлайн-клиентом и приложением (например, как информация о сеансе или корзина). Такие шаблоны взаимодействия уменьшают гибкость, в которой Отдельные задачи могут быть назначены на ресурсы Grid. Другая проблема в этом контексте заключается в том, что сбой сайта может привести к потере важного приложения. Бизнес-процессы могут длиться дни, недели, месяцы или даже годы. Это очень распространено для рабочего процесса и организованных веб-сервисов. Утрата взаимодействия с состоянием было бы неприемлемо в этом контексте. Кроме того, расширенная транзакция модели часто используются [7] в этом контексте для того, чтобы расслабиться в изоляции. В случае неудачи одна возможность достичь согласованности - прервать все текущие транзакции. Тем не менее, это на самом деле не вариант, так как они должны идти вперед, несмотря на неудачи, поддержка доступности для таких долго работающих приложений ограничена с современной технологией Grid.

    адресованные решения для некоторых из Grid вопросы отдельных уровней. Гораздо больше работы должно быть сделано, как в отношении отдельных уровней и по всему многоуровневой архитектуре с учетом любой формы данных и зависимости выполнения.

    В этой статье мы определили некоторые недостатки современной Grid -технологии, когда дело доходят корпоративные приложения. Проблемы в основном из-за интерактивной природы бизнес-приложений, большой объем данных, которые находятся в системах баз данных и требует транзакционный доступ, а также компонентной и многоуровневой архитектуры современных корпоративных приложений. Тем не менее, мы считаем, что многие недавние исследования достижения в области управления данными и распределенные системы могут применяться и включаться в Grid -инфраструктуру, чтобы стать на шаг ближе к тому, что OGF предусматривает в качестве корпоративной сети. Репликация, кэширование, методы онлайн-реконфигурации и механизмы распределения нагрузки, которые были предложены, кажутся многообещающими кандидатами. Тем не менее, мы считаем, что технология корректировки предложенная должна быть сделана, они работают в Grid -среде. Это направлено ​​на содействие перекрестному удобрению между Grid и сообществом распределенных систем, сделать это мы также думаем, что есть некоторые нерешенные вопросы, которые все еще нуждаются в дальнейшем фундаментальные исследования.

    Литература :

    Amir, Y., Danilov, C., Miskin-Amir, M., Stanton, J., Tutu, C.: On the performance of consistent wide-area database replication. Technical Report CNDS-2003-3, John Hopkins University (20 15 )

    2. Amza, C., Cox, A.L., Zwaenepoel, W.: Distributed versioning: consistent replication for scaling backend databases of dynamic content web sites. In: Int. Middleware Conf. (2016)

    3. Balakrishnan, M., Birman, K.: PLATO: Predicitve latency-aware total ordering. In: Proc. of the Int. Symp. on Reliable Distributed Systems (SRDS) (2016)

    4. Barga, R., Lomet, D., Weikum, G.: Recovery guarantees for general multi-tier applications. In: Int. Conf. on Data Engineering (ICDE) (2012)

    5. Bartoli, A., Jiménez-Peris, R., Kemme, B., and all: Adapt: towards autonomic web services. In: Distributed Systems Online (2015)

    6. Bilas, A., Iftode, L., Singh, J.P.: Evaluation of hardware support for shared virtual memory clusters. In: Proc. of the 12th ACM International Conference on Supercomputing (ICS98) (1998)

    7. Breitbart, Y., Korth, H.F.: Replication and consistency: being lazy helps sometimes. In: ACM Int. Conf. on Principles of Database Systems (PODS) (20017)

    8. Cardellini, V., Casalicchio, E., Colajanni, M., Yu, P.S.: The state of the art in locally distributed Web-server systems. ACM Comput. Surv. 34(2), 263–311 (20 18 )

    9. Chen, J., Soundararajan, G., Amza, C.: Autonomic provisioning of backend databases in dynamic content web servers. In: Int. Conf. on Autonomic Computing (ICAC) (2006)

    10. Council, T.P.P.: TPC Benchmark C (2016)

    11. Council, T.P.P.: TPC Benchmark W (2016)

    12. de Sousa, A.L.P.F., Oliveira, R.C., Moura, F., Pedone, F.: Partial replication in the database state machine. In: IEEE Int. Symposium on Network Computing and Applications (20 17 )

    13. Elnikety, S., Zwaenepoel, W., Pedone, F.: Database replication using generalized snapshot isolation. In: IEEE Int. Symp. on Reliable Distributed Systems (SRDS) (2015)

    14. Enterprise Grid Alliance: EGA Reference Model (2015)

    15. Ferreira, L., Easton, J., Kra, D., et.al.: Patterns: Emerging Patterns for Enterprise Grids. IBM RedBooks (2016)

    1. Бегунов А.А. Применение результатов моделирования для оптимизации и управления технологическими процессами // Параллельные вычислительные технологии: Тр. Междунар. науч. конф. (28 янв. – 1 февр. 2008 г., г. Санкт-Петербург). 2008. C. 31–38.

    2. Foster I., Kesselman C. The Grid 2: Blueprint for a New Computing Infrastructure. Second edition. San Francisco: Morgan Kaufmann, 2003. 750 p.

    3. Foster I., Kesselman C., Tuecke S. The Anatomy of the Grid: Enabling Scalable Virtual Organizations // International J. of Supercomputer Applications and High Performance Computing. 2001. V. 15, No 3. P. 200–222.

    4. Лукичев А.С. Интеграция SOA- и классических высокопроизводительных приложений // Научный сервис в сети Интернет: технологии распределенных вычислений: Труды Всероссийск. науч. конф. (18–23 сентября 2006 г., г. Новороссийск). М.:Изд-во МГУ, 2006. C. 42–44.

    1. Бегунов А.А. Применение результатов моделирования для оптимизации и управления технологическими процессами // Параллельные вычислительные технологии: Тр. Междунар. науч. конф. (28 янв. – 1 февр. 2008 г., г. Санкт-Петербург). 2008. C. 31–38.

    2. Foster I., Kesselman C. The Grid 2: Blueprint for a New Computing Infrastructure. Second edition. San Francisco: Morgan Kaufmann, 2003. 750 p.

    3. Foster I., Kesselman C., Tuecke S. The Anatomy of the Grid: Enabling Scalable Virtual Organizations // International J. of Supercomputer Applications and High Performance Computing. 2001. V. 15, No 3. P. 200–222.

    4. Лукичев А.С. Интеграция SOA- и классических высокопроизводительных приложений // Научный сервис в сети Интернет: технологии распределенных вычислений: Труды Всероссийск. науч. конф. (18–23 сентября 2006 г., г. Новороссийск). М.:Изд-во МГУ, 2006. C. 42–44.

    16. Бегунов А.А. Применение результатов моделирования для оптимизации и управления технологическими процессами // Параллельные вычислительные технологии: Тр. Междунар. науч. конф. (28 янв. – 1 февр. 2018 г., г. Санкт - Петербург ). 2018. C. 31–38.

    17 . Foster I., Kesselman C. The Grid 2: Blueprint for a New Computing Infrastructure. Second edition. San Francisco: Morgan Kaufmann, 2015. 750 p.

    18. Foster I., Kesselman C., Tuecke S. The Anatomy of the Grid: Enabling Scalable Virtual Organizations // International J. of Supercomputer Applications and High Performance Computing. 201 7 . V. 15, No

    19 . P. 200–222. 4. Лукичев А.С. Интеграция SOA- и классических высокопроизводительных приложений // Научный сервис в сети Интернет: технологии распределенных вычислений: Труды Всероссийск. науч. конф. (18–23 сентября 2016 г., г. Новороссийск). М.: Изд-во МГУ, 2016. C. 42–44.

    Читайте также: