Как можно использовать компьютер при биологических исследованиях кратко

Обновлено: 06.07.2024

Компьютеры - это очень мощные машины, способные выполнять огромное множество различных задач, и биология не исключение. На мой взгляд, самый простой и доходчивый пример - это электронный микроскоп. Здесь компьютер увеличивает изображение в тысячи раз, чего не позволяют простые механические микроскопы. Также компьютеры могут решать всевозможные генетические задачи, определять возраст того или иного предмета (древних окаменелых животных) и еще сотни операций.

Как написать хороший ответ? Как написать хороший ответ?

  • Написать правильный и достоверный ответ;
  • Отвечать подробно и ясно, чтобы ответ принес наибольшую пользу;
  • Писать грамотно, поскольку ответы без грамматических, орфографических и пунктуационных ошибок лучше воспринимаются.

Мореплаватель — имя существительное, употребляется в мужском роде. К нему может быть несколько синонимов.
1. Моряк. Старый моряк смотрел вдаль, думая о предстоящем опасном путешествии;
2. Аргонавт. На аргонавте были старые потертые штаны, а его рубашка пропиталась запахом моря и соли;
3. Мореход. Опытный мореход знал, что на этом месте погибло уже много кораблей, ведь под водой скрывались острые скалы;
4. Морской волк. Старый морской волк был рад, ведь ему предстояло отчалить в долгое плавание.

биологии компьютеры используются очень широко — это и моделирование самых разных биологических систем, и организация и хранение всевозможной информации, и документооборот, и обучение, и экологические ГИС, и Интернет-технологии. Однако, говоря о компьютерной биологии, прежде всего имеют в виду три задачи: расшифровка генома, определение пространственной структуры белка и моделирование функционирования биомакромолекул (рис. 1).

Все перечисленные задачи требуют колоссальных вычислительных мощностей, и сама постановка этих проблем немыслима без высокопроизводительных вычислительных систем. Успехи компьютерной биологии, появившиеся на фоне стремительного развития суперкомпьютерных вычислений, привели к возникновению совершенно новых наук: геномики, протеомики, биоинформатики — дисциплин, которые революционизируют наши представления о живых организмах.

Геномика занимается установлением структуры и выяснением механизма функционирования генома в живых системах. Эта наука открывает новое понимание молекулярных механизмов заболеваний, определяет новые подходы в создании лекарств, новые диагностические тесты. Геномика положила начало получению трансгенных растений и животных.

С геномикой тесно связана еще одна новая наука — протеомика. Если геномика исследует информационный материал клетки, то протеомика изучает структуру и функции белков.

Третья наука — биоинформатика — занимается более широким спектром вопросов, включая анализ биологических текстов, построение структур макромолекул, предсказание их функций и создание новых лекарственных препаратов. Биоинформатика открывает перспективы перед многими научными и прикладными дисциплинами, такими как археология, теория эволюции, экология, сельское хозяйство и т.п.

В данной статье мы кратко остановимся на специфике задач компьютерной биологии, расскажем о том, какие международные проекты создаются для их решения и какие аппаратные вычислительные комплексы используются для осуществления подобных проектов.

Расшифровка структуры генома человека

асшифровка структуры генома сводится к выявлению последовательности символов отдельных структурных единиц и определению их функциональной нагрузки. Для описания сути и масштабов данной вычислительной задачи необходимо кратко рассказать об основах теории наследственности.

Генетика зародилась почти 150 лет назад, когда Грегор Мендель открыл существование дискретных частиц (названных впоследствии генами), передающих наследственные свойства. В начале XX века появилась хромосомная теория наследственности, согласно которой гены линейно расположены в ядерных хромосомах и их последовательность может быть расшифрована.

Позднее было установлено, что гены состоят из ДНК, а ДНК, в свою очередь, имеет структуру двойной спирали. Каждая нить этой спирали представляет собой линейную молекулу, состоящую из нуклеотидов, содержащих в своем составе те или иные азотистые основания: аденин (А), тимин (T), гуанин (G) и цитозин (С) (рис. 2).

Затем было открыто, что ДНК является матрицей для репликации, то есть для превращения информации, содержащейся в ДНК, в белковые молекулы. Таким образом, молекула ДНК, являющаяся носителем генетической информации, представляет собой биополимер, элементарным звеном которого служит нуклеотидная пара. Установление последовательности чередований этих оснований в генах означает раскрытие генетического кода генома. Появление быстрых методов компьютерной расшифровки последовательности нуклеотидных пар в геномах организмов позволило решить задачу расшифровки генома.

В 2000 году конкурирующие коллективы — Celera Genomics и международный консорциум — объявили о том, что совместными усилиями в целом завершена работа над проектом HGP. В том же году премьер-министр Великобритании Тони Блэр и президент США Билл Клинтон заявили, что расшифровано 97% генома человека. На тот момент была расшифрована структура 50 тыс. генов, в которых идентифицирована последовательность расположения 3,5 млрд. генетических букв. Основная часть проекта была завершена намного раньше намеченных сроков, и сегодня последовательность ДНК человека раскодирована практически на 100%.

Одной из причин быстрого осуществления данного проекта явилось интенсивное развитие суперкомпьютерных мощностей ведущих исследовательских центров.

Зная практически всю последовательность миллиардов букв-нуклеотидов генетического кода нашей ДНК, ученые смогут вплотную заняться теми проблемами жизни человека, которые вызываются генетическими причинами.

Проект HGP обещает изменить наши представления о жизни на Земле (рис. 3). Новые технологии будут внедряться не только в биологии, но также в медицине и сельском хозяйстве. Генетические данные послужат основой для развития таких дисциплин, как судебная медицина и идентификационные методы в биологии, откроют новые перспективы в экологии и науках об окружающей среде, новые методы расщепления токсичных отходов, обеспечат создание новых биоэнергетических источников и индустриальных процессов, помогут разгадать тайны эволюции, антропологии, процессов миграции человека и т.д.

В то время как расшифровка первичной структуры молекул ДНК человека завершена, изучение ее пространственной структуры находится в начальной стадии. Для моделирования пространственной структуры фрагментов ДНК требуется учет всевозможных конфигураций как отдельных нуклеотидов, входящих в состав ДНК, так и большого числа молекул растворителей, окружающих макромолекулу. Процедура расчета энергии межмолекулярных взаимодействий занимает основную часть вычислительных ресурсов. Использование высокопроизводительных вычислений позволяет изучить пространственную организацию больших фрагментов ДНК, механизмы связывания лекарств и других биологически активных соединений с ДНК.

Определение пространственной структуры биологических макромолекул

ще более трудоемкой по сравнению с расшифровкой генома является задача расшифровки пространственной структуры белков, входящих в состав биологического организма. Знание пространственной структуры белков тесно связано с их функционированием, в частности без этого невозможно создание новых типов лекарств. Предсказание пространственной структуры белков по последовательности нуклеотидных пар в ДНК — самая важная и сложная задача компьютерной биологии.

Число известных первичных белковых структур, установленных по известным нуклеотидным последовательностям ДНК, намного превосходит число экспериментально подтвержденных пространственных белковых структур. Цель исследований состоит в нахождении искомой структуры на основе минимизации свободной энергии пространственной системы, но даже для небольшого белка это задача сводится к поиску минимума функции десятков тысяч переменных. Точное решение подобной задачи сегодня невозможно, но уже разработано множество приближенных подходов. Один из самых эффективных — использование в качестве первого приближения информации о пространственной структуре белков, обладающих первичной структурой, близкой к исследуемому белку. В этом случае задача сводится к расчетному уточнению начального приближения.

Знание пространственной структуры белков играет решающую роль для понимания их функционирования (рис. 4). Учитывая, что число различных белков в организме человека составляет сотни тысяч, можно понять, сколь масштабная задача стоит перед исследователями.

Массивным вычислениям — мощные компьютеры

Компьютерный центр Bristol-Myers Squibb

Компания Bristol-Myers Squibb занимается разнообразными исследованиями в области биоинформатики и одновременно ведет работы для фармацевтической промышленности, опираясь на широкий диапазон научных исследований, проводимых в Израиле, США и Канаде. Спектр интересов компании охватывает различные аспекты медицины — от изучения наследственных заболеваний до детального анализа моделей генетических систем.

Группа исследователей в области биоинформатики Bristol-Myers Squibb использует в своей работе кластер Linux-серверов компании Incyte. Эта система обрабатывает результаты, получаемые в ходе выполнения проекта HGP, включая анализ ДНК и белковых цепочек, расшифровку профилей и протеомику.

Linux-кластер Incyte интегрирован с сервером семейства SGI 2000, который дает исследователям возможность выполнять специальные приложения в Linux-среде и высвобождает ресурсы сервера SGI 2000 для приложений, которые требуют интенсивного распараллеливания и разделяемой памяти большого объема. Это позволяет Bristol-Myers Squibb снизить нагрузку по администрированию передачи данных и вычислений между вычислительными платформами и повышает эффективность работы пользователей.

По словам руководителя группы биоинформатики Bristol-Myers Squibb, в лаборатории построена идеальная среда для биоинформационных вычислений.

Компания Incyte, являющаяся лидером среди поставщиков информации по исследованиям генома, располагает передовыми системами обработки, способными анализировать и управлять растущими объемами данных по геному, накапливающихся в процессе исследований. Кластер систем Linux, разработанный Incyte, предоставляет ученым из Bristol-Myers Squibb возможность анализировать большие объемы данных быстрее и с меньшими затратами, чем раньше. С помощью серверов SGI и Incyte Genomics значительно повысилась эффективность разработки новых биоинформационных решений.

Токийский суперкомпьютерный биоинформационный центр

Данная система служит для исследований в области генома человека, а также для других приложений компьютерной биологии и вычислительной химии в сфере предсказания протеиновых структур.

В дополнение к последнему апгрейду, который позволил построить систему с 512 процессорами компания SGI также поставила хранилище данных (SGI TP9400 storage system) на 5 Тбайт.

В результате развертывания сервера Origin 3900 (рис. 5) в несколько раз была увеличена мощность системы, причем без изменения площади, занимаемой суперкомпьютером.

Суперкомпьютерный центр Sanger Centre компании Celera Genomics

Ученые из компаний Celera Genomics, Sanger Centre и Whitehead Institute внесли существенный вклад в проект по расшифровке генома человека, используя в своих исследованиях суперкомпьютерные системы Compaq AlphaServer под ОС Tru64 UNIX и ПО TruCluster. В системе было задействовано более 600 процессоров Alpha, выполняющих около триллиона операций в секунду. Итоговые вычисления осуществлялись на новой системе Compaq AlphaServer GS160, так как для успешного решения задачи требовалось 64 Гбайт общей памяти.

Корпорация Compaq поддерживает работы в области расшифровки генома человека с начала реализации данного проекта. Первоначальная конфигурация центра Sanger Centre включала 160 рабочих станций Compaq Alpha, четыре системы Compaq AlphaServer 1200, а впоследствии центр приобрел 250 систем Compaq AlphaServer и рабочих станций под ОС Tru64 UNIX, развернул RAID-систему Compaq StorageWorks емкостью 4 Тбайт, подсистему Network Appliances RAID емкостью 300 Гбайт и 48 компьютеров Compaq Deskpro.

В 1999 году Compaq создала Bioinformatics Expertise Center в Мальборо (шт. Массачусетс), начала исследовательские работы по биоинформатике в своих лабораториях в Кембридже и Массачусетсе, разработав алгоритмы интеллектуального анализа генетических данных. В том же году корпорация Compaq была выбрана институтом Whitehead Institute в качестве поставщика информационной инфраструктуры для работы по расшифровке генома человека. При анализе генетических данных институт использовал серверы Compaq AlphaServer ES40 и системы хранения данных Compaq StorageWorks. В лаборатории Compaq Enterprise System Lab для завершения работ по проекту был инсталлирован кластер серверов AlphaServer ES40 (100 процессоров и дисковая память в 1 Тбайт).

Суперкомпьютерный центр Oak Ridge National Laboratory

Национальная лаборатория Oak Ridge National Laboratory Департамента энергетики США (Department of Energy, DOE) предлагает уникальные расчетные мощности, которые превышают возможности любой другой организации в США. Oak Ridge National Laboratory (ORNL) имеет в своем распоряжении такие системы, как Cray X1 и IBM SP.

Благодаря компьютерам современная биология развивается необычайно быстрыми темпами. Компьютеры не только помогают проводить биологические исследования, они помогают анализировать их, одновременно экономят время и облегчают доступ к получению информации.

Компьютер способен за несколько минут провести сразу несколько десятков (и даже сотен!!) опытов и выдать результат, для получения которого раньше потребовались бы годы кропотливой работы.

Но и это еще не все. Новое поколение суперкомпьютеров в состоянии моделировать различные биологические процессы, предсказывая разные варианты развития событий, в зависимости от внесенных корректировок и изменения условий.

В биологии появилась даже новая область - биоинформатика, в основе которой лежит применение инструментов вычисления и анализа для сбора и интерпретации биологических данных. Анализ генома человека, является одним из главных достижений биоинформатики на сегодняшний день.

Вопрос:

Как можно использовать компьютер при биологическом исследовании?

Полный ответ:

Компьютеры - это очень мощные машины, способные выполнять огромное множество различных задач, и биология не исключение. На мой взгляд, самый простой и доходчивый пример - это электронный микроскоп.
Здесь компьютер увеличивает изображение в тысячи раз, чего не позволяют простые механические микроскопы. Также компьютеры могут решать всевозможные генетические задачи, определять возраст того или иного предмета (древних окаменелых животных) и еще сотни операций.

Читайте также: