Определение нуклеотидной последовательности днк кратко и понятно

Обновлено: 02.07.2024

ДНК (дезоксирибонуклеиновая кислота) — это линейный органический полимер, мономерными звеньями которого являются нуклиатиды.

Вся информация о строении и функционировании любого живого организма содержится в закодированном виде в его генетическом материале. Основу генетического материала организма составляет дезоксирибонуклеиновая кислота (ДНК).

ДНК большинства организмов – это длинная двухцепочечная полимерная молекула. Последовательность мономерных звеньев (дезоксирибонуклеотидов) в одной ее цепи соответствует (комплементарна) последовательности дезоксирибонуклеотидов в другой. Принцип комплементарности обеспечивает синтез новых молекул ДНК, идентичных исходным, при их удвоении (репликации).

Участок молекулы ДНК, кодирующий определенный признак, – ген.

Гены – это индивидуальные генетические элементы, имеющие строго специфичную нуклеотидную последовательность, и кодирующие определенные признаки организма. Одни из них кодируют белки, другие — только молекулы РНК.

Информация, которая содержится в генах, кодирующих белки (структурных генах), расшифровывается в ходе двух последовательных процессов:

синтеза РНК (транскрипции): на определенном участке ДНК как на матрице синтезируется матричная РНК (мРНК).
синтеза белка (трансляции): В ходе согласованной работы многокомпонентной системы при участии транспортных РНК (тРНК), мРНК, ферментов и различных белковых факторов осуществляется синтез белковой молекулы.

Все эти процессы обеспечивают правильный перевод зашифрованной в ДНК генетической информации с языка нуклеотидов на язык аминокислот. Аминокислотная последовательность белковой молекулы определяет ее структуру и функции.

Строение ДНК

ДНК – это линейный органический полимер. Его мономерные звенья – нуклеотиды, которые, в свою очередь, состоят из:

азотистого основания;
пятиуглеродного сахара (пентозы);
фосфатной группы (рисунок 1).

Рисунок 1 : ДНК – строение одной цепочки нуклеотидов

При этом, фосфатная группа присоединена к 5′-атому углерода моносахаридного остатка, а органическое основание — к 1′-атому.

Основания в ДНК бывают двух типов:

Пуриновые: аденин ( А ) и гуанин (G);
Пиримидиновые: цитозин (С) и тимин (Т);(рисунок 2),

Рисунок 2: Азотистые основания- пуриновые и пиримидиновые

Строение нуклеотидов в молекуле ДНК

В ДНК моносахарид представлен 2′-дезоксирибозой, содержащей только 1 гидроксильную группу (ОН), а в РНК — рибозой, имеющей 2 гидроксильные группы (OH).

Нуклеотиды соединены друг с другом фосфодиэфирными связями, при этом фосфатная группа 5′-углеродного атома одного нуклеотида связана с З’-ОН-группой дезоксирибозы соседнего нуклеотида (рисунок 1). На одном конце полинуклеотидной цепи находится З’-ОН-группа (З’-конец), а на другом — 5′-фосфатная группа (5′-конец).

Уровни структуры ДНК

Принято выделять 3 уровня структуры ДНК:

первичную;
вторичную;
третичную.

Первичная структура ДНК – это последовательность расположения нуклеотидов в полинуклеотидной цепи ДНК.

Вторичная структура ДНК стабилизируется водородными связями между комплементарными парами оснований и представляет собой двойную спираль из двух антипараллелных цепочек, закрученных вправо вокруг одной оси.

Общий виток спирали- 3,4нм, расстояние между цепочками 2нм.

Третичная структура ДНК – суперсперализация ДНК. Двойная спираль ДНК на некоторых участках может подвергаться дальнейшей спирализации с образованием суперспирали или открытой кольцевой формы, что часто вызвано ковалентным соединением их открытых концов. Суперспиральная структура ДНК обеспечивает экономную упаковку очень длинной молекулы ДНК в хромосоме. Так, в вытянутой форме длина молекулы ДНК составляет 8 см, а в форме суперспирали укладывается в 5 нм.

Правило Чаргаффа

Правило Э. Чаргаффа – это закономерность количественного содержания азотистых оснований в молекуле ДНК:

Модель ДНК Уотсона-Крика

Б 1953 г. Джеймс Уотсон и Фрэнсис Крик, основываясь на данных рентгеноструктурного анализа кристаллов ДНК, пришли к выводу, что нативная ДНК состоит из двух полимерных цепей, образующих двойную спираль (рисунок 3).

Навитые одна на другую полинуклеотидные цепи удерживаются вместе водородными связями, образующимися между комплементарными основаниями противоположных цепей (рисунок 3). При этом аденин образует пару только с тимином, а гуанин — с цитозином. Пара оснований А—Т стабилизируется двумя водородными связями, а пара G—С — тремя.

Длина двухцепочечной ДНК обычно измеряется числом пар комплементарных нуклеотидов (п.н.). Для молекул ДНК, состоящих из тысяч или миллионов пар нуклеотидов, приняты единицы т.п.н. и м.п.н. соответственно. Например, ДНК хромосомы 1 человека представляет собой одну двойную спираль длиной 263 м.п.н.

Рисунок 3: Модель ДНК Уотсона-Крика

Цепи молекулы ДНК антипараллельны: одна из них имеет направление 3’→5′, другая 5’→3′. В соответствии с принципом комплементарности, если в одной из цепей имеется нуклеотидная последовательность 5-TAGGCAT-3′, то в комплементарной цепи в этом месте должна находиться последовательность 3′-ATCCGTA-5′. В этом случае двухцепочечная форма будет выглядеть следующим образом:

В такой записи 5′-конец верхней цепи всегда располагают слева, а 3′-конец — справа.

Носитель генетической информации должен удовлетворять двум основным требованиям: воспроизводиться (реплицироваться) с высокой точностью и детерминировать (кодировать) синтез белковых молекул.

Модель ДНК Уотсона—Крика полностью отвечает этим требованиям, так как:

НУКЛЕОТИ́ДНЫЕ ПОСЛЕ́ ДОВАТЕЛЬ НО СТИ, порядок следования нуклеотидных остатков в нуклеиновых кислотах. Н. п. ДНК записываются в виде последовательностей букв, обозначающих входящие в нуклеотиды азотистые основания: A – аденин, G – гуанин, C – цитозин, T – тимин, без пробелов, в направлении от 5 ′ -конца к 3 ′ -концу, напр. GATTC. В РНК вместо тимина присутствует урацил (U). Одна Н. п. комплементарна другой, если она содержит в каждом положении комплементарный нуклеотид (A к T, G к C) и читается в противоположном направлении. Напр., комплементарной последовательностью для GATTCC является последовательность GGAATC. В двунитевой молекуле ДНК Н. п. двух цепей являются комплементарными.

Анализ последовательности ДНК. Особенности

Наиболее широко используемый метод для ДНК-анализа — секвенирование по Сангеру (по фамилии Фредерика Сангера, получившего вместе с Вальтером Гилбертом Нобелевскую премию 1980 г. за разработку метода секвенирования ДНК). В настоящее время может быть определена последовательность фактически любого сегмента очищенной ДНК, независимо от того, что это — клонированный фрагмент или искомая последовательность, амплифицированная методом ПЦР.

Метод секвенирования Сангера основан на свойстве химических аналогов четырех нуклеотидов, известных как дидезоксинуклеотиды (ddA, ddC, ddG и ddT), не имеющих 3'-гидроксильной группы в дезоксирибозе (у них имеется 2'-гидроксильная группа, в норме отсутствующая в ДНК). Включаясь в растущую нить ДНК, дидезоксинуклеотиды не позволяют ДНК-полимеразе подключать следующее основание и, следовательно, продолжить рост цепи ДНК.

При секвенировании по Сангеру фрагмент ДНК служит шаблоном для синтеза, начинающегося с короткого олигонуклеотида. ДНК-полимераза следует вдоль последовательности шаблона, присоединяя последующие нуклеотиды. Для того чтобы получить информацию о последовательности нуклеотидов, в реакцию вместе с четырьмя нормальными нуклеотидами добавляют их дидезокси-аналоги.

Каждый дидезокси-аналог помечают определенным флюоресцентным красителем со своим спектром излучения. Полимераза включает или нормальный нуклеотид и продолжает синтез нити, или дидезоксинуклеотид, при этом завершая синтез. Разорванные нити разделяют электрофорезом, а конкретный дидезоксинуклеотид, вызвавший остановку синтеза, выявляется по цвету флюоресценции включенной метки.
Для автоматизации процедуры секвенирования разработаны специальные приборы.

Без информации о последовательности ДНК невозможно предсказать аминокислотную последовательность, закодированную геном, обнаружить конкретную мутацию при генетической болезни; она очень важна при создании АСО-зондов и ПЦР-праймеров, используемых в процедурах молекулярной диагностики.

В быстром темпе создаются каталоги сходства в последовательностях этих организмов, кодирующих и некодирующих белок. Последовательность всего генома с исчерпывающим каталогом генов организма, предоставляемая секвенированием, — критически важный источник информации для понимания метаболических систем клеток и обнаружения уязвимых мест патогенных микроорганизмов, пригодных для воздействия вакцинами и антибиотиками.

Кроме того, при сравнении 99% некодирующих последовательностей генома человека с такими же последовательностями у других видов было установлено сходство в ДНК, сохраняющееся в течение сотен миллионов лет эволюции. Это дало важный инструмент для идентификации функциональных элементов генома человека.

Редактор: Искандер Милевски. Дата обновления публикации: 18.3.2021

Обзор

ДНК не то, чем кажется. И то, чем кажется, тоже. Но не всегда.

иллюстрация автора статьи

Автор

Редакторы

Генеральный партнер конкурса — ежегодная биотехнологическая конференция BiotechClub, организованная международной инновационной биотехнологической компанией BIOCAD.

Спонсор конкурса — компания SkyGen: передовой дистрибьютор продукции для life science на российском рынке.

Место ДНК в клетке и обществе

Всё это радует и служит популяризации науки, однако не стоит забывать что в жизни — в биологической жизни — ДНК — это, чаще всего, правозакрученная двойная спираль, шаг которой охватывает примерно 10 нуклеотидов.

В тени молекулярной догмы

реплицироваться в новую копию ДНК;
транскрибироваться в РНК.

И уже РНК далее способна (хотя и не обязательно — может просто функционировать в клетке сама по себе):

или в особом, описанном позже, случае

Рисунок 2. Центральная догма молекулярной биологии

Что же осталось в тени процессов, объединенных информационными потоками центральной догмы? Что бы это ни было, ему есть где развернутся. На некодирующие области приходится большая часть эукариотических геномов (в случае человека — увесистые 98%). У прокариот их поменьше — в среднем, 20%. По началу такие области, не содержащие послание для передачи в РНК, называли мусорной ДНК (junk DNA) [1] и относились к ним с пренебрежением. Прошли годы, методики совершенствовались, знания неуклонно копились. И теперь мы знаем: в этом сумраке таится много полезного. Что же именно и в какой пропорции?

В некодирующей области ДНК есть, скажем, мобильные генетические элементы (прежде всего, способные перемещаться по геному транспозоны [2]), тандемные повторы разного сорта (от сателлитов до микросателлитов) [3] и прочее. Наконец, огромное значение имеют области ДНК, нужные для регуляции. Действительно, помимо блоков, ЦДМБ имеет еще и стрелки — они обозначают процессы передачи информации, вполне конкретные биохимические процессы.

Что регулирует эти сложные процессы, что управляет ими? Специфичное, хорошо оркестрованное взаимодействие ДНК и ДНК-связывающих белков. Дело в том, что в живой клетке (ткани, природе. ) все должно быть динамично и управляемо. Это жизненно необходимо и для разумного реагирования на удары судьбы (стрессы), и для разного рода взаимодействий клеток, и для индивидуального развития (онтогенеза).

Притча о слепых белках и ДНК

Безусловно, ДНК далеко до структурного разнообразия белков с их неисчислимыми фолдами, укладками и т.п. Однако и у нее можно выделить иерархию уровней организации: от первичной (последовательность нуклеотидов) через небольшое разнообразие вторичных и третичных структурных блоков до четвертичной. Последняя представляет собой надмолекулярные объединения — как между разными молекулами ДНК, так и между ДНК и ДНК-связывающими белками.

триплетность;
неперекрываемость;
вырожденность;
универсальность;
наличие кодонов — знаков препинания;

и некоторыми другими.

Все эти законы не действуют на некодирующей части генома. А действуют совсем другие и для каждого типа последовательности они, в общем, свои.

Таковы принципы кодирования и хранения генетической информации, изображенные в виде блоков ЦДМБ. А как насчет способов ее воплощения, то есть перевода информации одного биополимера в другой, а также всех последующих этапов экспрессии генов? Что стоит за стрелками на схеме догмы, соединяющей квадраты? Большая биохимическая работа и сложные структурные основы. Эти процессы протекают во вполне физической реальности — на них согласованно работают многие ферменты, факторы. Вовлечены в эту 3D-хореографию и специализированные области ДНК. Что же делает их такими специализированными?

В первом приближении — им следует связывать белковые молекулы. Для этого служат опять-таки разные уровни организации регуляторных ДНК: особая последовательность, структура и физико-химические свойства.

Рисунок 3. Сайт специфичного и точного связывания важной рестриктазы EcoRI и место разреза — расщепления ДНК

рисунок автора статьи

Рисунок 4. Сайт связывания фактора транскрипции CEBPB

видят ДНК совершенно по-разному.

Пo мере того, как ученые вникали в интимные стороны взаимодействий ДНК и ДНК-связывающих белков, они стали различать прямое (direct) и непрямое прочтения (indirect readout) нуклеотидной последовательности. В случае прямого прочтения распознавание и связывание двух биомолекул определяется теми парами оснований, которые, собственно, контактируют с белком. Здесь все понятно. Но уже довольно давно биологи стали отмечать: не вовлеченные в прямые взаимодействия нуклеотиды определяют стабильность и специфичность связывания. В этом и состоит непрямое прочтение.

В числе первых этот аспект распознавания описан на примере такого важного фактора транскррипции, как TATA-связывающий белок (TATA-binding protein, TBP). После этого последовало множество других примеров непрямого прочтения [6].

Но и этого мало: выделили также прочтение формы (shape readout) — оно определяется трехмерной формой дуплекса ДНК. В основе этого нового видения той же ДНК — вандерваальсовы и электростатические взаимодействия. Напомним, что прямое прочтение ДНК белком зависит от водородных связей, образованных конкретными нуклеотидами и аминокислотными остатками [7].

Следующий пункт. Важность великого множества одних только физико-химических и структурных свойств (не забывая и первичную структуру!) связано с тем, что, скажем, транскрипция — процесс многостадийный, и на разных этапах одни параметры ДНК могут быть важнее других. Даже инициация транскрипции насчитывает несколько этапов: посадка белков, образование закрытого комплекса, плавление дуплекса (то есть расхождение цепей) с образованием открытого комплекса и т.д. Кстати, именно инициация транскрипции — в особенности на примере прокариотических промоторов и простых РНК-полимераз, — служит элементарной системой для изучения всей сложной кухни молекулярного узнавания [8], [9].

Рисунок 5. Бактериофаг Т7 — срез через вирион (слева) и общий вид

Биография Т7 от начала до конца. До 3′-конца

Далее включается область генов II класса и соответствующих промоторов. Их задача — активная наработка ДНК бактериофага (ее репликация), а также синтез лизоцима — антибактериального фермента, с помощью которого потомкам бактериофага предстоит выбраться из гибнущей клетки. Стандартный сценарий для такого литического фага, как Т7.

Наконец, область генов и промоторов III класса. Их задача — обеспечить созревание фаговой ДНК, сборку новых вирусных частиц и затем упаковать одно в другое.

На этом жизненный цикл Т7 заканчивается литической и трагической концовкой. Весь экшн занимает обычно 17 мин, по минутам же расписано переключение между его фазами [13], [14]. Но остается довольно животрепещущий вопрос: что переключает активность областей этого элементарного генома?

Промоторы — промотируют, полимераза — полимеразит

Рисунок 7. Едва различимые последовательности очень непохожих по своим свойствам нативных промоторов бактериофага T7

Здесь на сцену выходят физико-химические свойства дуплекса промоторных областей. Они могут объяснить, как РНК-полимераза Т7 распознает их и специфично, и переключаемо. Для этого процесса молекулярного узнавания важнее именно уровень физико-химических свойств ДНК — что особенно явственно в случае предельно простой транскрипционной системы Т7 [14].

Какими же параметрами ДНК могут направляться взаимодействия биомолекул?

Задолго до прямого контакта молекулярному узнаванию промотора и полимеразы может способствовать электростатический потенциал. Действительно, если мы вспомним, что каждый ее мономер-нуклеотид имеет заряженную отрицательно фосфатную группу, станет понятно — на ДНК есть к чему притянутся положительному заряду. В полном соответствии со школьным законом Кулона. Действительно, ДНК-связывающие белки с этой целью снабжены положительно заряженными участками. В случае же промоторов Т7 присутствуют и особые мотивы распределения заряда [15]. Если мы рассчитаем значение заряда вдоль оси ДНК (на основе известной последовательности нуклеотидов), то получим характерные профили (рис. 8). Заметим, что свой профиль есть и у промоторов II и III класса — по ним, в частности, фаговая РНК-полимераза их и различает.

Рисунок 8. Профили электростатического потенциала для промоторов Т7: ранних, II класса и III класса

Следующее важное свойство ДНК — дестабилизация при скручивании. Сложно подобрать простое название этому параметру, так что приведем какое есть: вызванная суперспирализацией дестабилизации дуплекса ДНК (Stress-Induced Duplex Destabilization). Если коротко, модель SIDD — это способ описать, что будет с ДНК, если на нее как следует надавить, а точнее — скрутить. Дело в том, что одни последовательности в такой напряженной ситуации могут легко расплавиться (так называют расхождение цепей ДНК), другие — выстоят, третьи — плавятся совсем не там, где от них ждешь. Это свойство важно для взаимодействия ДНК с белками и, в частности, хорошо зарекомендовало себя для предсказания промоторов [9]. Как же обстоят дела с SIDD у промоторов Т7?

Рисунок 9. Профиль SIDD для генома Т7

рисунок автора статьи

Из набора промоторов Т7 SIDD показывает следующий тренд. Если промотор представляет класс III, то он гораздо более легкоплавкий — цепи дуплекса такого участка ДНК расходятся при меньшей температуре и более низкой суперспирализации. Это неплохо соотносится с экспериментальными данными о том, что промоторы разных классов активны при разных условиях окружающей среды — включая как раз таки показатель суперспиральности [4], [9].

Другая закономерность затрагивает репликацию, для которой Т7-ДНК также является хорошей моделью. Этот геном имеет специализированный ориджин (точку начала репликации), отдаленный от 5′-конца на 17% длины генома. Однако его копирование может начинаться также в ряде других точек — и это как раз таки некоторые промоторы. Удивительно, но именно они относятся к числу дестабилизированных. Удивительно и осмысленно, поскольку репликация также может требовать особых физико-химических свойств дуплекса. В частности, легкость плавление дуплекса ДНК здесь точно не помешает [5].

Исчерпывающие мутанты

Сложный характер зависимости промоторной активности от физико-химических свойств ДНК и от нуклеотидной последовательности требует полных или по меньшей мере больших данных. Вот если бы получить все или почти все возможные варианты промотора Т7 и узнать, насколько они активны. А ведь в постгеномную эпоху и век дешевых NGS это как раз таки реализуемо! И уже проделано в отношении промотора Т7. В работе [17] использована высокопроизводительная методология: в небольшие фрагменты ДНК встроили почти 8 тысяч случайным образом измененных последовательностей промотора фага Т7, а также последовательности-метки (баркоды) — чтобы потом разобрать, кто есть кто. Далее напрямую замерили их промоторную активность. Имея в распоряжении полные последовательности (промотор + небольшой контекст), нетрудно и рассчитать те физико-химические параметры дуплекса, которые не требуют значительных участков ДНК на входе (SIDD здесь, к сожалению, отпадает — ведь для расчета этого параметра дуплекса нужны очень крупные фрагменты ДНК).

Что показала данная работа и последующий анализ данных о последовательности, физико-химии и величине промоторной активности? Прежде всего, она подтвердила многие выводы о важности отдельных нуклеотидов в конкретных положениях и согласованности таких замен. Нетривиальный результат: ранее для этого ученые не одно десятилетие скрупулезно изучали геном T7 с помощью доступных тогда методов. И теперь мы знаем, что высокопроизводительный, основанный на NGS подход — хороший способ разобраться в устройстве других промоторов и вообще вовлеченных в регуляцию областей ДНК. В том числе в новых, не исследованных геномах, которые нам поставляют бесчисленные секвенаторы.

Читайте также: