Сколько генов приблизительно содержится в каждой клетке человека кратко

Обновлено: 02.07.2024

После того как ученые получили основную информацию о геноме человека, они попытались определить число генов, но эта задача оказалась непростой. Точное число неизвестно до сих пор, и все же оценки становятся все более достоверными.

Считалось, что секвенирование генома человека позволит определить локализацию каждого гена и их общее количество. Однако сегодня существует несколько баз данных генов, которые в значительной мере отличаются друг от друга.

Однако есть и другие способы. Сейчас довольно много известно о том, какими признаками должны обладать гены белка, и существуют программы, которые ищут их in silico — в компьютере, с помощью анализа генома. Подсказкой может служить и то, что гены разных видов эукариот в силу общности эволюционного происхождения сходны между собой (гомологичны), и если мы видим последовательность, которая у другого живого существа кодировала белок, — возможно, она кодирует белок и у человека.

Особый интерес вызывают белки, чье существование экспериментально не доказано, — так называемые потерянные (missing) белки. К этой категории относят все вышеперечисленные группы, кроме первой либо первой и последней. Для выявления и характеристики таких белков создан ресурс MissingProteinPedia.

Не только белки

РНК подразделяются на некодирующие РНК (нкРНК), которые не транслируются в белки, и кодирующие, или матричные РНК (мРНК), служащие матрицей для синтеза белков. У некодирующих РНК более сложная классификация. Они бывают инфраструктурными и регуляторными. Инфраструктурные РНК известны нам из школьных учебников — это рибосомные РНК (рРНК) и транспортные РНК (тРНК). Молекулы рРНК составляют основу рибосомы — молекулярной машины, которая и строит белок на матричной РНК (проводит трансляцию). Последовательность из трех нуклеотидов в мРНК указывает, какую аминокислоту следуют включить в белок. Молекулы тРНК приносят указанные аминокислоты на рибосомы в ходе трансляции.

Таблица 1. Некодирующие регуляторные РНК

Новое секвенирование и базы данных

Исследовать многообразие РНК не так просто по многим причинам, от их высокой лабильности до малых размеров. Однако появление высокопроизводительных методов параллельного секвенирования (когда миллионы фрагментов ДНК из одного образца читаются одновременно), оно же секвенирование нового поколения (next-generation sequencing, NGS), значительно ускорило поиск функциональных участков генома.

Кроме того, появились методы секвенирования РНК — сначала через создание ДНК-копий, а потом и прямые. Изначально они создавались для количественного определения экспрессии генов, но также способствовали обнаружению ранее не известных РНК, как кодирующих, так и не кодирующих.

Благодаря методам NGS базы данных генов lncRNA и других РНК всего за десятилетие резко выросли, и каталоги генов человека теперь содержат больше генов РНК, чем генов белков. Кроме того, секвенирование РНК позволило установить, что альтернативный сплайсинг, альтернативное инициирование транскрипции и альтернативное прерывание транскрипции происходят гораздо чаще, чем полагали, и затрагивают до 95% человеческих генов. Следовательно, даже когда мы узнаем местоположение всех генов в геноме, нужно будет выявить все изоформы этих генов, а также определить, выполняют ли эти изоформы какие-либо функции или просто представляют собой ошибки сплайсинга.

Таблица 2. Количество разных типов генов в базах данных Gencode, RefSeq, CHESS

Типы генов Gencode RefSeq CHESS
Белок-кодирующие гены 19 901 20 345 21 306
Гены длинных некодирующих РНК 15 779 17 712 18 484
Антисмысловые РНК 5501 28 2694
Другие некодирующие РНК 2213 13 899 4347
Псевдогены 14 723 15 952
Общее число транскриптов (видов РНК) 203 835 154 484 323 827

В 2017 году сотрудники Университета Джонса Хопкинса под руководством Стивена Зальцберга создали еще одну базу данных генов человека — CHESS. Они использовали данные глубокого секвенирования РНК, чтобы заново получить информацию о всех продуктах транскрипции в разнообразных тканях человеческого организма, и отмечают, что существенно пополнили списки генов. Примечательно, что новая база включает все белок-кодирующие гены как Gencode, так и RefSeq, поэтому пользователям CHESS не нужно решать, какую базу данных они предпочитают. Создатели CHESS отмечают, что более обширная база с большей вероятностью содержит последовательности, ошибочно отнесенные к генам, но лучше потом удалить такую последовательность, чем пропустить существующий ген.


Обзор

Найти ответ на этот вопрос оказалось куда сложнее, чем кто-либо предполагал

Автор
Редактор


Спонсором приза зрительских симпатий выступил медико-генетический центр Genotek.

Как же мало известно о генах! Первый раз я остро ощутила это, находясь на практике в лаборатории медицинской генетики Харбинского медицинского университета. Исследовательская группа, где я проходила стажировку, занималась изучением онкогена Sei-1, который индуцирует образование двухминутных хромосом (DM), что способствует развитию онкогенеза. Однако механизм образования онкогена Sei-1 остается неизвестным до сих пор. А ведь различные мутации генов являются причиной возникновения и других опасных заболеваний человека, помимо рака. Итак, в данной статье мы изложим некоторые соображения о том, почему мы все еще многое не знаем о генах, а также сформулируем наше мнение о том, сколько генов у человека.

Выявление полного списка генов необходимо для выяснения молекулярных механизмов возникновения и развития рака, шизофрении [3], деменции, а также многих других заболеваний человека. Секвенирование ДНК, выделенной из тканей больных, позволяет выявлять такие мутации, как нуклеотидные замены, делеции и вставки, ответственные за возникновение этих заболеваний.

Немного о РНК

Виды РНК

Рисунок 2. Виды РНК

рисунок автора статьи

Регуляторные нкРНК очень широко представлены в организме, классифицируются в зависимости от размера и выполняют ряд важных функций (табл. 1).

Проблема терминологии

Ген любой участок хромосомной ДНК, который транскрибируется в функциональную молекулу РНК или сначала транскрибируется в РНК, а затем транслируется в функциональный белок.

Это определение включает как гены некодирующих РНК, так и белок-кодирующие гены, и позволяет определять все варианты альтернативного сплайсинга в одном локусе как варианты одного и того же гена. Это позволяет исключить псевдогены – нефункциональные остатки структурных генов, утратившие способность кодировать белок.

Результаты двух первых исследований свидетельствовали о наличии у человека 31 000 [2] и 26 588 белок-кодирующих генов [17], а в 2004 появилась полная последовательность генома человека [4], и авторы подсчитали, что полный каталог насчитывает 24 000 белок-кодирующих генов. Каталог человеческих генов Ensembl включает 22 287 белок-кодирующих генов и 34 214 транскриптов [18].

Секвенирование нового поколения (NGS)

Появление высокопроизводительных методов параллельного секвенирования (в ходе такого секвенирования миллионы фрагментов ДНК из одного образца секвенируются одновременно) или секвенирования нового (следующего) поколения (next-generation sequencing, NGS) [1] позволило значительно ускорить поиск функциональных участков генома [4]. Биотехнологические компании разработали и коммерциализировали различные платформы для NG-секвенирования, позволяющие секвенировать от 1 млн до десятков млрд коротких последовательностей (ридов, reads) длиной 50–600 нуклеотидов каждая. К наиболее популярным платформам относятся такие, как Illumina и IonTorrent, использующие амплификацию ДНК с помощью ПЦР [19], а также платформы одномолекулярного секвенирования, такие как Helicos Biosciences HeliScope, Pacific Biosciences SMRT (single molecule real-time sequencing), и нанопорового секвенирования Oxford Nanopore, осуществляющие секвенирование в реальном времени и позволяющие прочитывать значительно более длинные риды — до 10–60 тыс. нуклеотидов. Кроме того, изобретение секвенирования РНК (RNA-seq) в 2008 году, которое создавалось для количественного определения экспрессии генов, также способствовало обнаружению транскрибируемых последовательностей, как кодирующих, так и некодирующих РНК [20].

Благодаря NGS, базы данных днкРНК и других генов РНК (таких как микро-РНК) резко выросли за десятилетие, и текущие каталоги генов человека теперь содержат больше генов, кодирующих РНК, чем белки (табл. 2).

Таблица 2. Количество разных типов генов в следующих базах данных: Gencode, Ensembl, RefSeq, CHESS
Типы геновGencodeEnsemblRefSeqCHESS
Белок-кодирующие гены 19 901 20 376 20 345 21 306
Гены длинных некодирующих РНК 15 779 14 720 17 712 18 484
Антисмысловые РНК 5501 28 2694
Другие некодирующие РНК 2213 2222 13 899 4347
Псевдогены 14 723 1740 15 952
Общее число транскриптов 203 835 203 903 154 484 323 827

Последовательность ДНК

Рисунок 3. Последовательность ДНК, получаемая после секвенирования человеческого генома

В ходе секвенирования РНК обнаружилось, что альтернативный сплайсинг, альтернативное инициирование транскрипции и альтернативное прерывание транскрипции проиcходят гораздо чаще, чем полагали, затрагивая до 95% человеческих генов. Следовательно, даже если известно местоположение всех генов, сначала нужно выявить все изоформы этих генов, а также определить, выполняют ли эти изоформы какие-либо функции или они просто представляют собой ошибки сплайсинга.

Базы данных генов человека

Задача по составлению каталога всех генов по-прежнему не решена. Проблема заключается в том, что за последние 15 лет только две исследовательские группы составили список доминантных генов: RefSeq, которая поддерживается Национальным центром биотехнологической информации (NCBI) при Национальных институтах здоровья (NIH), и Ensembl/Gencode, которая поддерживается Европейской молекулярно-биологической лабораторией (EMBL). Однако, несмотря на большой прогресс, сейчас в каталогах различается количество белок-колирующих генов, генов длинных некодирующих РНК, псевдогенов, а также варьирует количество антисмысловых РНК и других некодирующих РНК (табл. 2). Каталоги еще дорабатываются: например, в прошлом году сотни генов, кодирующих белок, были добавлены или удалены из списка Gencode. Эти разногласия объясняют проблему создания полного каталога человеческих генов.

В 2017 году была создана новая база данных генов человека — CHESS. Примечательно, что она включает все белок-кодирующие гены как Gencode, так и RefSeq, так что пользователям CHESS не нужно решать, какую базу данных они предпочитают. Бóльшее количество генов может вызывать больше ошибок, но создатели считают, что бóльший набор окажется полезным при исследовании болезней человека, которые еще не отнесены к генетическим. Набор генов CHESS в настоящее время в версии 2.0 еще не окончательный, и, безусловно, создатели работают над его усовершенствованием.

Ответ. Разным клеткам организма необходимы разные белки. Поэтому в каждой клетке реализуется только та часть генетической информации, которая отвечает за синтез именно этих белков.

2. Из скольких видов аминокислот состоят белки?

Ответ. Белки́ (протеи́ны, полипепти́ды) — высокомолекулярные органические вещества, состоящие из аминокислот, соединённых в цепочку пептидной связью. В живых организмах аминокислотный состав белков определяется генетическим кодом, при синтезе в большинстве случаев используется 20 стандартных аминокислот.

3. У каких организмов генотип включает одну молекулу ДНК?

Ответ. Прокариоты и вирусы содержат только одну молекулу ДНК, участки которой кодируют макромолекулы.

4. Что такое генетический код?

Ответ. Генети́ческий код — свойственный всем живым организмам способ кодирования последовательности аминокислотных остатков в составе белков при помощи последовательности нуклеотидов в составе нуклеиновой кислоты.

5. Чем определяется специфичность каждого организма?

Ответ. Одна из самых замечательных особенностей жизни состоит в том, что все живые существа характеризуются общностью строения клеток и происходящих в них процессов. Однако они имеют и очень много различий. Даже особи одного вида различаются по некоторым свойствам и признакам: морфологическим, физиологическим, биохимическим. В конечном счете сходство и различие организмов определяется набором белков. Каждый вид растений и животных имеет особый, только ему присущий набор белков, т. е. белки являются основой видовой специфичности. Некоторые белки, выполняющие одинаковые функции, могут иметь одинаковое строение у разных видов. Например, инсулин - гормон поджелудочной железы, регулирующий количество сахара в крови, одинаков у собаки и у человека. Однако многие белки, выполняя одну и ту же функцию, несколько отличаются по строению у разных представителей одного и того же вида. Примером могут служить белки групп крови у человека. Такое разнообразие белков обусловливает индивидуальную специфичность организмов. На земле нет двух людей, у которых все белки были бы одинаковыми. Известно, что в эритроцитах (красных кровяных клетках дисковидной формы) содержится гемоглобин, который доставляет кислород ко всем клеткам тела. Гемоглобин состоит из железосодержащего пигмента - гема и белка- глобина.

При изучении структуры гемоглобина эритроцитов крови человека обнаружили, что каждая белковая молекула состоит из четырех полипептидных цепей (2 альфа и 2 бета-цепи). Установив первичную структуру белка, т. е. последовательность аминокислот в каждой цепи, выяснили также, с помощью каких связей между R-группами (радикалами аминокислот) образуется его третичная и четвертичная структура. Все здоровые люди имеют гемоглобин с одинаковой первичной и пространственной структурой. У людей, страдающих серповидноклеточной анемией - тяжелым наследственным заболеванием, эритроциты похожи не на диски, как обычно, а на серпы. Такое изменение формы клеток происходит из-за отличия первичной структуры гемоглобина у больных людей. В беа-цепи нормального гемоглобина на шестом месте от NH2-конца стоит глутаминовая кислота. При серповидноклеточной анемии она заменена на аминокислоту валин. Из 574 аминокислот, входящих в состав гемоглобина, заменены только две (по одной в каждой бета-цепи). Но это приводит к существенному изменению третичной и четвертичной структуры белка и, как следствие, к изменению формы и нарушению функции эритроцита. Серповидные эритроциты плохо справляются со своей задачей - переносом кислорода. На этом примере мы видим, что форма и функции клеток зависят от структуры входящих в их состав белков.

Вопросы после § 27

1. Что такое оперон?

Ответ. Генетической единицей механизма регуляции синтеза белков следует считать оперон, в состав которого входят один или несколько структурных генов, т. е. генов, несущих информацию о структуре иРНК, которая, в свою очередь, несет информацию о структуре белка.

2. Какую роль играет рецептор в регуляторном механизме клетки?

Ответ. Регуляторная функция белков ― осуществление белками регуляции процессов в клетке или в организме, что связано с их способностью к приёму и передаче информации. Существует несколько разновидностей белков, выполняющих регуляторную функцию:

• белки-рецепторы, воспринимающие сигнал; мембранные белки-рецепторы передают сигнал с поверхности клетки внутрь, преобразовывая его;

• сигнальные белки-гормоны и другие вещества, осуществляющие межклеточную сигнализацию (многие из них, хотя далеко не все, являются белками или пептидами);

• регуляторные белки, которые регулируют многие процессы внутри клеток.

3. Какова роль гормонов в регуляторном механизме клетки?

Ответ. Гормоны связываются с особыми рецепторами, расположенными или на клеточной мембране, или внутри клетки. В результате взаимодействия рецептора с гормоном в клетке активируются или, наоборот, репрессируются те или иные гены, и синтез белков в данной клетке меняет свой характер.

4. Сколько генов приблизительно содержится в каждой клетке человека?

Ответ. Геном человека — совокупность наследственного материала, заключенного в клетке человека. Человеческий геном состоит из 23 пар хромосом, находящихся в ядре, а также митохондриальной ДНК. Двадцать две аутосомы, две половые хромосомы Х и Y, а также митохондриальная ДНК человека содержат вместе примерно 3,1 млрд пар оснований.

5. Какие вещества в многоклеточном организме играют важнейшую роль в координации работы тысяч генов?

Такие механизмы лучше изучены в клетках прокариот. Несмотря на то что прокариоты — одноклеточные организмы, их транскрипция и трансляция также регулируются, так как в один момент времени клетка может нуждаться в каком-либо белке, а в другой момент тот же самый белок может стать для нее вреден.


№№ заданий Пояснения Ответы Ключ Критерии Инструкция Источник Раздел кодификатора ФИПИ
Добавить инструкцию Печать Версия для копирования в MS Word
PDF-версии: горизонтальная · вертикальная · крупный шрифт · с большим полем

1) Какие функции выполняет хромосома?

2) Что представляет собой ген?

3) В кариотипе дрозофилы насчитывают 8 хромосом. Сколько хромосом находится у насекомого в половых и сколько – в неполовых клетках?

ГЕНЫ И ХРОМОСОМЫ

Клетки живых организмов содержат генетический материал в виде гигантских молекул, которые называются нуклеиновыми кислотами. С их помощью генетическая информация передаётся из поколения в поколение. Кроме того, они регулируют большинство клеточных процессов, управляя синтезом белков.

Ген – это участок молекулы ДНК, которая кодирует один определённый белок. Наследственные изменения генов, выражающиеся в замене, выпадении или перестановке нуклеотидов, называются генными мутациями. В результате мутаций могут возникнуть как полезные, так и вредные изменения признаков организма.

Хромосомы – нитевидные структуры, находящиеся в ядрах всех клеток. Они состоят из молекулы ДНК и белка. У каждого вида организмов своё определённое число и своя форма хромосом. Набор хромосом, характерный для конкретного вида, называют кариотипом.

Исследования кариотипов различных организмов показали, что в их клетках может содержаться двойной и одинарный наборы хромосом. Двойной набор хромосом состоит всегда из парных хромосом, одинаковых по величине, форме и характеру наследственной информации. Парные хромосомы называют гомологичными. Так, все неполовые клетки человека содержат 23 пары хромосом, т.е. 46 хромосом представлены в виде 23 пар.

В некоторых клетках может быть одинарный набор хромосом. Например, в половых клетках животных парные хромосомы отсутствуют, гомологичных хромосом нет, а есть негомологичные.

Каждая хромосома содержит тысячи генов, в ней хранится определённая часть наследственной информации. Мутации, изменяющие структуру хромосомы, называют хромосомными. Неправильное расхождение хромосом при образовании половых клеток может привести к серьёзным наследственным заболеваниям. Так, например, в результате такой геномной мутации, как появление в каждой клетке человека 47 хромосом вместо 46, возникает болезнь Дауна.

Пояснение . Правильный ответ должен содержать следующие элементы:

1) Хранение и передача части наследственной информации всего организма.

2) Участок молекулы ДНК, в котором находится информация о структуре конкретного белка.

3) В неполовых 8 хромосом, в половых 4 хромосомы.

Ответ включает два из названных выше элементов и не содержит биологических ошибок.

Ответ включает один из названных выше элементов и не содержит биологических ошибок.

Ответ включает один любой из названных выше элементов и содержит негрубые биологические ошибки.

Читайте также: