Биоинформатики из МФТИ и Института математических проблем биологии РАН обнаружили неизвестные ранее особенности структуры генов, связанных с работой мозга. Исследование опубликовано в журнале Plos One.
Известно, что ДНК кодирует информацию о строении и функционировании живых организмов. В этой «книге жизни» последовательно, нуклеотид за нуклеотидом записана информация обо всех белках и РНК, образующихся в клетке. Фрагмент ДНК, кодирующий информацию об одном белке, называют геном, а способ «перевода» последовательности ДНК в аминокислотную последовательность белка — генетическим кодом. Еще в 1960-х годах были открыты основные свойства генетического кода, среди которых важным является триплетность. Это свойство означает, что три последовательно стоящих нуклеотида (кодон) кодируют одну аминокислоту. Так, например, последовательность нуклеотидов ATG (аденин-тимин-гуанин) кодирует аминокислоту метионин, с которой обычно начинаются все белки живых организмов на стадии синтеза.
Со времен открытия генетического кода получено множество информации о структуре генов живых организмов. Стало известно, что гены эукариот (организмов, имеющих ядро) «раздроблены». Внутри гена между кодирующими участками, называемыми экзонами, присутствуют некодирующие фрагменты ДНК — интроны. При созревании РНК таких генов происходит вырезание интронов и сшивание экзонов — процесс, называемый сплайсингом.
Ученые высказывают различные гипотезы относительно того, каким образом и как давно произошли интроны. В частности, наличие интронов делает возможным альтернативный сплайсинг — процесс выборочного сшивания различных экзонов, что позволяет получить различающиеся последовательности белка с одного гена. Это обеспечивает количество различных белков в клетках, значительно превосходящее общее количество генов. Также важным механизмом эволюции генов, в котором участвуют интроны, является так называемое «перемешивание экзонов». В этом процессе, например, «лишний» экзон может добавиться между двумя другими экзонами гена в процессе рекомбинации. Таким образом возникают новые гены.
Ввиду доступности полной последовательности геномов многих организмов, сегодня ученые имеют возможность детально анализировать эволюцию интронов. Известно, что интроны могут иметь различную длину (от нескольких десятков пар до нескольких сот тысяч пар нуклеотидов), а также различную фазу. Интроны фазы 0 расположены между кодонами, фазы 1 — после первого нуклеотида кодона, фазы 2 — после второго.
Биоинформатики из МФТИ и ИМПБ РАН проанализировали, как соотносятся между собой длина и фаза интронов у человека и мыши. «До нас никому не приходило в голову изучить связь длины интрона с его фазой — потому что здравый смысл говорит о том, что никакой связи между ними быть не должно (как между ростом человека и цветом его глаз например)», — комментирует Евгений Баулин, сотрудник лаборатории прикладной математики ИМПБ РАН и кафедры алгоритмов и технологий программирования МФТИ. К удивлению авторов исследования, была обнаружена группа генов, содержащих необычно много длинных (более 50 тысяч пар нуклеотидов) интронов фазы 1. Причем такие гены были связаны с передачей нервного импульса в мозгу.
Проведя детальный анализ множества научных публикаций, исследователи смогли собрать пазл разрозненных фактов в стройную картину. Оказалось, что наличие интронов фазы 1 у данной группы генов объясняется в большинстве случаев наличием в начале белков особой аминокислотной последовательности, сигнального пептида. Задача этого пептида — направить белок к месту его работы, в случае рецепторов нервных клеток — в плазматическую мембрану. В свою очередь, относительно большая длина данных интронов тоже косвенно связана с наличием сигнального пептида. Сигнальный пептид у таких белков всегда расположен в начале молекулы, а кодирующий его фрагмент ДНК — в начале гена. А именно в начале гена очень часто находятся длинные интроны, потому что в них находятся регуляторные последовательности ДНК, важные для синтеза данного белка.
В результате работы авторы смогли расшифровать стройную и цельную картину механизма перемешивания экзонов и участия длинных интронов фазы 1 в нем. «Этот механизм обеспечивает ускоренную эволюцию межклеточных и мембранных белков у животных, в частности, наиболее молодых из них — белков, обеспечивающих передачу нервных импульсов в клетках мозга», — заключает Евгений Баулин.
7