Точечные замены аминокислотных остатков в белках вследствие мутации ДНК могут приводить к изменению функций белков в клетках. Считается, что некоторые из таких функциональных изменений становятся ключевыми для последующего развития рака. Можем ли мы увидеть такие мутации на уровне протеома клетки, а если можем, то насколько достоверными будут полученные результаты?
В работе аспиранта МФТИ Анны Лобас с коллегами в коллаборации с учеными институтов РАН под руководством Сергея Мошковского из Института биомедицинской химии РАН и Михаила Горшкова, сотрудника кафедры «Химическая физика» МФТИ и заведующего лаборатории Института энергетических проблем химической физики РАН был предложен экспериментальный и биоинформационный алгоритм подхода к поиску мутированных участков последовательностей белков в протеоме клеточной линии человека HEK293 на основе протеогеномных технологий. Изучение мутантных белков поможет найти «слабые места» опухолевых клеток и разработать в последующем более эффективные лекарства. Результаты исследования опубликованы в журнале Proteomics.
Протеогеномика и «Big data»
Казалось бы, совсем недавно в нашу жизнь ворвалось понятие «big data». Но уже невозможно представить ни одной науки, которая бы не использовала большие массивы информации. Технологии «больших данных» в биологии позволили, с одной стороны, проводить более масштабные эксперименты и извлекать больше полезного из биологического материала. С другой стороны, из огромного массива становится труднее выделить существенные закономерности. Чтобы справиться с этой проблемой, ученым приходится разрабатывать сложные алгоритмы фильтрации и анализа информации.
Протеомика — наука, изучающая совокупность белков клетки или целого организма, — не исключение. Основной метод протеомного анализа — масс-спектрометрия, позволяющая точно «взвесить» молекулы белков, пептидов и их фрагментов в образце. Данные протеомного эксперимента – это, как правило, набор масс-спектров, по виду которых ученому предстоит определить, к каким белкам они относятся. Сделать это исключительно по виду масс-спектра пока невозможно. Поэтому для анализа требуется база данных белковых последовательностей, которые могут встретиться в анализируемом образце. Вместо того, чтобы «расшифровывать» неизвестную последовательность «с нуля», программа просто сверяет экспериментальные данные со «словарём» белковых последовательностей.
Однако этот подход не вполне подходит для поиска белков, аминокислотная последовательность которых отличается от того, что прописано в «эталонном» геноме. Идентифицировать в раковых клетках белки с мутациями невозможно, если база данных не содержит такую форму белка. Тогда в работу вступает протеогеномика — область на стыке протеомики и геномики. Вместо универсальной белковой базы данных в протеогеномных исследованиях используются базы, уникальные для исследуемых клеток, включающие информацию о возможных прочтениях генома и его «перевод» в аминокислотную последовательность.
Белковую базу данных расширили геномом клетки
В новой работе российские ученые разработали алгоритм поиска мутантных белков, позволяющий сравнивать масс-спектрометрические результаты разных исследовательских групп и выделять мутации, связанные с раком. Эффективность подхода исследователи продемонстрировали на клеточной линии HEK-293, полученной из почки человеческого эмбриона. Это модельная культура клеток человека, которую часто используют в исследованиях, поскольку ее легко выращивать в лаборатории. Кроме того, линия HEK-293 несет множество мутаций и служит отличной моделью для отработки протеогеномного подхода к исследованию рака.
Помимо собственных экспериментальных данных, в своей работе ученые использовали масс-спектры из двух работ, посвященных исследованию протеома клеток HEK-293. Для протеогеномного анализа ученые подготовили расширенную базу данных на основе результатов секвенирования экзома клеточной линии HEK-293. Экзом — это совокупность экзонов (участков генов, которые кодируют последовательность аминокислот в белке). Секвенирование экзома позволяет сконцентрировать внимание исследователей только на белок-кодирующих генах, а также определить расположение экзонов в них. Увеличенная база стала больше на 1336 вариантов последовательностей. Таким образом в белковый «словарь» добавились последовательности, которые отличаются от исходных на одну или несколько «букв» — аминокислот. Без этой поправки поисковая программа не смогла бы обнаружить такие немного «неправильные» белки. Поскольку в каждой клетке постоянно происходят мутации, а в раковых – особенно часто, обнаружение белков, отличающихся от «эталонных», поможет понять, чем опухолевая клетка отличается от нормальной.
По данным масс-спектрометрического анализа из двух ранних исследований и экспериментально полученным в текущей работе масс-спектрам ученые определили, какие пептиды — короткие белки или фрагменты белков – содержатся в клетках и к каким белкам они относятся. Используя новый подход к протеогеномному анализу с использованием расширенной базы данных, ученые обнаружили в клетках HEK-293 113 уникальных вариантных последовательностей пептидов, относившихся к экзонным областям 103 генов. Это существенно больше, чем в работе, ранее выполненной группой Стивена Гиги, где не использовалась дополненная геномными вариантами белковая база данных, а поиск аминокислотных замен производился другим методом.
Для некоторых из обнаруженных мутаций ранее была показана связь с различными типами рака. Возможно, наличие этих вариантов способствует лучшему выживанию и размножению клеток. В частности, один из обнаруженных геномных вариантов относится к белку p53, подавляющему злокачественное преобразование клетки.
«Наш подход может в дальнейшем использоваться для поиска ассоциированных с раком мутаций на основе протеомных данных. Это, в свою очередь, поможет в изучении белкового состава опухолей и разработке препаратов, «нацеленных» на мутантные белки, производимые в опухолевых клетках», — отмечает Михаил Горшков, один из руководителей проекта, заведующий лабораторией физико-химических методов исследования структуры веществ ИНЭПХФ РАН, сотрудник Кафедры химической физики МФТИ.