Ученые из МФТИ с коллегами из Биомедицинского холдинга «Атлас» разработали новую методику анализа биоинформатических данных. Разработанная программа EphaGen может использоваться для контроля качества при диагностике генетических заболеваний. Команда опубликовала статью в Nucleic acid research.
Расшифровка генома человека в начале XXI века и понимание нуклеотидной последовательности дали широкие возможности для изучения не только генетических заболеваний, но и генетических предрасположенностей. Это стало возможно с разработкой методик секвенирования (то есть определения последовательности ДНК) нового поколения (NGS — next-generation sequencing). Современные методы сделали процесс быстрее и дешевле, что позволило использовать их в терапии.
Если многофакторные заболевания (развитие которых может быть спровоцировано нарушением нескольких участков ДНК) все еще остаются в области научного исследования, то диагностика моногенных заболеваний (ассоциированных с нарушением конкретного участка ДНК) уже внедрена в клиническую практику врача-генетика.
Основная трудность использования данных NGS в клинике — необходимость четкого ответа, есть ли у пациента мутация или нет. В случае, если мутация не найдена, необходимо удостовериться, что это не связано с низким качеством данных. Для этого вводятся специальные метрики качества, но они лишь косвенно отвечают на вопрос о наличии мутации. Учеными из МФТИ и биомедицинской компании «Атлас» была разработана программа EphaGen, реализующая новую методику оценки, которая напрямую отвечает на поставленный вопрос. В качестве образца используется база данных с определенными априорными вероятностями вариантов. Новая методика не просто сравнивает новые данные с эталоном, а оценивает вероятность вариации и на основании этого определяет, можно ли использовать новые данные для клинического анализа или нет. Выходным значением программы является одно число, которое можно использовать в качестве критерия достоверности.
Максим Иванов, первый автор данной работы, аспирант кафедры биоинформатики МФТИ, говорит: «Благодаря быстрому внедрению новых технологий секвенирования в клиническую практику усложнилась интерпретация данных, полученных в лаборатории. Врачу зачастую хочется видеть конкретный ответ — обнаружена мутация или нет. Однако, в такой форме лаборатория ответить зачастую не может из-за многочисленных “но”: “мутации мы не видим, НО: этот ген мы не анализировали, другой ген мы не полностью проанализировали, а в третьем у нас технически не удался конкретный участок определенного гена”. NGS — довольно масштабная технология, именно из-за этого масштаба определенный очень важный участок ДНК может выпасть из анализа, и это останется незамеченным. Мы реализовали интегральную характеристику, которая поможет врачу понять достоверность этого ответа “нет мутации” и унифицировать язык общения между практикующим врачом и лабораторией. Ну и, конечно, это может иметь множество других приложений — помогать лабораториям контролировать качество, делать выбор между различными технологиями и так далее».
Разработанную программу EphaGen можно применять для оценки биоинформатических данных. Получаемое числовое значение может быть использовано в качестве критерия в повседневной клинической практике.
Работа выполнена при поддержке Российского фонда фундаментальных исследований.