Стремительно развивающиеся цифровые технологии все активнее проникают в медицину. О том, зачем нужны отечественные базы BigData, и как искусственный интеллект может улучшить ситуацию с диагностикой и лечением генетических заболеваний, рассказал Медновостям главный внештатный специалист по медицинской генетике Минздрава России, президент Ассоциации медицинских генетиков России, член-корреспондент РАН, директор ФГБНУ «МГНЦ» д.м.н. Сергей Куцев.
Сергей Куцев. Фото: med-gen.ru
Сергей Иванович, действительно ли искусственный интеллект (ИИ) произвел революцию в медицинской генетике, перевел ее из области чистой науки в клиническую практику.
— Современная генетика оперирует огромным объемом данных, получаемых при ДНК-диагностике. В результате тестирования мы обнаруживаем в геноме пациента изменения нуклеотидной последовательности, которые могут быть, как вариантами нормы (полиморфизмы), так и причиной развития заболевания, то есть мутациями. И чтобы понять, с чем мы имеем дело, требуется анализ большого количества различных баз данных.
Но пока использование ИИ для нас – это еще только научная работа. Чтобы использовать его на практике, нужно стандартизировать большие массивы клинических данных.Когда у нас появятся электронные истории болезней со стандартизованным описанием клинических проявлений у каждого пациента, мы сможем обозначать группы риска и целенаправленно их обследовать. Эти исследования особенно важны для поиска тех заболеваний, для которых есть патогенетическое лечение.
Сегодня в нашем Медико-генетическом центре и в других центрах накоплен большой массив информации о наследственных заболеваниях и их молекулярно-генетических причинах. При некоторых заболеваниях возможно определить наиболее частые или мажорные мутации. Созданные на их основании алгоритмы диагностики входят в клинические рекомендации. И конечно, было бы хорошо собрать все данные, касающиеся молекулярных причин различных наследственных заболеваний, в единую информационную систему. В идеале электронная карта должна быть у каждого пациента и доступна для врачей всех специальностей. Например, в Израиле уже есть такая система: где бы ни лечился пациент в данный момент, врач имеет доступ к его истории болезни, где сохраняются результаты всех предыдущих обследований.
И, конечно, нам нужна отечественная база данных, содержащая информацию о тех или иных вариантах в генетическом аппарате.Анализ информации с использованием Big Data способен заменить сложные дополнительные лабораторные исследования. Сегодня мы работаем с международными базами данных. Самая известная из них OMIM – база данных по наследственным заболеваниям, которая содержит информацию о клинической картине и о являющихся его причиной генетических вариантах. В результате полногеномного секвенирования мы получаем огромное количество так называемых «сырых» данных пациента, которые могут весить больше 100 Гб. И программное обеспечение помогает отфильтровать те варианты, которые могут быть причиной заболевания. Но и после автоматического процессинга остаются сотни вариантов, которые анализируют специалисты.
Зачем нужна отечественная база данных, когда уже есть международные?
— Дело в том, что варианты нормы и мутации, а также частота их встречаемости различаются в разных популяциях. Популяционные базы данных основаны на данных полных экзомов и полных геномов клинически здоровых людей, и зная частоту варианта в популяции уже можно сделать вывод о том, с чем мы имеем дело: с нормой или патологией.
Например, сейчас все больше информации поступает о наследственных формах эпилепсии. У одного из наших пациентов мы нашли вариант, который, по нашим данным, встречается в популяции очень редко, и может быть, как нормой, так и причиной эпилепсии. Мы обратились к нашим китайским коллегам с вопросом о том, насколько часто подобное изменение ДНК встречается у них. Если оно такое же редкое или встречается у больных с похожей клинической картиной, то с большой вероятностью может быть причиной заболевания. Оказалось, что этот вариант имеют около 5% населения Китая, а эпилепсией страдает гораздо меньшее людей. Это означает, что данный вариант абсолютно точно не является причиной заболевания. Получается, что простой анализ информации с использованием Big Data способен заменить сложные дополнительные лабораторные исследования.
Помимо собственной базы данных, нам нужна еще и единая для всех врачей-генетиков собственная платформа для работы с пациентами, и для будущего анализа электронных историй болезни.
Генетикам необходимо так называемое «глубокое фенотипирование», то есть доскональное изучение всей совокупности признаков и клинических симптомов у пациента. Несмотря на наличие технологий, которые позволяют очень подробно изучать структуру генома, фенотип у нас описывается достаточно примитивно. Тем не менее, для диагностики очень часто имеют значение даже небольшие признаки. Например, по особенностям лица, хороший генетик может сразу заподозрить тот или иной синдром.
Что даст генетикам и их пациентам глубокое фенотипировнаие?
— В теории глубокое фенотипирование включает около 13 тысяч признаков, по которым желательно обследовать пациента. Все это Big Data, которые действительно нужно анализировать. Если бы мы имели такую возможность и полный геном, мы могли бы очень многое сделать не только для наследственных, но и для мультифакторных заболеваний.
Сегодня исследование генома и изучение его разнообразия – одно из важнейших направлений, и это задача на ближайшие 20-30 лет. Ранее считалось, что кодирующая часть генома – это 1-2% от всего генетического аппарата, а все остальные участки не играют никакой роли. Но оказалось, что это совсем не так: эти участки кодируют различные классы РНК, а эти РНК в свою очередь являются регуляторами функции других генов.
Изучением структуры генома в норме и патологий очень активно занимаются во всем мире. Например, в Великобритании была программа «Сто тысяч геномов», в рамках которой предполагалось исследовать 100 тысяч жителей страны. Теперь это программа называется «миллион геномов», и в перспективе ляжет в основу здравоохранения Великобритании. Подобные проекты идут в других странах, таких как Китай, США и других. У нас, к сожалению, таких масштабных проектов нет.
Как Big Data может улучшить ситуацию с диагностикой и лечением редких генетических заболеваний?
— Все наследственные болезни являются редкими, но среди них есть и относительно часто встречающиеся, например, фенилкетонурия или муковисцидоз. Существуют очень разные подходы к разработке терапии. Так, редактирование генома – это прямой путь лечения, исправление какого-то определенного дефекта, который мы можем выявить. Но Big Data позволяет искать и другие пути, обходные. В частности: использовать генорегуляторы и искать гены, участвующих в молекулярных сетях, воздействовать на элементы этих сетей, чтобы нейтрализовать действие другого гена или наоборот его активизировать.
Если мы будем иметь достаточно подробное описание клинических проявлений, приближающееся к тому, что мы называем «глубокое фенотипирование», то сможем попытаться выявить группы риска и затем уже более точными методами находить пациентов с заболеваниями, от которых можно найти лечение.
И уже есть конкретные примеры?
Конечно. К примеру, у нас возникла идея проанализировать электронные истории болезней пациентов из высокой группы риска по орфанным заболеваниям. Так, болезнь Фабри многолика и в патологический процесс вовлекается сердечно-сосудистая система, выделительная система (почки) и нервная система, из-за чего пациенты могут попадать к специалистам разного профиля, которые не всегда могут прийти к предположению о таком редком заболевании. В нашей стране есть лечебные учреждения, которые имеют электронные карты пациентов. И мы проанализировали большое количество карт пациентов, которые давно наблюдаются у нефрологов, неврологов или кардиологов и имеют клинические проявления, которые могут быть составной частью болезни Фабри. В итоге образовалась группа из нескольких тысяч пациентов, которую мы можем назвать группой риска по этой болезни. Следующим шагом станет проведение скрининга (существуют методы, которые позволяют определять активность фермента, недостаточность которого приводит к этому заболеванию). И таким образом мы выясним, насколько нам помог искусственный интеллект, использованный для анализа симптомов в электронных картах.
Можно ли считать полногеномное секвенирование эффективным инструментом выявления наследственных заболеваний ?
— Без сомнения. Это действительно то, что революционизировало нашу медико-генетическую службу. Например, существует несколько сотен генов, которые могут приводить к эпилепсии. И будет затратно и тяжело секвенировать отдельно каждый ген. Это будет сделано позже – для валидации вариантов, выявленных при полногеномных исследованиях.
Сегодня очень популярно создание панелей, когда анализируются несколько десятков или сотен генов, отвечающих за ту или иную патологию. Очень важно, что эта технология позволяет выявить генетическую гетерогенность, которая характерна для наследственных заболеваний. Речь идет о том, что одно и то же заболевание может быть вызвано мутацией в разных генах, а значит и лечение тоже может отличаться на основе знаний генотипа. В частности фенилкетонурия может быть вызвана не только мутацией в гене фенилаланингидроксилазы: похожая клиническая картина может наблюдаться при наличии мутаций в других генах, например, при гиперфенилаланинемиях с дефицитом тетрагидробиоптерина.
Найти тот единственный вариант, который привел к развитию заболевания всегда непросто, потому что в разных областях каждого генома есть несколько сотен тысяч вариантов, и какая-то часть из них уникальны и не описаны ранее. Поэтому существует и такой подход, при котором исследуются также геномы отца и матери и сравниваются с геномом ребенка.
В этом году была принята федеральная программа по развитию геномных технологий. Создаются три центра геномных исследований. Будут ли они заниматься, в том числе, популяционной геномикой, генетической паспортизацией населения?
— Насколько мне известно, нет. Один из трех центров будет работать в области биобезопасности и заниматься инфекционными патологиями и геномикой микроорганизмов, второй – в области сельского хозяйства, а третий – в области медицины. Этот центр будет называться «Высокоточное редактирование генома» и будет сосредоточен исключительно на разработках технологий редактирования генома. Это одно из перспективных направлений для разработки технологий лечения наследственных, онкологических, аутоиммунных и инфекционных заболеваний (включая ВИЧ). Но глобально вопросов медицинской генетики эта программа не касается. Медицинская генетика у нас, к сожалению, пока в стороне от федеральных инициатив.
Редактирование генома – это не то же самое, что исследования эпидемиологии наследственных заболеваний, структуры генома или функций тех или иных его локусов. А мы пока не знаем, за что отвечает большая часть генетического аппарата. Технология редактирования генома перспективна, но пока не применима для лечения наследственных заболеваний. Так, потенциальным ограничением являются побочные эффекты: помимо того, что редактируется цель (определенный ген), происходит и внецелевое редактирование других генов. Это может привести, например, к онкологическому заболеванию. Но технология развивается, и новые инструменты уменьшают риски внецелевого редактирования.
В России к 2025 году планируют обеспечить всех жителей генетическими паспортами. Поможет ли это снизить риск рождения детей с наследственными заболеваниями?
Генетическая паспортизация, о которой говорит правительство, не имеет отношения к медицинской генетике. Предполагается создать паспорт с теми или иными маркерами, которые позволяют идентифицировать личность, а это проблема судебной медицины.
Есть и другое понимание генетического паспорта, уже связанное с медициной. Подобный паспорт не до конца научно обоснован и предполагает с помощью генетических технологий изучить предрасположенность того или иного человека к частым социально значимым заболеваниям, таким как сахарный диабет, бронхиальная астма, артериальная гипертензия и т.д. Но это не наследственные, а мультифакторные заболевания, при которых генетическая предрасположенность существует, но болезнь развивается только под воздействием внешних факторов. Генетические признаки предрасположенности не могут предсказывать развитие заболевания и, в сущности, шансы остаются 1 к 1.
Еще одно понимание генетического паспорта предполагает тестирование каждого индивидуума на носительство патогенных вариантов частых наследственных заболеваний. Это позволит при планировании деторождения сравнить паспорта супругов и узнать, есть ли риск рождения ребенка с той или иной мутацией.
Создается впечатление, что сегодня такой риск возрастает. В последнее время действительно стало больше генных мутаций или просто их стали чаще замечать?
— Частота наследственных заболеваний остается на одном уровне, это законы динамики популяции. Мы получаем все больше информации о подобных заболеваниях, но это связано с тем, что часть их переходит из группы ненаследственных в группу наследственных. Мутации могут отличаться и могут быть различны у разных популяций, но процент людей с наследственными заболеваниями остается стабильным.