Российские биоинформатики предложили новую архитектуру нейронной сети, которая способна предсказать, насколько точно выбрана «нацеливающая» на редактируемый ген РНК. Этот подход позволит эффективнее изменять ДНК при помощи популярной методики CRISPR/CAS, а значит, поможет разработать новые способы терапии тяжелых наследственных заболеваний.
Редактирование генома — очень популярный подход в самых разных областях экспериментальной биологии, а также в агро- и биотехнологиях. Чаще всего используют метод CRISPR/Cas.
CRISPR/Cas — один из множества способов защиты бактерий от вирусов. При заражении ДНК патоген оказывается внутри клетки, но поскольку его последовательности отличаются от последовательностей микроорганизма, Cas-белки распознают этот наследственный материал как чужеродный и разрезают его. Чтобы в дальнейшем бактерия могла быстрее среагировать на вирус, фрагменты ДНК патогена сохраняются в клетке — почти как база вирусных сигнатур в компьютерном антивирусе. Далее они передаются из поколения в поколение и используются Cas-белками для защиты от новых вторжений.
В 2011–2013 году ученые из разных лабораторий мира (Д. Даудна, Э. Шарпентье, Ф. Джанг в США и В. Шикснис в Литве) независимо друг от друга смогли адаптировать систему CRISPR/Cas к изменению произвольных последовательностей ДНК в клетках человека и животных, сделав редактирование генома значительно проще и эффективнее. Ключевые элементы технологии — гидовая, или наводящая, РНК и белок Cas9, который разрезает ДНК в месте, соответствующем ее последовательности. Затем клетка «залечит» разрез, но изменения уже будут внесены. Однако наводящая РНК не всегда попадает в нужное место и может неверно направить «генетические ножницы» Cas9. Необходимо превратить технологию CRISPR/Cas в современный высокоточный инструмент — это особенно важно в случае медицинских вмешательств.
Ученые из Сколтеха под руководством Константина Северинова применили глубокое обучение, гауссовские процессы и другие методы, чтобы решить проблему более точного выбора оптимальных наводящих РНК. Результатом стал набор нейросетей, которые представляют собой математические модели, реализованные в виде последовательных умножений матриц — больших наборов чисел со сложной внутренней структурой.
Нейросеть способна к обучению благодаря наличию «памяти», определенным образом изменяемой каждый раз, когда система считает в режиме тренировки. Модели были обучены на разных наборах данных, содержащих десятки тысяч экспериментально подтвержденных гидовых РНК, с высокой точностью сработавших на клетках человека и других животных.
Алгоритм, предложенный учеными из Сколтеха, оценивает вероятности разрезания ДНК-мишеней в правильном месте для заданных гидовых РНК. На это можно ориентироваться при выборе инструмента редактирования в любой технологии, основанной на CRISPR/Cas. Ученые уже предложили заранее рассчитанный их нейросетью набор гидовых последовательностей РНК, позволяющих точно изменять гены 22-й хромосомы человека. Это стало возможным благодаря точности предсказания частоты разрезания и добавлению оценки погрешности, которую не предоставлял ни один ранее разработанный для решения такой задачи метод.
«Результаты нашей работы могут быть применимы в любом приложении технологий, которые основаны на CRISPR/Cas, будь то терапия генетических заболеваний, агротехнологии, или эксперименты в фундаментальных научных исследованиях», — рассказывает аспирант Сколтеха Богдан Кириллов, один из создателей нового метода и первый автор статьи.
Разработанный российскими учеными метод упрощает проблему подбора правильного инструмента для высокоточного редактирования ДНК, а значит, экономит время и ресурсы. Редактирование ДНК в перспективе может помочь в разработке терапий некоторых наследственных болезней.
Результаты работы, выполненной при поддержке гранта Российского научного фонда (РНФ), опубликованы в журнале Nucleic Acids Research.