Белки перемещаются внутри клетки, взаимодействуют с друг другом и обеспечивают разные функции организма. Влияние на эти взаимодействия может открыть новые способы лечения самых разных заболеваний. Однако молекулы лекарств либо слишком большие, чтобы добраться до белка в клетке, либо не могут оказывать необходимое воздействие. Пептиды, которые являются посредниками и регуляторами в 40% клеточных процессов, имеют маленькие молекулы и высокую специфичность и аффинность. Они могут прицельно и эффективно воздействовать на белки внутри клетки.
Для того, чтобы создавать пептидные лекарства, необходимо знать сайты связывания — те части молекулы белка, которые взаимодействуют с пептидами. Их можно обнаружить экспериментальным путем, например рентгеноструктурным анализом. Однако такие исследования достаточно дорогие. Двое ученых из Сколтеха создали сверточную нейросеть BiteNetPp, которая изучает известную структуру белка и прогнозирует координаты сайтов связывания и оценку достоверности своего прогноза.
«Нейронные сети уже давно обучают распознавать, например, фигуры пешеходов или велосипедистов на обычных двумерных снимках. Мы рассматриваем обнаружение сайтов связывания как подобного рода поиск объекта на картинке. Разница в том, что мы подаем на вход модели не плоскую картинку, а трехмерную атомарную структуру белка, и модель оперирует не пикселями, а их 3D-аналогом — вокселями.
BiteNetPp — первая модель, которую дообучили на датасете по белкам и пептидам после первичного обучения на данных по белкам и малым молекулам. Наглядная аналогия могла бы выглядеть так: вы хотите обучить модель обнаруживать места, где на улице останавливаются велосипедисты, но вы начинаете с данных об остановках пешеходов и лишь затем расширяете домен до велосипедистов. Вместо того чтобы начинать с чистого листа, вы переучиваете готовую модель, ожидая, что “сайты связывания” велосипедистов и пешеходов могут пересекаться: может, это ларек с мороженым, светофор и т.п.», — поясняет руководитель исследования, Петр Попов.
Нейросеть не только обнаруживает сайты связывания белков с поразительной точностью, но и делает это с поразительной скоростью: анализ одной белковой структуры проходит меньше, чем за секунду. По словам ученых, в перспективе нейросеть поможет создавать новые эффективные лекарства.