Команда DeepMind, подразделение Google, разработала технологию AlphaFold 2. На конференции CASP — исследовательском форуме о проблеме сворачивания белка — алгоритм занял первое место с результатом 92,4 баллов из 100 возможных. Первая версия нейросети в 2018 году набрала только 60 очков. Точность второй версии уже не хуже экспериментальных методов.
AlphaFold 2 моделирует трехмерную структуру белка и его сворачивание. Алгоритм использует граф, в котором вершины — аминокислотные остатки, а ребра — их связи. Нейросеть с механизмом внимания исследует систему и учитывает похожие белки. Технология определяет последовательность аминокислот на основании 3^100 комбинаций. Выходные данные показывают расстояние и углы связей, по которым восстанавливают соединение.
Система работает на информации о 170 тысячах белковых образцах. Обучение нейросети заняло несколько недель. Профессор Венки Рамакришнан считает, что DeepMind сделала «потрясающий шаг вперед в решении […] грандиозной задачи биологии 50-летней давности».
Разработка подразделения Google поможет в создании новых лекарственных препаратов. До CASP AlphaFold 2 предсказал две белковые структуры вируса SARS-CoV-2. Информация о взаимодействии и составе белков позволит выявить причины болезней Паркинсона и Альцгеймера на ранних стадиях. В будущем исследователи выяснят, как образуются, функционируют и сочетаются белковые комплексы с ДНК, РНК и небольшими молекулами.
Источник: AlphaFold: a solution to a 50-year-old grand challenge in biology