Открытие химических реакций – важная цель синтетической органической химии, потому что каждая реакция ускоряет процесс создания новых лекарств и материалов. В прошлом новые реакции искали при помощи теории графов, компьютерного проектирования или вручную, методом проб и ошибок, что отнимало довольно много времени, но успеха удалось достичь при помощи моделей глубокого обучения.
Для открытия реакций требуется не только знание законов химии, но и умение находить и выстраивать новые закономерности в химических элементах и реакциях. Отсутствие последнего – недостаток большинства методов, которые применялись до этого, в том числе и предшествующих нейросетей. Ученые учли эту недоработку, когда разрабатывали новую генеративную рекуррентную нейросеть. Преимущество рекуррентных нейросетей – возможность обрабатывать последовательности при помощи собственной внутренней памяти.
Чтобы эта нейросеть «узнала» об уже найденных закономерностях в химических реакциях и на основе этого научилась предсказывать появление новых, ее тренировали на научных работах, посвященных реакции Сузуки. Эта реакция обширно применяется при изготовлении фармацевтических препаратов и других химикатов, которые используются в промышленных целях.
Нейросеть, разработанная учеными, предложила около двух тысяч новых реакций. Часть из них неизвестна науке. Другая часть уже открыта учеными, но этих реакций не было в данных, на которых обучалась нейросеть. Результаты исследования означают, что модели глубокого обучения способны применять креативный подход для поиска новых реакций в органической химии, но ученые отмечают, что возможности пока ограничены.
Источник: Discovery of novel chemical reactions by deep generative recurrent neural network