Читать нас в Telegram

Автоматизация математических открытий

Команда математиков, среди которой Теренс Тао — один из самых известных математиков современности, — показала, насколько большие языковые модели эффективны в поиске решений определённых математических задач.

Перед математиками часто стоит задача найти объект с заданными свойствами. Например, при исследовании величины, принимающей бесконечное количество значений, требуется определить её верхнюю границу — значение, больше которого эта величина не может быть. Не всегда удаётся с первого раза дать точную оценку, часто находят оценку с запасом. Поэтому математики пытаются конкретизировать существующие оценки.

Кандидата на оценку можно частично проверить на компьютере. Компьютер будет перебирать значения величины и сравнивать с предложенной оценкой — если хотя бы для одного значения неравенство не выполняется, то оценка неверна. Такой подход не позволяет доказать корректность оценки для всех значений, но позволяет быстро отметать неподходящих кандидатов. Похожих задач с поиском объектов с заданными свойствами в математике много, и для многих из них проверку можно запрограммировать, присваивая каждому объекту численную оценку соответствия условиям.

В мае 2025 года лаборатория Google DeepMind представила метод AlphaEvolve, который позволяет эффективно находить объекты с заданными свойствами с помощью LLM. В качестве объекта может выступать компьютерная программа, математическая конструкция, молекула и др.

AlphaEvolve использует эволюционный подход. Пользователь даёт описание задачи и объекта в промпте. На каждом шаге AlphaEvolve генерирует программный код, конструирующий объект. Это принципиальный момент: AlphaEvolve ищет не в пространстве объектов напрямую, а в пространстве программ, которые генерируют эти объекты. Такое решение объясняется тем, что искомые объекты часто имеют регулярную структуру, которую можно лаконично описать кодом. К тому же LLM обучены программировать. Далее верификатор оценивает результат запуска кода. Программы, которые больше всего удовлетворяют требованиям верификатора, подаются на вход LLM, которая затем улучшает их. Далее эта процедура «улучшение-верификация» повторяется несколько раз.

Команда математиков протестировала модифицированный AlphaEvolve на задачах из разных областей. Модифицированная версия на каждом шаге генерирует не программу, которая конструирует объект, а программу, которая улучшает данный ей объект за заданное время с помощью найденных эвристик. Такой подход эффективнее: если раньше для генерации N объектов LLM нужно было запускать N раз, то теперь одна генерация выдаёт программу, которая непрерывно улучшает объект.

По результатам тестирования AlphaEvolve нашёл объекты не хуже уже известных, а в некоторых задачах — более оптимальные.

Почему это важно?

Как отмечают авторы, многие новые объекты, найденные AlphaEvolve, можно было найти и самостоятельно, но они не были найдены из-за отсутствия у математиков времени и ресурсов на поиск комбинации существующих идей, которая работает для конкретной задачи. Поэтому полуавтоматические методы вроде AlphaEvolve могут быть полезны в таких случаях.

В статье упоминается комбинирование AlphaEvolve с другими методами ИИ, которое позволяет не только находить объекты, но и формализовывать механизм их поиска, например выводить точную формулу, работающую для разных параметров. Также анализ некоторых программ, созданных AlphaEvolve, позволил учёным заметно продвинуться в решении некоторых задач.

Google разработает LLM для Apple

Компания Apple близка к соглашению с Google об внедрении языковой модели Gemini в ассистента Siri. По информации Bloomberg, сделка предусматривает выплату около миллиарда долларов в год за доступ к Gemini.

Apple хочет использовать технологию Google из-за сложностей в разработке собственных моделей. Компания анонсировала улучшенную Siri с Apple Intelligence внутри в 2024 году, но много раз переносила запуск.

Модель Gemini будет работать на серверах Apple в рамках инфраструктуры Private Cloud Compute, что позволит не передавать данные пользователей Google.Ранее Apple тестировала других поставщиков LLM, включая OpenAI и Anthropic.

Почему это важно?

Сделка показывает технологический разрыв в области ИИ между компаниями. Google и Microsoft начали инвестировать в LLM раньше, и даже финансовые ресурсы Apple не компенсируют отставание в несколько лет. Партнёрство создаёт зависимость от конкурента в критически важной технологии.