Архитектура нейросети, благодаря которой стало возможным обучать очень глубокие нейросети
Год выпуска: 2015
Описание
ResNet (Residual Network) – модель, использующая идею residual learning. В рамках этой идеи к выходу каждого слоя прибавляется его вход, таким образом слой выучивает не полноценное новое преобразование входа, а добавочное (остаточное – residual) преобразование. «Прокидывание» входа к выходу слоя (skip connection) существенно упрощает процедуру обучения (в частности решает проблему затухания градиентов) и тем самым позволяет обучать очень глубокие нейросети. Идея residual learning используется практически во всех современных нейронных сетях.
Примеры использования:
Идеи архитектуры ResNet используются практически во всех современных нейросетях.
Нововведения
Представлен механиз skip connection – прибавление входа к выходу слоя. Благодаря это механизму задача оптимизации, решаемая во время обучения, стало значительно проще. Таким образом стало возможно обучать очень глубокие нейросети
Количество параметров: 23M-60M
Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время
Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст
Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно, а через реальные задачи. Объясняем, какие разделы действительно нужны джуну,…