В рубрике «Компьютерное зрение» собраны материалы о том, как алгоритмы работают с изображениями и видео. Здесь мы рассказываем о распознавании объектов, генерации изображений, датасетах, OCR и других технологиях машинного зрения, которые применяются в искусстве, цифровом наследии, медиа и повседневных сервисах.
Маски в Инстаграме и ТикТоке способны изменить лицо до неузнаваемости или вообще превратить его в зайчика/оленя/волдеморта. Создание таких масок не…
Как видит русскую классику нейросеть ruDALLE? Пройдите тест и попробуйте угадать, что скрывается под изображениями
Сколько ваших знакомых без проблем смогут прочитать рукописи Пушкина? А петровскую скоропись? А рецепт своего лечащего врача? Чтобы разобрать написанное,…
DALL-E — нейросеть-трансформер с 12 миллиардами параметров, которую обучили генерировать изображения по произвольному текстовому описанию. Например, пишете ей «кресло в…
Модели компьютерного зрения обычно без труда распознают стул, стоящий на кухне, но перевернутый стул в спальне ставит их в тупик.…
Научить нейросети понимать искусство пытаются уже много лет. И хотя про «понимание» говорить рано, некоторые задачи, ранее доступные лишь искусствоведу,…
«Системный Блокъ» уже рассказывал, как «Союзмультфильм» вручную восстановил часть советских анимационных лент. Основная проблема старых мультфильмов — не физические повреждения…
Маленькие дети радуются, когда удается прочитать вывеску на улице. Нейросети тоже читают вывески, а некоторые еще и шрифт определяют. И…
Мы привыкли воспринимать комиксы как цветные или черно-белые картинки с текстом, которые складываются в историю. Однако это сложно организованный текст,…
Автоматические определители живых организмов стоят на смартфонах миллионов любителей природы. Достаточно просто навести камеру на растение или животное, чтобы определить,…