Компьютерное зрение

Компьютерное зрение — все, что связано с автоматической обработкой картинок и видео. Мы рассказываем о том, какие алгоритмы дают возможность отличить на картинке кошку от собаки, и даже различить между собой кошек разных пород, а также о том, как компьютер анализирует рентгеновские снимки лучше врача и какие технологии машинного зрения помогают “видеть” автопилоту современного автомобиля. А еще в этой рубрике можно узнать, почему системы компьютерного зрения, с одной стороны, поражают своими умениями, а с другой стороны, все еще не совершенны. Например, система компьютерного зрения легко может отличить тигра от пантеры, но перепутать леопарда с диваном.

Нейросеть не потечет: можно ли накраситься цифровым макияжем

Маски в Инстаграме и ТикТоке способны изменить лицо до неузнаваемости или вообще превратить его в зайчика/оленя/волдеморта. Создание таких масок не обходится без нейросетей и играет в цифровом мире в основном развлекательную роль. Но что если те же технологии можно применить в образовательных целях?

Русская классика глазами нейросети ruDALLE

Как видит русскую классику нейросеть ruDALLE? Пройдите тест и попробуйте угадать, что скрывается под изображениями

Transkribus: как компьютерное зрение помогает переводить тексты сирийских мистиков

Сколько ваших знакомых без проблем смогут прочитать рукописи Пушкина? А петровскую скоропись? А рецепт своего лечащего врача? Чтобы разобрать написанное, часто нужен натренированный глаз. Добиться этого можно двумя способами: мы можем тренировать собственное зрение, а можем — компьютерное. Как и зачем тренируют модели распознавания рукописного текста — рассказывают исследовательницы классической сирийской литературы Юлия Фурман и Анна Черкашина

dall e

Редька-балерина и кресло-авокадо: нейросеть научилась рисовать изображения на заказ

DALL-E — нейросеть-трансформер с 12 миллиардами параметров, которую обучили генерировать изображения по произвольному текстовому описанию. Например, пишете ей «кресло в виде авокадо» — и получаете изображение, которое почти неотличимо от фотографии из салона дизайнерской мебели. Рассказываем, что еще умеет DALL-E

ObjectNet — датасет, который поставил в тупик лучшие модели компьютерного зрения

Модели компьютерного зрения обычно без труда распознают стул, стоящий на кухне, но перевернутый стул в спальне ставит их в тупик. Создатели ObjectNet постарались решить проблему с помощью датасета с тысячами необычных фотографий

нейросети в искусстве

Определяем дату написания картины онлайн без регистрации и СМС

Научить нейросети понимать искусство пытаются уже много лет. И хотя про «понимание» говорить рано, некоторые задачи, ранее доступные лишь искусствоведу, они решают неплохо! Пример — датировка живописи. Рассказываем про систему, сделанную студентами МИСиС, которая может датировать картины — причем не только всем известные «Звездную ночь» или «Мона Лизу», но и полотна неизвестных художников. Кстати, эту модель может протестировать любой желающий!

улучшить изображение нейросеть

Возвращение четкого попугая: как нейросеть реставрирует старые советские мультфильмы

«Системный Блокъ» уже рассказывал, как «Союзмультфильм» вручную восстановил часть советских анимационных лент. Основная проблема старых мультфильмов — не физические повреждения и выцветание, а низкое разрешение видеозаписи.

шрифт уличной вывески

Нейросеть читает вывески на улицах Лондона

Маленькие дети радуются, когда удается прочитать вывеску на улице. Нейросети тоже читают вывески, а некоторые еще и шрифт определяют. И если по почерку человека можно узнать его характер, то какую информацию о жителях городского района позволяет получить почерк улицы?

Как компьютеры читают комиксы?

Мы привыкли воспринимать комиксы как цветные или черно-белые картинки с текстом, которые складываются в историю. Однако это сложно организованный текст, потребление которого требует от нас и визуального, и текстового восприятия. Несмотря на сложность, сегодня комиксы исследуют автоматически при помощи компьютерного зрения. Рассказываем, как это работает

Как нейросеть узнает растения и почему она ошибается

Автоматические определители живых организмов стоят на смартфонах миллионов любителей природы. Достаточно просто навести камеру на растение или животное, чтобы определить, что это. Разбираемся, как устроены такие приложения и что у них под капотом

Секреты позы и лица: как работают face keypoint detection и pose estimation

Существует две проблемы для определения движения ключевых точек лица и тела. Первая заключается в анатомических различиях и внешних факторах, вторая затрагивает время обработки изображения. Несмотря на трудности, face keypoint detection и pose estimation используются во многих направлениях. Благодаря им строятся алгоритмы для масок в социальных сетях, motion capture, и даже сравнение человеческих эмоций и движений. Обо всем этом читайте в нашем материале

Спутник в небе, нейросеть на земле

Что может увидеть компьютер на космических снимках?

Может ли машина видеть так же, как человек?

Как Тесла с автопилотом распознает объекты на дороге на видео в реальном времени и как это удается смартфону, когда он обводит лица людей в кадре в цветные рамки еще до снимка

Как посмотреть на мир глазами нейросетей

Обученная нейросеть может точно предсказать цену дома по фотографии. Но как она это делает? Мы залезли «под капот» искусственному интеллекту — и разобрались в деталях

Как работают фильтры в Инстаграме

Разбираемся в том, как устроено компьютерное зрение, что такое ядро свертки — и при чем тут фильтры в Инстаграме

Искусственный интеллект смотрит сериалы

Распознавание лиц используют не только в камерах слежения. Можно следить и за героями сериалов! Зачем — читайте в нашей статье!

Нейросеть видит людей сквозь стены

Искусственный интеллект + радиоволны = рентгеновское зрение