Известный специалист по анализу данных Андрей Карпаты (Andrej Karpathy) попытался научить компьютер определять плохие селфи. Для этого он
- Отобрал 5 млн изображений в Instagram по тегу селфи;
- Затем при помощи уже обученной модели компьютерного зрения отобрал 2 млн, которые точно содержат хотя бы одно лицо;
- Создал новую модель на основе сверточной нейронной сети, задача которой — отделять хорошие селфи от плохих.
Чтобы обучиться, модели нужно много размеченных данных — так работают все без исключения нейросети. В данном случае требовалось две коллекции селфи: хорошие и плохие. Карпаты решил сделать обучающую выборку на основе лайков — он поделил авторов селфи на группы с примерно одинаковым числом подписчиков, после чего в каждой группе отсортировал селфи по числу лайков. Фотографии, собравшие больше сердечек, были признаны хорошими.
Судя по результатам, эксперимент удался. Авторы взяли уже обученный алгоритм и подали ему для оценки 50000 других селфи, которые НЕ использовались при обучении. Дальше нейросеть попросили выдать самые плохие селфи из этой новой коллекции — и они действительно оказались ужасны.
А так выглядят хорошие:
По итогам эксперимента автор сформулировал правила хорошего селфи с точки зрения бездушного алгоритма. Нужно:
- Быть девушкой;
- Отводить под лицо примерно треть площади фото;
- Демонстрировать длинные волосы;
- Использовать фильтры. Популярные варианты — ч/б, или наоборот перенасыщенные цветом;
- Добавлять белые рамки.
Не нужно:
- Снимать в темноте;
- Делать голову/лицо слишком большими;
- Делать групповые селфи.