© unsplash.com

Известный специалист по анализу данных Андрей Карпаты (Andrej Karpathy) попытался научить компьютер определять плохие селфи. Для этого он

  • Отобрал 5 млн изображений в Instagram по тегу селфи;
  • Затем при помощи уже обученной модели компьютерного зрения отобрал 2 млн, которые точно содержат хотя бы одно лицо;
  • Создал новую модель на основе сверточной нейронной сети, задача которой — отделять хорошие селфи от плохих.

Чтобы обучиться, модели нужно много размеченных данных — так работают все без исключения нейросети. В данном случае требовалось две коллекции селфи: хорошие и плохие. Карпаты решил сделать обучающую выборку на основе лайков — он поделил авторов селфи на группы с примерно одинаковым числом подписчиков, после чего в каждой группе отсортировал селфи по числу лайков. Фотографии, собравшие больше сердечек, были признаны хорошими.

Судя по результатам, эксперимент удался. Авторы взяли уже обученный алгоритм и подали ему для оценки 50000 других селфи, которые НЕ использовались при обучении. Дальше нейросеть попросили выдать самые плохие селфи из этой новой коллекции — и они действительно оказались ужасны.

А так выглядят хорошие:

По итогам эксперимента автор сформулировал правила хорошего селфи с точки зрения бездушного алгоритма. Нужно:

  • Быть девушкой;
  • Отводить под лицо примерно треть площади фото;
  • Демонстрировать длинные волосы;
  • Использовать фильтры. Популярные варианты — ч/б, или наоборот перенасыщенные цветом;
  • Добавлять белые рамки.

Не нужно:

  • Снимать в темноте;
  • Делать голову/лицо слишком большими;
  • Делать групповые селфи.