Что такое дипфейк?
Дипфейк (англ. deepfake) — это технология создания реалистичных аудио, фото и видео на основе искусственного интеллекта. Термин объединяет два понятия: глубокое обучение — deep learning и подделка — fake. Для создания дипфейков чаще всего используются генеративно-состязательные нейросети (GAN). Одна часть алгоритма обучается на реальных фотографиях (аудио, видео) определённого объекта и создаёт на их основе новые материалы. Затем она соревнуется со второй частью алгоритма, пока та не перестанет отличать копию от оригинала. Дипфейками называют и сами сгенерированные аудио, фото и видео.
Дипфейки используют в рекламе и кино: например, «омолаживают», «состаривают» и даже «воскрешают» актёров. Применяют технологии и в бизнесе — так компания EY (Ernst & Young) с помощью дипфейков общалась с клиентами. Однако, по данным сервиса «Анкетолог», 42% опрошенных россиян относятся к дипфейкам негативно, 40% — нейтрально и только 16% — положительно. Дело в том, что правдоподобные видео — это также инструмент для финансового мошенничества, политических манипуляций и нарушения авторских прав. Поэтому мы решили узнать, а как ещё можно использовать дипфейки в созидательных целях — в сфере образования.
Создание видеокурса, или Учитель на замену
В 2022 году Институт образования ВШЭ выяснил, что нагрузка преподавателей, работающих в школе по основному месту, составляет в среднем 27 часов аудиторной работы при норме в 18.
Средняя недельная нагрузка преподавателей по данным Института образования Высшей школы экономики. Источник
Нагрузка вузовских преподавателей тоже растёт. В этой ситуации дипфейки могут быть полезны, например, при разработке онлайн-курса. Педагогу достаточно записать только первую лекцию, а остальную информацию, загруженную в программу, озвучит его цифровой двойник — дипфейк. Подобный эксперимент — создание AI-аватара на основе портрета реального человека — уже провели в СПбГУ. Таким образом, учитель сможет потратить время не на съёмки, а на работу над содержанием курса, практическими занятиями или саморазвитие.
Дипфейк-суперстар
Представьте, что сложную или скучную тему вам объясняет рок-звезда, любимый актёр или харизматичный политик. Так с помощью дипфейков можно привлечь внимание аудитории к нетипичному для неё контенту и повысить вовлечённость учеников в образовательный процесс. К примеру, фанаты рэпера Jay-Z услышали монолог Гамлета в исполнении своего кумира (вернее, его цифрового двойника). Большое количество открытых данных в Сети: голос, мимика, жесты, интонация знаменитости — это основа для создания максимально реалистичного дипфейка.
«Воскрешение» исторических личностей
В 2019 году посетителей музея Дали в Санкт-Петербурге, штат Флорида, приветствовал дипфейк художника. 125 роликов воспроизводились в 190 512 возможных комбинациях в зависимости от реакции пользователей. Для реалистичного изображения сюрреалиста рекламное агентство Goodby Silverstein & Partners использовало архивные материалы, интервью, книги и личные письма.
Благодаря дипфейкам «воскрешённых» исторических личностей в школе погружение в культурный контекст будет более полным. Эйнштейн расскажет о теории относительности, а Пётр I — о реформах в Российской империи. Так в 2022 году издательство «Эксмо» провело книжное шоу «Что читать дальше», в котором «Анна Ахматова», «Эдгар По» и «Михаил Булгаков» рассказали о книжных новинках сезона. В «оживших» литераторах угадываются дипфейки и не воспринимаются как полноценные собеседники, зато привлекают внимание аудитории.
Дипфейки оживят и дискуссионные форматы. Например, ученики могут визуализировать спор между западниками и славянофилами или представителями политических партий.
Дипфейк Сальвадора Дали в Dalí Museum (США). Источник
Блок жив: от лица автора
На восприятие художественного произведения влияет и манера его исполнения. Поэтому учителя литературы используют сохранившиеся в аудиозаписи голоса поэтов и писателей на занятиях, чтобы продемонстрировать авторское прочтение. «Распространить» звучание — голос, интонацию, ритм — на другие произведения можно благодаря «голосовому переносу», или «клонированию голоса». Это технология для создания реалистичных аудиозаписей, которые звучат так, будто конкретные люди говорят то, чего они не говорили на самом деле. А вы бы хотели послушать любимые стихотворения Блока, Мандельштама или Маяковского в исполнении их дипфейков?
Визуализация персонажа
Нейросети уже рисовали героев русской классики. В качестве иллюстраций к художественным произведениям можно использовать и дипфейки. Для этого надо загрузить в программу текстовое описание, к примеру, Татьяны Лариной — и наблюдать, как дипфейк читает письмо Онегину. Чем более детальное описание даёт автор, тем реалистичнее визуализация. Важно не упоминать имя персонажа, если алгоритм использует открытые данные из интернета. Иначе он соберёт всю связанную с персонажем информацию, в том числе не соответствующие канону фанфики и любительские арты.
«Обмен телами»
Ещё один вариант применения дипфейков в образовании — «обмен» телами или лицами между учителем и учеником. Так ученик будет слушать лекцию, которую читает его виртуальное тело. Или наоборот: под «маской» учителя он расскажет выученную тему. Этот приём можно использовать для развития эмпатии и улучшения взаимопонимания в классе.
Список нейросетей для создания дипфейков
Бесплатные
Zao
Можно обменяться телами со звёздами, политиками и другими известными личностями; примерить на себя разные образы, подбирая одежду, причёску, макияж и так далее. Приложение быстро обрабатывает контент, однако генерация лица проводится только по азиатскому типу.
FaceSwap
Предназначена для роликов высокого качества, есть мобильная и компьютерная версия, но требуется мощная видеокарта.
DeepFaсeLab
Лучший вариант для создания качественных дипфейков на бесплатной основе, но нужно хотя бы базовое обучение из-за широкого функционала.
Doublicat
Позволяет поместить фото на известный мем или гифку. Программа хорошо копирует мимику оригинала, накладывая её на заданное лицо. Не требует технических знаний.
Сервис FastShot AI
Можно сгенерировать несуществующего персонажа, выбрав позу и другие параметры, либо «наклеить» на них лицо реального человека. Позволяет создать бесплатно три дипфейка, сервис прост и понятен.
Телеграм-бот Avatarify
Генерирует простые дипфейки по фотографии: видеомемы, липсинк с мимикой под песни. Набор звуковых дорожек ограничен, нельзя добавить собственные.
DeepSwapper
Бесплатный сервис, который позволяет заменять лица на фото в неограниченном количестве. Видеозамена лиц анонсирована, но пока не доступна.
Шварцнеггер в роли Системного Блока. Результат «наложения» лица при помощи сервиса DeepSwapper
Платные
Deepfakes web β
Мощный сайт для создания дипфейк-видео. Для обработки достаточно пройти регистрацию и загрузить исходник. Однако на обработку уходит четыре часа. Преимущества в том, что от мощности устройства работа сервиса не зависит — всё генерируется в облаке.
MyHeritage
Сервис-приложение к проекту, позволяющему составлять генеалогическое древо. Функция Deep Nostalgia «оживляет» старые фото после её загрузки на сайт и использования кнопки «анимация».
Synthesia
Генерирует видео высокого качества. Создает реалистичные лица, синхронизацию губ и клонирует голос. Алгоритмы Synthesia требуют сложного обучения.
AI Nero
Позволяет при помощи искусственного интеллекта генерировать аватары, удалять фон и анимировать лица на фотографиях. Есть возможность попробовать бесплатную версию при регистрации и подписке на рассылку.
Системный Блокъ, «оживлённый» при помощи сервиса Nero AI
Итого
Использование новых технологий, в частности дипфейков, порождает новые вопросы. Будут ли ученики доверять виртуальному преподавателю? Насколько этично использовать образы знаменитостей и «присваивать» им то, чего они не говорили? И смогут ли ученики отличить Маяковского на кадрах кинохроники от дипфейка Маяковского? Возможно, распознавание ложной информации и критическое мышление — это главное, чему можно научить в школе при помощи дипфейков.