От химии к цифре
Стеганография — это наука о том, как спрятать какую-либо информацию в другой информации. Самый понятный пример — можно написать письмо обычными чернилами, а секретные данные записать между строк симпатическими, проявляющимися, например, при нагреве. В данном случае видимый текст письма — это контейнер, то есть информация, предназначенная для скрытия сообщения. Невидимый текст письма — само сообщение, нагрев — ключ, с помощью которого можно узнать о наличии сообщения и его содержании.
Симпатические чернила изобрели еще древние греки, но в цифровую эпоху стеганография не ограничивается лишь «химическими» методами. В современной стеганографии в качестве контейнера используют мультимедийные данные в цифровом виде, изначально имеющие аналоговую природу (картинки, видео, звук).
Как это работает?
Цифровая стеганография основана на избыточности информации. Она проявляется в том, что для однозначного понимания сообщения человеку нужно гораздо меньше информации, чем в этом сообщении содержится. Например, можно однозначно прочитать текст, из которого убраны гласные, х_ть и н_ б_з тр_д_. Эта избыточность характерна и для цифровых объектов, заключается она в битах. Иными словами, часть бит в изображении JPEG или аудиодорожке MP3 может быть удалена или изменена незаметно для человеческих органов чувств. Значит, без специальных средств человек не заметит разницу между первоначальным сообщением и сообщением с удаленными или измененными кусочками информации.
Наиболее распространенный и понятный метод стеганографии — это LSB-метод, или замена менее значимых бит (Least Significant Bit).
Для примера представим картинку. Для компьютера это набор из сотен тысяч пикселей. В каждом пикселе содержится информация о его цвете. В формате RGB эта информация кодируется в 24 бита. Последние 2–3 бита изображения несут в себе меньше всего данных и визуально заметить в них изменения практически невозможно. Следовательно, в последние биты некоторых или даже всех пикселей можно записать секретное сообщение. А поскольку пикселей в картинке много, сообщение может быть достаточно длинным.
По такому же принципу можно тайно передать послание в аудиофайлах. На практике это работает примерно так:
Исходный файл:
(00100111 11101001 11001000)
(00100111 11001000 11101001)
(11001000 00100111 11101001)
Сообщение: 01000001 (число 65):
(00100110 11101001 11001000)
(00100110 11001000 11101000)
(11001000 00100111 11101001)
Полезные инструменты
Чтобы не подставлять нужные значения битов вручную, программисты создали множество утилит для стеганографии, которыми может пользоваться каждый. Например, DeEgger Embedder позволяет прятать сообщения в контейнерах формата PNG, JPG, AVI и MP3 и обратно извлекать их. Ниже можно увидеть результат работы этой программы: слева размещен «пустой» контейнер, без скрытых данных; справа — с первыми тремя главами «Анны Карениной».
Разницу можно увидеть только при анализе шумов на изображениях. Изменение последних битов делает картинку более «шумной»:
Однако существенный минус многих таких утилит состоит в том, что скрываемые файлы записываются в конец файла-контейнера. И если знать, что и где искать, наличие таких сообщений довольно легко обнаружить.
Более продвинутая программа, подходящая для шифрования данных в аудиофайлах, называется DeepSound. Если вы смотрели сериал Mr. Robot, то наверняка видели ее: именно с ее помощью главный герой прятал данные на CD-дисках. Эта программа «размазывает» биты скрытого сообщения по всему аудиофайлу, при этом сохраняя его размер, поэтому такую стеганографию выявить гораздо сложнее.
Зачем?
С помощью стеганографии можно достигать разных целей: скрывать любовную переписку от ревнивой жены, защищать авторское право и интеллектуальную собственность, бороться с цензурой. Некоторые сервисы специально создаются для того, чтобы позволить людям хоть как-то обходить цензуру.
Таким образом, картины Серова или сонаты Бетховена могут стать инструментом для передачи сообщений, из-за которых, как вам кажется, вы можете привлечь к себе ненужное внимание государства. Со стороны это будет выглядеть как обсуждение произведений искусства. И только вы знаете, что можно увидеть или услышать по ту сторону бит.
Источники:
- Кулешов С.В., Зайцева А.А., Аксенов А.Ю. Информационная избыточность в мультимедийных данных. Труды СПИИРАН. Вып. 4(23). 2012.
- О. В. Генне. Основные положение стеганографии. Защита информации. Конфидент. №3, 2000.