Когда у канадца Шона Пауэра украли MacBook, он с помощью программы для отслеживания получил фото человека, который использовал его устройство. Пауэр написал об этом в Twitter (сейчас X), и интернет-детективы, активно включившись в расследование, установили местонахождение вора. Они поговорили с ним и … ноутбук вернулся к хозяину без обращения в полицию. Это лишь один из сотен случаев, когда обычные пользователи, блогеры и гражданские активисты помогают раскрыть преступление с помощью технологий. Рассказываем, как цифровые инструменты от карт Google до анализа метаданных в соцсетях меняют криминалистику.
Иллюстрация: Надежда Луценко
Интернет-ищейки (internet sleuths) — это сообщества энтузиастов, которые используют цифровые инструменты для расследования преступлений, поиска пропавших людей и разоблачения мошенников. Называть их могут по-разному — и «онлайн-сыщики», и «интернет-детективы», но суть одна: простые пользователи, не имеющие отношения к органам правопорядка, проводят собственные расследования в сети. Они кропотливо собирают всю информацию в интернете и на ее основе делают выводы. Впрочем, не всегда верные.
В Китае этот феномен известен под интригующим названием «поиск человеческой плоти» (human flesh search engine), когда тысячи пользователей скоординировано ищут информацию о человеке через соцсети и блоги. Учитывая, что в Китае доступ к интернету есть у 1,11 млрд человек, информация находится очень быстро. Например, в случае со школьницей, избившей одноклассницу, китайские интернет-детективы быстро установили имя и адрес виновной, и через неделю толпа собралась перед школой, где все произошло. На место происшествия даже пришлось вызвать полицию.
Крупнейшее англоязычное сообщество интернет-ищеек — форум Websleuths — было создано в 1999 году для обсуждения нераскрытых дел. На сегодня количество eго зарегистрированных пользователей превысило 240 тысяч человек. Исследователи отмечают, что подобные инициативы могут быть полезны полиции. Например, волонтеры сопоставляют записи с камер наблюдения с фотографиями из соцсетей или помогают расследовать случаи жестокого обращения с животными. Однако иногда это перерастает в кибертравлю и самосуд, из-за чего власти некоторых стран, в том числе и Китая, пытаются ограничить такую деятельность.
Посмотрим, с помощью каких технологий обычные пользователи могут помочь в раскрытии преступлений.
Google Maps и Google Earth — это картографические сервисы Google, которые выполняют схожие задачи, но разными способами. Google Maps предлагает интерактивные карты и панорамы Street View, а Google Earth — детальные спутниковые снимки с возможностью анализировать изменения местности за разные годы.
Для расследования интернет-ищейки активно используют:
Полиция тоже использует эти сервисы, чтобы получить больше информации — например, они ищут плантации конопли через аномалии на спутниковых картах. Так, швейцарские полицейские обнаружили плантацию, когда с помощью Google Earth искали на карте страны дома двух фермеров, состоящих, как они предполагали, в преступной группе.
Картографические сервисы помогают в расследовании и более серьезных преступлений. Для полицейских из Испании важной зацепкой стал кадр с Google Street View. Они расследовали исчезновение человека и обратили внимание на Google-снимки около дома подозреваемых. И на них обнаружили любопытное.
Тот самый снимок: на одном из кадров Google Street View мужчина укладывает в багажник нечто, завернутое в пакеты. Источник
Не сообщается, как полиция получила конкретно это изображение: нашла случайно или оно были предоставлено компанией Google по запросу следствия. Этот снимок стал одной из ключевых улик. Позже полиция обнаружила останки пропавшего, закопанные на местном кладбище в таком же белом пакете, как и на снимке.
Для самостоятельного изучения картографических сервисов Google важно знать следующее:
Метаданные сами по себе не являются технологией — это структурированные данные, описывающие другие данные. Они нужны для классификации информации, чтобы упростить поиск и управление ею.
К метаданным относятся:
Для поиска информации, привязанной к определенной местности, особенно важен геотегинг. Он позволяет пользователям добавлять местоположение к фотографиям и видео для размещения в соцсетях. Основа технологии — GPS, встроенная в смартфоны, которая определяет координаты через спутниковую связь. Когда GPS недоступна, устройства используют информацию от Wi-Fi или сотовых сетей для определения местоположения.
Часто именно геотеггинг становится одной из важнейших зацепок в расследовании. Яркий пример — дело Габи Петито, в котором интернет-сыщики и полиция опирались на данные социальных сетей.
В 2021 году блогер Габи Петито отправилась в путешествие по национальным паркам США вместе с своим женихом Брайаном Ландри. Пара делилась фотографиями и видео в Instagram* и Youtube. Но обратно домой из поездки вернулся один Ландри. Начались масштабные поиски девушки. Фотографии и видео из соцсетей Габи включали геотеги, даты создания, технические параметры устройств. Эта информация помогла реконструировать маршрут поездки через несколько национальных парков, где без точных координат найти следы было почти невозможно.
В роли цифровых ищеек выступили обычные пользователи TikTok, YouTube и Instagram*. Они изучали фото, геотеги и даже плейлисты Габи в Spotify, выискивая несостыковки в маршруте, а также проверяли алиби жениха по временным меткам. Они также публиковали призывы найти свидетелей. На один из таких призывов откликнулась другая путешественница. Она опубликовала видео, на котором был запечатлен фургон пары в интересующую всех дату.
В кадр попал белый фургон, припаркованный в парке Гранд-Титон около шести вечера. Задняя дверь фургона была закрыта, рядом находились шляпа и сандалии – мелкие детали, которые сразу навели на мысль о пропавшей. Эти же вещи мелькали на фото у Габи в Instagram*. Источник
На следующий день после получения ролика (и спустя восемь дней поисков) ФБР нашло останки девушки недалеко от того места, где находился фургон на видео. Обвинения в смерти Габи были предъявлены ее жениху.
Технология распознавания лиц с помощью нейросетей используется для определения или подтверждения личности. Сначала нейросеть находит лицо в кадре, затем определяет его ключевые черты и создает «цифровой отпечаток» лица в виде набора чисел. После этого «отпечаток» сравнивается с базой данных лиц для поиска совпадений.
Один из сервисов, который использует такую технологию для поиска по изображениям — онлайн-поисковик PimEyes. С помощью искусственного интеллекта приложение ищет в интернете изображения, похожие на исходную фотографию. А еще PimEyes позволяет обнаружить случаи публикации фотографий без согласия автора. Но чаще всего его используют, чтобы найти доступные изображения человека в сети.
Есть и другие, менее известные и специализированные сервисы. Например, правоохранительные органы США применяют сервис Clearview AI. Его сложные алгоритмы на основе ИИ анализируют изображения, однако для распознавания лиц Clearview AI (как и базовые сервисы) использует общедоступные интернет-источники. Программное обеспечение Clearview AI индексирует около 10 миллиардов изображений, взятых из Facebook*, Instagram*, LinkedIn, X и других соцсетей.
Сервисы распознавания лиц также помогают раскрывать преступления. В феврале 2024 года немецкие власти объявили об аресте 65-летней Даниэлы Клетте, бывшего члена организации «Фракция Красной Армии» (RAF). Эта леворадикальная террористическая организация действовала в Германии в 1968–1998 годах. На территории страны они создавали «условия для глобальной революции»: грабили банки, нападали на чиновников, взрывали учреждения. Весной 1998 года RAF объявила о роспуске, но поиски ее участников продолжились и после этого.
За год до ареста Даниэлы Клетте журналисты немецкого подкаста Legion. Most Wanted, рассказывая о преступлениях RAF, извлекли фотографию Клетте из объявления о розыске и отправили ее в онлайн-поисковик PimEyes. В результатах они обнаружили изображения похожей пожилой женщины, которая до пандемии вела активную социальную жизнь в Берлине.
Даниела Клетте, вторая справа — участница фестиваля культур в Берлине в 2009 году, улыбается и разбрасывает лепестки. Эти фотографии из «мирной» жизни и сервис Pimeyes выдали ее местонахождение. Источник
На сходство изображений обратил внимание журналист-расследователь Майкл Колборн. Он решил помочь подкастерам и проверил найденные фотографии предполагаемой преступницы в другом, более сложном инструменте на основе ИИ — Amazon Rekognition. Этот сервис работает иначе, чем Pimeyes: он сравнивает предложенные для обработки изображения между собой и выставляет им проценты сходства (score). В случае с фотографиями Клетте, из 4 сравниваемых пар Amazon Rekognition подтвердил сходство между 3 парами — от 88% до 99%.
Команда подкаста сообщила властям о своих находках. Позже полиция заявила, что им удалось продвинуться в расследовании благодаря информации, полученной от общественности.
Веб-скрейпинг (скрепинг или скрапинг, от англ. web scraping) — это технология извлечения данных с веб-сайтов. Делать это можно с помощью специальных программ — ботов веб-скрейперов.
Упрощенно процесс состоит из двух основных этапов: поиска необходимых сведений и их структурирования. Сначала нужно составить список сайтов, на которые зайдет бот, и решить, что именно важно извлечь. Бот заходит на страницы, загружает HTML-код и извлекает эту информацию. На последнем этапе программа собирает сведения в виде таблицы (CSV или Excel), базы данных или в формате JSON.
Сведения с помощью веб-скрейпинга собирают для самых разных целей: например, для отслеживания цен у конкурентов, аналитики, мониторинга новостей, объявлений. Эту информацию продают или используют для развития бизнеса. Также на этих данных обучают нейронные сети. Веб-скрейпинг важен и для выявления потенциальных уязвимостей на сайтах, а также для сбора данных о деятельности киберпреступников.
Например, скрейпинг в даркнете помогает понять, как устроены нелегальные рынки: какие товары и услуги там продаются, как меняется их ассортимент, кто и откуда ведет продажи, какие есть поведенческие паттерны у продавцов и покупателей. Анализ транзакций и отзывов на теневых площадках позволяет установить связи между участниками сети. Без веб-скрейпинга собрать такую информацию очень сложно.
Веб-скрейпинг доступен не только исследователям и профессиональным журналистам вроде Bellingcat (внесено Минюстом в реестр СМИ-иноагентов). Сыщики-любители тоже умеют веб-скрейпить, хотя и не используют сложные инструменты.
Во время захвата Капитолия в 2021 году, когда погибли пять человек, были ранены десятки полицейских, а также разграблено Национальное законодательное собрание Америки, в открытый доступ попали множество постов и видео с места событий от самих участников беспорядков.
На это сразу обратили внимание профессиональные расследователи. Они сохраняли выложенные материалы, так как были уверены, что люди, причастные к штурму, вскоре возьмутся за удаление контента. Один из крупных архивов удалось собрать простым пользователям Reddit. Они сохранили в треде, посвященном захвату, ссылки на видео и позже перезалили их на облачный сервис MEGA. Журналисты сами призывали пользователей загружать фото и видео штурма в специальную папку, а также создали онлайн-форму с подсказками, какие материалы действительно важны. Для сохранения видеозаписей с личных страниц использовались такие инструменты как, например, Twitter Video Downloader.
Видеоклипы со штурма Капитолия команда Bellingcat (внесены Минюстом в реестр СМИ-иноагентов) смогла сохранить в том числе с помощью энтузиастов. Источник
Журналист Джанкарло Фиорелла прокомментировал помощь интернет-добровольцев так: «Я работаю в Bellingcat уже два года, и впервые за это время вижу настолько сильную вовлеченность простых людей, присылающих материалы с вопросом: «Чем я могу помочь?». Да, есть код Python и продвинутые инструменты распознавания лиц. Но если вы просто знаете, как скопировать ссылки и творчески подходите к подбору ключевых слов (тэгов), которые люди, скорее всего, будут использовать, когда вокруг них происходят исторические события, то вы сможете выполнять подобную работу сами или помогать другим».
Технологии превратили интернет-сообщества в еще один, хотя и официально непризнанный, инструмент правосудия. Сейчас, когда скриншот или метка на карте могут стать решающими уликами, для расследования важны не только полномочия и доступ к закрытым базам. Важными становятся умения искать по открытым источникам, пользоваться инструментами и собирать разрозненные цифровые следы в реальные доказательства.
*принадлежит компании «Meta», признанной экстремистской организацией и запрещенной в РФ
Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время
Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст
Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно, а через реальные задачи. Объясняем, какие разделы действительно нужны джуну,…