В последние годы в Испании был зафиксирован рост преступлений, связанных с ложными обвинениями. Поскольку это явление создает лишнюю нагрузку на правоохранительные органы, с ним пытаются бороться самыми разными способами. Группа исследователей, в которую вошли специалисты из Мадридского университета Комплутенсе, Мадридского университета имени Карла III, Римского университета Сапиенца и Министерства внутренних дел Испании, разработала для этой цели систему VeriPol, способную проанализировать заявление о преступлении и с высокой степенью точности определить, является ли оно правдой.
«В частности, мы создали VeriPol для краж, хищений, ограблений, сопряженных с насилием и запугиванием свидетелей, поскольку в последние годы возросло число ложных обвинений именно в данной категории преступлений», — уточняет Федерико Либераторе, один из исследователей.
VeriPol представляет собой нейросеть, которую обучают на двух корпусах заявлений о кражах — истинных и ложных. Она выявляет наиболее характерные для каждого из них особенности построения фразы. В 2015 году, например, системе предъявили 1122 заявления (534 истинных и 588 ложных) из уже закрытых дел — только тех, в которых либо преступник был задержан, либо заявитель признался во лжи.
Идея принадлежит инспектору Мигелю Камачо, специалисту в области математики и статистики. Еще в 2012 году он предположил, что искусственный интеллект можно использовать для автоматического выявления маркеров, указывающих на истинность или ложность утверждений. Хотя каждый считает свою ложь уникальной, на самом деле это не так — и нейросеть с легкостью найдет в ложных обвинениях соответствующие паттерны.
Правдивые показания зачастую изобилуют подробностями, тогда как лгун старается их избежать, чтобы потом в них не запутаться. Поэтому одним из наиболее ярких маркеров лжи VeriPol считает дату. Лгун скорее скажет, что преступление имело место «несколько дней назад», «в какой-то день» или «два или три дня назад», а не «вчера» или «в четверг». Заявление с большой долей вероятности оказывается ложью, если заявитель утверждает, что на него напали «сзади» или «со спины» — так он избавляет себя от необходимости описывать детали. Нейросеть выяснила, что выдуманные нападения чаще всего совершают люди «в черном» и что в ложных показаниях чаще, чем в правдивых, встречаются слова «надежный», «адвокат», «мобильный», «айфон», «компания» или «контракт».
VeriPol анализирует также наиболее популярные грамматические и синтаксические средства. Личные и указательные местоимения, а также глаголы «быть» и «находиться» чаще появляются в правдивых показаниях. В этом случае заявитель охотнее рассказывает о том, как произошло преступление, а также говорит о своем «взаимодействии» с преступником. В ложных свидетельствах, наоборот, преобладает неопределенность. Фразы с наречием «едва» — к примеру, «едва видел» или «едва помню», — да и отрицания вроде «не слышал», «не узнал», по статистике, часто указывают на ложь.
Конечно, все приведенные языковые средства только в определенном контексте могут указывать на вероятность лжи. Никто не обвинит человека, который правда не запомнил или не рассмотрел нападавшего. Поэтому VeriPol— это всего лишь один из инструментов в распоряжении правоохранительных органов. «Система напоминает старика-полицейского с колоссальным опытом работы, который просто помогает полиции, указывая, что ему кажется правдой, а что — ложью», — говорит исследователь Лара Кихано.
Проект стартовал в 2014 году, а летом 2017-го VeriPol протестировали сотрудники Национального полицейского корпуса Испании. Тогда было установлено, что система с 91-процентной точностью способна распознать ложь, тогда как эксперту это удается в 75% случаев.
Это первая подобная система, получившая от властей официальное разрешение на использование. В ближайшие месяцы VeriPol планируют внедрить на полицейских участках по всей Испании, потом ее будут адаптировать для других преступлений.