© Pierre André

Джек Потрошитель — известнейший маньяк в истории человечества и просто синоним серийного убийцы. Менее известна история «писем Джека». В то самое время, пока сыщики безуспешно гонялись за маньяком… в полицию приходили СОТНИ посланий за подписью «Jack the Ripper» с угрозами, обещаниями новых убийств и т.п.

Большинство писем — явная фальшивка. Одного фейкового «потрошителя» даже поймали — это была 21-летняя девушка, впечатленная новостями о «Jack the Ripper» в газетах. Но есть как минимум два письма, которые появились до шумихи в СМИ — и одно из них даже предсказало деталь будущего убийства. Отправитель пообещал отрезать следующей жертве ухо (и послать в полицию) — и ухо действительно было отрезано (хотя и не послано). Следом — еще до какой-либо огласки в СМИ — была отправлена открытка, автор которой брал ответственность за новое убийство и ИЗВИНЯЛСЯ за то, что не отправил ухо. И только потом, когда эти два послания опубликовали газеты, хлынула лавина поддельных писем.

Одно из двух писем, полученных до шумихи в СМИ

130 лет спустя ученый из Манчестера решил сравнить «письма Джека Потрошителя» статистически. Он проанализировал наиболее частотные цепочки (n-граммы) слов в этих текстах, а также характерные для них синтаксические структуры — и автоматически сгруппировал все письма по «стилистическому сходству».

Кластеризация (автоматическая группировка) писем по стилистическому сходству

Статистика показала, что те самые два послания написаны одним человеком — в них встречаются характерные обороты и синтаксис, которые стилизаторам повторить не удалось (несмотря на явные попытки замаскироваться под «Потрошителя»). В частности, там нашлась уникальная N-грамма длиной в 4 слова, которая не встречается более нигде.

Но самое интересное, что нашлось еще третье письмо, схожее с этими двумя — и оказывается, оно тоже послано до основной волны публикаций в газетах! Так благодаря статистическим методам пополнился список писем «настоящего Джека Потрошителя».