Столетие назад французского драматурга XVII века Жана Батиста Мольера постигла участь Шекспира: авторство его пьес было поставлено под сомнение. Подозрения пали на ближайшего собрата Мольера, Пьера Корнеля, который жил и творил в это же время — он стал потенциальном автором мольеровских пьес. Учёные призвали на помощь компьютерную программу, которая способна проанализировать связи между словами в текстах Мольера и Корнеля и с высокой долей вероятности выяснить истину.
Мольер известен миру комедиями «Тартюф» и «Дон Жуан». Именно на них акцентировали внимание в XX веке, изучая стиль писателя. Французский писатель Пьер Луис еще в 1919 году отметил, что Мольер провёл большую часть жизни в гастролях с театром как актёр труппы и начал писать пьесы подозрительно поздно — лишь около 40 лет. Ни одного оригинального текста, подписанного самим Мольером, до сих пор не найдено. Луис предположил, что Корнель и Мольер работали сообща, используя актерскую славу Мольера и талант Корнеля. В начале XXI века ученые отметили сходство в употреблении некоторых слов в пьесах драматургов.
Ф. Кафиеро и Ж.Б. Кэмпс, компьютерные лингвисты из парижского университета PSL (Paris Sciences et Lettres), представили новую технологию для разрешения вопроса об авторстве Мольера. Они собрали тексты комедий Мольера, Корнеля и еще десяти их современников, чтобы проанализировать и сравнить особенности использования языка при помощи статистики.
Программа опиралась не только на частотности слов в пьесах, но и отдельно на служебные слова (предлоги, артикли) — давно известно, что именно в них сохраняются наиболее трудные для имитации свойства индивидуального стиля. Также ученые сопоставляли часто встречающиеся в текстах Корнеля и Мольера грамматические структуры (частотные последовательности разных частей речи), слова в зоне рифмовки, отдельные части слов (аффиксы) и другие лингвистические зацепки.
Полученные данные очевидно подтвердили авторство Мольера. Чем больше текстов анализировала программа, тем понятнее становилось, что язык пьес Мольера и Корнеля совершенно разный, какие бы параметры ни учитывали ученые. Однако работа не является бесспорной. Исследование теряет часть своей убедительности из-за того, что в качестве материала ученые использовали цельные тексты произведений. По опыту современной стилометрии, результаты могли быть более достоверными, если бы исследователи сначала разделили все тексты на отрывки фиксированный длины (скажем, 10 тыс. слов) и сопоставили их. Если бы и в этом случае Корнель и Мольер различались так же хорошо, это бы позволило исключить искажающие факторы, связанные с разным объемом и частью индивидуальных особенностей пьес. Еще один вариант — брать для анализа выбранные фрагменты текстов каждого автора.
Изучить полное описание исследования и составить свое мнение вы можете здесь.