Знали ли вы, что слово «время» в произведениях А. П. Чехова имеет определенные схемы употребления, повторяющиеся от тома к тому? Могли ли подумать о том, что письма к любимой супруге Ольге Леонардовне драматург писал как к чужому человеку? Как связаны стили Чехова-писателя и Чехова-личности? Ответы на эти вопросы читайте в продолжении статьи о семантическом издании Chekhov Digital.
Иллюстратор: Женя Родикова
Для разработки семантического издания и организации корректного по нему поиска были исследованы и размечены особенности входящих в него текстов. Так, для произведений А. П. Чехова размечены такие именованные сущности, как:
Для уточнения этих сущностей с помощью метода когнитивного анализа исследовались ключевые понятия, базовым среди которых является “концепт”. Концепт в когнитивной лингвистике представляет все значения, понятия, представления и ассоциации, которые возникают при осмыслении концепта в сознании человека [5]. Затем рассматривалось, как различные концепты представлены в текстах А. П. Чехова. Для выявления концептов были использованы методы тематического моделирования и корпусного анализа.
С помощью тематического моделирования с различными настройками удалось выявить, что во всех произведениях 1-3 томов встречается тема, которую мы обобщенно назвали «человек». Она включает слова «человек», «время», «лицо» и «любить/любовь», которые могут отражать концепты. Результаты тематического моделирования для 4-6 томов показали немного иные результаты: тема «человек» также встречается во всех произведениях, но ее содержание меняется.
Концепту «время» посвящено довольно мало исследований в чеховских произведениях. Согласно подходу в исследовании концепта «время» в произведениях А. П. Чехова, он представлен в трех интерпретациях:
1. Хронологическое время — точные даты
2. Релятивное время — время, когда события определяются относительно друг друга
3. Эгоцентрическое время — время с точки зрения субъекта [4].
Исследователи утверждают, что хронологическое время не встречается в текстах произведений А. П. Чехова [6], однако есть употребление релятивного времени:
«Это как раз 7-е августа 1887 года, когда было затмение солнца»
«1865 г. Август, 3. У бухгалтера Глоткина опять заболела грудь»
«1867 г. Июнь, 30. В Аравии, пишут, холера. Быть может, в Россию придет, и тогда откроется много вакансий» [8].
Корпусный анализ помог выявить, что в корпусе 1-6 тт. произведений А. П. Чехова часто встречаются лексемы, которые относятся к релятивному времени: день (21 место) и год (29 место).
При анализе контекстов употребления слова «время» были выявлены «схемы» его употребления, которые, на наш взгляд, важно разметить в семантическом издании:
Интересно, что в схемах встречается субъективное время — «время существования, время отсутствия, время жизни», которое можно отнести к эгоцентрическому времени. Для вышеперечисленных интерпретаций времени были подобраны теги для их разметки в проекте.
В литературоведении наиболее распространены исследования, посвященные чеховскому хронотопу. Для хронотопа в целом характерна первичность времени по сравнению с местом [2]. На визуализации, сделанной с помощью Voyant Tools, представлено распределение слов «время» и «место» в 1-6 тт ПССиП. Как можно заметить, «время» является более частотным, и это может указывать на его первичность.
Распределение слов «время» и «место» в первых 6-ти томах произведений А. П. Чехова
В настоящий момент решаются следующие задачи :
1) построить лексико-семантическое поле концепта «время» (проанализировать контексты употребления слова «время» в 7-18 тт., сформировать список гипонимов (слов с узким значением, называющих предмет, свойство, признак как элемент класса), и синонимов слова «время») и разметить соответствующие ему лексемы;
2) с помощью цифровых методов проанализировать категорию «место» в ранних чеховских текстах;
3) разметить «место» и «время» в чеховских текстах, построить визуализацию их пересечений для исследования чеховского хронотопа [3].
Для исследования использовались тексты писем из 8-12 томов писем А. П. Чехова. Временной промежуток с 1899 по 1904 г. выбран не случайно — он полон значимых для писателя событий, таких как знакомство и бракосочетание с О. Л. Книппер, премьера пьес «Три сестры» и «Вишневый сад» и пр. [6]. Исследование проводилось с помощью методов кластеризации и стилометрического анализа данных в stylo.
Кластерный анализ продемонстрировал, что письма Чехова кластеризуются по группам в зависимости от степени близости адресата к автору. В связи с этим были выделены 4 группы адресатов, на которые разделили изучаемые письма — это письма жене (черный кластер), семье (красный кластер), родственникам (синий кластер) и остальным, или «другим людям» (зеленый кластер).
Нажмите, чтобы изучить дендрограмму в высоком разрешении
Стилометрическое исследование проводилось с применением функции rolling.classify(), которая позволяет производить стилистическую атрибуцию произведений. С ее помощью сравнивались тексты пяти томов писем А. П. Чехова с его 14 эпистолярными рассказами, выбранными из ПССиП. Мы предположили, что стиль художественных произведений должен походить на стиль писем «другим» адресатам, поскольку и те, и другие ориентированы на широкую публику. Для проверки предположения каждый из рассказов сопоставлялся с корпусами писем каждой из четырех групп адресатов в рамках каждого года. В результате работы гипотеза подтвердилась: письма другим людям действительно оказались близки по стилю к эпистолярным рассказам.
Стилометрический подход также определил два переломных момента в письмах жене и семье — это 1901 и 1904 гг. Дело в том, что в момент знакомства, а именно в 1899 и следующем 1900 гг., стиль писем А. П. Чехова к О. Л. Книппер напоминает стиль эпистолярных рассказов. Это может свидетельствовать о том, что автор писал жене как литературный деятель. Сопоставление же рассказов с письмами 1901 и 1902 гг. не выявило ни одного фрагмента, сходного со стилем писем жене и членам семьи. Можно предположить, что в этот период времени стиль писем А. П. Чехова близким людям резко изменился, его манера письма как человека семейного разошлась с его манерой письма как писателя.
манера письма Чехова-семьянина разошлась с его манерой письма как писателя
Однако уже в 1903 г. полностью изменился стиль писем семье и начал меняться стиль писем жене, что существенно проявляется в письмах 1904 г.. В это время стиль писем близким снова начинает напоминать стиль эпистолярных рассказов. Такие стилистические вариации могут свидетельствовать о стирании границ между авторским и личностным «Я» писателя в последний год его жизни.
Полученные результаты позволили конкретизировать материал исследования и выявить алгоритм представления текстов на сайте проекта Chekhov Digital. Так, письма рассматривались по календарным годам и по выделенным 4-м группам адресатов. Последнее включено в разметку писем [7].
Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время
Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст
Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно, а через реальные задачи. Объясняем, какие разделы действительно нужны джуну,…