Именованные сущности в произведениях А. П. Чехова
Для разработки семантического издания и организации корректного по нему поиска были исследованы и размечены особенности входящих в него текстов. Так, для произведений А. П. Чехова размечены такие именованные сущности, как:
- имена, названия;
- даты;
- времена года;
- цвета;
- свойства, состояния и события;
- природные явления; социальный статус;
- профессия;
- животные, растения.
Для уточнения этих сущностей с помощью метода когнитивного анализа исследовались ключевые понятия, базовым среди которых является “концепт”. Концепт в когнитивной лингвистике представляет все значения, понятия, представления и ассоциации, которые возникают при осмыслении концепта в сознании человека [5]. Затем рассматривалось, как различные концепты представлены в текстах А. П. Чехова. Для выявления концептов были использованы методы тематического моделирования и корпусного анализа.
С помощью тематического моделирования с различными настройками удалось выявить, что во всех произведениях 1-3 томов встречается тема, которую мы обобщенно назвали «человек». Она включает слова «человек», «время», «лицо» и «любить/любовь», которые могут отражать концепты. Результаты тематического моделирования для 4-6 томов показали немного иные результаты: тема «человек» также встречается во всех произведениях, но ее содержание меняется.
Ощущаем ход «времени»
Концепту «время» посвящено довольно мало исследований в чеховских произведениях. Согласно подходу в исследовании концепта «время» в произведениях А. П. Чехова, он представлен в трех интерпретациях:
1. Хронологическое время — точные даты
2. Релятивное время — время, когда события определяются относительно друг друга
3. Эгоцентрическое время — время с точки зрения субъекта [4].
Исследователи утверждают, что хронологическое время не встречается в текстах произведений А. П. Чехова [6], однако есть употребление релятивного времени:
«Это как раз 7-е августа 1887 года, когда было затмение солнца»
«1865 г. Август, 3. У бухгалтера Глоткина опять заболела грудь»
«1867 г. Июнь, 30. В Аравии, пишут, холера. Быть может, в Россию придет, и тогда откроется много вакансий» [8].
Корпусный анализ помог выявить, что в корпусе 1-6 тт. произведений А. П. Чехова часто встречаются лексемы, которые относятся к релятивному времени: день (21 место) и год (29 место).
При анализе контекстов употребления слова «время» были выявлены «схемы» его употребления, которые, на наш взгляд, важно разметить в семантическом издании:
Интересно, что в схемах встречается субъективное время — «время существования, время отсутствия, время жизни», которое можно отнести к эгоцентрическому времени. Для вышеперечисленных интерпретаций времени были подобраны теги для их разметки в проекте.
В литературоведении наиболее распространены исследования, посвященные чеховскому хронотопу. Для хронотопа в целом характерна первичность времени по сравнению с местом [2]. На визуализации, сделанной с помощью Voyant Tools, представлено распределение слов «время» и «место» в 1-6 тт ПССиП. Как можно заметить, «время» является более частотным, и это может указывать на его первичность.
Распределение слов «время» и «место» в первых 6-ти томах произведений А. П. Чехова
В настоящий момент решаются следующие задачи :
1) построить лексико-семантическое поле концепта «время» (проанализировать контексты употребления слова «время» в 7-18 тт., сформировать список гипонимов (слов с узким значением, называющих предмет, свойство, признак как элемент класса), и синонимов слова «время») и разметить соответствующие ему лексемы;
2) с помощью цифровых методов проанализировать категорию «место» в ранних чеховских текстах;
3) разметить «место» и «время» в чеховских текстах, построить визуализацию их пересечений для исследования чеховского хронотопа [3].
Чехов-адресант: писатель и личность
Для исследования использовались тексты писем из 8-12 томов писем А. П. Чехова. Временной промежуток с 1899 по 1904 г. выбран не случайно — он полон значимых для писателя событий, таких как знакомство и бракосочетание с О. Л. Книппер, премьера пьес «Три сестры» и «Вишневый сад» и пр. [6]. Исследование проводилось с помощью методов кластеризации и стилометрического анализа данных в stylo.
Кластерный анализ продемонстрировал, что письма Чехова кластеризуются по группам в зависимости от степени близости адресата к автору. В связи с этим были выделены 4 группы адресатов, на которые разделили изучаемые письма — это письма жене (черный кластер), семье (красный кластер), родственникам (синий кластер) и остальным, или «другим людям» (зеленый кластер).
Нажмите, чтобы изучить дендрограмму в высоком разрешении
Стилометрическое исследование проводилось с применением функции rolling.classify(), которая позволяет производить стилистическую атрибуцию произведений. С ее помощью сравнивались тексты пяти томов писем А. П. Чехова с его 14 эпистолярными рассказами, выбранными из ПССиП. Мы предположили, что стиль художественных произведений должен походить на стиль писем «другим» адресатам, поскольку и те, и другие ориентированы на широкую публику. Для проверки предположения каждый из рассказов сопоставлялся с корпусами писем каждой из четырех групп адресатов в рамках каждого года. В результате работы гипотеза подтвердилась: письма другим людям действительно оказались близки по стилю к эпистолярным рассказам.
Так что же происходит с письмами жене?
Стилометрический подход также определил два переломных момента в письмах жене и семье — это 1901 и 1904 гг. Дело в том, что в момент знакомства, а именно в 1899 и следующем 1900 гг., стиль писем А. П. Чехова к О. Л. Книппер напоминает стиль эпистолярных рассказов. Это может свидетельствовать о том, что автор писал жене как литературный деятель. Сопоставление же рассказов с письмами 1901 и 1902 гг. не выявило ни одного фрагмента, сходного со стилем писем жене и членам семьи. Можно предположить, что в этот период времени стиль писем А. П. Чехова близким людям резко изменился, его манера письма как человека семейного разошлась с его манерой письма как писателя.
манера письма Чехова-семьянина разошлась с его манерой письма как писателя
Однако уже в 1903 г. полностью изменился стиль писем семье и начал меняться стиль писем жене, что существенно проявляется в письмах 1904 г.. В это время стиль писем близким снова начинает напоминать стиль эпистолярных рассказов. Такие стилистические вариации могут свидетельствовать о стирании границ между авторским и личностным «Я» писателя в последний год его жизни.
Полученные результаты позволили конкретизировать материал исследования и выявить алгоритм представления текстов на сайте проекта Chekhov Digital. Так, письма рассматривались по календарным годам и по выделенным 4-м группам адресатов. Последнее включено в разметку писем [7].
Источники
- Chekhov Digital
- Бахтин М. М. Вопросы литературы и эстетики. М.: Худож. лит. 1975. http://philologos.narod.ru/bakhtin/hronotop/hronmain.html
- Кудин А. М. Цифровое издание текстов А. П. Чехова: проблема семантической разметки: выпускная квалификационная работа магистра / А. М. Кудин. Ростов-н/Д.: 2021. 99 с.
- Маслакова Е. В. Языковые средства художественной концептуализации времени в произведениях А.П. Чехова / Е. В. Маслакова // Известия вузов. Северо-Кавказский регион. Серия: Общественные науки. 2010. №1. https://cyberleninka.ru/article/n/yazykovye-sredstva-hudozhestvennoy-kontseptualizatsii-vremeni-v-proizvedeniyah-a-p-chehova
- Посиделова В. В. Семантико-когнитивный подход к концептосфере русского языка / В. В. Посиделова // Философия права. 2014. №1 (62). С. 34-37.
- Хронология жизни Чехова
- Щербак А. С. Психолингвистический анализ эпистолярного дискурса А. П. Чехова (на материале цифрового корпуса писем): выпускная квалификационная работа магистра / А. С. Щербак. Ростов-н/Д.: 2022. 158 с.
- ЭНИ «Чехов»