Читать нас в Telegram
Иллюстратор: Александра Комарова

Что такое Sketch Engine?

Sketch Engine — инструмент для корпусных исследований, таких, которые выполняются на материале корпусов, больших электронных коллекций текстов. Sketch Engine может быть полезен не только исследователям-лингвистам и филологам, но и лексикографам, переводчикам и тем, кто изучает и преподает язык.

Почему такое название — «скетч»? Скетч — это быстрый набросок, пробная версия рисунка. Очень простой и незавершенный, скетч, тем не менее, передает общий замысел рисунка: мы уже понимаем, что хочет изобразить художник. Так и Sketch Engine позволяет создать «скетч», набросок, образ отдельного слова, текста или даже целого корпуса.

С его помощью мы можем например, понять, в каких контекстах встречается интересующее нас слово, какие у интересующего нас текста или корпуса ключевые слова, а затем уже интерпретировать и использовать полученные результаты. Интерфейс Sketch Engine дает возможность работать с 520 корпусами 95 языков или создавать собственные корпуса. Для работы понадобится только браузер, Sketch Engine — онлайн-проект.

Sketch Engine — коммерческий проект, но у него есть пробная бесплатная подписка, которая действует 30 дней (и ей несложно воспользоваться несколько раз — достаточно зарегистрироваться на новую почту). В бесплатной подписке доступны только 250 загруженных корпусов, а объем пользовательского корпуса ограничен миллионом слов. Для работы с собственным корпусом можно скачать полностью бесплатный инструмент NoSketchEngine (понадобятся навыки программирования), а корпуса некоторых языков находятся в свободном доступе, но функционал бесплатных сервисов ограничен.

Некоторые бесплатные корпуса (их общее название Araneum)

Чтобы создать свой корпус и работать с ним, мы воспользовались бесплатной онлайн-версией проекта. Тексты Владимира Маяковского мы скачали из поэтического подкорпуса НКРЯ.

После того как мы зарегистрировали пробный аккаунт, появилась рабочая область, где нам предлагается выбрать для работы уже существующий корпус или создать свой. Чтобы создать свой корпус, нужно выбрать вкладку «My corpora» и нажать «New corpus».

Затем нужно придумать название, выбрать язык и наконец загрузить тексты. Совет: сразу много текстов удобно загружать архивом в zip-формате.

Немного информации о корпусе, который у нас получился:

Он поэт — этим и интересен

Маяковский — одна из ярчайших фигур Серебряного века. В советских учебниках литературы писали, что он один из первых поэтов начала ХХ века, который «отдал свой могучий талант революционному обновлению жизни, начатому Великим Октябрем». Сегодня исследователи его творчества делятся на два лагеря: одни утверждают, что Маяковский — прежде всего поэт-агитатор, другие видят в нём лирика-одиночку.

Многие маяковеды разделяют творчество Маяковского на «до» и «после» Октябрьской Революции, объясняя это тем, что после прихода к власти большевиков он стал «официальным» поэтом, а задача его творчества кардинально изменилась: теперь он не оппозиционный и опасный агитатор, пагубно влияющий на сознание масс, а поэт нового строя, который должен его «продвигать». Два образа, довольно конфликтные между собой, как-то уживаются в Маяковском. Поэт-шестидесятник Евгений Евтушенко назвал это феноменом «огромности и беззащитности».

А мы попробуем при помощи Sketch Engine провести собственное «расследование», чтобы выяснить, какой был лирический герой Маяковского — главный ключ к пониманию поэзии любого автора, и какой лирический герой чаще появляется в творчестве Маяковского: поэт-агитатор на пароходе современности или отвергнутый и непонятый всеми романтик, каким автор предстает перед нами в своей любовной лирике.

Человек Маяковского

Мы разбили свой корпус на подкорпусы «до» и «после» Революции. Это позволит нам, например, оценить частоту появления одного и того же слова в разных подкорпусах или сравнить ключевые слова разных подкорпусов. Для этого мы заранее создали два .zip архива из текстов соответствующих годов, загрузили их в корпус, а потом уже создали подкорпусы.

Вот так выглядит меню функций Sketch Engine:

Инструменты Sketch Engine

Воспользуемся инструментом «Word Sketch». Он ищет слова и словосочетания, которые задает пользователь, оценивает частоту их появления и показывает, в каких контекстах встречаются заданные пользователем слова в корпусе. Например, мы хотим узнать, как меняется образ человека в стихотворениях Маяковского: задаем лемму «Человек» и запускаем программу для подкорпуса «До революции». Аналогично поступаем с подкорпусом «После революции».

1 — Скетч слова «человек» в подкорпусе «До революции»
2 — Скетч слова «человек» в подкорпусе «После революции»

Перед нами результаты частотного анализа слова «человек» в поэзии Маяковского. Контекстные слова делятся на группы в зависимости от типа связи с указанным словом: в первой колонке глаголы, для которых слово «человек» — субъект действия, во второй — прилагательные и т.д.

Следующим этапом мы их должны интерпретировать. Выберем для этого первую колонку «subject_of». Что делает человек в стихах Маяковского, написанных до революции? Ничего особенного: он рождается, растет, ждет чего-то, дичает и в итоге исчезает. А вот после революции он деятелен и полон энергии: ходит, ездит, прыгает, готов ринуться куда-то… в общем, живет полной жизнью.

Это же можно подтвердить инструментом «Word Sketch Difference» для «Subcorpora»: в режиме «Subcorpora» он предназначен для сравнивания одной и той же леммы в разных подкорпусах. Мы сравнили, в каких контекстах встречается слово «Человек», и получили такую визуализацию:

Если мы предположим, что главным героем поэзии Маяковского был простой рабочий, представитель пролетариата — основной движущей силы революции, то такие перемены могли быть связаны с изменением социального положения героя, установлением новой власти и радужными перспективами социализма. Стоит также принять во внимание, что первые послереволюционные годы Маяковский активно работал в «окнах сатиры РОСТА», по факту исполняя госзаказ.

Но образ человека не исчерпывается действиями. Воспользуемся инструментом «Concordance» (конкорданс): он позволяет увидеть расширенный контекст слова «Человек», то есть, не просто сочетания слов, а целые предложения, в которых встречается указанное слово.

При анализе полученных данных увидим, что до 1917 года в творчестве Маяковского много восклицаний, побудительных предложений, есть призыв к действию («Эй, человек, землю саму зови на вальс!» или «Люди, слушайте, вылезьте из оков!»), а вот после 1917 года предложения утвердительные, в них прославляется человек, его всесилие и могущество («миром правит сам человек», «Человеку — сажень», «Люди двигают горами» или «Люди летают по небесам»).

Казалось бы, еще одно подтверждение в пользу теории о Маяковском как исключительно поэте, славящем новое государство и новых людей, но есть одна небольшая деталь. Почему так мало призыва брать новые высоты в послереволюционном периоде творчества Маяковского? Неужели всего достигли и не к чему больше стремиться? А как же светлое коммунистическое будущее, достичь которого можно только упорным трудом, в том числе, и над собой?

Контексты, в которых слово «человек» встречается до революции

После революции, что наглядно показывает нам «Concordance», в творчестве Маяковского очень часто встречается образ «искусственных людей»: «Этими — и добрыми, и кобры лютей, Союз до краев загружен». Они — порождение бюрократической системы, которая рождается вместе с молодым Советским государством, хоть и совершенно противоречит его идее.

А Маяковский сам в «Стихах о советском паспорте» говорил, что «волком бы выгрыз бюрократизм», но, увы, бюрократия, мещанство, «квартирный вопрос», как называл его Булгаков, «обывательщина» и слепая вера партийным лидерам убивают живую душу человека, он перестает быть личностью, шагая строевым шагом с тысячами и миллионами таких же, как и он.

Отсюда, вероятно, и иронические нотки в поздней поэзии Маяковского, и его обличительные высказывания в адрес безвольных обывателей, и мотив одиночества в толпе, который усиливается год от года.

Фрагмент Concordance слова «человек» после революции

Советская Россия на деле совершенно не отвечала заявленному в теории. Благодаря «Word Sketch» мы выяснили, что человек у Маяковского, хоть и стал деятельным после Революции, но стал не личностью, а винтиком в системе. Виной всему бюрократия, которая возникла в государстве, которое изначально должно было быть основано на всеобщем равенстве и принципах справедливости.

Еще в последние годы жизни Ленина бюрократия охватила сначала верхушку партии в борьбе за сферы влияния и быстро спустилась вниз по партийной вертикали. Маяковский был одним из немногих, кто всем сердцем и душой болел за идею сделать положение рабочего народа лучше, и такой исход событий не мог его удовлетворять, а даже мог доводить до отчаяния от осознания собственной беспомощности неспособности повлиять на ситуацию.

Результаты выдачи Word Sketch и Concordance (и всех других функций Sketch Engine) можно скачать в форматах CSV, XLS, XML и PDF. Для этого нужно нажать на стрелочку в правом верхнем углу рабочей панели:

На этом возможности Sketch Engine не заканчиваются. О них и том, что же говорит поэт о Советском государстве и России в целом, читайте во второй части нашей статьи!

Источник текстов: Поэтический подкорпус НКРЯ

Источники: