Чтобы найти слова, которые были популярны в прошлом, но вышли из употребления сегодня, надо сравнить две коллекции текстов. Одна коллекция должна представлять язык более старого периода, другая — более нового, близкого к современности. В этом исследовании такими коллекциями стали:
- дневниковые записи из корпус дневников проекта «Прожито», сделанные в период с 1900 по 1940 год
- современные тексты с Яндекс.Дзена
Оба корпуса состоят в основном из текстов непрофессиональных авторов. «Прожито» хранит записи из дневников обычных людей: школьников, студентов, рабочих, врачей, учителей, художников… На Яндекс.Дзене тоже публикуются очень разные люди. И те, и другие пользуются живым русским языком. Только за 100 лет этот язык ощутимо изменился. Грамматика поменялась не сильно, а вот в лексике происходил постоянный дрейф.
Чтобы найти изменения в лексике, можно посчитать частотности слов в двух корпусах и выделить те слова, которые в одном употребляются часто, а в другом редко или вообще не встречаются. Естественно, частотности слов считались не в штуках, а в долях — относительно объема каждого из корпусов. Что же выявил такой подсчет? Вот некоторые из слов частотность которых в текстах «Прожито» была в 10 и более раз выше, чем в текстах Яндекс.Дзена:
Слово | Значение | Пример употребления |
авантажный | хорошо выглядящий, представительный | Костюм не особенно авантажен у меня (1916) |
дрянность | Гадость | Тут налицо дрянность, самая настоящая душевная и моральная дрянность (1918) |
кокотка | содержанка | Он называл ее своей женой, но вел себя с ней как с кокоткой, чем она нисколько не смущалась (1921) |
окладной | продолжительный, затяжной (напр. о дожде) | Весь день поливает окладной дождь |
превесело | очень весело | Время мы провели премило и превесело, чувствовали себя так развязно, непринужденно |
преглупый | очень глупый | Губа и щека раздулись, и лицо стало преглупое |
телефонировать | звонить по телефону | Василий телефонировал из Порхова, что могут нам дать только пять солдат-мальчишек (1918) |
филистер | бездуховный обыватель, мещанин | Никогда я не буду филистером, никогда не буду мещанином (1915) |
цукать | Третировать, издеваться | Жак женился, жена молодая (ну, она его уже цукает, скоро согнет в бараний рог) |
Многие слова исчезают и возникают индивидуально и непредсказуемо — предвидеть падение популярности какого-нибудь «филистера» лингвисты не в состоянии. Но случаются в этих переменах и некоторые регулярные вещи. Например, когда приставка пре— постепенно утрачивает свое значение усиления (‘очень’), это вымывает из языка целый блок слов типа «преотличный», «премилый», «прегрустный» и т.п.
Можно произвести и обратную операцию. Посмотреть на слова, которых мало или нет в старых текстах, но много в новых. Конечно, среди них будет много очень предсказуемых вещей вроде «блога», «интернета» или «спорткара». Но есть и примеры поинтереснее. Скажем, слово «неадекватный». В краткой форме оно есть уже у Льва Толстого: «употребляемое мною слово неадекватно понято». Но и в XIX, и в XX веке слово использовалось только для несоответствия чему-то терминов, идей, вещей и прочих неодушевленных или вообще абстрактных объектов. Называть неадекватными людей начали только в XXI веке.
Похожая история и у слова «зашкаливать», которое появилось в середине XX века. Оно, разумеется, происходит от шкалы на измерительном приборе — ранее зашкаливать могли именно стрелки на этих приборах. Но затем слово сильно расширило значения — через метафору зашкаливания оно стало означать вообще любое запредельное повышение показателей. Зашкаливать могут цены, рейтинги, эмоции и прочие вещи, которые уже точно никакими приборами со шкалами не измеряются.
А вот слово «силовик» развивалось не по пути плавной метафорической экспансии, а просто через смену совершенно разных значений, так или иначе связанных с силой в разных смыслах. В XX веке силовиками оказываются то разнообразные механики и электрики, то спортсмены и цирковые силачи. Ну а в конце 90-х появляется знакомое всем сегодня значение «представитель силовых ведомств».
Источник: https://yandex.ru/company/researches/2021/old-words
Данные:
- 1000 слов, частотность которых в текстах «Прожито» была в 10 и более раз выше, чем в текстах Яндекс.Дзена.
- 1000 частотных слов из Яндекс.Дзена, которые ни разу не встречались в текстах из «Прожито»