Лингвистика

Сводеш 2.0: новый уровень разговоров про академию

За что хвататься, когда учишь новый язык? Некоторые начинают со ста самых частотных слов, некоторые — с любимой темы или полезных выражений типа «Спасибо» или «Передайте, пожалуйста, соль». Но как быть, если изучать приходится не французский или испанский, а целый пласт разнообразных выражений, используемых в академической среде? На помощь приходят корпусные исследования!

Лингвисты часто пользуются списком Сводеша — перечнем «основных» слов конкретного языка. Обычно он помогает устанавливать степень родства разных языков и время их исторического разделения (в родственных языках ядерная лексика из списка Сводеша обычно звучит похоже, даже если языки разошлись очень давно), но может использоваться и при изучении базовой лексики нового языка. Входит в него обычно 100-200 слов, большинство из которых вполне можно встретить в школьном учебнике английского.

Список Сводеша на «академическом» языке

Эйврил Коксхед, выпускница Университет королевы Виктории в Веллингтоне, пошла еще дальше: она составила особую схему из нескольких сотен словарных групп, которая должна помочь людям подготовиться к учебе и работе в университете. Схема носит название AWL (The Academic Word List). В нее входит 570 «лексических семей» (групп однокоренных слов), разделенных на 10 частей. Все они взяты из реальных учебников, методичек, научных статей и конспектов: для своей работы Коксхед проанализировала текстовый материал объемом более 3,5 млн отдельных слов.

На первый взгляд, каких-то особых принципов формирования у разделов нет, — в каждом из них можно встретить слова различных частей речи. Однако AWL, как и списки Сводеша, составлялся по принципу наибольшей частотности: на самом деле в первом его разделе размещены 60 самых часто встречающихся слов и их дериваты, во втором — такая же по размеру группа чуть более редких единиц и т. д. Исключение составляет только последний, десятый раздел: в него входит 30 лексических групп.

Критерии отбора слов

Корпус, на основе которого был составлен AWL, содержит выдержки из текстов по самым разным дисциплинам — от гуманитарных до относящихся к медицине (им соответствуют четыре подкорпуса). Тем не менее, в нем нет узкоспециализированных терминов, знание которых требуется от тех, кто уже достаточно хорошо владеет какой-либо профессией. Это в некотором смысле сближает AWL с двумя версиями расширенного списка частотной лексики для изучающих английский как иностранный: The General Service List (1953) The New General Service List (2013), на основе которых строятся многочисленные подборки слов для изучения на разных уровнях владения языком.

Отбор слов для AWL производился по трем критериям:

  1. Слова не должны входить в другие списки частотной лексики (на тот момент из крупных в широком доступе был только GSL, насчитывающий две тысячи токенов).
  2. Каждый член лексической группы должен был встречаться по меньшей мере 10 раз в каждом из подкорпусов (они соответствовали подборкам по четырем темам — искусство, коммерческая деятельность, законодательство и наука).
  3. Всего каждое слово должно было встречаться в корпусе не менее 100 раз.

Что получилось?

В итоге оказалось, что список содержит более 94% лексики, встречающейся в работах по 20 и более из выделенных исследовательницей 28 основных отраслей научного знания. Также было доказано, что изучение AWL улучшает понимание неакадемических текстов — в подобных ведь и на русском языке встречаются слова типа «измерить», «гипотеза» или «доказывать».

https://sysblok.ru/linguistics/sejchas-vyletit-ptichka-chto-vnutri-u-platform-dlja-izuchenija-jazyka/На основе списка Эйврил Коксхед уже начали составлять педагогические разработки — в сети можно найти даже исчерпывающую подборку упражнений по каждому разделу AWL (кстати, будет полезно даже неплохо знающим язык). Сама автор утверждает, что было бы интересно проверить близость контекстуальных значений слов в разных научных сферах, а еще проверить, нужно ли составлять похожие списки более узких терминов. Тем не менее, благодаря этой работе научный язык в целом стал менее страшным для новичков, — глядишь, скоро и курс на Дуолинго появится?

Источники

Share

Recent Posts

GPT решила знаменитую нерешенную задачу математики, Google показал новый ИИ-поиск

Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время

25.05.2026

ИИ найдет «скрытых» детей в соцсетях по костям лица

Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст

19.05.2026

Какая математика нужна джуну в NLP?

Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно, а через реальные задачи. Объясняем, какие разделы действительно нужны джуну,…

19.05.2026