Историческая лингвистика и эволюционная биология изучают схожие процессы: развитие языков и эволюцию живых организмов. Они задаются аналогичными вопросами и сталкиваются с похожими проблемами. А еще их интересы пересекаются: реконструируя эволюцию языков и генов, лингвисты и биологи помогают археологам воссоздать картину древних миграций и распространения культур. Неудивительно, что исследователи перенимают друг у друга идеи и методы. Какие именно — рассказываем далее.
Когда люди заинтересовались эволюцией языков и как ее изучали
Еще Сократ пытался сопоставлять современный ему греческий с более древними его версиями и жаловался, что язык портится [1]. Но в основном до XVIII века исследователи языков занимались лишь языковым описанием, составляя бесчисленные словари и учебники грамматики. Причем круг описываемых языков был предельно узким: так, европейцы занимались по большей части греческим и латынью. Не зря начальным этапом развития языкознания называется период с VI и аж до XVIII века.
Великие географические открытия вынудили европейцев изучать множество экзотических для них языков, и примерно в это же время деятели науки и культуры стали интересоваться и своими национальными языками. А XVIII век — век Просвещения — побудил человечество задуматься и о происхождении языка. Именно тогда появились классические теории его появления: звукоподражательная, теория коллективного договора, бессознательных выкриков.
Начало сравнительно-исторического языкознания — изучения родства и происхождения языков
Самостоятельное направление, изучающее эволюцию языков, — сравнительно-историческое языкознание, или компаративистика, — оформилось благодаря Уильяму Джонсу, который в 1786 году указал на связь санскрита с греческим, латинским, кельтским, готским и древнеперсидским языками и на совпадения между формами этих языков: по его мнению, их было слишком много, чтобы объяснить это случайностью. На основании этого он смог предположить, что все они происходят от одного, более не существующего праиндоевропейского языка.
Наблюдения Джонса подтолкнули других ученых продолжить сопоставление языков. Вскоре был введен термин «сравнительная грамматика» и сформирован один из главных принципов сравнительно-исторического языкознания: сопоставление не слов целиком, а их составных частей, таких как корни, приставки и суффиксы.
Дарвин и Шлейхер
Следующее важное для компаративистики наблюдение сделал немецкий лингвист Август Шлейхер. С самого детства он был близок к естественным наукам: его отец был врачом, а сам он серьезно увлекался ботаникой и был хорошо знаком с трудами Чарльза Дарвина, жившего и публиковавшегося в тот же период.
Шлейхер сравнивал языки с живыми организмами, поскольку они так же подчиняются законам изменчивости и борьбы за существование, и предлагал систематизировать их аналогично: языки сопоставимы с видами организмов, диалекты или наречия — с подвидами, речь каждого отдельного человека — с индивидуальной особью. Он перенес в языкознание термины естественных наук (генеалогическое «древо», языковые «семьи» и «ветви», «организм» языка), и само языкознание относил к естественным наукам.
Разумеется, целиком загнать язык в достаточно жесткие биологические рамки невозможно, и идеи Шлейхера неоднократно подвергались серьезной критике. Тем не менее, указанные им параллели между языками и живыми организмами действительно присутствуют. Составные части слов теряются и заимствуются, подобно генам. Ошибки в произношении или написании слов (в биологии — мутации) могут закрепляться (как слово «кофе» со временем стало допустимо употреблять как в мужском, так и в среднем роде), а могут отсеиваться, подвергаясь стабилизирующему отбору. Слова из разных языков, произошедшие от одного предка и называемые когнатами, биологи могли бы назвать гомологами. Мы можем наблюдать в языках и своеобразный дрейф генов, когда одно слово по чистой случайности становится «вирусным», а его менее удачливый синоним совсем выходит из употребления.
Стоит отметить, что Дарвин, чьи теории Шлейхер любил применять к языкам, сам был хорошо знаком с трудами Шлейхера и его коллег и даже ссылался на них. Например, в книге «Происхождение человека и половой отбор» Дарвин спорил со Шлейхером и другими исследователями о том, возникла ли речь до или после расселения предков человека.
Генеалогия индоевропейских языков, иллюстрация из книги Шлейхера 1853 года (источник). Книга Дарвина «Происхождение видов» выйдет в 1859
Изучая отличия человека от других видов животных, Дарвин интересовался и речью. В «Происхождении видов путем естественного отбора» он предложил создать генеалогическое древо для языков по аналогии с живыми организмами, что позже и осуществил Шлейхер.
Коэволюция лингвистики и эволюционной биологии в XXI веке
В современных исследованиях мы продолжаем находить доказательства параллелизма биологической и лингвистической эволюции. Например, в 2007 году в журнале Nature было опубликовано две работы ученых-биологов, посвященные эволюции — только не организмов, как можно было ожидать, а языков [2, 3]. В них биологи описали закономерность эволюции языка, хорошо знакомую им по своему предмету: то, что часто используется, редко изменяется. Например, функционально важные гены, которые работают всегда и во всех клетках организма, обычно очень консервативны, то есть меняются медленно. Как оказалось, консервативность слов тоже зависит от частоты применения.
Одна из статей рассказывает, что вероятность превращения глагола из неправильного (форма которого в прошедшем времени отличается от формы в настоящем: go — went) в правильный (чье прошедшее время образуется с помощью окончания -ed: watch — watched) тем меньше, чем чаще используется глагол (некоторые частотные — как to be и to go — до сих пор не превратились) [2]. При этом исследователи используют такие термины, как распад и период полураспада, проводя параллель с процессом распада атома, и даже выведена формула: период полураспада равен квадратному корню из частоты встречаемости.В другой авторы представили результаты более глобального исследования эволюции языков [3]. Для 87 индоевропейских языков они взяли слова, соответствующие понятиям из списка Сводеша, — это 200 (на данный момент) понятий, актуальных для всех культур и встречающихся во всех языках мира, — сгруппировали их и построили эволюционное дерево теми же методами, какими биологи строят их для живых организмов.
Дерево, составленное по результатам исследования [3]. Оно немного отличается от традиционного: сербохорватский оказался более дальним родственником болгарского и македонского языков, а польский стал ближе к украинскому и белорусскому, чем русский (отличия от традиционного дерева выделены красным)
Подобно своим коллегам, они пришли к выводу, что скорость изменения слова обратно пропорциональна частоте его употребления — что похоже на результат стабилизирующего отбора, который отсеивает отклонения от нормы. Примечательно, что они также использовали термин «период полураспада», обозначая им время, за которое понятие с вероятностью 50% начнет обозначаться другим словом.
Языки и гены — вместе или врозь?
И лингвистов, и биологов интересует прошлое человечества. Лингвисты могут строить о нем догадки, реконструируя эволюцию языков, а биологи — реконструируя эволюцию ДНК. Получающиеся у них эволюционные деревья не совпадают друг с другом. Насколько часты расхождения? Недавнее исследование утверждает: хотя генетически близкие народы чаще говорят на близкородственных языках, исключений тоже немало. Авторы собрали базу данных, где для 4000 человек указаны их генотип и родной язык. В базу вошли представители 397 генетически разных популяций, говорящие на 295 языках (не только индоевропейских). Оказалось, что для 18% популяций самая генетически близкая популяция-сестра говорит на языке из другой языковой семьи [4].
Другие ученые попытались установить связь между генами, языками и географическим положением [5]. Оказалось, что языки показывают генетическое сходство точнее, чем это делает местоположение — по крайней мере, на европейских популяциях, причем синтаксис (строение предложений) говорит о родстве между популяциями даже больше, чем лексика (словарный состав языка). Кроме того, подтвердилось, что языки народов, живущих бок о бок, со временем становятся похожи — даже если относятся к разным языковым семьям, то есть происходят от разных предков. Популяции человека помимо генов могут обмениваться и словами, и мельчайшими единицами языка — фонемами (близко по значению к звуку), и это явление может носить массовый характер, сближая языки в том числе неродственные. И напротив, принадлежность к одной и той же группе не всегда означает, что языки похожи. Например, непохожи между собой на слух и на письме румынский и испанский. При этом румыны порой могут понять испанцев и без перевода, а испанцы румынов не понимают вообще.
Эпидемиология индоевропейских языков
Наиболее тесно лингвисты и биологи сотрудничают при изучении древних миграций и распространения языков и культур: именно здесь результаты их исследований уточняют и дополняют друг друга. Распространение генов, языка и культуры взаимосвязаны, хотя, конечно, не совпадают полностью. Например, одних лишь артефактов, собираемых во время археологических раскопок, недостаточно, чтобы делать выводы о миграциях, ведь предметы могут «расселяться» и за счет торговли. Но важно, чтобы полученные из разных источников данные не противоречили друг другу.
Популяционные генетики последние 20 лет активно восполняют пробелы в данных палеоантропологов, анализируя геномы древних людей и генетическую изменчивость человеческих патогенов (подробнее мы писали об этом в статье «Тайны древней ДНК: как палеогенетики и биоинформатики помогают археологам»). Лингвистические исследования тоже выявляют недостающие детали. Наглядный пример объединения усилий — поиски родины индоевропейских языков.
Гипотез происхождения индоевропейских языков насчитывается несколько. Их предполагаемой родиной называют Балканы, Армянское нагорье, степи Восточной Европы. Когда-то после обнаружения родственности языков родиной посчитали Индию, но эта теория на данный момент опровергнута.
Наиболее популярны две гипотезы — анатолийская и степная (курганная). Первая локализует родину индоевропейского языка в Малой Азии на территории современной Турции, вторая — в Северном Причерноморье в междуречье Днепра и Волги.
За каждой из гипотез стоит ряд археологических и лингвистических исследований, и каждую из них критикуют. Исследования древней ДНК не сняли разногласий: они свидетельствуют, что около 5000 лет назад из евразийских степей на территорию Европы действительно активно мигрировали скотоводы, которые могли принести туда несколько основных ветвей индоевропейских языков. Однако в древней ДНК, найденной на территориях Микенской Греции, Балкан и Анатолии, следов этой миграции заметно меньше, так что распространения всех языков индоевропейской семьи степная гипотеза не объясняет.Чтобы разобраться, лингвисты объединились с эволюционными биологами. Они составили обновленные списки родственных слов и применили к ним методы, исходно разработанные для анализа эволюции и распространения вирусов [6], — это позволило реконструировать не только эволюционное дерево индоевропейских языков, но и географию распространения предковых языков вплоть до протоиндоевропейского [7].
Распространение индоевропейских языков в соответствии со степной, анатолийской и гибридной гипотезами. Степная гипотеза предполагает, что оно началось 5000–6000 лет назад благодаря миграциям скотоводов из евразийских степей. Согласно анатолийской гипотезе, оно началось 8000–9500 лет назад и было связано с мирным распространением сельского хозяйства с Ближнего Востока [7]
Результатом стала гибридная гипотеза, которая примиряет сторонников степной и анатолийской версий и согласуется с выводами генетиков: протоиндоевропейский язык мог возникнуть в Закавказье, откуда потом распространился севернее, в степи, где и возник прародитель некоторых индоевропейских языков — в частности, романской, германской и славянской языковых групп.
Биологам и лингвистам предстоит еще много совместной работы. Сходство эволюции языков и живых организмов — не единственное, что их объединяет и вдохновляет на обмен идеями, но оно стало отправной точкой коэволюции двух наук и наверняка еще не раз сыграет на руку обеим.
Источники
- Percival W. K. Biological analogy in the study of language before the advent of comparative grammar // Biological metaphor and cladistic classification (H. Hoenigswald and L. Wiener, eds.). University of Pennsylvania Press, Philadelphia, 1987. Pp. 3–38.
- Lieberman E., Michel J.-B., Jackson J. et al. Quantifying the evolutionary dynamics of language // Nature. 2007. Vol. 449, No. 7163. Pp. 713–716. DOI: https://doi.org/10.1038/nature06137 (дата обращения: 20.01.2025).
- Pagel M., Atkinson Q., Meade A. Frequency of word-use predicts rates of lexical evolution throughout Indo-European history // Nature. 2007. Vol. 449, No. 7163. Pp. 717–720. DOI: https://doi.org/10.1038/nature06176 (дата обращения: 20.01.2025).
- Barbieri C. et al. A global analysis of matches and mismatches between human genetic and linguistic histories // PNAS. 2022. Vol. 119, No. 47. DOI: https://doi.org/10.1073/pnas.2122084119 (дата обращения: 20.01.2025).
- Creanza N. et al. A comparison of worldwide phonemic and genetic variation in human populations // PNAS. 2015. Vol. 112, No. 5. Pp. 1265–72. DOI: https://doi.org/10.1073/pnas.1424033112 (дата обращения: 21.01.2025).
- Drummond A. J., Rambaut A. BEAST: Bayesian evolutionary analysis by sampling trees // BMC Evolutionary Biology. 2007. Vol. 7. DOI: https://doi.org/10.1186/1471-2148-7-214 (дата обращения: 21.01.2025).
- Heggarty P. et al. Language trees with sampled ancestors support a hybrid model for the origin of Indo-European languages // Science. 2023. Vol. 381, No. 6656. DOI: https://doi.org/10.1126/science.abg0818 (дата обращения: 21.01.2025).
- Atkinson Q., Gray R. Curious parallels and curious connections — phylogenetic thinking in biology and historical linguistics // Systematic Biology. 2005. Vol. 54, No. 4, Pp. 513–526. DOI: https://doi.org/10.1080/10635150590950317 (дата обращения: 21.01.2025).