Как узнать про геном хоть что-нибудь, если на дворе 1913
В самом начале XX века люди уже установили, что гены расположены на хромосомах, но было неизвестно, в каком порядке они там находятся. До эпохи секвенирования генома их последовательность определялась исключительно по проявлению признаков в живом организме: так, если красноглазые мухи дрозофилы всегда или почти всегда имели прямые крылья, а белоглазые — загнутые, можно было говорить о том, что гены, контролирующие цвет глаз и форму крыльев, находятся на хромосоме рядом. Такие признаки (и гены) называются сцепленными.
На картинке это отображалось так: LG — linkage group, группы сцепления. Это либо вся хромосома, либо ее часть — все гены, про которые мы знаем, что они сцеплены. Короткие горизонтальные линии на LG — местоположение генов или других генетических маркеров, каждый из которых подписан. Такие карты существуют для многих организмов, но сейчас их вытесняют физические карты, полученные при секвенировании генома — то есть при прочтении последовательности нуклеотидов.
Как измерить расстояние между двумя пальмами (финиковой и масличной), а также мышью и человеком
Этот красивый график демонстрирует синтению — сохранения порядка генов на хромосомах двух видов. Близкородственные виды, не так давно произошедшие от общего предка, имеют очень похожий порядок генов, но постепенно происходят хромосомные перестройки, и это разрушает синтению. Поэтому у далеких друг от друга видов порядок генов разный. Для примера мы взяли синтению между финиковой и масличной пальмами.
Каждый прямоугольник, окружающий центральную часть графика — это одна хромосома (все, что справа — хромосомы финиковой пальмы, все, что слева — масличной), а линии, выходящие из этого прямоугольника, показывают участки хромосом, на которых у обеих пальм сохраняется одинаковый порядок генов. Например, здесь можно увидеть, что части первой хромосомы финиковой пальмы почти целиком попали во вторую и восьмую хромосому масличной, а части четырнадцатой — в девятую, вторую и первую.
Другой вариант визуализации синтении — изобразить хромосомы в виде прямоугольников разной длины. Хромосомы одного вида нужно раскрасить в разные цвета, и этим же цветом окрасить участки, где у второго вида сохраняется тот же порядок генов. Например, на этом графике видно, что у нас с мышью довольно похожая Х-хромосома, хотя мы в целом весьма разные.
Как найти «гены интеллекта»
Это — манхеттенский график, который называется так исключительно из-за визуального сходства (никаких ссылок на Доктора Манхеттена!). В биологии его используют для визуализации результатов метода, который называется GWAS — он позволяет найти участки генома, связанные с тем или иным признаком, например, с развитием болезни Альцгеймера, обучаемостью или ростом. По оси икс расположены хромосомы, по оси игрек — вероятность участка быть связанным с признаком. Там, где на графике небоскреб (пик) — там и расположен потенциально подозрительный кусочек. Например, на этом рисунке показано, что пять участков генома (все пики выше пунктирной линии) влияют на формирование системы кровоснабжения сетчатки глаза.
Как определить, в каком мы родстве с бактериями и от кого мы произошли
Это — древо жизни, созданное международной исследовательской группой ученых по данным секвенирования геномов (определения и описания их нуклеотидной последовательности).
Почему именно этот график стал революцией в биологии? В 1977 Карл Везе придумал трехдоменную систему из архей (древнейших одноклеточных, живущих в экстремальных условиях термальных источников), бактерий и эукариотов (всех существ, имеющих клеточное ядро — в том числе, например, людей и грибов). И примерно в тот же момент эту систему начали расшатывать, но получилось ее несколько накренить только 2016: последняя редакция напоминает куст жизни с двумя стволами, один из которых делится на два. Больше всего в мире бактерий, и две бактерии могут различаться сильнее, чем роза и лама, а мы оказались на одной ветке с археями — и это значит, что мы похожи сильнее, чем мы думали.
А вот другой вариант дерева жизни, с нашим последним общим предком, которого назвали LUCA, Last Universal Common Ancestor, на русском часто произносится как «Лука» (скорее всего он был кучкой молекул на дне протолужи, но своих предшественников на сложном пути жизни надо уважать).
Еще древо жизни может выглядеть вот так — как сеть. Такой график исправляет один важный недостаток деревьев: линейное развитие предполагает, что два вида расходятся раз и навсегда, но зачастую они снова встречаются и могут снова скрещиваться, становясь чуть более похожими друг на друга.
Что еще?
У биологов много других интересных визуализаций — ландшафт приспособленности, диаграммы цветка и далее, далее, далее. Биология — очень красивая наука, даже если мы не вспоминаем про бабочек и больших кошек, а говорим только про данные).