Получить базу из 100,000 записей за 5 минут на домашний компьютер? Еще 20 лет назад для ученых-биологов это было в области сказок. Если нужны данные в дополнение к своим — езди по коллекциям (в разных городах!), договаривайся со знакомыми коллегами, переписывай вручную из книжек. Сейчас же — 5 минут настройки фильтров, и множество записей уже ждут аналитической обработки. И с каждым годом объемы и типы доступной информации только возрастают. Найти их можно в базах данных биоразнообразия (biodiversity database).

Уже создано большое число таких порталов, каждый из которых работает с определенными темами. Так, можно выделить таксономические базы и базы «коллекционные». Первые включают информацию о положении таксона в системе живого мира, валидных названиях, синонимах и родственных связях между таксонами (например, TROPICOS). Вторые работают на уровне отдельных организмов и предоставляют информацию о их распространении, внешних признаках. Сюда же включены фотографии, записи голосов птиц, видео, последовательности ДНК и пр. Такие базы можно разделить на «оцифрованные коллекции» и на «аггрегаторы». Примером оцифрованных коллекций может служить портал Цифрового гербария МГУ имени М.В. Ломоносова. В рамках проекта отсканировано более 1 000 000 гербарных образцов с конца XIX века до наших дней, а также проведена оцифровка этикеток (каждое засушенное растение в научном гербарии снабжается этикеткой: где собрано, кем и когда). Для 571 956 образцов сделана геопривязка к карте.

Аггрегаторы пополняются разными людьми и организациями. У каждого проекта свои требования к типам данных, их региональной приуроченности и т.д. Примером может служить — «GBIF» — база по распространению всех видов живых организмов. Она насчитывает 1 411 011 811 записей из 53 090 датасетов*. Скачать их может любой — достаточно пройти регистрацию на портале. А вот добавлять можно лишь от лица научных организаций и в определенном формате.

Некоторые порталы собирают данные более локальных проектов. Таков, например, «Catalog of Life», который аккумулирует записи из 171 базы. К этой же категории относится и «the Encyclopedia of Life». Для интересующих таксонов там можно посмотреть и распространение (из GBIF), и значения отдельных признаков (из TRY-database) и еще ряд параметров.

Для того, чтобы выбрать наиболее полезную лично Вам базу данных, необходимо определиться с несколькими пунктами:

  1. какие живые организмы Вас интересуют?
  2. какой регион Вас интересует?
  3. какого типа данные необходимы? (фото, GPS-точки, таксономическое положение)

Большинство международных сайтов ведется на английском языке, поэтому для наиболее релевантного поиска таких порталов лучше пользоваться поиском Google и вводить запрос на английском.

Ниже приведено несколько порталов, которые могут быть интересны не только ученым, но и всем любителям живой природы.

  • iNaturalist
    Крупный международный портал, куда каждый желающий может добавить свое наблюдение за живой природой. 38 328 497 записей уже доступны на портале. Построен по принципу соцсети. Данные по распространению iNat передает в GBIF, а таксономическую информацию, напротив, получает из «the Plant List». Сайт полностью русифицирован.
  • Avibase
    Посвящена исключительно птицам. И насчитывает 27,521,252 записей. Интересная фишка системы — выбрать свой регион и скачать для него список встречающихся птиц с фотографиями и базовой информацией. Портал частично переведен на русский язык.
  • ООПТ России
    Портал, посвященный особо охраняемым природным территориям РФ также позволяет узнать, какие виды живых организмов включены в Красные Книги и в каких ООПТ встречаются. Есть поиск по русскоязычным названиям.
  • Млекопитающие России
    Недавно созданный портал обладает очень понятной структурой сайта и уже содержит 7663 фотографий млекопитающих нашей страны. Пользователи могут добавлять свои данные в свободном режиме. Хорошо подойдет для знакомства с фауной страны.

*Все показатели баз приводятся на 21.05.2020

Ссылки на упоминаемые базы