Большие данные добрались и до классических (во многом описательных) наук. Но в отличие от других предметных областей, революцию совершили не суперкомпьютеры, а смартфоны и интернет. От биологии отпочковалась информатика биоразнообразия — новая область знаний, возникшая на стыке информатики, географии и классических наук о жизни. Сам термин появился в первой половине 1990-х гг., а уже в 2000 г. этому новому предмету посвятил спецвыпуск журнал Science.

Ученые-полевики, в том числе исследователи биоразнообразия, уже лет 20 как обвешались столь нужными в экспедициях гаджетами — навигаторами, цифровыми фотоаппаратами, спутниковыми телефонами, планшетами. Постепенно, шаг за шагом все эти функции стал выполнять смартфон. Смартфон становился быстрее, удобнее, надежнее, производительнее и дешевле.

Смартфон был принят на вооружение не только учеными, но и армией любителей природы. Можно сказать, что инертность консервативного научного сообщества дает любителям конкурентное преимущество. Человек, которому нравится искать в лесу грибы, не задумывается о том, как правильно надо их изучать. Он просто их с удовольствием отыскивает и, взяв с собой смартфон, фотографирует, а в exif-файл фотографии уже без участия человека записываются координаты, дата и время съемки. По соседним снимкам ясно, что обитает вокруг. Таких снимков за дневной маршрут может быть сотни (легко), иногда тысячи.

Студенты МГУ на практике снимают на память дикий гладиолус. Фото: Алексей Серегин

В первый раз я увидел цифровой фотоаппарат в 2003 году, а вот за компьютер с интернетом сел еще в 1999 году. Это было интересное время — рекламу сайтов печатали на больших разворотах бесплатных рекламных газет. В первое десятилетие 2000-х гг. в интернете было множество сайтов по интересам, небольших тематических форумов, чатов, колоссальное разнообразие личных страниц.

За следующее десятилетие все разнообразие непрофессионального пользования интернетом в мире «канализировалось» в небольшое число сверхпопулярных решений — поисковик, социальная сеть, википедия, а еще платформы-агрегаторы. Эти решения многофункциональны, эргономичны и их функционал понятен любому пользователю.

Не обошла эта агрегация и универсализация и такое явление как сбор данных о биоразнообразии. Всплеск многочисленных тематических платформ первого десятилетия двухтысячных (отдельный сайт со своим форумом по бабочкам, птицам, жукам, грибам, растениям — даже не один, а два-три да к тому же в каждой стране) уступил место сообществам в социальных сетях. Но за последние два-три года и это явление постепенно становится анахронизмом: на их место пришел iNaturalist. Его логика простая и чертовски привлекательная — вместе мы можем больше.

100 миллионов фотографий

Зарегистрированный пользователь грузит сделанную фотографию, движок считывает все данные из exif-файла, а искусственный интеллект с той или иной долей вероятности называет сфотографированный организм. Если он ошибся, сообщество более продвинутых пользователей с удовольствием блеснет эрудицией и поправит завравшуюся машину, сделав ее нейронную сеть чуть компетентнее.

Третьеклассница делает свой проект на iNaturalist. Фото: Алексей Серегин

В итоге в режиме реального времени формируется массив больших данных с уникальными свойствами. Во-первых, это библиотека изображений, в которой уже свыше 250 тыс. видов, снятых в своей среде обитания. Наблюдений в базе — 32 млн, в большинстве случаев одно «наблюдение» подтверждено не просто изображением, а серией фотографий того же организма с разных ракурсов. Сто миллионов оригинальных фотографий, аккуратно разложенных по веткам дерева биологической номенклатуры — по видам, каждый из которых относится к какому-то роду, семейству, классу, царству.

Сайт iNaturalist

Во-вторых, у каждого наблюдения есть метаданные — прежде всего, метка на карте, дата и время съемки. Ни один ученый, ни одна научная группа, ни один институт даже с неограниченным финансированием не сможет сделать то, что делает почти 1 млн человек, каждый из которых выходит в лес (горы, степи, луга, моря) со смартфоном или цифровым фотоаппаратом. Это явление в мире получило свое название «citizen science» — словосочетание, которому в русском языке ничего лучшего, чем «гражданская наука» пока не нашлось.

В лес за большими данными

Наступила очередная весна — и можно с уверенностью сказать: очень скоро всего за несколько дней число наблюдений в iNaturalist увеличится на сотни тысяч, а то и миллионы. Произойдет это с 24 по 27 апреля, когда в 200 городах земного шара пройдет City Nature Challenge. Люди пойдут в лес майнить большие данные о биоразнообразии. Обычно City Nature Challenge называют чемпионатом мира по документации городского биоразнообразия. В этом году из-за коронавируса от идеи жесткой соревновательности решили отказаться и сделать упор на коллаборацию и наблюдение за любыми формами жизни, в т.ч. и дома. Тем не менее российский зачет пока не отменен. Мы ожидаем, что натуралисты по всему миру все равно выйдут на City Nature Challenge, приняв необходимые меры, чтобы не контактировать с людьми и не создавать эпидемиологических рисков.

Как и год назад, с первых часов соревнований начнут расти столбики рейтинга восточноазиатских городов — там утро наступает раньше, и участники, пока не жарко, выходят на фотоохоту. Куала-Лумпур будет активен наравне с Гонконгом (если не помешает карантин), от них не будут отставать города Тайваня. Тут же будут города Австралии.

Постепенно в гонку включатся города Европы и Африки — там день только начинается. И вот уже Вена и Берлин догоняют азиатские мегаполисы. К вечеру по Москве первые наблюдения начнут делать участники из Америки, а глубокой ночью (опять же, при условии, что карантин не станет непреодолимым препятствием для участников) в лидеры первого дня вырвутся Сан-Франциско и Лос-Анджелес, в которых и зародился CNC пять лет назад. Но ненадолго, поскольку в Азии уже забрезжит рассвет нового дня.

И так четверо суток в режиме реального времени. Обычно каждый участник видит и положение своего города, и личный зачет в своем городе, стране и мировом табеле. В этом году мировой зачет отменен, так как велика вероятность, что некоторые города еще будут на карантине.

Финиш гонки натуралистов

Но это еще не все. Во время City Nature Challenge многие не торопятся загружать фотографии через приложение, а все светлое время суток находятся в полевых маршрутах с мощными пауэрбанками в рюкзаках. Эти люди кардинально меняют статистику больших данных на пятый-шестой день. Зачетное окно для съемки закончилось, а отправлять фотонаблюдения можно еще несколько дней. И вот тут начинается финальная гонка городов-лидеров, которые заметно оторвутся от всех прочих.

Так, или примерно проходит чемпионат мира по документации городского биоразнообразия. При этом слово «город» не должно сбивать с толку: Москва и Севастополь, например, участвуют не в границах городской застройки, а в границах субъектов федерации.

Это соревнование имеет одну цель — на 96 часов привлечь жителей больших и малых городов мира к документации биоразнообразия путем создания нового оригинального массива данных, которые отражают современное состояние городской природы.

Участники фотографируют на свои смартфоны и фотоаппараты растения, грибы и животных и загружают изображения на портал соревнований. В России для этого используются приложения iNaturalist и Seek или сайт inaturalist.org. В прошлом году в CNC участвовало примерно 150 городов и свыше 30 тыс. человек, в 2020 году на площадке зарегистрировано свыше 200 городов-участников.

А что в России?

В апреле этого года впервые в City Nature Challenge будут участвовать три города из России — Москва, Севастополь и Курск. В категории «вне зачета» к ним уже присоединились Екатеринбург, Железногорск, Орехово-Зуево, Петропавловск-Камчатский, Пермь и Ижевск. Но если вы считаете глубоко несправедливым, что ваш город не участвует, то в iNaturalist дает возможность это исправить. По этой ссылке есть форма от iNaturalist для желающих организовать City Nature Challenge в родном Урюпинске.

Присоединиться к городским командам может каждый читатель «Системного Блока». Для этого необходимо зарегистрироваться на платформе iNaturalist (и хотя бы за пару недель до соревнований освоиться там, сделав свои первые наблюдения в природе). В период проведения City Nature Challenge за четверо суток необходимо сфотографировать как можно больше объектов дикой природы в административных границах городов-участников.

Соревнования между городами проводятся в разных категориях: число наблюдений, число видов, число участников. Кроме отмененного из-за вируса глобального зачета, проходят отдельные зачеты для городов из разных климатических зон и по странам. Чтобы малые города не чувствовали себя обиженными, в отдельном зачете цифры пересчитывают на площадь города и на число жителей. Личные зачеты обычно проводятся по числу наблюдений и по числу найденных видов по городам, странам и в мировом зачете.

Кому светила победа и были ли шансы у россиян?

Соревновательную часть City Nature Challenge отменили из-за коронавируса. Но могла ли Москва (Севастополь, Курск) победить, участвуя в первый раз? Соревнование городов мира по фотодокументации биоразнообразия проводится в форме биоблица, т.е. с лимитом времени на поиск и съемку растений, животных и грибов в дикой природе. Дается четыре дня. «Москва против мегаполисов мира» — чем не слоган?

Москва выступает в категории городов с бореальным климатом. Конец апреля — это время, когда уже вовсю цветет мать-и-мачеха и только-только появляются чистяки и ветреницы. Но: зима 2019-2020 гг. стала самой теплой за всю историю метеорологических наблюдений. В декабре и январе пользователи iNaturalist находили в Москве цветущие сорняки, а в соседней Рязанской области мать-и-мачеха цвела все три зимних месяца подряд. Иногда в апреле в Москве на городских прудах еще может держаться лед, но только не в этот раз!

В 2019 г. среди северных городов первое место занял Чикаго, в котором было сделано 7985 наблюдений, которые относятся к 1035 видам живых организмов. По числу наблюдателей в «бореальной» категории первое место за агломерацией Миннеаполис/Сент-Пол, где в CNC приняло участие 439 наблюдателей. В Москве сделало хотя бы одно наблюдение в 2019 году на iNaturalist 876 наблюдателей, в т.ч. 35 человек сделало больше 100 штук. Сообщество небольшое, но активное. Даже не участвуя в CNC-2019, в апреле 2019 года в «фоновом режиме» москвичи опубликовали 2468 наблюдений 544 видов различных организмов.

В общем, для победы в «бореальной» категории, пожалуй, должно было бы хватить усилий существующего московского комьюнити iNaturalist. Так, для сбора 10 тыс. наблюдений за 4 дня соревнований нужно, чтобы 100 человек делали по 25 наблюдений в каждый день соревнований. Ну, или 50 человек по 50 наблюдений в день. В конце апреля это не так уж и сложно! Правда, найти при этом даже 1000 видов живых организмов задача сложная.

Магическая цифра: 4 588 видов. Именно столько разных растений, животных и грибов было сфотографировано за четыре дня в Кейптауне во время CNC-2019.

Для сравнения: (1) во флоре Москвы 903 вида дикорастущих растений, еще 1005 — заносных (в т.ч. известных по единственному случайному экземпляру); (2) гнездование в Москве доказано для 117 видов птиц, зимуют в Москве с разной степенью регулярности 118 видов; (3) на iNaturalist есть фотографии 832 вида грибов, снятых в пределах МКАД; (4) состав энтомофауны Москвы точно не известен — считается, что, например, жуков в Средней России обычно примерно столько же, сколько растений. А ведь есть еще мхи, лишайники, водоросли, рыбы и множество беспозвоночных. Но большинство из них в апреле либо не найти, либо не опознать. Вся надежда на стремительную весну. По общему числу видов в общем зачете Москве ничего не светит — мирно курим в сторонке и наблюдаем за состязанием Кейптауна, Гонконга и Хьюстона. Фотографии одних только капских протей чего стоят!

А сколько вообще участников?

По числу участников соревнований в 2019 году впереди были Сан-Франциско (1947 человек) и Лос-Анжелес (1555 человек). Это связано с историческими причинами. Хотя CNC проводится всего пять лет, его базирование на платформе iNaturalist привлекает именно калифорнийцев. Дело в том, что Беркли — его родина. В 2008 г. трое студентов делали совместный дипломный проект, который спустя три года и стал тем самым знакомым для миллионов порталом. В 2014 г. iNaturalist встал под эгиду Калифорнийской Академии наук.

Может ли в Москве поучаствовать в CNC, например, 2000 или 3000 натуралистов? Уф. Где б их взять? Хотя лучше действовать по-другому. Если бы вдруг Москва выиграла зачет массовиков-затейников в категории «число наблюдателей» и при этом проиграет по числу наблюдений, то значит у нас с вами очень низкий КПД. Сомнительная номинация. Так что если бороться за победу (пусть и не в этом году), то уж точно в следующей категории.

Люди-фотопулеметы

Следующая категория — это число наблюдений. В 2019 году в этой категории после нескольких лет гегемонии Калифорнии победил южноафриканский Кейптаун — здесь было сделано 53 763 наблюдения. Кейптаунский «индекс Хирша» при этом очень высокий — 110 (т.е. 110 человек сделали 110 и более наблюдений), а Крис Финбош сделал лично 4040 наблюдений (и успел их загрузить). Железный человек. Конечно, в Капской области, на берегу океана и в прибрежных водах жизнь бурлит! Изучать и фотографировать родную природу жителям Кейптауна не только радостно, но еще и эстетически приятно.

Можно ли за четыре дня в Москве сделать столько наблюдений? Думаете, у нас просто нет столько дикой природы? Вы ошибаетесь. Зеленые насаждения занимают 54,5% от площади столицы, да и в городских кварталах всегда есть газоны, палисадники, дворы школ и поликлиник. В общем, покрыть всю территорию города и Новой Москвы сетью наблюдений и собрать эти данные будет крайне интересно с научной точки зрения.

Давайте снова обратимся к «среднему по больнице». Чтобы сделать 60 тыс. наблюдений за 4 дня (и победить) нужно каждый день делать по 15 тысяч наблюдений. Иными словами, нужно 15 человек таких же чокнутых как Крис Финбош. Представляете, всего 15! Но Крис — один такой во всем мире. Джон Саливан из Крайстчерча на втором месте, он сделал 3757 наблюдений. Всего 36 топ-наблюдателей со всего мира сделали в CNC-2019 все вместе 60523 наблюдений. А ведь у них за плечами — годы общения с живой природой и с платформой iNaturalist, зачастую высшее биологическое образование, а у некоторых даже ученые степени. И все они из разных городов.

Есть ли среди вас такие же активные фотографы дикой природы как Крис из ЮАР и Джон из Новой Зеландии? Тогда все к нам, вам предстоит освоиться на iNaturalist!

Научный зачет

Интересен и научный зачет — доля наблюдений «исследовательского уровня». Это самый интригующий и важный для научного сообщества зачет. «Исследовательский уровень» предполагает, что определение сфотографированной гусеницы или кустика подтвердило два человека. При этом их определения совпали, а другого мнения при этом ни у кого не возникло. В общем, настоящий научный консенсус по наименованию вашей фотографии достигнут.

И так вот эксперты должны посмотреть из каждого города десятки тысяч фотографий. Кто-то знает цветковые растения, кто-то умеет по фотографиям определять мхи и лишайники, кто-то знает всех птиц, а кто-то сообразит по следам, что это был заяц или косуля. В итоге города-участники меряются долей наблюдений «исследовательского уровня». У этой функции очень много аргументов — общая техническая оснащенность наблюдателей (качество фото), их биологическая осведомленность (какую бабочку надо снять сверху, а какую снизу), полнота экспертного сообщества (чтобы и лихенолог был, и бриолог, и энтомолог, и орнитолог, и арахнолог, и альголог, и ботаник) и их увлеченность. И все это ради одной цели: победить!

Среди государств-участников платформы iNaturalist Россия занимает совершенно особое место — 82,3% всех наблюдений определено до вида и имеют статус «исследовательский уровень». Вот за эту категорию стоит побороться особо! Правда, нужно убедить не фотографировать букашек слабыми камерами дешевых смартфонов, но разговор о качестве нужен особый.

Природе нужен ты

Апрель близко. Пора готовиться к походу за большими данными — в лес, парк или хотя бы палисадник под окном хрущевки. Не тратьте ваши фотонаблюдения аленьких цветочков и диковинных зверюшек на инстаграм, вконтакте и фейсбук. Сегодня вам поставят десяток лайков, а завтра об этих фотографиях никто не вспомнит. Присоединяйтесь к CNC, и ваши ценные кадры пригодятся ученым. Освойтесь на iNaturalist, чтобы в последние выходные апреля принять участие в крупнейшем биоблице мира — City Nature Challenge 2020!