Объем производимой человеком информации постоянно растет — и появляются новые, неведомые ранее средства обработки этого нескончаемого потока. Это верно не только для тех областей науки и техники, про которые пишут каждый день, но и для индустрий, которые вряд ли пришли бы вам в голову при упоминании «информационного взрыва».

Например, многие знакомы с распознаванием объектов на фото и видео. Сегодня каждый может купить телефон с технологией, называемой производителями «искусственный интеллект». В таком телефоне специально обученная нейросеть будет анализировать, что вы хотите снять, и задавать наилучшие параметры. А есть еще системы распознавания лиц, загруженности дорог по данным уличных камер… или, например, системы, которые не впускают кота в дом, если у него во рту мышь. Если вы читаете эту статью, то наверняка уже слышали об этом. Поэтому мы не будем углубляться в то, как это работает (несколько интересных ссылок есть в конце статьи), а поговорим об еще одной области применения машинного обучения — менее хайповой, но не менее важной.

Вид сверху

Данные дистанционного зондирования Земли (ДЗЗ) — именно так называется то, что мы с вами видим каждый раз, когда переключаемся в режим «Спутник» в Яндекс.Картах или Google Maps. Конечно, термин «космические снимки» в этом случае тоже будет правильным, но данные ДЗЗ — более широкое понятие. Сюда входят материалы, полученные не только с искусственных спутников и не только в видимом (оптическом) диапазоне.

Что значит «оптический диапазон»? Все очень просто: это изображение, полученное примерно в том же диапазоне световых волн, в каком картинку окружающего мира получает наш мозг через восприятие глазами. Поэтому такое изображение является наиболее привычным для человека. В принципе, деревья на Яндекс.Картах могли бы быть и ярко-красного цвета, но, скорее всего, вы бы не захотели смотреть на такую карту.

Материалы ДЗЗ — для простоты пока назовем их космоснимками — являются растрами, то есть изображениями. Только получены эти картинки специальными методами, изображающими поверхность Земли, «вид сверху». И наверняка однажды кто-то подумал: «А нельзя ли применить технологию распознавания объектов на обычных фотографиях (таких же растрах) к космоснимкам?». Конечно, можно! Более того, оказалось, что это очень востребованная и перспективная область работы, которая сейчас развивается гигантскими шагами.

Визуализация искусственных спутников земли, European Space Agency

По данным на начало 2019 года, вокруг Земли обращалось около 5 тысяч спутников, из которых примерно 700 связаны с ДЗЗ (данные на картинке выше уже немного устарели). Объем данных, поступающий от этих спутников, огромен, и с течением времени только увеличивается как при накоплении информации, так и с запуском новых аппаратов. Хотя часть из них принадлежит военным структурам, то есть информация с них никогда не попадает в открытый доступ или даже в коммерческий сектор, существует огромное количество съемочных систем, данные которых доступны для покупки или распространяются по открытым лицензиям. Кстати, снимки, которые вы видите в навигационных системах и веб-картах, таких как Яндекс, Google, Bing и так далее — это не один большой снимок Земли, сделанный одномоментно, а множество «склеенных» снимков Земли разного масштаба и времени.

Машины, корабли, посевы: что можно посчитать с орбиты

Дешифрирование снимков развивалось с того самого момента, как из космоса была сделана первая фотография Земли. Но традиционно очень многое в этой отрасли зависело от экспертизы, опыта, умения синтезировать полученную информацию, а также аккуратности и усидчивости исполнителя — из-за отсутствия некоторых этих свойств у компьютера автоматизировать процессы не получалось.

С появлением машинного обучения и нейросетей ситуация значительно поменялась. Распознавание пока ещё лучше всего работает для относительно легко узнаваемых, унифицированных и отличающихся от своего окружения объектов — например, машин. Теперь стало чрезвычайно легко посчитать, например, машины на парковках торговых центров, чтобы оценить оборот и загруженность моллов в определенные часы. Это можно сделать буквально одним нажатием клавиши — больше не нужно ходить целыми днями по стоянке! Также алгоритмы распознавания неплохо работают для кораблей — можно осуществлять мониторинг объемов и путей морских перевозок, незаконного вылова рыбы, работы верфей… Главное преимущество состоит в огромной экономии времени и полном отсутствии ручного труда в процессе. Конечно, участие человека критически необходимо для контроля качества работы алгоритма, и, в самом начале, для создания этого алгоритма, но они несравнимы с усилиями, которые приходилось бы приложить ранее для такого рода работ.

Распознавание машин на парковке торгового центра
Источник: Orbital Insight

Такие технологии чрезвычайно важны для гуманитарных организаций — для более точных оценок численности населения в тех или иных районах, транспортной доступности, последствий стихийных бедствий или катастроф. Например, Facebook только в этом году опубликовал два масштабных проекта, посвященных оценке плотности населения (путем распознавания жилых строений) и картографированию дорог по космическим снимкам в глобальном масштабе! Результаты проектов более чем успешные: команде удалось добиться уровней достоверности и детализации, немыслимых ранее, особенно в развивающихся регионах мира. Оба проекта некоммерческие и не приносят компании непосредственной прибыли.

Результаты автоматического распознавания дорог на снимках — слева представлены результаты работы алгоритма, справа они же совмещены с уже прорисованными участниками проекта OSM дорогами. 
Источник: Facebook Artificial Intelligence

При обработке снимков речь может идти не только о распознавании объектов, но и об использовании технологий машинного обучения для получения информации о качественных и количественных характеристиках. Так, в сельском хозяйстве алгоритмы машинного обучения позволяют следить за составом, качеством и жизненным циклом посевов. Это предлагает делать своим клиентам компания OneSoil, разработавшая технологию автоматического мониторинга фермерских полей по данным спутника Sentinel, свободно распространяемым Европейским космическим агентством. На сайте компании также можно найти интерактивную карту с информацией и статистикой по сельскохозяйственным полям — пока еще не по всему миру, но компания планирует расширить область мониторинга до всей планеты к 2020 году. Компания Descartes Labs создала Living Atlas of the Planet, при помощи данных космосъемки оценивающий состояние сельскохозяйственных культур и их урожайность, а также позволяющий строить прогнозы на будущее.

Прогноз урожайности кукурузы в США по данным Descartes Labs

Что дальше?

Значительное уменьшение затрат времени на обработку космических снимков открывает также широкие горизонты для оценки динамики явлений и объектов. Сейчас наиболее популярные источники свободно распространяемых снимков в оптическом (и не только) диапазоне, системы Landsat и Sentinel, обновляют снимки одной и той же территории раз в одну-две недели, что позволяет оценивать изменения в различных отраслях, например, темпы разработки полезных ископаемых, изменения в городской застройке. Компания Plant Labs, владеющая группировкой спутников высокого разрешения, предоставляет своим клиентам ежедневные обновления снимков вместе с аналитикой, которая была бы невозможна без технологий машинного обучения.

Конкуренция на рынке растет ежедневно, и возможные сферы применения отнюдь не ограничиваются описанными в статье. С дальнейшим развитием технологий как спутниковой съемки, так и машинного обучения, станет возможным то, что кажется невозможным сейчас — как это произошло с нынешними технологиями, которые были почти фантастикой даже 10 лет назад.

Источники

  1. Про инженера, ИИ и кота
  2. Facebook и плотность населения
  3. Facebook и картографирование дорог
  4. Анализ сельскохозяйственных полей компании OneSoil
  5. Descartes Labs’ Living Atlas of the Planet