Читать нас в Telegram
Иллюстратор: Женя Родикова

Что такое «городские данные» и чем они отличаются от Big Data 

Когда мы в команде Habidatum придумали термин «городские данные», в этом не было научного пафоса: мы просто пытались описать некую новую ситуацию в исследованиях. Где-то восемь лет назад стало ясно, что все данные о городе, которые раньше использовались, получили громадный бонус, потому что к ним присоединились Big Data, или большие данные, — огромный поток часто неструктурированной информации. Как правило, он не создан специально, а возникает как побочный продукт работы телеком-компаний, платежных и других систем. 

«Городские данные» или Urban data родились ровно в тот момент, когда появилась городская повестка в отношении данных — потому что возник термин «смарт-сити», в котором эти данные используются в огромном количестве. 

«Городские данные» — это данные с фокусом на город. В них попадают и статистические данные, и неструктурированная информация больших объемов — то, что называется Big Data. У нас возникла идея упаковать данные в визуально приемлемую форму именно для городского планирования — поэтому они и получили название urban data. Big Data как часть «городских данных», это более универсальное понятие — оно может быть и в финансах, и в городах, и в городских сюжетах.

Мне кажется, во всем, что связано с Big Data, не стоит искать скрупулезного научного подхода. Это просто новый объем информации, который появился. А сами подходы к Big Data — это целая история: там есть развернутая, глубокая система разных теорий, концепций, гипотез и многого другого. 

Город как массив данных 

Современный город практически не может существовать в отрыве от больших данных. Они — часть городских процессов. Самый простой пример — расчет времени прихода автобуса, который отображается на многих остановках на дисплее. А ведь есть еще записи в МФЦ, поликлиники, их обработка и многое другое. Все это — Big Data, уже структурированные, но возникающие часто из абсолютно неструктурированных потоков. 

Город без данных был бы неудобным для жизни. Это словно город без людей, город-призрак, в котором все вроде бы есть, но никто не живет. 

Данные уже настолько «въелись» в ткань больших городов, в их процессы, что неудобство будет колоссальным, и его почувствуют все. Люди быстро привыкли к тому, что город взял на себя часть логистики, основанной в том числе на больших данных. Они считают, что эти задачи — это обязанность городских структур и сервисов, а не их собственная. Поэтому современному человеку будет очень тяжело жить в городе без данных. 

Данные уже «въелись» в ткань больших городов

Город — это еще и скопление цифровых следов, которые оставляют люди. Около восьми лет назад стало активно использоваться понятие «цифровой двойник», исходя из того, что после человека остается «цифровой след» или «цифровая тень». Такой след может быть очень близок к самому носителю, но, тем не менее, он — уже прошлое, по которому можно восстановить и регистрировать поведение людей. 

Как мне кажется, самый главный сюжет в городе — это не люди, которые только половина истории. Город — это еще и морфология, и функции в этой морфологии: какие-то сервисы, работы, места для жизни и работы и так далее. Взаимодействие между этими функциями и есть квинтэссенция города. Потому что от того, как вы спланируете все это, будет зависеть жизнь города: малый и средний бизнес, деньги, которые получает этот бизнес, налоги, которые получает создатель города. Рисунок планировки и морфология может увести экономику города в минус, а может создать процветающую систему. Именно эти вещи влияют на экономическую эффективность. Поэтому я думаю, что самая интересная часть городской системы — это не социология или психология города, а их смычка: как ведут себя люди в зависимости от планировки города, плотности зданий и подобного. 

Город-близнец «в цифре» 

В 1974 году в России была издана книга Джея Форрестера «Динамика развития города», я учился в том числе и по ней. В этой книге описана модель города (Forrester’s Model of an Urban Area), то есть всего, что в нем движется, что производит какую-то ренту. Чтобы смоделировать такое уравнение, была проделана гигантская работа, но, на мой взгляд, она бессмысленна — потому, что не представляет никакого интеллектуального прорыва. Это просто попытка описать математическим языком, что происходит в городе, попытка «дергать» за разные параметры и симулировать те или иные эффекты. 

Проблема в том, что количество неизвестных параметров, включая ценности людей в отношении жилья, транспорта, потребительские ценности и так далее, постоянно меняется и в конечном итоге модель Форрестера перестает быть осмысленной. Когда появляются большие данные, то возникает совершенно другой тип модели. Появляются «цифровые следы», тренды, которые мы сами наблюдали и фиксировали, осознавая, что тоже являемся частью этой модели. 


сейчас почти любой мегаполис имеет лаборатории, которые поддерживают «цифрового двойника» города

Нужно понимать, что «цифровой двойник» города (digital twin) — это только подспорье, это визуализация представлений о цифровых средах. В нем нет ничего научного. «Цифровой двойник» — это просто метафора, которая позволяет нам осознать, что город производит огромное количество информации, «цифровых следов». И эту информацию можно понять, визуализировать и отследить. В каком-то смысле она непредсказуема, но, тем не менее, движения этой информации с помощью «цифрового двойника» улавливать можно. 

Сейчас почти любой мегаполис имеет центры или лаборатории, которые поддерживают «цифрового двойника» города. Например, Нью-Йорк имеет такую лабораторию. Похожий центр мониторинга Control Syntax Rio есть в Рио-де-Жанейро.Барселона была одной из первых в этой области, сейчас такие лаборатории существуют и в северных итальянских городах — Турине, Милане. Цифровой двойник есть и у Москвы. 

Зарубежное и советское градостроительство 

Расчеты на больших массивах данных существовали уже в доцифровую эру. Похожие расчеты делал Жорж Эжен Осман и его архитекторы в XIX веке в Париже. Сам Осман не был архитектором, он был префектом. Он и его архитекторы делали все те же расчеты, которые производятся сейчас: изоляция, ширина улиц, высота зданий, плотность переулков для передвижения. Все это было невероятно важно уже тогда. 

На мой взгляд, самый революционный план города был предложен Ильдефонсом Серда, испанским градостроителем, который проектировал расширение Барселоны — потому что это один из самых научных планов. Район Барселоны Эшампле или Новый город, где стоят ровные здания со скошенными углами высотой 6 этажей, со внутренними двориками, где просчитано соотношение тротуара и улицы — это один из самых комфортных для проживания городов в мире. Эшампле начали «портить», в какой-то момент достраивая новые этажи, но остановились, когда поняли, что становится хуже. Таким образом, план Серда сохранился до сих пор. 

Патрик Геддес — шотландский, британский социолог-натуралист, который был помощников Чарльза Дарвина во время учебы в университете, впоследствии стал социальным экспериментатором и строителем. Он создал концепцию Тель-Авива, Калькутты, Мадраса, части территории Иерусалима. В основном он планировал колониальные английские города и развивал целую концепцию — систему городов и города как системы, своего рода экосистемы. Он рассчитывал озеленение, розу ветров, по которой выстраивал проспекты, то есть при планировании принимал во внимание и социальные соображения 

Еще один знаменитый архитектор, на которого в XX веке молились практически все города мира — это Константинос Доксиадис. Доксиадис — автор плана Исламабада и создатель фрактального города, когда город представляется системой решеток — транспортных артерий, каждая из которых отвечает за свою скорость. Самая высокая скорость такой артерии у Доксиадиса — 280 км\ч, дальше — скорости ниже на уровне обычных улиц, дорожек и тропинок. Его идея состояла в том, что транспортные артерии должны существовать независимо, но пересекаться между собой так, чтобы можно было пройти через весь город пешком по пешеходным дорожкам, на велосипеде и по другим уровням иерархии. При этом все тропинки и дорожки в каких-то точках соединялись друг с другом, так что можно было перейти с одного уровня на другой. Это знаменитая концепция динамополиса была предложена Доксиадисом в рамках экистики — теории формирования и эволюции человеческих поселений. 

Журнал с таким же названием — «Экистика», был моден среди советских градостроителей и всех, кто занимался расселением. На 60-70-е, начало 80-х годов приходится расцвет советского градостроительства: Бубнов со своими замечательными теориями был очень близок тому, о чем писал Доксиадис. Его книга про экуменополис, одна из самых интересных книг в области градостроительства, повлияла в том числе на советский сектор. 

Но советское градостроительство отличалось от других, ведь в Советском Союзе не было никакой экономики, а было директивное хозяйство, которое распределялось по разным местам. Советская концепция микрорайона никогда бы не выжила, ее бы никто не одобрил, если бы в стране была рыночная экономика, потому что эта концепция противоречит рынку. В советское время это никого не волновало: можно было назначить, где будет химчистка, где будет овощной магазин, где будет аптека. На фоне дефицита жилья, когда были рады любой квартире, люди ходили на любые расстояния от своего дома. Такие типовые однообразные советские районы держались только на расчетах из головы архитекторов, у которых никогда не было шанса увидеть вживую город, построенный на свободе рынка. Из-за этого советское строительство перегружено расчетами. 

Строительные нормы и правила, конечно, нужны. Но посмотрите на планировку, например, Нью-Йорка — по сути это проекция того, каким образом стоимость земли может быть максимизирована: сколько человек должно пройти по улице, как быстро перейти на другую улицу, чтобы максимально окупить эту стоимость. Плотность американской транспортной сети в этом смысле очень опирается на рыночную экономику. 

Советские архитекторы строили города, которые позже «убили» всю экономику в стране: малый и средний бизнес, который является основным для наполнения городской среды, не размещается там, где им не выгодно. Доля малого бизнеса в валовом продукте России — 20%, а например, в Польше — 48%, в Америке — под 70%. Все это связано не только с административными барьерами, которых в СССР было очень много, а прежде всего с тем, что среда, в которой предполагалось размещаться бизнесу, была для этого абсолютно непригодной. Расчеты советских архитекторов гениальны с одной стороны, потому что люди придумали в то время альтернативу живому поведению города. С другой стороны это — фантастический маразм, какой-то SimCity, виртуальная модель, построенная на абстрактных предположениях, и к жизни имеющая очень опосредованное отношение. Хотя морфологические исследования Бубнова, несмотря на их советскость, были очень занятными. 

Большие данные vs Классическая статистика 

Одна из ошибок, которую совершают в отношении больших данных — это попытка применить к big data критерии обычной статистики. Подразумевается, что c помощью статистики уже все выяснили, а большие данные что-то уточнят и дополнят. Но большие данные вообще ничего не добавят и не улучшат, они про другое: они выхватывают совершенно другие картины. Их можно считать новой областью — они больше про макросюжеты. При этом «старые» данные вроде валового городского продукта, отраслевой или социально-демографической структуры в годовом измерении, инфляции — это все остается важным и не теряет своей ценности. Я регулярно пользуюсь регулярно обычной статистикой и она мне очень всегда нравится. 

Другое дело, что большие данные помогают улучшить какие-то статистические параметры. Например, индекс потребительских цен теперь можно мерить на локальном уровне — благодаря тому, что есть трафик социальных данных Мы даже создали совместный продукт: соединили данные бюро переписи США, социально-демографическую статистику плюс данные по доходу со статистикой, полученной из big data. На мой взляд, за такими синкретическими моделями будущее, они становятся все более и более популярными. 

Город во времени и пространстве

С помощью больших данных мы видим город во времени — причем не только по месяцам, сезонам и годам, а по часам. С помощью этого муниципальная администрация, ученые и аналитики могут координировать городские ритмы с планировкой города, рабочие часы с коммерческими и культурными услугами и так далее. 

Город в этом смысле — проекция трудового законодательства. Он построен для рабочего человека: 8 часов на работе и остальное время дома. Условно говоря, город 2010-х — это машина для перевозки людей из дома на работу и обратно. Но городской социолог Жан Дияр подсчитал, что только 12% нашей жизни мы тратим на работу. 88% остального времени: детство, старость, отпуски, сон — то есть все, что угодно, кроме работы. Сейчас мы видим, что примерно у 30% жителей в больших городах есть много денег и времени, и они используют город по-другому: в рваном ритме, сдвинутом в вечер. Мы понимаем, что наша пространственная организация города абсолютно не приспособлена для этого класса свободных людей. Все остальные люди также постепенно начинают использовать город, спланированный для дня, вечером. Задачи спланировать город для вечера и ночи не стоит, а ведь это самый благоприятный временной отрезок с точки зрения коммерческих услуг, учреждений и всего прочего— отрезок с 7 вечера до 1 ночи, Про это вообще никто не задумывается, нет такого градостроителя, который бы это описывал. 

Используя пространственно-временной подход, мы сейчас изучаем, какое количество зданий «омертвлено» в те или иные часы, что можно с этим сделать, можно ли открыть части этих зданий для посетителей и устроить там какие-то общественные пространства в часы с 19:00 до 1:00. 

На мой взгляд, пространственно-временная концепция города — это и есть пространственное массовое планирование, самый главный инструмент градостроителя. Время — это ресурс, которое открывает колоссальные возможности для использования пространства в городе. Из-за этого мы можем в гораздо меньшей степени печься о расширении города: то есть не покушаясь на какую-то сверхъестественную плотность, просто заполнить временные лакуны людьми, меняя график их перемещения по городу. Мы не составляем этот график за людей, но оказываем на него влияние.

Если измерять пространственно-временное планирование в миллиардах долларов, то оно послужит тем же инструментом, чем в свое время были правила землепользования и застройки. Эти правила в американских городах создают примерно 15% валового внутреннего продукта США. 300 млрд долларов — это эффект этих правил. Я думаю, что не меньший эффект будет и от пространственно-временной координации. Например, в Барселоне, чтобы снизить конфликтность местного населения и приезжих, которые мешают друг другу в разнообразных местах, поменяли часы работы учреждений и музеев для того, чтобы их разделить. Благодаря этому город не потерял туристов и не потерял жителей, которые могли бы уехать, если были бы недовольны. Таким образом эффект от использования пространственно-временного подхода в любом случае будет — и экономический, и социальный. 

Как большие данные могут помочь в планировке городов

В связи с появлением больших данных у нас открылись колоссальные информационные возможности, но просели интерпретационные. На мой взгляд, интерпретация данных, то есть концептуальная задача осмысления того, что данные могут дать, их природы, является ключевой. Данные оживают только через концепцию, сами по себе они ничего дать нам не могут. Мне кажется, именно это и имел в виду дата-сайентист Лоренцо Бавассо на конференции DataIQ Summit, когда сказал, что «Data has a better idea» (Данные знают лучше). Я эту фразу понимаю именно так: вы подходите к данным с определенной концепцией и идеей, а они вам показывают еще что-то новое. А иначе зачем же вы походили к ним, если вы все заранее знаете? Оживить данные, дать им возможность высказаться можно только в том случае, если у тебя уже есть какая-то идея.

Сейчас еще рано говорить о том, были ли сделаны какие-то ошибки в интерпретации больших данных, которые повлияли на планировку городов. Данные еще не внедрены до такой степени, чтобы влиять всерьез. Все города, с которыми мы имеем дело, запланированы задолго до появления больших данных. Какие-то отдельные части городов строятся с оглядкой на то, что говорят большие данные, но всерьез изучать ошибки, связанные с данными, мне кажется, пока рано. 

Я думаю, никто не будет делать город исключительно на основе data — существуют свои концепции, накопленный опыт традиционного градостроительства, который никуда не исчезает и тоже очень важен. Большие данные встроятся в эту историю, Хотя уже есть экспериментальные города, например, Black Rock City в Неваде, США, построенный по концентрическим кругам, есть и другие. Но пока это все лишь экспериментальные проекты, это не всерьез про город. Я думаю, большую роль в планировке города данные будут играть сильно позже. 

Я вижу, что существует эгоизм современного поколения: они не понимают, что будет с городом, как он будет выглядеть через 15, 20, 30, 50 лет. Прежде всего, я говорю об общественности — о жителях зарубежных городов, которые участвуют в общественном слушании (у нас общественность в этом смысле пока декорация, к сожалению). Очень часто они идут на поводу своего эгоизма, а через 15 лет выясняется, что так, как они хотели, не работает. И градостроитель не повлиял на них, не рассказал, что нужно смотреть на их район на 50 лет вперед. В городе через 50 лет будут жить другие люди, сегодняшних жителей почти не останется, поэтому нужно планировать то, что нужно будущим поколениям, оставлять им какую-то степень свободы. 

Большие данные имеют ровно ту же опасность — на существующих текущих потоках начинают принимать планировочные решения. Но такие данные — это моментальный срез того экономического и пространственного поведения, которое существует сейчас. А планировка города — она надолго, поэтому мы не можем ориентироваться только на ценности нынешнего поколения. Большие данные не видят этих ценностей впереди. И они, в связи с таким узким подходом, основанном исключительно на текущем моменте, могут стать они причиной ошибки. 

Big brother большого города

У всего хорошего всегда есть плохая тень, «темный» аспект. Такой аспект использования больших данных — это попытки управления людьми через данные, например, с помощью системы распознавания лиц, которые внедряются в крупных городах, или с помощью системы социального рейтинга в Китае. 

Мы не занимаемся этим, нам это не интересно. Гораздо интереснее обобщенные, агрегированные данные, чем индивидуальные треки. Когда происходит массовая слежка, этот big brother, люди начинают адаптироваться и избегать какие-то мест, а это уже никуда не годится. В Барселоне, например, запрещены камеры распознавания лиц, и уж тем более инфракрасные камеры, которые считают количество людей. Спецслужбы — это вообще отдельная история. Но если брать какой-то социальный контроль, то это противоречит общим гуманитарным ценностям, поэтому я считаю это безобразием. Все, кто занимается большими данными в урбанистике всерьез, категорически против такого использования data. 

«Городские данные» открывают новые горизонты 

Данные — это совершенно новый взгляд на город, это важный перелом в городских исследованиях. Это не просто продолжение статистики. а открытие нового угла зрения на город, в частности на время. Данные дали нам возможность его увидеть, измерить, а это уже очень много. Помимо времени, большие данные дали нам возможность, например, не просто знать, где бывают люди, а что они думают о тех или иных местах. А то, что они думают — это ключ к их пространственному и потребительскому поведению. 

Благодаря данным мы больше узнаем о том, что часто наблюдаем, но не можем измерить — как в случаях, когда люди не используют какой-то городской объект, например, парк. Наличие этого объекта у них в голове, потенциальная возможность его использовать создают ему ценность. Таких объектов много: это могут быть не только парки, а площади и здания города, которые мало посещаются, но любимы по другим причинам. Классическая модель «если не используют — давайте закроем и построим что-то новое» может не сработать. Большие данные помогают увидеть эмоциональную привязку к объектам и тем самым избежать колоссального количества строительных ошибок. Данные дают нам совсем другой взгляд на градостроительство.

Что почитать про город и данные 

Американский градостроитель и исследователь Энтони Таунсенд (Anthony M. Townsend) хорошо пишет про город и данные, он уже написал несколько книг про «смарт-сити». Мне близка его философия: он использует большие данные, но при этом размышляет о городе, например, о беспилотных автомобилях, и о том, как изменят город данные, собираемые этими автомобилями, как изменится социальная тайна. 

Мне очень нравится Дрор Полег (Dror Poleg), который больше пишет про город, а не про большие данные. И хотя он не специалист в больших данных, а городской аналитик, то, что он пытается использовать данные, мне в нем и нравится. У него недавно вышла книга «Rethinking real estate». 

Лев Манович тоже много пишет на эту тему с другой точки зрения. Он противопоставляет большие данные small data — маленькому объему неструктурированных данных, и это тоже интересно.