Каждый день мы видим графики и диаграммы — когда читаем новости, изучаем отчеты на работе или читаем научные исследования. Но всегда ли они верно отражают данные? Иногда ошибка в масштабе, в цвете или выборе способа отображения делает график убедительным, но неверным. Мы начинаем новый цикл материалов о том, как визуализация данных может не только объяснять сложное, но и вводить в заблуждение. В первом выпуске разбираемся, как масштабирование фигур и неправильный расчет площадей искажает восприятие фактов.
Визуализация данных — эффективный инструмент, с помощью которого легко увидеть тенденции, изменения, проблемы. Но стоит немного ошибиться с масштабом или формой — и визуализация начинает не объяснять, а запутывать. Часто задачей визуализации становится сравнение числовых значений. Как правильно это сделать, чтобы не ввести читателя в заблуждение?
Перед нами инфографика, которая использовалась в материале «Известий». Здесь сравнивается доля людей с ожирением среди мужчин и женщин по федеральным округам. Мужчины обозначены голубыми пиктограммами, женщины — красными.
Процент людей с ожирением по федеральным округам. Инфографика «Известий». Источник
Разницу между данными попытались отобразить через разницу высоты и площади фигурок. Однако пропорции не соблюдены. Например, в Северо-Кавказском федеральном округе женщин с ожирением в 1,5 раза больше, чем мужчин, но эта пропорция не соблюдена: высота отличается лишь в 1,3 раза, а площадь фигуры — наоборот, более чем вдвое больше.
С увеличением размеров разница между фигурками становится более заметной, но еще менее правдоподобной. Если мы посмотрим на Сибирский федеральный округ, где соотношение женщин и мужчин с ожирением составляет примерно два к одному, то увидим гораздо большую разницу в площади фигурок. Это создает ложное впечатление.
Почему так происходит? При сравнении значений с помощью размеров геометрических фигур или пиктограмм важно учитывать соотношение их площадей. Если вместо площади использовать высоту фигуры, то при изменении ее размера будут меняться и пропорции, но уже не в соответствии с данными.
Если мы воспроизведем график «Известий» в Excel, отобразив разницу показателей только через высоту фигурок, различия окажутся не такими уж внушительными.
Исправленный вариант инфографики: фигурки различаются только по высоте
Но здесь искаженные формы мужских пиктограмм выглядят менее презентабельно, поэтому лучше использовать другой способ визуализации. Для более наглядного сравнения хорошо подходят столбчатые диаграммы (их еще называют барчартами). Они отображают данные через высоту столбика, и прочитать такую диаграмму очень легко. Инфографика могла бы выглядеть так.
Сравнение людей с ожирением по округам с помощью столбчатых диаграмм
Мы можем немного сместить акцент и сравнить не жителей округов, а мужчин и женщин.
Сравнение доли мужчин и женщин с ожирением по федеральным округам
Визуальное сравнение данных должно точно отражать числовые значения, чтобы обеспечить ясность и правильное восприятие информации.
Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время
Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст
Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно, а через реальные задачи. Объясняем, какие разделы действительно нужны джуну,…