Визуализация данных — эффективный инструмент, с помощью которого легко увидеть тенденции, изменения, проблемы. Но стоит немного ошибиться с масштабом или формой — и визуализация начинает не объяснять, а запутывать. Часто задачей визуализации становится сравнение числовых значений. Как правильно это сделать, чтобы не ввести читателя в заблуждение?
Как неверный масштаб может испортить все
Перед нами инфографика, которая использовалась в материале «Известий». Здесь сравнивается доля людей с ожирением среди мужчин и женщин по федеральным округам. Мужчины обозначены голубыми пиктограммами, женщины — красными.

Процент людей с ожирением по федеральным округам. Инфографика «Известий». Источник
Разницу между данными попытались отобразить через разницу высоты и площади фигурок. Однако пропорции не соблюдены. Например, в Северо-Кавказском федеральном округе женщин с ожирением в 1,5 раза больше, чем мужчин, но эта пропорция не соблюдена: высота отличается лишь в 1,3 раза, а площадь фигуры — наоборот, более чем вдвое больше.
С увеличением размеров разница между фигурками становится более заметной, но еще менее правдоподобной. Если мы посмотрим на Сибирский федеральный округ, где соотношение женщин и мужчин с ожирением составляет примерно два к одному, то увидим гораздо большую разницу в площади фигурок. Это создает ложное впечатление.
Почему так происходит? При сравнении значений с помощью размеров геометрических фигур или пиктограмм важно учитывать соотношение их площадей. Если вместо площади использовать высоту фигуры, то при изменении ее размера будут меняться и пропорции, но уже не в соответствии с данными.
Исправляем график в верных пропорциях
Если мы воспроизведем график «Известий» в Excel, отобразив разницу показателей только через высоту фигурок, различия окажутся не такими уж внушительными.

Исправленный вариант инфографики: фигурки различаются только по высоте
Но здесь искаженные формы мужских пиктограмм выглядят менее презентабельно, поэтому лучше использовать другой способ визуализации. Для более наглядного сравнения хорошо подходят столбчатые диаграммы (их еще называют барчартами). Они отображают данные через высоту столбика, и прочитать такую диаграмму очень легко. Инфографика могла бы выглядеть так.

Сравнение людей с ожирением по округам с помощью столбчатых диаграмм
Мы можем немного сместить акцент и сравнить не жителей округов, а мужчин и женщин.


Сравнение доли мужчин и женщин с ожирением по федеральным округам
Как не обмануть читателя и правильно сравнить данные
Визуальное сравнение данных должно точно отражать числовые значения, чтобы обеспечить ясность и правильное восприятие информации.
- Если одна фигура представляет значение, которое в два раза больше другого, то и размеры этих фигур должны различаться в два раза по высоте или площади. Это не только помогает избежать недопонимания, но и делает визуализацию более интуитивно понятной для зрителя.
- Если вы используете барчарт, убедитесь, что все столбцы построены относительно нулевой базовой линии. Это не только упрощает сравнение их длин, но и обеспечивает достоверность визуализации данных.
- Отсортируйте столбцы по убыванию или возрастанию. Это привлечет внимание либо к наибольшему, либо к наименьшему значению и, таким образом, поможет сразу интерпретировать информацию. Однако есть одно исключение: если категории имеют естественный порядок, например, дни недели или месяцы года, сохраняйте этот порядок вместо сортировки.