Графики помогают быстро понять, что происходит с цифрами: растут ли продажи, улучшается ли доступ к воде, падает ли уровень безработицы. Но даже честные данные можно подать так, что зритель увидит совсем не то, что происходит в действительности — особенно если обрезана вертикальная ось Y. Разбираемся, почему этот прием в визуализации данных искажает восприятие, когда его использование допустимо и как не ввести аудиторию в заблуждение
Проблема недобросовестной визуализации данных — не новость. Еще в 1950-х годах, до появления персональных компьютеров, писатель Дарелл Хафф в своей книге «Как лгать с помощью статистики» собрал множество примеров вводящих в заблуждение диаграмм из газет.
Обрезка оси Y — один из самых распространенных приемов редактирования графиков. Его суть в том, что вертикальная шкала начинается не с нуля, а например, с 90. На первый взгляд — ничего страшного. Но на деле это может сильно исказить впечатление от данных.
Простой пример: представьте два столбца со значениями 92 и 96. Если ось начинается с 0, разница почти незаметна. А если начать с 90, то второй столбец будет в несколько раз выше первого. Хотя на самом деле он всего на 4 единицы больше.
Ученые давно изучают, как мы воспринимаем графики. Исследование Кливленда и Макгилла еще в 1984 году показало, что лучше всего мы сравниваем значения, когда они расположены вдоль одной общей шкалы — как деления на линейке [6]. А вот сравнение длин (например, высота столбцов без общей базы) дается гораздо сложнее и чаще приводит к ошибкам.
Когда ось Y обрезана, зритель теряет точку отсчета и начинает сравнивать не абсолютные значения, а относительные длины. Это и создает иллюзию «огромного роста» или «резкого падения», даже если изменения минимальны.
Да, и это доказано экспериментально. В другом исследовании сотни участников оценивали «честные» и «обрезанные» графики и отвечали на вопросы вроде: «Насколько сильно вырос показатель?» [7]. Результаты были однозначны: люди, видевшие графики с обрезанной осью, значительно переоценивали разницу между значениями — в среднем на 58–130%. Похожий эффект давали и другие искажения: например, неправильное масштабирование площадей или изменение пропорций графика.
Еще одно исследование показало, что эффект обрезки оси сохраняется, даже когда на графике присутствуют явные указания на обрезку или подписаны точные цифры [4]. Зрители все равно полагались на визуальное впечатление, а не на числа.
Можно — для линейных графиков, но осторожно и честно. Проблема не в самом приеме, а в том, как и зачем его используют.
Разберем график динамики снижения числа учителей в России, представленный в материале RTVI. Чисто визуально такое изменение мы можем назвать «существенным» или даже «резким». В то же время, если мы построим график от нуля с этими же показателями, он будет выглядеть как прямая линия. Такой вариант тоже не подходит: он не информативен.
Как решить такую проблему и сделать это честно, советует евангелист Tableau и консультант в Moxy Analytics Кевин Флерлейдж. Нужно:
Если нужно показать абсолютные значения на столбчатой диаграмме, ось должна начинаться с нуля.
Если же вас интересует небольшая, но важная динамика в узком диапазоне на линейной диаграмме, обрезка допустима, но об этом обязательно нужно предупредить.
Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время
Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст
Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно, а через реальные задачи. Объясняем, какие разделы действительно нужны джуну,…