Для большинства не является секретом, что компании собирают данные о своих клиентах. Их используют для создания таргетированной рекламы. История покупок и просмотров позволяет создавать индивидуальные подборки товаров. Но такое использование истории поиска — самый примитивный вариант; есть кейсы и поинтереснее.

Большие данные могут изучать не только маркетологи, но и психологи. Нередко это более надежный источник информации: даже в анонимных тестах люди зачастую не до конца откровенны. Большие данные помогут понять, почему так происходит. Примеры использования Big Data в психологии приводит Сет Стивенс-Давидовиц в книге «Все лгут. Поисковики, Big Data и Интернет знают о вас всё».

Поисковик знает лучше

Первый любопытный кейс — сексуальная ориентация. В Америке количество мужчин, открыто заявляющих о своей гомосексуальности, сильно различается в зависимости от штата: в Род-Айленде живет больше гомосексуалов, чем в Миссисипи. Возможно, это зависит от степени толерантности штата: с одной стороны, люди переезжают туда, где им комфортнее, с другой — оставшиеся не рискуют говорить о себе правду.

Исследователь изучил аккаунты респондентов в Фейсбуке и выяснил, что внутренняя миграция действительно объясняет некоторый дисбаланс в распределении — но не весь. Однако данные о поисках порно стабильны: 5 процентов запросов приходится на гомосексуальную порнографию повсеместно.

Сны по Фрейду

Другой интересный пример из книги — сны. Фрейд утверждал, что форма бананов и огурцов имеет глубокий смысл, особенно в сновидениях. Использовав данные пользователей, которые записывали содержание своих снов, исследователь нашел в них все описания еды. Первый вывод — продукты снятся чаще, если их есть. Второй — огурец на седьмом месте среди овощей, появляющихся в снах, и на седьмом месте среди покупаемых овощей вообще. Кажется, банан — это все-таки просто банан.

Почему Big Data не решает все проблемы

Наконец, в книге демонстрируется ненадежность анализа больших данных.
Предположим, вы хотите понять, можно ли предсказывать какой-нибудь сложный и комплексный признак типа интеллекта с помощью генетических данных. Вы можете попытаться найти корреляцию тестов на IQ с последовательностями генов людей, прошедших эти тесты. Даже если вы поставите этот эксперимент несколько раз на нескольких наборах данных, валидного результата вы не получите — слишком много переменных, по-разному проявляющихся в разных наборах данных.

Психология и большие данные: что дальше

Сегодня большие данные используются для анализа поведения людей. Они позволяют составить более точный психологический портрет человека, используя данные из источников в сети — как открытых, так и закрытых. Эти портреты позволяют предсказать поведение человека или даже толпы, и иногда даже заставить их вести себя определенным образом.

Исследования человеческого поведения с помощью машинного обучения и больших данных сейчас вышли за рамки поведения в Интернете. С помощью компьютерного зрения возможно отслеживать эмоции людей и их действия в конкретной ситуации; нейросеть, распознающая человеческую речь, может диагностировать психоз или нервный срыв, что дает еще больше данных для психологических и социальных исследований.

Большие данные не заменяют традиционных методов психологии. Их анализ дает возможности узнать особенности среды, но не может рассказать о поведении конкретного человека. Совокупное использование этих методов поможет увидеть ситуацию с нескольких точек зрения и понять взаимосвязь окружения людей, их мнения и поведения.

Источники

  1. Using Big Data to Study Psychology
  2. Finding Hidden Customer Behavior Patterns Using Big Data Analytics