Ученые Университета Пенсильвании научились предсказывать уровень смертности от болезней сердечно-сосудистой системы в разных округах американских штатов. Предсказания работают на основе автоматического анализа твитов, написанных жителями — и выдают результаты лучше, чем при использовании медицинской статистики для той же местности (ожирение, курение, повышенное давление).
![](https://sun1-11.userapi.com/c844320/v844320368/a70ed/FBfn4-W3nJk.jpg)
Алгоритм выделяет в текстах сообщений слова и словосочетания, связанные с разными типами положительных (радость, удовольствие) и отрицательных (гнев, злость, раздражение) эмоций. Извлекаются также лексика, указывающая на то, что человек состоит в отношениях, трудоустроен, имеет профессиональную квалификацию… Как и следовало ожидать, отрицательные эмоции, проблемы с отношениями и устройством на работу положительно коррелируют с уровнем смертности от инфарктов и инсультов.
Алгоритм выделяет в текстах сообщений слова и словосочетания, связанные с разными типами положительных (радость, удовольствие) и отрицательных (гнев, злость, раздражение) эмоций. Извлекаются также лексика, указывающая на то, что человек состоит в отношениях, трудоустроен, имеет профессиональную квалификацию… Как и следовало ожидать, отрицательные эмоции, проблемы с отношениями и устройством на работу положительно коррелируют с уровнем смертности от инфарктов и инсультов.
![](https://sun1-7.userapi.com/c846016/v846016463/a835c/Zuas1F0M2QE.jpg)
Подробности есть в статье на медиуме.