Проанализировав данные, команда американских разработчиков обнаружила, что не все испорченные продукты питания были отозваны из продажи. Даже если возникала волна негативных комментариев, отзыв чаще всего был добровольным решением компании-продавца. Система быстрого обнаружения могла бы вовремя поднимать тревогу и ускорять процесс изъятия испорченных продуктов из продажи.
Исследователи взяли за основу отзывы покупателей о продуктах в интернет-магазине Amazon и связали их с оценкой пищевых продуктов, которую проводило американское Управление по санитарному надзору за качеством пищевых продуктов и медикаментов (FDA) с 2012 по 2014 год. Затем они использовали метод сопоставления текста в реляционной базе данных PostGres и применили алгоритм машинного обучения, чтобы автоматически обнаруживать сообщения об опасных или некачественных продуктах питания.
Из более чем миллиона покупательских отзывов Amazon только пять тысяч содержали сообщение о плохом качестве, а поиск синонимов к терминам в более чем двадцати тысячах обзоров, связанных с отзывом продуктов в FDA, показал, что большинство из них были связаны с некачественными продуктами питания.
Ученые надеются, что разработанный алгоритм в будущем сможет заблаговременно обнаруживать плохие продукты питания и поможет их быстрее отзывать.
Источник: Detecting reports of unsafe foods in consumer product reviews