
Как сделать тематическое моделирование
Рассказываем, как сделать тематическое моделирование для большого объема текста, предположить его содержание и разделить по темам
Рассказываем, как сделать тематическое моделирование для большого объема текста, предположить его содержание и разделить по темам
Кто такой русский рэпер, и о чем он читает? Пацан с района в трениках «три полоски», воспевающий «родных жульбанов»? Татуированный бык на гелике с золотой цепью в палец толщиной? А может, мрачноватый питерский интеллектуал с оксфордским дипломом, вплетающий в свой флоу Гумилева и не чуждый политике? Разбираемся вместе с социологами Антоном Бойченко и Светланой Жучковой, которые попытались изучить русский рэп целиком при помощи тематического моделирования
«Системный Блокъ» уже рассказывал, как делать тематическое моделирование при помощи Mallet — классического инструмента выделения тем с опорой на алгоритм LDA. Однако есть и более современные инструменты, не требующие возни с командной строкой. На этот раз мы расскажем об одном из таких инструментов — сервисе TopicModellingTool, а также о визуализации тем при помощи Tableau Public
Тематическое моделирование — легкий способ понять смысловой состав большой коллекции текстов, которую невозможно быстро прочесть глазами. Пользоваться инструментами тематического моделирования может каждый — а научиться можно в нашем тьюториале. Здесь вы найдете пошаговое руководство с решением основных технических трудностей
Как метод Дельты Бёрроуза и тематическое моделирование помогают решить проблему атрибуции текста