Игровые автоматы патинко появились в Японии ещё до Второй мировой войны и за свою историю успели пережить запрет и возрождение.…
Что узнали учёные, исследующие религиозность африканцев? Какие инструменты помогают анализировать древние рукописные иероглифы и токенизировать азиатские тексты? И что творят…
«Твоя апрельская ложь», «Форма голоса», «Очень приятно, Бог»… Романтическое аниме овладело сердцами миллионов зрителей по всему миру. Но что именно…
Стилометрия — это количественный метод в лингвистике, литературоведении и других гуманитарных науках, который определяет авторский стиль с помощью статистических метрик.…
Онлайн-буллинг — проблема, с которой сталкиваются школьники по всему миру. Однако оценить её масштаб бывает сложно из-за отсутствия статистики. Министерство…
Китайский язык может быть очень сложно токенизировать, чтобы извлечь информацию из большого объёма текста: стандартные инструменты путаются в иероглифах. Рассказываем,…
Как автоматически провести токенизацию и морфологический анализ текстов на корейском языке? Рассказываем про библиотеку koNLPy, которая выделяет токены, определяет морфемы…
Мы уже рассказывали, как работать с японским языком с помощью сервиса Voyant Tools. Покажем, как можно самостоятельно провести токенизацию текстов…
В начале этого года в Японии выдали престижную литературную премию писательнице Риэ Кудан. Затем она призналась, что около 5% текста…
Узбекистан — солнечный, хлопковый, гостеприимный. Но в XX веке и тут проходили сталинские репрессии. Проект Raqamli tarix («Цифровая история») помогает…