by_dh_hse

Как английский вытесняет корейский в K-pop музыке: анализ данных и визуализация

Как международная популярность корейских поп-групп повлияла на тексты их песен? Как часто исполнители используют английские слова? Как отличаются песни о…

06.01.2025

Романтика в эпоху больших данных: что делает аниме хитом?

«Твоя апрельская ложь», «Форма голоса», «Очень приятно, Бог»… Романтическое аниме овладело сердцами миллионов зрителей по всему миру. Но что именно…

01.08.2024

Достигла ли своих целей разработка искусственного интеллекта?

В 1972 году ученые составили список из 12 задач, которые нужно решить для создания искусственного интеллекта в ближайшие десятилетия. В…

30.12.2020

«Цифровой антрополог отличается от Data Scientist’а вниманием к деталям»: интервью с Дарьей Радченко (КБ «Стрелка»)

COVID-19 изменил повседневные практики миллионов людей — и это видно по их «цифровым следам». Что говорят об эффективности весеннего карантина…

23.11.2020

Маяковский и корпусный анализ: «несоветский» поэт Революции

Продолжаем серию постов о применении Sketch Engine в цифровой филологии на примере исследования текстов Маяковского. В прошлом материале мы узнали,…

21.10.2020

Sketch Engine и Маяковский. Часть I: человек до и после революции

Системный Блокъ уже рассказывал, как провести собственное корпусное исследование при помощи antconc и mystem. Теперь мы обратимся к другому инструменту…

14.10.2020

Над пропастью поржи: интервью с техноблогером Вастриком

Технологический блогер vas3k (в миру программист Василий Зубарев) известен всему просвещенному интернету как автор постов о машинном обучении, VR, машинном…

03.09.2020

Цифровая этнография и «дьявольский значок» уведомлений

В книге «Жизнь онлайн: исследование реального опыта в виртуальном пространстве» цифровой этнограф Аннет Маркхэм показывает, как личность, социум и отношения…

20.08.2020

«Если бы по Евангелию жили бездумные роботы, они были бы одноглазые, однорукие и одноногие»

Как сочетаются компьютерные технологии и Церковь? Зачем настоятелю монастыря алгоритм дистрибутивной семантики word2vec? Исследовать церковные тексты количественными методами — это…

10.07.2020

Мы вытаскиваем людей из небытия: интервью с техническим руководителем ОБД «Мемориал» Виктором Тумаркиным

В России трудно найти семью, где не было бы родственника-участника ВОВ. Но многие почти ничего не знают о судьбе близких,…

22.06.2020

Как менялись песни Битлов и можно ли вычислить эмоции компьютерными методами?

От She Loves You до She’s So Heavy: как психологи исследовали композиции Beatles цифровыми методами и ранжировали их от радостных…

25.05.2020

Вся классика в один клик: как выделить из текста события

Школьники, зависающие на сайтах с краткими содержаниями, многое бы отдали за чудо-ресурс, которому можно было бы отдать какое-нибудь художественное произведение…

16.05.2020

Стали ли современные поп-песни грустнее за последние 50 лет?

Поп-музыка — практически неограниченное пространство для исследователя. Можно попробовать изучать ее инструментами социологии, теории музыки, культурологии и еще десятка дисциплин,…

24.04.2020

В мозге нашли «пусковой механизм» сознания

Недавнее исследование, проведенное на макаках, показало, что стимуляция определенной части переднего мозга пробуждает животных от наркоза. Ученые подозревают, что нашли…

16.04.2020

Игра в войнушку: выживет ли кто-нибудь после нажатия красной кнопки

С приходом коронавируса интерес к апокалиптическим сценариям будущего заметно вырос. «Системный Блокъ» уже писал об эпидемиях, поэтому теперь поговорим не…

02.04.2020

Есть ли стиль у переводчика? А если найдем?

Как инструменты стилометрии помогают исследовать относительную силу стилистического отпечатка автора и переводчика в художественном тексте

28.03.2020

На распутье Digital Humanities

Недотехнари, псевдоученые, шарлатаны — как только не называли цифровых гуманитариев (и как они сами себя только не называли). Представители этого…

20.02.2020

«Область, в которой я работаю, рождается прямо на глазах»

Значение слов постоянно меняется, отражаясь в контекстах. Следом меняются и типичные ассоциации, связанные со словами. Как «тюремная камера» превращалась в…

10.02.2020

Корпус для всех: как используют НКРЯ

Кому и почему «важно, чтобы корпус жил»? Системный Блокъ узнал, как применяют Национальный корпус русского языка: от школьных исследований до…

05.02.2020

Джон Сноу vs Холера

Коронавирус из Китая разлетается по планете. Уже появились первые жертвы в других странах, а в самой КНР погибло более 400…

04.02.2020

Как делать тематическое моделирование без боли и командной строки

«Системный Блокъ» уже рассказывал, как делать тематическое моделирование при помощи Mallet — классического инструмента выделения тем с опорой на алгоритм…

27.12.2019

Скоро ли появится Альтрон? Битва за лидерство в военном ИИ

Хотя искусственный интеллект все еще находится на ранней стадии своего развития, он способен изменить экономический и военный баланс в международной…

25.12.2019

Ищем смыслы: как сделать тематическое моделирование корпуса текстов

Тематическое моделирование — легкий способ понять смысловой состав большой коллекции текстов, которую невозможно быстро прочесть глазами. Пользоваться инструментами тематического моделирования…

06.12.2019

Как начать свой путь в NLP (не путать с НЛП)

Хотите разобраться в автоматической обработке языка и стать NLP-инженером? Вам сюда

02.12.2019

Роботы вступают в гонку вооружений: военные применения ИИ

Военные используют искусственный интеллект с момента его появления. Самонаводящиеся ракеты с компьютерным зрением поступили на вооружение еще в разгар Холодной…

22.11.2019

Семантические сети: как представить значения слов в виде графа

Компьютерные лингвисты из Вышки, университета Тренто и университета Осло разработали vec2graph — инструмент для визуализации семантической близости слов в виде…

28.10.2019

Когнитивная стилистика и образование речи

Никогда не задумывались, как мы строим предложения? Конечно, нет, это невозможно. Молодая наука когнитивная стилистика объясняет, почему

24.10.2019

Перенос стиля нейросетями: Дрейк, Летов, Оксимирон

Авторский стиль тяжело определить формально — это целый комплекс деталей, которые заметны человеческому глазу, но могут ускользнуть от компьютера. Указать…

11.10.2019

Разделяй и определяй, или Кто автор «Сна в красном тереме»

Как метод Дельты Бёрроуза и тематическое моделирование помогают решить проблему атрибуции текста

10.10.2019

Красота и божественная слава: статистический анализ Корана

Исследование священных текстов с помощью методов автоматической обработки языка и статистики — то, с чего начались современные Digital Humanities. Сегодня…

27.09.2019

Знакомый почерк: цифровые технологии для юристов

Любой текст, написанный от руки, имеет много особенностей: форма, размер и расположение букв, даже сила, с которой ручка отпечаталась на…

16.09.2019

Теперь с перламутровыми пуговицами: как алгоритмы работают в модной индустрии

Мода, с одной стороны, довольно консервативна - сложно придумать альтернативу рубашке, джинсам и платью, а с другой - крайне продвинута:…

09.09.2019

«Объединить классических филологов и специалистов по цифре»

Какие возможности даёт историческому лингвисту программирование? Об этом в интервью Системному Блоку рассказал Йоханн-Маттис Лист — исследователь в области исторической…

26.08.2019

Что такое кросс-языковая морфология и зачем она нужна

Машинный перевод и другая компьютерно-лингвистическая магия работают тогда, когда есть много данных для обучения нейросетей. Но что делать, если язык…

19.07.2019

Под зонтиком Digital Humanities

Ученый и писатель Роман Лейбов о том, что делать с корпусом, учить ли гуманитарию математику и чем заниматься в Рунете,…

15.07.2019

Великий, могучий и понятный… Или нет?

Что такое простой и понятный русский язык? Хотелось бы, чтобы разобрался компьютер. Пока он лучше справляется с английским, но можно…

03.07.2019

Электронный след Анны Ахматовой

Учимся визуализировать открытые геоданные на примере Ахматовских мест в Москве. К 130-летию Анны Ахматовой.

23.06.2019

Цифровая история польских евреев

Последний путь Януша Корчака и 200 детей из дома сирот, истребление Варшавского гетто, истории обычных людей — на карте, в…

19.06.2019

«Хочу сделать Sci-Hub легальной платформой»

Создатель Sci-Hub Александра Элбакян — о том, как работает Sci-Hub, что нужно, чтобы этот ресурс стал легальным, и чем грозит…

14.06.2019

У вас вся спина белая: как искусственный интеллект учится шутить

Шутки — дело серьезное. Исследовательница из Стенфорда Хё Хё точно это знает, потому что она разрабатывает генератор каламбуров для искусственного…

06.06.2019

Гуманитарии должны прогнозировать культуру

Лев Манович — о будущем соцсетей, смещении глобальных культурных центров и экспорте русского страдания

20.05.2019

О чем говорят герои фильмов Уэса Андерсона?

Первого мая режиссер и волшебник Уэс Андерсон отмечает пятидесятилетний юбилей. Перечитываем его фильмографию и делаем визуализацию. Так, как ее сделал…

01.05.2019

Гендерные трудности английской литературы

За двести пятьдесят лет положение женщин в обществе изменилось, и эти изменения затронули не только реальную жизнь, но и книжное…

23.04.2019

Поприветствуем волдемортинг: Главнейший Анти-Поиск

Обмануть Google: как эвфемизмы помогают прятать информацию и зачем люди делают это

18.04.2019

Сгоревший Нотр-Дам может спасти компьютерная игра (на самом деле нет)

Assassin’s Creed снова был готов выручить мировую культуру, но на этот раз не сложилось

16.04.2019

Цифра на службе у филолога

“Гумилёва считали?”: лингвист и популяризатор Александр Пиперски рассказывает, как открыл для себя количественные методы, что из этого получилось и зачем…

05.04.2019

«Черный ящик» нейросетей приоткрылся

Система искусственного интеллекта из MIT научилась объяснять свои решения через цепочки рассуждений. Теперь люди смогут понимать, почему нейросеть приняла столб…

07.03.2019

Как геймеры древнеегипетское письмо расшифровывали

Фанаты Assassin’s Creed за одну ночь помогли собрать материал для переводчика египетских иероглифов

27.02.2019

Как лингвистика стала близкой подругой математики и информатики?

История сближения науки о языке с компьютерными науками

20.02.2019

Карта путешествий Пушкина

Пушкин с детства любил путешествовать и много поездил (царская немилость и ссылки способствовали). Но за границей так и не побывал.…

10.02.2019

Смерть у Шекспира

Шекспир не щадил своих персонажей — каждая вторая пьеса кончалась горой трупов. Но как именно они умерли? Какие виды смерти…

22.01.2019

Жутко громко, запредельно тихо: звуки в романах

Крик, рёв, бормотание, шепот: измеряем громкость в литературе

18.01.2019

Бандитский Лондон: интерактивная карта

«Два гребца забили человека веслами», «священник из ревности заколол соперника» — криминальная хроника средневекового Лондона с привязкой к координатам

14.01.2019

5 лучших новогодних инфографик

Зачем елке аспирин, что говорят политики в новогодних обращениях и как правильно приготовить селедку под шубой

31.12.2018

Рембрандт к успеху шел — не фартануло

Как анализ данных предсказывает успех художника

24.12.2018

Как нейросеть пишет песни

Языковую модель на основе рекуррентной нейросети научили подбирать тексты под мелодию с учетом пауз и длительности нот. Разбираемся, как это…

17.12.2018

Персональный склерозник: от альбома XVII века до цифровых тетрадей

Почему XXI век — золотой век альбомов и чем хороши сервисы заметок

10.12.2018

Не бездушная машина

Могут ли роботы сострадать? Искусственный интеллект для тяжелых эмоций и сложных ситуаций

03.12.2018

Искусственный интеллект смотрит сериалы

Распознавание лиц используют не только в камерах слежения. Можно следить и за героями сериалов! Зачем — читайте в нашей статье!

26.11.2018

Большой Брат узнает по походке

Прятать лицо от камеры слежения скоро станет бесполезно

21.11.2018