
280 символов Трампа: как Твиттер стал оружием в политической гонке
Как гневные твиты, написанные КАПСОМ, помогли Дональду Трампу завоевать пост президента США? Разбираются ученые
Как гневные твиты, написанные КАПСОМ, помогли Дональду Трампу завоевать пост президента США? Разбираются ученые
Не так давно заговорили о том, что система нейронного машинного перевода от Google сама научилась переводить в языковых парах, для которых у неё нет параллельных корпусов. Действительно ли онлайн-переводчик изобрел собственный универсальный язык, машинную интерлингву?
Ну, или по крайней мере схему его движения. Рассказываем о «диких» ливанских маршрутках — и как студенты вместе с гражданскими активистами приручали их с помощью GPS и мобильных приложений
Рассказываем о цифровых проектах, связанных с исследованием творчества великого немецкого композитора Рихарда Вагнера
Как устроен шедевр Булгакова: анализируем роман «Мастер и Маргарита» с помощью методов цифрового литературоведения
В 2019 году наша команда спецпроектов знакомила вас с учеными, популяризаторами науки, которые применяют цифровые методы в своих гуманитарных исследованиях. А 2020-й мы решили начать со знакомства с участниками самого Системного Блока. Кто, как и почему делает этот проект — расскажем в нашем праздничном интервью
«Живой» перевод от Google в смартфонах стал лучше переводить тексты с фотографий
Нейронные сети научились сочинять рождественские колядки, подписывать поздравительные открытки, находить по-зимнему заснеженные территории и делать предсказания на будущий год. В разгар праздничных каникул публикуем подборку самых ярких новогодних AI-экспериментов
Если вам кажется, что самое странное изображение в биологии — это препарированная лягушка, вид сбоку, то спешим вас разубедить: биологи успешно создают визуализации для самых разнообразных данных. О некоторых из них речь пойдет в нашей статье
Весь 2019 год «Системный Блокъ» рассказывал, как высокие технологии становятся частью современной науки, культуры и повседневности, принося хорошее и плохое. Мы писали о последних прорывах в автоматической обработке языка и о методах борьбы с фейк ньюс, объясняли на пальцах, как работают нейросети, машинный перевод и фильтры в инстаграме, учили обкачивать VK, твиттер и HTML-страницы и делать корпусные исследования, рассказывали про статистические исследования в истории, литературе и искусстве, а еще много исследовали сами... За год в «СБъ» вышло больше 220 материалов. Предлагаем вам подборку из 12 постов, которые стоит перечитать. Можно как раз под бой курантов 🥂
Статистика дает ответ на вопрос, который давно волнует исследователей классической французской литературы: писал ли Мольер свои произведения, или за него все сделал Корнель?
«Системный Блокъ» уже рассказывал, как делать тематическое моделирование при помощи Mallet — классического инструмента выделения тем с опорой на алгоритм LDA. Однако есть и более современные инструменты, не требующие возни с командной строкой. На этот раз мы расскажем об одном из таких инструментов — сервисе TopicModellingTool, а также о визуализации тем при помощи Tableau Public
Резистентность к антидепрессантам – одна из проблем, с которой психиатры сталкиваются в лечении депрессии. Часто подбор препарата ведется долго, методом проб и ошибок. Причина кроется в разнообразии: мозг у разных людей устроен по-разному, и то, что хорошо подходит одному пациенту, может не иметь никакого эффекта для другого. Можно ли, опираясь на биологические особенности строения мозга, повысить эффективность подбора терапии?
Хотя искусственный интеллект все еще находится на ранней стадии своего развития, он способен изменить экономический и военный баланс в международной системе. Все больше государств и негосударственных организаций разрабатывают свои системы ИИ. Пока главные лидеры в гонке вооружений — США и Китай. США стремится удержать первенство, Китай же амбициозно планирует обогнать своего соперника к 2030 году. Несмотря на независимые национальные разработки, США и Китай все же ориентируются на идеи друг друга. Ну, а в чем же тактика и стратегия, сейчас разберемся
Продолжаем погружение в цифровую историю важнейших документов Французской революции
Как ученые пытаются понять по активности мозга, что видит человек, и при чем тут машинное обучение
Рекламными ботами в инстаграме уже никого не удивишь. Но теперь искусственно созданные виртуальные инстаграмеры становятся звездами и начинают оказывать влияние на реальных людей
Научиться программировать мечтают многие, но как выбрать подходящий курс из сотен доступных вариантов? Мы сделали обзор курсов по Python, которые проходили сами
Алгоритм умеет восстанавливать надписи, сделанные несколько тысяч лет назад — и, как утверждают создатели, делает это быстрее, чем профессиональные исследователи эпиграфисты
Чего стоит анонимность в эпоху стеклянного мира, можно ли спрятаться от Гугла и Амазона, кто следит за нами особенно пристально и… нужно ли вообще скрываться
Тематическое моделирование — легкий способ понять смысловой состав большой коллекции текстов, которую невозможно быстро прочесть глазами. Пользоваться инструментами тематического моделирования может каждый — а научиться можно в нашем тьюториале. Здесь вы найдете пошаговое руководство с решением основных технических трудностей
Как то, что мы читаем, влияет на нашу жизнь
Хотите разобраться в автоматической обработке языка и стать NLP-инженером? Вам сюда
Если мы не знаем наверняка, как именно ИИ принимает решения, можем ли мы доверять этим решениям?
Масштабное исследование фотографий в Твиттере от Cultural Analytics Lab Льва Мановича
Компьютерные модели научились предсказывать стихийные бедствия. Иногда это уже помогает предупредить опасность
Как работает новый инструмент распознавания речи и автоматического определения говорящего
Военные используют искусственный интеллект с момента его появления. Самонаводящиеся ракеты с компьютерным зрением поступили на вооружение еще в разгар Холодной войны, с начала 2000-х активно применяются беспилотные ударные дроны, обретающие все больше самостоятельности в решении вопросов жизни и смерти... Что дальше?
Молодые родители учатся понимать новорожденного ценой нервов и бессонных ночей. Но скоро им на помощь могут прийти системы автоматического распознавания младенческого плача
Градиентный спуск — это способ поиска точек минимума или максимума в сложных функциях. Рассказываем, почему это так важно для обучения нейросетей
Что может объединять мать художника-авангардиста Александра Родченко, Сталина и полуобнаженную девушку в джинсах? Все они в разное время появлялись на обложке журнала «Советское фото»
Влияют ли порносайты на наши предпочтения в сексе? Чем опасны для людей порно-мемы? И при чем тут крысы, которых научили возбуждаться от запаха смерти? Разбираемся с причинами и последствиями эволюции вкусов зрителей порно в цифровую эпоху.
Видеохостинг YouTube имеет локализации в 100 с лишним странах — это значит, что для них есть специальная локальная версия сайта (а то и не одна). Например, когда вы заходите в YouTube из России, вы видите меню на русском языке. Такие же меню есть не только на языках-гигантах вроде английского, испанского или китайского, но и, к примеру, на суахили, эстонском, зулусском, урду, африкаансе, узбекском... А как оценивать качество перевода всех этих кнопочек в меню и их понятность для пользователей?
Когда в начале XX века в газетной статье «Пребывание вдовствующей императрицы Марии Федоровны в Финляндии» опечатались в первом слове, заменив «р» на «о», вышел жуткий скандал. А как находить такие близкие по написанию слова автоматически? Разбираемся с помощью питона и расстояния Левенштейна
Научпоп стремительно обзаводится почитателями по всему миру. Какие ученые хотят рассказать о своей работе больше всего, что ресурсы и паблики для этого делают и какими характеристиками обладает типичный научно-популярный текст?
Обзор самого известного онлайн-ресурса о языках мира: что можно узнать и кому это пригодится?
Как, сколько и с кем общаться, чтобы стать по-настоящему главным героем пьесы — отвечает математика
Создатели надеются, что нейросеть поможет быстрее обнаруживать некачественные или просроченные продукты
Компьютерные лингвисты из Вышки, университета Тренто и университета Осло разработали vec2graph — инструмент для визуализации семантической близости слов в виде сети. Воспользоваться vec2graph может любой желающий. Рассказываем, как это работает и зачем нужно
Великое, могучее, свободное, подвижное. От праславянской акцентуации к нейросетевым программам автоматической расстановки ударений
Никогда не задумывались, как мы строим предложения? Конечно, нет, это невозможно. Молодая наука когнитивная стилистика объясняет, почему
Поэзия — цветной вид искусства. В отличие от фотографии и кино, она никогда не была черно-белой. Поэты в своем творчестве окрашивают не только физические объекты, но и запахи, звуки, тактильные ощущения… А можно ли исследовать цветовую картину мира отдельного поэта с помощью цифровых методов?
Карта времен Второй Мировой войны показала американцам масштабы военных действий и помогла ленд-лизу
Нейросети научились неплохо подражать человеку в написании текста. Но теперь есть симметричный ответ: системы обнаружения текста, порожденного нейросетями. Запасаемся попкорном и следим за битвой брони и снаряда в искусственном интеллекте
Что можно узнать о пользователях интернета, зачем психологам истории поиска в Гугле и почему утверждение «все врут» больше не работает
Авторский стиль тяжело определить формально — это целый комплекс деталей, которые заметны человеческому глазу, но могут ускользнуть от компьютера. Указать на характерный выбор слов, конструкций, моделей легко, но как рассказать алгоритму про метафоры или научить его распознавать другие тонкие материи?
Как метод Дельты Бёрроуза и тематическое моделирование помогают решить проблему атрибуции текста
В случае увольнения люди охотнее согласятся уступить рабочее место машине, но не человеку
...зачем в этом разбираться и почему мы волнуемся за НКРЯ
Сегодня модно исследовать художественную литературу методами анализа социальных сетей. Мы начинаем серию постов по сетевому анализу русской драматургии. В первом посте мы расскажем, как сетевой анализ позволяет посчитать «влиятельность» литературного героя
Все любят котиков… особенно переводчики. Рассказываем о CAT-системах: чем и как сегодня переводят
Мы продолжаем цикл постов о компьютерных языках, используемых для передачи музыки. Сегодня рассказываем о принципиальных отличиях музыки от других видов данных и об особенностях компьютерной разметки, используемой для отображения музыкальных данных
Как мегасобытия вроде Чемпионата мира влияют на рынок краткосрочной аренды жилья в Москве? Разбираемся с помощью статистики Airbnb и визуализации этих данных на карте столицы
Как сделать музей по-настоящему цифровым, какие существуют инструменты для создания интерактивного пространства и что предстоит изменить в российском музейном деле
Исследование священных текстов с помощью методов автоматической обработки языка и статистики — то, с чего начались современные Digital Humanities. Сегодня статистика применяется для анализа священных текстов разных религиозных традиций, в том числе исламской. Публикуем перевод недавней работы, где анализируется соотношение божественных черт в Коране
Виртуальная реальность — еще одно измерение человеческой культуры, появившееся благодаря цифровым технологиям. Компьютерные игры в масштабных 3D-вселенных, виртуальные выставки, обучающий VR с его возможностью получения «удаленного» опыта… Как все это осмысляют гуманитарии?