Читать нас в Telegram

По словам их узнаете их: как вычисляли автора «Беовульфа»

Рассказываем, как одни ученые устанавливали авторство знаменитого древнеанглийского эпоса «Беовульф» при помощи статистики, а другие с ними спорили. Ведь научные споры цифровых филологов — это интересно!

как оживить умершего

«Поднимите мне руку!»: как технологии оживляют покойных

До начала XIX века память об умершем сохранялась в произведениях искусства и письменных источниках. Два столетия спустя человека стало возможно увековечить… целиком. Теперь внешность, голос, мимика и движения — потенциальный материал для виртуальной копии. Да-да, это реальность, а не один из эпизодов «Чёрного зеркала». Разбираемся в тонкостях цифрового бессмертия, бизнесе «двойников» и этике воскрешения
что такое стилометрия

Стилометрия: как в разное время люди искали авторов текстов

Сегодня для того, чтобы понять, кто написал текст под псевдонимом, у исследователей есть количественные методы анализа, в основе которых – подсчет служебных слов в тексте. О том, как люди к этому пришли, рассказываем в материале об истории стилометрии

Почему искусственный интеллект врет и как его его от этого отучить. Расшифровка подкаста с Давидом Дале

Публикуем материалы к седьмому выпуску подкаста «Неопознанный Искусственный Интеллект»: текст расшифровки выпуска, оглавление, полезные ссылки и термины.
расизм

Не стреляйте черных роботов: расизм, смерть и машины

Если ввести в поисковую строку браузера слово «робот»‎, на большинстве картинок роботы окажутся белыми или серебристыми. Исследование 2018 года показало, что это может быть неслучайно: расовая нетерпимость распространяется не только на людей.
ксенобот

Создан первый живой программируемый организм

Ученые из США опубликовали исследование о новом типе роботов. Ксеноботы — комбинация искусственного интеллекта и биологического организма. Они стали первыми механизмами из органических тканей.

ObjectNet — датасет, который поставил в тупик лучшие модели компьютерного зрения

Модели компьютерного зрения обычно без труда распознают стул, стоящий на кухне, но перевернутый стул в спальне ставит их в тупик. Создатели ObjectNet постарались решить проблему с помощью датасета с тысячами необычных фотографий
тест по средневековым университетам

Кто такой педель и как получить матпомощь в XIV веке? Тест по cредневековым университетам

Быть студентом в Средние века — это вам не с айфона шпоры списывать. Но многие знакомые современным студентам вещи были в университетах уже тогда. Например, землячества или материальная помощь для малообеспеченных. Проверьте ваши знания об университетской жизни в Средневековье.
чат-бот Meena

Давай поговорим: как работает «человечный» чат-бот Google

В Google попытались сделать чат-бота, который заточен на максимально осмысленные и человекоподобные ответы. Рассказываем, как он устроен
нейросети в искусстве

Определяем дату написания картины онлайн без регистрации и СМС

Научить нейросети понимать искусство пытаются уже много лет. И хотя про «понимание» говорить рано, некоторые задачи, ранее доступные лишь искусствоведу, они решают неплохо! Пример — датировка живописи. Рассказываем про систему, сделанную студентами МИСиС, которая может датировать картины — причем не только всем известные «Звездную ночь» или «Мона Лизу», но и полотна неизвестных художников. Кстати, эту модель может протестировать любой желающий!
какие задачи решаются с помощью NLP

Компьютерная лингвистика в медицине: от справок до COVID

О чем вы думаете, когда слышите «NLP»? О голосовых помощниках, о переводчиках, о поисковой машине… Но область применения для технологии обработки естественного языка гораздо шире! Разбираемся, как NLP помогает бороться с COVID-19 и упрощает взаимодействие людей в медицине
система ГИС

Цифровой Гарлем: GIS-система по истории самого известного черного района США

Борьба угнетенных людей за свои права на улицах городов — явление, через которое проходили и проходят многие страны. Движение Black Lives Matter вновь обострило борьбу чернокожего населения за свои права в США, но ведется эта борьба давно — и привлекает внимание историков. Изучаем корни сложных расовых взаимоотношений в нью-йоркском Гарлеме через GIS-систему Digital Harlem

Математика протестов: тест о штрафах и задержаниях митингующих в России

Сколько городов охватили протесты? А на какую сумму уже оштрафовали всех задержанных на акциях? Пройдите наш тест по статистике протестов — и узнайте, насколько хорошо вы представляете ключевые «протестные цифры».
Facebook соцсеть

Цифровая песочница для ботов-наркоторговцев

По исследованию Insider Intelligence за 2020 год пользователи из США не доверяют Facebook в вопросах защиты личной информации. Разработчики социальной сети разрабатывают проект, нацеленный на поиск слабых мест Facebook. Он поможет выявить потенциальные проблемы с конфиденциальностью с помощью ботов до того, как они повлияют на реальных людей, использующих платформу
книги российских писателей

Маркес и шесть лет российских писателей

Разобрались, какие книги пользуются спросом у читателей благодаря единой системе по числу книговыдач в Москве
big data

Большой атлас больших данных

Круги вместо стран: на основе больших данных создан мировой атлас, в котором можно сравнить страны мира по разным параметрам
выражение скорби

Посты о смерти: оценить нельзя игнорировать

Все видели мемы «Проспал дистанционку» с траурной свечкой, «Здоровья погибшим» и «Press F to pay respect»? Кому-то они покажутся циничными, но пользователи могут использовать черный юмор из-за фрустрации и непонимания, как реагировать на трагические новости. Разбираемся, почему никто не знает, ставить ли лайк смерти в сети
ИИ в играх

Пазлы и искусственный интеллект: как улучшить нейросети при помощи игр

С помощью мобильных игр мы обычно расслабляемся и убиваем время. А вот новая игра от исследователей из Калифорнийского университета и фонда Шампалимо запущена для исследовательских целей — она изучает человека, чтобы улучшить искусственный интеллект. Разбираемся, к каким открытиям может привести игра-пазл

Опубликован открытый корпус европейских романов

Проект «Дальнее чтение для европейской литературной истории» выпустил собрание старых произведений. В коллекцию вошли 884 романа на 18 языках
NLP

ЕГЭ для нейросетей: как тестируют усвоение языка машинами

Многие знают о современных языковых моделях и спорят, что лучше: BERT или GPT-3. Но мало кто знает, по каким критериям оценивается их качество. Разбираемся, что делает языковую модель умной
как работает МРТ как работает полиграф

Миф о «машине правды»: как работают полиграф и МРТ на самом деле

Миф, что с помощью современных устройств можно раскрыть обман, очень устойчив. При этом научные исследования указывают на серьезные недостатки таких технологий. Разбираемся, могут ли полиграф и МРТ отделить правду от лжи

Что не так с современным машинным обучением. Расшифровка подкаста с Дмитрием Ветровым

Публикуем материалы к шестому выпуску подкаста «Неопознанный Искусственный Интеллект»: текст расшифровки выпуска, оглавление, полезные ссылки и термины.

Роборуки для помощи инвалидам стали точнее и быстрее

Исследователи разработали алгоритмы для людей с ограниченными возможностями. Они получат интуитивный контроль над конечностями машин
rucompromat

Токсичный Путин: что видно в соцсети русского компромата

Рассказываем, что увидели ученые, построив «социальную сеть русского компромата» на 11 тысяч человек. Спойлер: Путин официально самый токсичный! Но ведь если ваши связи помогают вам прятать деньги и возводить на них дворцы, то «токсичность» можно и потерпеть? Ради комнаты для грязи — годятся любые связи. Подробности — в нашей статье
сколько лет дому

Как построить карту возрастов зданий на открытых данных: проект How old is this house?

Визуализация возраста зданий на карте — не новая идея, в том числе для Москвы. Подобную вещь несколько лет назад сделал «Меркатор», сравнительно недавно интерактивную карту опубликовала «Стрелка». Но оба проекта посвящены теме жилищного строительства и показывают только жилые дома. Проект how-old-is-this.house старается показать более полную картину
чат-бот

Логика Аристотеля выводит ИИ на новый уровень

Австралийские ученые разработали терапевтические чат-боты для людей, которые испытывают трудности в общении
улучшить изображение нейросеть

Возвращение четкого попугая: как нейросеть реставрирует старые советские мультфильмы

«Системный Блокъ» уже рассказывал как «Союзмультфильм» вручную восстановил часть советских анимационных лент. Основная проблема старых мультфильмов — не физические повреждения и выцветание, а низкое разрешение видеозаписи.

Птицы наконец услышали друг друга в пандемию

Во время локдауна городские воробьи в Сан-Франциско запели чище и с бóльшим количеством информации. С сельскими птицами такого не случилось. Ученые объясняют это низким уровнем шумового загрязнения в пандемию.
Неопознанный искусственный интеллект

Взгляд на ИИ из Кремниевой долины. Расшифровка подкаста с Николаем Любимовым

Дополнение к пятому выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки
эстетический холодок

Исследователи мозга нашли связь между мурашками и музыкой

Ученые выяснили, откуда берутся мурашки при прослушивании музыки. Электроэнцефалография показала: «эстетический холодок» возникает из-за активности головного мозга в тета-диапазоне
память мозга

Память человека оказалась избирательной на слова

Человеческий мозг способен устанавливать связи между объектами, словами и изображениями из нашего прошлого опыта. Чем чаще мозг обращается к словам из прошлого опыта человека, тем они лучше запоминаются. Ученые подозревают, что мы гораздо лучше запоминаем те слова, которые служат для создания связей между воспоминаниями
мультфильмы союзмультфильм

«Союзмультфильм» remastered: старые советские картины показали в новом качестве

«Союзмультфильм» представил первый сборник советских анимаций. Ленты очистили от дефектов пленки и восстановили под требования современного кино и телевидения. Реставрацию специалисты студии провели вручную
редакционное расстояние

Расстояние Левенштейна

Мы уже рассказывали про редакционные расстояния, с помощью которых сравнивают близость строк и вычисляют степень их похожести. Сегодня рассказываем о самом распространенном редакционном расстоянии — расстоянии Левенштейна

Как цифровой этикет формирует комфортную digital-среду

Благодаря пандемии мы уже научились защищать свои физические границы и держать дистанцию. Но личные границы существуют и в цифровой среде. Разбираемся, как обезопасить свою страницу от хейтеров, не скомпрометировать самих себя и писать сообщения так, чтобы получать качественные и своевременные ответы.

«Системный Блокъ» 2020: лучшие посты

В 2020 году Системный Блокъ опубликовал примерно 400 материалов, включая статьи, интервью, подкасты, видео и мемы. Сегодня мы собрали для вас лучшее. Крутейшие исследования, интервью, визуализации и мемы 2020 года от «СБъ» — в одной статье
цель искусственного интеллекта

Достигла ли своих целей разработка искусственного интеллекта?

В 1972 году ученые составили список из 12 задач, которые нужно решить для создания искусственного интеллекта в ближайшие десятилетия. В список входили автоматический перевод, самоуправляемые автомобили и даже автономные роботы-планетоходы. Мы попробовали оценить, что сделано, а что еще нет
цифровой архив воспоминаний

Как звучат личные истории в цифровом архиве: интервью с Линор Горалик

Все, что ты помнишь, важно. Как звучат личные истории в цифровом архиве воспоминаний, почему воспоминания стоит транслировать и какие цели преследует проект по актуализации памяти. Обо всем этом — в интервью с Линор Горалик, писательницей, основавшей проект Postpost. Media

Как строить искусственный интеллект и не погубить человеческую цивилизацию. Расшифровка подкаста с Константином Воронцовым

Эта страничка — дополнение к третьему выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки.
метод моделирования в истории

Пелопоннесская война и анализ данных: статистические модели для историков

При изучении прошлого ученые часто сталкиваются с нехваткой данных о событиях. Это вызывает проблемы при проверке подлинности фактов и ведет к закономерной фальсификации исторического момента. Рассказываем, как статистические модели исторического моделирования могут помочь исследователям

Что такое редакционное расстояние

Как понять, насколько близки две строки формально? Какое расстояние от слова «карета» до слова «ракета»? Линейкой здесь не измеришь, на помощь приходят редакционные расстояния. Рассказываем, что такое редакционное расстояние, как они работают и какие виды редакционных расстояний существуют

Как обучать датасаентистов, играя в шляпу, и запускать космические корабли будущего. Подкаст НИИ с Виктором Кантором

Эта страничка — дополнение к третьему выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки.
дополненная реальность

Тысяча выставок на ладони: AR-технологии в музеях

Иногда походы в музей не оправдывают наших ожиданий. Тогда на помощь приходят технологии. Рассказываем об инструментах дополненной реальности (AR) для музеев и их возможностях
на ошибках учатся

Каждая ошибка — шаг к пониманию

Чтобы мозг эффективно учился, надо изучать свой ошибочный опыт — вывод нейрофизиологов Университета Пенсильвании
IT-евангелист

Во что верят IT-евангелисты?

Твоя вера должна быть сильна: рассказываем, кто такой IT-евангелист, что он должен уметь, как этому научиться и почему мы еще услышим об IT-евангелистах в будущем. Этот текст — первый в серии «Новый рынок труда», где мы рассказываем о профессиях будущего. Эту серию на страницах «Системного Блока» запускает социально-гуманитарный факультет НИУ ВШЭ - Пермь.

Как лингвисты делают искусственный интеллект, а компьютер решает ЕГЭ. Подкаст НИИ с Татьяной Шавриной

Эта страничка — дополнение ко второму у выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь мы опубликовали текст расшифровки выпуска, с оглавлением и ссылками, для удобства
музыка и мозг

Как музыка меняет наш мозг

Те, кто ругали весь белый свет, плетясь со скрипкой или гитарой в музыкальную школу в 9 утра в субботу, вряд ли задумывались, что развитие музыкальных навыков меняет наш мозг. Разбираемся, почему пылящийся на полке диплом пианиста — не такая уж и бесполезная вещь

Как работает GPT-2 и в чем его особенности

Все слышали о GPT-3, которая умеет сочинять стихи и прозу, разгадывать анаграммы, переводить, отвечать на вопросы по прочитанному тексту и даже писать философские рассуждения о жизни и смерти. Рассказываем, как работает ее бабушка, GPT-2, без которой такой прорыв в области обработки естественного языка был бы невозможен
шрифт уличной вывески

Нейросеть читает вывески на улицах Лондона

Маленькие дети радуются, когда удается прочитать вывеску на улице. Нейросети тоже читают вывески, а некоторые еще и шрифт определяют. И если по почерку человека можно узнать его характер, то какую информацию о жителях городского района позволяет получить почерк улицы?
Эрмитаж онлайн

Как сходить в Эрмитаж онлайн

Как посмотреть коллекцию одного из самых известных музеев мира, спланировать посещение или просто насладиться искусством, не тратя время на очереди или деньги на билеты — и не рискуя подхватить COVID. Эрмитаж теперь можно посетить онлайн

Как прийти к «сильному» искусственному интеллекту. Первый выпуск подкаста НИИ

Эта страничка — дополнение к первому выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки.

От Вердена до Хиросимы, от Гитлера до Трампа: как устроена коллективная память в Twitter

Есть исторические события, о которых помнят, думают и спорят миллионы людей. А есть такие, которые никому не интересны, и никакие государственные выходные вроде Дня народного единства этого не изменят. Теперь измерить вес исторического события или личности в коллективной памяти общества можно с помощью анализа соцсетей
клетки мозга

В мозге нашли клетки, отвечающие за «кодирование» опыта

Ученые Массачусетского технологического института и японского института RIKEN обнаружили группу клеток мозга, хранящих абстрактный прошлый опыт и помогающих интерпретировать новые события. Статья об открытии опубликована журнале Nature Neuroscience
птицы москвы

Видно птицу по полету, а данные о ней — по базе

Какие привычки у птиц, где они обитают и что едят? Проект «Птицы Москвы и Подмосковья» собрал фото, видео с камер наблюдения и сообщения горожан о пернатых на одном сайте. Рассказываем, чем полезен ресурс для исследователей-орнитологов и любителей птиц
минералогия

Интерактивная минералогия: как старинные рисунки камней стали цифровым проектом

В начале 19 века британский натуралист Джеймс Саубери издал 7-томный сборник с рисунками минералов. Теперь насладиться эстетикой «Британская и экзотическая минералогия» можно онлайн. Все рисунки собраны на одной веб-странице в огромный интерактивный постер
похожие картины

Алгоритм находит скрытые связи между картинами

В MIT научились автоматически выявлять похожие полотна в музейных коллекциях. Алгоритм строит «дерево близости» картин и позволяет выявить культурные влияния в живописи

Нейросети-трансформеры изнутри: как работает декодер

Мы уже рассказывали, как работают нейросети-трансформеры — самая популярная и успешная нейросетевая архитектура наших дней. Мы подробно разобрались, как нейросеть-трансформер кодирует текст и как она уделяет «внимание» наиболее важным словам и связям. Теперь пришла пора поговорить о том, как нейросеть выдает итоговый результат, будь то машинный перевод, разметка или продолжение начатого текста. То есть, о декодировании

Социальный digital вместо нелегальных помидоров: интервью с соосновательницей IT-проекта для беженцев TaQadam

Платформа TaQadam — пример интеграции социальных задач и IT-предпринимательства. Рожденный в стенах ООН проект направлен на помощь одному из самых незащищенных слоев населения Ливана — беженцам. «Системный Блокъ» поговорил с сооснователем проекта Кариной Грошевой о том, как можно и нужно обеспечивать беженцев работой, которая не требует специального разрешения
data lake

Data Lake или Data Warehouse: как работает сбор и хранение в Big Data и в чем отличие двух методов

О больших данных или Big Data стало известно не так давно, но популярность они уже обрели немалую. Говорить о больших данных просто, а понять, как их собирают и обрабатывают — не всегда. Разбираемся, какие подходы существуют в сборе и хранении информации, в чем отличие Data Lake от Data Warehouse, что такое ETL и ELT и как их не перепутать.
Иллюстратор: Анна Руденко

«Цифровой антрополог отличается от Data Scientist’а вниманием к деталям»: интервью с Дарьей Радченко (КБ «Стрелка»)

COVID-19 изменил повседневные практики миллионов людей — и это видно по их «цифровым следам». Что говорят об эффективности весеннего карантина данные Инстаграма и других соцмедиа, как люди на самоизоляции «переоткрыли» заново свои спальные районы, а также каковы ограничения Data Science в социальных исследованиях — рассказывает Дарья Радченко, заместитель руководителя Центра городской антропологии КБ «Стрелка».

Самоуправляемый автомобиль научился понимать водителя

Команда ученых из MIT запрограммировала автомобиль определять социотипы других водителей. Как это может повлиять на развитие самоуправляемых автомобилей?
сознание человека

Мозг в банке: где у человека «сознание»

Проигнорировав молчаливое неодобрение некоторых философов, предположим, что сознание существует. Но что это такое и где оно находится? В каком состоянии человек скорее в сознании, а в каком – лишен всяких его признаков? Попробуем разобраться