Фото автора

Евгения Родикова

Художник

Увлекаюсь живописью, иллюстрацией, дизайном одежды. Люблю котиков

Иллюстратор статей

RhymeTagger: создан инструмент для автоматической разметки рифмы

Чешский цифровой стиховед Петр Плехач разработал и опубликовал библиотеку Python под названием rhymetagger, которая предназначена для поиска рифмы в стихотворениях. Разработанный алгоритм протестировали на текстах на английском, французском и чешском языках

Правосудие на ладони: открытые данные о судах и приговорах в России

Проект «Достоевский» от ОВД-Инфо – открытые данные об уголовных делах в России с 2009 года на одной бесплатной платформе

Взгляд в «черный ящик» искусственного интеллекта

Ученые исследуют внутренности нейронных сетей через аналогию со зрением

Виден ли конец «нейронного блицкрига»: компьютерные лингвисты между вычислениями и теорией. Расшифровка подкаста с Денисом Кирьяновым

Публикуем материалы к восьмому выпуску подкаста «Неопознанный Искусственный Интеллект»: текст расшифровки выпуска, оглавление, полезные ссылки и термины.

Стэнфорд научит белых воротничков сосуществовать с нейросетями

Внедрение искусственного интеллекта обернулось проблемой для сотрудников компаний. Но ученые знают решение: они открыли лабораторию социальных взаимодействий… с роботами!

Пообедать у Канта: калининградские ученые воссоздают дом философа в 3D

К грядущему 300-летию одного из самых цитируемых философов мира специалисты из Центра социально-гуманитарной информатики Балтийского федерального университета реконструируют дом своего земляка в Кёнигсберге XVIII в. Виртуальная реконструкция ведется на основе письменных источников, а также единичных старых фотографий и картин

VR-дизайнер «оживил» 54 римских императора

Карантинный проект дизайнера из Торонто вышел из-под контроля: посмотрите, как могли бы выглядеть римские императоры вживую
цифровой гуманитарий

Тест: какой вы цифровой гуманитарий?

Пройдите тест, который покажет, кто вы в мире цифровых гуманитарных исследований. А заодно — познакомьтесь с известными цифровыми гуманитариями.

Ученые доказали: поисковики меняют нашу память

Американские ученые опубликовали исследование о влиянии интернета на память людей. Теперь, когда человеку нужна какая-либо информация, он вспоминает не сами факты, а где можно их найти
тайна перевала дятлова

Гибель группы Дятлова смоделировали в лаборатории лавин

Исследователи лавин из Швейцарии создали компьютерную модель, которая демонстрирует одну из версий гибели туристов. Ученые использовали также технологии из 3D-анимации и автомобильных краш-тестов

У ворон нашли самосознание

Исследователи выяснили, что вороны оценивают свой разум. Интеллект и сознание птиц зависят от связности и активности нейронов.
рост ВВП

Рост экономики Европы отразился в портретах XIV – XXI веков

Развитие портретной живописи с XIV по XXI век связали с подъемом уровня социального доверия, причина которого – в экономике
комбинаторика

Алгоритм против копирайта: как запатентовать все мелодии мира

Программист и адвокат заявили права собственности на каждую когда-либо написанную мелодию песни
паратекст

Окружён, но не сломлен: цифровой паратекст и его применение

Когда мы читаем книгу, то иногда отвлекаемся на нумерацию страниц, перечитываем оглавление или сравниваем обложку с содержанием. Так происходит, потому что все эти элементы являются паратекстом. О том, что означает этот термин и какие функции несёт, расскажем в нашей статье
структура белков

Нейросети научили определять структуру белка

Исследователи из компании Google создали алгоритм, который распознает строение белка. Биологи решали эту задачу 50 лет
звук губами

Нейросеть определяет дипфейки по губам

Группа исследователей из Беркли и Стэнфорда разработала инструмент, который находит нестыковки в аудио-визуальном потоке между положениями губ и произносимыми звуками
дата-журналист

От данных — к людям: что такое дата-журналистика

Анализ смертей от алкоголизма в России и визуализация травм протестующих в Беларуси, изучение статистики наркопреступлений и расследование пыток в силовых структурах на основе тысяч приговоров — все это примеры журналистики данных. Разбираемся, чем занимаются data-журналисты и что в их работе главное. Спойлер: главное — не данные!

Почему искусственный интеллект врет и как его его от этого отучить. Расшифровка подкаста с Давидом Дале

Публикуем материалы к седьмому выпуску подкаста «Неопознанный Искусственный Интеллект»: текст расшифровки выпуска, оглавление, полезные ссылки и термины.
тест по средневековым университетам

Кто такой педель и как получить матпомощь в XIV веке? Тест по cредневековым университетам

Быть студентом в Средние века — это вам не с айфона шпоры списывать. Но многие знакомые современным студентам вещи были в университетах уже тогда. Например, землячества или материальная помощь для малообеспеченных. Проверьте ваши знания об университетской жизни в Средневековье.
система ГИС

Цифровой Гарлем: GIS-система по истории самого известного черного района США

Борьба угнетенных людей за свои права на улицах городов — явление, через которое проходили и проходят многие страны. Движение Black Lives Matter вновь обострило борьбу чернокожего населения за свои права в США, но ведется эта борьба давно — и привлекает внимание историков. Изучаем корни сложных расовых взаимоотношений в нью-йоркском Гарлеме через GIS-систему Digital Harlem

Математика протестов: тест о штрафах и задержаниях митингующих в России

Сколько городов охватили протесты? А на какую сумму уже оштрафовали всех задержанных на акциях? Пройдите наш тест по статистике протестов — и узнайте, насколько хорошо вы представляете ключевые «протестные цифры».
big data

Большой атлас больших данных

Круги вместо стран: на основе больших данных создан мировой атлас, в котором можно сравнить страны мира по разным параметрам

Что не так с современным машинным обучением. Расшифровка подкаста с Дмитрием Ветровым

Публикуем материалы к шестому выпуску подкаста «Неопознанный Искусственный Интеллект»: текст расшифровки выпуска, оглавление, полезные ссылки и термины.

Роборуки для помощи инвалидам стали точнее и быстрее

Исследователи разработали алгоритмы для людей с ограниченными возможностями. Они получат интуитивный контроль над конечностями машин
Неопознанный искусственный интеллект

Взгляд на ИИ из Кремниевой долины. Расшифровка подкаста с Николаем Любимовым

Дополнение к пятому выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки
редакционное расстояние

Расстояние Левенштейна

Мы уже рассказывали про редакционные расстояния, с помощью которых сравнивают близость строк и вычисляют степень их похожести. Сегодня рассказываем о самом распространенном редакционном расстоянии — расстоянии Левенштейна

«Системный Блокъ» 2020: лучшие посты

В 2020 году Системный Блокъ опубликовал примерно 400 материалов, включая статьи, интервью, подкасты, видео и мемы. Сегодня мы собрали для вас лучшее. Крутейшие исследования, интервью, визуализации и мемы 2020 года от «СБъ» — в одной статье

Как строить искусственный интеллект и не погубить человеческую цивилизацию. Расшифровка подкаста с Константином Воронцовым

Эта страничка — дополнение к третьему выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки.

Что такое редакционное расстояние

Как понять, насколько близки две строки формально? Какое расстояние от слова «карета» до слова «ракета»? Линейкой здесь не измеришь, на помощь приходят редакционные расстояния. Рассказываем, что такое редакционное расстояние, как они работают и какие виды редакционных расстояний существуют

Как обучать датасаентистов, играя в шляпу, и запускать космические корабли будущего. Подкаст НИИ с Виктором Кантором

Эта страничка — дополнение к третьему выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки.

Как лингвисты делают искусственный интеллект, а компьютер решает ЕГЭ. Подкаст НИИ с Татьяной Шавриной

Эта страничка — дополнение ко второму у выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь мы опубликовали текст расшифровки выпуска, с оглавлением и ссылками, для удобства

Как работает GPT-2 и в чем его особенности

Все слышали о GPT-3, которая умеет сочинять стихи и прозу, разгадывать анаграммы, переводить, отвечать на вопросы по прочитанному тексту и даже писать философские рассуждения о жизни и смерти. Рассказываем, как работает ее бабушка, GPT-2, без которой такой прорыв в области обработки естественного языка был бы невозможен

Как прийти к «сильному» искусственному интеллекту. Первый выпуск подкаста НИИ

Эта страничка — дополнение к первому выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки.

Нейросети-трансформеры изнутри: как работает декодер

Мы уже рассказывали, как работают нейросети-трансформеры — самая популярная и успешная нейросетевая архитектура наших дней. Мы подробно разобрались, как нейросеть-трансформер кодирует текст и как она уделяет «внимание» наиболее важным словам и связям. Теперь пришла пора поговорить о том, как нейросеть выдает итоговый результат, будь то машинный перевод, разметка или продолжение начатого текста. То есть, о декодировании

Социальный digital вместо нелегальных помидоров: интервью с соосновательницей IT-проекта для беженцев TaQadam

Платформа TaQadam — пример интеграции социальных задач и IT-предпринимательства. Рожденный в стенах ООН проект направлен на помощь одному из самых незащищенных слоев населения Ливана — беженцам. «Системный Блокъ» поговорил с сооснователем проекта Кариной Грошевой о том, как можно и нужно обеспечивать беженцев работой, которая не требует специального разрешения

Как вычислить TF-IDF?

Интуитивно задачу TF-IDF решает каждый, кто делал запрос в Гугле: нужно догадаться, какие слова ярче всего характеризуют запрос и «спросить» именно их. Хороший поисковик, если он хочет выдать релевантные результаты, тоже вычислит, какие слова несут больше всего смысла в текстах и соответствуют запросам. Как получить численные ответы на вопросы о том, какие слова важнее других и что это значит, читайте в глоссарии «Системного Блока»

Как компьютеры читают комиксы?

Мы привыкли воспринимать комиксы как цветные или черно-белые картинки с текстом, которые складываются в историю. Однако это сложно организованный текст, потребление которого требует от нас и визуального, и текстового восприятия. Несмотря на сложность, сегодня комиксы исследуют автоматически при помощи компьютерного зрения. Рассказываем, как это работает

Как работают трансформеры — крутейшие нейросети наших дней

Трансформер — самая модная сегодня нейросетевая архитектура. Она появилась в 2017 и перевернула всю обработку языка машинами. Мы расскажем о структуре трансформера без кода — чтобы потом при взгляде на код вы могли понять, что он делает

Named Entity Recognition (NER)

Когда человек читает книгу, он без труда понимает, что какие-то слова в тексте – это имя героя, а какие-то – название местности, даже если он впервые столкнулся с таким именем или названием. Для компьютера работа по распознаванию имен людей, названий организаций, топонимов и т.п. оказалась довольно сложной, но все-таки машины с ней справляются — и с каждым годом все лучше

Алгоритм против deepfake

Нейросети способны не только создавать дипфейки, но и бороться с ними — отслеживать манипуляции с изображением, даже если изменен был только один пиксель. Рассказываем и показываем, как работают такие инструменты

Скажи «Нет!»: цифровые проекты о домашнем и сексуальном насилии

Проблема насилия по отношению к женщинам, детям и подросткам — одна из острейших в наши дни. Она возникает в дискуссиях о законе о домашнем насилии, в сюжетах новостей и социальных роликах. Даже сериал «Чики» напомнил о телефоне доверия. А мы делимся цифровыми образовательными ресурсами, которые могут спасти жизнь

Не по голосу, но по глазам: алгоритм узнает тебя из тысячи

В июне Microsoft, Amazon и IBM временно отказались предоставлять силовым структурам технологии распознавания лиц. Примерно тогда же Ассоциация вычислительной техники призвала Конгресс США ввести мораторий на распознавание лиц во всех штатах. Причины — расовая, этническая и гендерная предвзятость алгоритмов, а также недоверие к полиции. Разбираемся, что не так с распознаванием лиц

TEI: текстовый инструментарий, который смог

TEI (Text Encoding Initiative) – это формат кодирования текстов и отличная возможность перенести рукописи в удобный электронный вид. TEI используется во многих проектах по созданию цифровых ресурсов. Тексты из архивных документов, рукописей и древних надписей сохраняются со всеми нюансами и разночтениями. А еще дополняются машиночитаемыми метаданными

Сводеш 2.0: новый уровень разговоров про академию

За что хвататься, когда учишь новый язык? Некоторые начинают со ста самых частотных слов, некоторые — с любимой темы или полезных выражений типа «Спасибо» или «Передайте, пожалуйста, соль». Но как быть, если изучать приходится не французский или испанский, а целый пласт разнообразных выражений, используемых в академической среде? На помощь приходят корпусные исследования!

Как не стать жертвой фейк ньюc: советы ученых

Ежедневно мы сталкиваемся с большим потоком противоречивых фактов и искаженной информации. Как отличить фейк-ньюс от реальных фактов? Каким источникам следует доверять и когда нужно сомневаться? Распознать фейки и научиться абстрагироваться от предубеждений поможет научный подход

Как помочь Камчатке: лайк, шер, репост, геотег

На Камчатке произошла экологическая катастрофа. Но можно ли помочь, если ты обычный человек? Мы можем не только распространять информацию, но и помогать ученым ее получить: краудсорсинг фотографий камчатского побережья и их пространственных метаданных может помочь специалистам в изучении причин и хронологии экологической катастрофы.

Почему Алиса и Siri располагают нас к откровенным разговорам

В фильме «Она» показано недалекое будущее, где искусственный интеллект стал рутиной, а главный герой заводит роман с виртуальной помощницей. В 2020 году эта мелодрама не кажется фантастикой. Разбираемся, как виртуальные агенты становятся нашими собеседниками, конфидентами и друзьями

Насколько предсказуема художественная литература?

Читать книги бывает долго и неинтересно. Иногда просто хочется узнать, что будет в конце. Рассказываем, может ли компьютер прочитать книжку за вас, и что он сумеет понять

Геохронологический трекинг в истории

Каждому, кто в школе заполнял контурные карты, известно, что исторические данные иногда гораздо удобнее представлять в пространстве. Для научного анализа событий прошлого историки используют более продвинутые географические методы. Разбираемся, что такое геохронологический трекинг, и как он помогает в исторических исследованиях

Мальчики - программисты, девочки - балерины: гендерное неравенство в образовании и науке

Бородатый сексистский анекдот гласит: «Женщина-программист — как морская свинка: не имеет отношения ни к морю, ни к свиньям». Не смешно и очень грустно: гендерный разрыв в точных и естественных науках существовал веками и успел стать привычным. Разбираемся, как работает гендерное неравенство в академическом сообществе.

Обучаем Word2vec: практикум по созданию векторных моделей языка

Как использовать в своей повседневной работе векторные семантические модели и библиотеку Word2Vec? Это несложно: понадобится немного кода на Python и (для второй части) готовые векторные модели — например, с сайта RusVectores. Публикуем наш тьюториал по Word2vec

Ok, Google, купи слона: онлайн-шоппинг и голосовые помощники

Типичный поход в магазин включает в себя долгий выбор продуктов, блуждание между полками товаров, ожидание в очереди. А что если бы мы могли доверить весь онлайн-шоппинг голосовым ассистентам в нашем смартфоне?

Hello world: музыкальный альбом от искусственного интеллекта

История взаимодействия искусственного интеллекта и музыки совсем не нова. Еще в 1958 году ИИ использовался для создания композиций, подражающих Баху. Как нейросети развили свои музыкальные навыки за 60 лет, рассказываем на примере альбома Hello World.

Право на голос: география иммиграционных протестов в США в начале нового тысячелетия

С мая 2020 движение Black Lives Matter вспыхнуло в США с новой силой. Масштабы акций велики, но с Америкой такое не впервые. Вспоминаем протесты 2006 года в поддержку иммигрантов и изучаем географию митингов с помощью системы ГИС и анализа массовых данных

Тиндер 1917 года и революция в цифре

Историческое знание нуждается в новых формах представления, особенно онлайн. Но как поговорить о прошлом доступно? Публичная история (public history) предлагает digital-проекты для изучения истории в игровой форме. Рассказываем о проектах «1917. Свободной истории» и «1917. День за днем»

Дата-майнинг Бодлера: как стихи запретного декадента разлетелись по миру

Рассказываем о проекте Baudelaire Song Project, где собраны все песни, написанные на стихи Шарля Бодлера, и музыка, вдохновленная его поэзией. Этот ресурс — разведочный аналитический дашборд с яркими визуализациями, целиком посвященный тому, как, кто и где «поет Бодлера». Россияне среди исполнителей тоже есть

Стереть нельзя оцифровать: эпиграфика открывает второе дыхание

Допустим, историк нашел древнюю надпись на скале — и хочет ее сохранить. Что делать? Классические методы: переписывание текста, зарисовка или эстампирование (создание оттиска) — часто приводят к неточностям и ошибкам. Но с изобретением цифровой фотографии и 3D-моделирования документирование эпиграфического памятников изменилось

Как распределяются крупные государственные субсидии

С конца 2019 года российские власти публикуют список топ-20 крупнейших государственных субсидий. Их получатели — РЖД, Сбербанк, телеканал Russia Today и другие организации и госструктуры. «Системный Блокъ» изучил этот список — и визуализировал для вас, кто, откуда и сколько миллиардов получил

Запутать нельзя угадать: как нейросети генерируют ложные приманки для тестов

Составлять тесты сложно: кроме правильного ответа надо придумать хотя бы три неправильных. Причем придумать их с умом: чтобы варианты не были слишком очевидно неверными — но и не оказались бы при этом подходящей альтернативой верному варианту. Хорошая новость в том, что скоро эту головоломную работу смогут выполнить за вас нейросети

Мемы vs. Анекдоты, или Выживает вируснейший

Еще лет двадцать назад англичанин, француз и русский часто собирались вместе, Вовочка пререкался с Марьванной, а кто-то искал Дерибасовскую. Сегодня их место заняли Карл, поросенок Петр и «Беды с Башкой». О том, как мемы пришли к успеху, читайте в нашем материале