Фото автора

Даниил Скоринкин

Главный редактор

Цифровой литературовед, программирующий гуманитарий

Редактор статей

Путешествие во времени: подборка дореволюционных открыток из будущего в прошлое

Сегодня 15 октября. И в любой стране Европе тоже 15 октября. Правда, к такому единогласию в календарях мы пришли недавно: чуть больше ста лет назад. До этого Россия и Европа жили буквально в разных временах. Как эта разница отразилась в почтовых открытках, читайте в нашем новом материале от проекта «Пишу тебе»

Как превратить текст в генеалогическое древо с помощью Python

Как понять, кем вам приходится сваха внучатого племянника вашей сестры? Проще всего - нарисовать генеалогическое древо, которое отразит все родственные связи. А еще лучше - написать код на Python, который сделает это за вас

Тест: что говорит статистика о выборах в регионах России

17–19 сентября 2021 года в России прошли выборы в Государственную Думу. Независимый электоральный аналитик Сергей Шпилькин построил графики, которые отражают результаты голосования в разных регионах. По ним можно предположить, были ли на выборах фальсификации. Пройдите наш тест и проверьте, сможете ли вы понять, какой регион на каждом графике?

«Кладмен мудак»: анализ тональности отзывов о запрещенных веществах

Язык интернета имеет свои характерные черты. И если исследованию языка Рунета посвящено множество работ, то DarkNet все еще остается серым пятном в этом плане. С помощью анализа тональности текстов выясняем, какая лексика характерна для отзывов о запрещенных веществах.

Веселое Рождество для великой княжны: как поздравляли друг друга в старых открытках

Наш проект по оцифровке открыток «Пишу тебе» продолжает исследовать свою постоянно растущую коллекцию. На этот раз мы изучили поздравительные открытки, написанные как до, так и после революции. Некоторые популярные поздравления сегодня выглядят неожиданно, хотя раньше были распространены повсеместно.

Подборка летних открыток дореволюционного и советского времени

Уже минула середина лета, кто-то еще только в предвкушении отпуска, а кто-то возвращается из поездок, путешествий, приключений. Такие моменты хочется разделять с близкими людьми. В дореволюционное и советское время популярным способом поделиться впечатлениями из поездки было отправление почтовых открыток с изображением городских достопримечательностей. Проект «Пишу тебе» сделал подборку летних почтовых открыток, где люди рассказывают об отдыхе и путешествиях.

«Это имитация интеллекта»: Константин Воронцов — о настоящем и будущем машинного обучения

Сможет ли человечество построить искусственный интеллект, не уступающий человеческому, и надо ли его строить? «Системный Блокъ» обсудил это с Константином Воронцовым, одним из известнейших специалистов по машинному обучению в России. Публикуем его ответы на наши вопросы

открытка

«Желаю быть паинькой»: как поздравляли с днем рождения в дореволюционных открытках

Сегодня Системный Блокъ отмечает свой третий день рождения. День рождения - очень добрый праздник. В этот день именинник получает приятные пожелания от близких людей. И никакие расстояния не помеха чтобы сказать теплые слова дорогому человеку. Сейчас нам не составит труда позвонить имениннику или отправить ему пожелания в мессенджере. А в начале XX века единственным способом поздравить на расстоянии человека было отправление почтовых открыток или писем.

зарплаты учителей в россии

«Марь Иванна, у вас воротничок сине́ет»: исследование СБъ о зарплатах учителей

Сегодня в России более 1,3 млн учителей средних школ. «Системный Блокъ» решил узнать, насколько учитель средней школы в России подходит под критерий среднего класса. Говоря геймерским языком: насколько трудно «проходить Россию» на уровне сложности «medium teacher»

Байкал

Нейросеть проследит за чистотой Байкала

Российские ученые начали разработку нейросетевого алгоритма для мониторинга экосистемы озера Байкал. Он будет делать анализ проб воды, автоматически распознавать и классифицировать живущие в ней микроорганизмы. Раньше это делалось вручную.

Привет с фронта: военные открытки

80 лет назад, 22 июня 1941 года, началась Великая Отечественная война. В военное время было особенно важно сообщить вести о себе своим близким, друзьям, знакомым. Проект «Пишу тебе» отобрал фронтовые открытки, посвященные тем временам. Эти открытки наполнены любовью, заботой и надеждой на встречу с родными

Как видят мир беспилотники и почему «обучение с учителем» сломано. Расшифровка подкаста с Борисом Янгелем

Эта страничка — дополнение к XI выпуску подкаста «Неопознанный Искусственный Интеллект». В этом выпуске мы общались с Борисом Янгелем из команды разработки беспилотных автомобилей в Яндексе. Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки

документы ВОВ

Что можно найти в цифровом архиве «Документы Победы»

Цифровой архив «Документы Победы» хранит свидетельства о том, как управлялись войска, оборонная промышленность и прочие отрасли хозяйства во время Великой Отечественной войны.

Рыбий жир полнит: о чем писали дети в открытках

1 июня — международный день защиты детей. К этому дню проект «Пишу тебе» собрал подборку старых открыток, написанных детьми. Юные авторы открыток рассказывают родителям о понравившихся игрушках, школьных отметках и последствиях употребления рыбьего жира.

Виден ли конец «нейронного блицкрига»: компьютерные лингвисты между вычислениями и теорией. Расшифровка подкаста с Денисом Кирьяновым

Публикуем материалы к восьмому выпуску подкаста «Неопознанный Искусственный Интеллект»: текст расшифровки выпуска, оглавление, полезные ссылки и термины.

цифровой гуманитарий

Тест: какой вы цифровой гуманитарий?

Пройдите тест, который покажет, кто вы в мире цифровых гуманитарных исследований. А заодно — познакомьтесь с известными цифровыми гуманитариями.

В пространстве текстов: детоксикация комментариев, подделка отзывов и нейроцензура

Как работают современные методы переноса стиля? Могут ли они быть полезны или опасны? И при чём здесь «бутылочное горлышко» нейросети?

дата-журналист

От данных — к людям: что такое дата-журналистика

Анализ смертей от алкоголизма в России и визуализация травм протестующих в Беларуси, изучение статистики наркопреступлений и расследование пыток в силовых структурах на основе тысяч приговоров — все это примеры журналистики данных. Разбираемся, чем занимаются data-журналисты и что в их работе главное. Спойлер: главное — не данные!

Как работают нейросети: подборка постов с пошаговыми разборами

Разбираем сложные технологии глубокого обучения, чтобы они становились понятны каждому

Почему искусственный интеллект врет и как его его от этого отучить. Расшифровка подкаста с Давидом Дале

Публикуем материалы к седьмому выпуску подкаста «Неопознанный Искусственный Интеллект»: текст расшифровки выпуска, оглавление, полезные ссылки и термины.

тест по средневековым университетам

Кто такой педель и как получить матпомощь в XIV веке? Тест по cредневековым университетам

Быть студентом в Средние века — это вам не с айфона шпоры списывать. Но многие знакомые современным студентам вещи были в университетах уже тогда. Например, землячества или материальная помощь для малообеспеченных. Проверьте ваши знания об университетской жизни в Средневековье.

нейросети в искусстве

Определяем дату написания картины онлайн без регистрации и СМС

Научить нейросети понимать искусство пытаются уже много лет. И хотя про «понимание» говорить рано, некоторые задачи, ранее доступные лишь искусствоведу, они решают неплохо! Пример — датировка живописи. Рассказываем про систему, сделанную студентами МИСиС, которая может датировать картины — причем не только всем известные «Звездную ночь» или «Мона Лизу», но и полотна неизвестных художников. Кстати, эту модель может протестировать любой желающий!

система ГИС

Цифровой Гарлем: GIS-система по истории самого известного черного района США

Борьба угнетенных людей за свои права на улицах городов — явление, через которое проходили и проходят многие страны. Движение Black Lives Matter вновь обострило борьбу чернокожего населения за свои права в США, но ведется эта борьба давно — и привлекает внимание историков. Изучаем корни сложных расовых взаимоотношений в нью-йоркском Гарлеме через GIS-систему Digital Harlem

Математика протестов: тест о штрафах и задержаниях митингующих в России

Сколько городов охватили протесты? А на какую сумму уже оштрафовали всех задержанных на акциях? Пройдите наш тест по статистике протестов — и узнайте, насколько хорошо вы представляете ключевые «протестные цифры».

Что не так с современным машинным обучением. Расшифровка подкаста с Дмитрием Ветровым

Публикуем материалы к шестому выпуску подкаста «Неопознанный Искусственный Интеллект»: текст расшифровки выпуска, оглавление, полезные ссылки и термины.

rucompromat

Токсичный Путин: что видно в соцсети русского компромата

Рассказываем, что увидели ученые, построив «социальную сеть русского компромата» на 11 тысяч человек. Спойлер: Путин официально самый токсичный! Но ведь если ваши связи помогают вам прятать деньги и возводить на них дворцы, то «токсичность» можно и потерпеть? Ради комнаты для грязи — годятся любые связи. Подробности — в нашей статье

Неопознанный искусственный интеллект

Взгляд на ИИ из Кремниевой долины. Расшифровка подкаста с Николаем Любимовым

Дополнение к пятому выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки

«Системный Блокъ» 2020: лучшие посты

В 2020 году Системный Блокъ опубликовал примерно 400 материалов, включая статьи, интервью, подкасты, видео и мемы. Сегодня мы собрали для вас лучшее. Крутейшие исследования, интервью, визуализации и мемы 2020 года от «СБъ» — в одной статье

цель искусственного интеллекта

Достигла ли своих целей разработка искусственного интеллекта?

В 1972 году ученые составили список из 12 задач, которые нужно решить для создания искусственного интеллекта в ближайшие десятилетия. В список входили автоматический перевод, самоуправляемые автомобили и даже автономные роботы-планетоходы. Мы попробовали оценить, что сделано, а что еще нет

цифровой архив воспоминаний

Как звучат личные истории в цифровом архиве: интервью с Линор Горалик

Все, что ты помнишь, важно. Как звучат личные истории в цифровом архиве воспоминаний, почему воспоминания стоит транслировать и какие цели преследует проект по актуализации памяти. Обо всем этом — в интервью с Линор Горалик, писательницей, основавшей проект Postpost. Media

Как строить искусственный интеллект и не погубить человеческую цивилизацию. Расшифровка подкаста с Константином Воронцовым

Эта страничка — дополнение к третьему выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки.

Как обучать датасаентистов, играя в шляпу, и запускать космические корабли будущего. Подкаст НИИ с Виктором Кантором

Эта страничка — дополнение к третьему выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки.

IT-евангелист

Во что верят IT-евангелисты?

Твоя вера должна быть сильна: рассказываем, кто такой IT-евангелист, что он должен уметь, как этому научиться и почему мы еще услышим об IT-евангелистах в будущем. Этот текст — первый в серии «Новый рынок труда», где мы рассказываем о профессиях будущего. Эту серию на страницах «Системного Блока» запускает социально-гуманитарный факультет НИУ ВШЭ - Пермь.

Как лингвисты делают искусственный интеллект, а компьютер решает ЕГЭ. Подкаст НИИ с Татьяной Шавриной

Эта страничка — дополнение ко второму у выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь мы опубликовали текст расшифровки выпуска, с оглавлением и ссылками, для удобства

Как прийти к «сильному» искусственному интеллекту. Первый выпуск подкаста НИИ

Эта страничка — дополнение к первому выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки.

Нейросети-трансформеры изнутри: как работает декодер

Мы уже рассказывали, как работают нейросети-трансформеры — самая популярная и успешная нейросетевая архитектура наших дней. Мы подробно разобрались, как нейросеть-трансформер кодирует текст и как она уделяет «внимание» наиболее важным словам и связям. Теперь пришла пора поговорить о том, как нейросеть выдает итоговый результат, будь то машинный перевод, разметка или продолжение начатого текста. То есть, о декодировании

Иллюстратор: Анна Руденко

«Цифровой антрополог отличается от Data Scientist’а вниманием к деталям»: интервью с Дарьей Радченко (КБ «Стрелка»)

COVID-19 изменил повседневные практики миллионов людей — и это видно по их «цифровым следам». Что говорят об эффективности весеннего карантина данные Инстаграма и других соцмедиа, как люди на самоизоляции «переоткрыли» заново свои спальные районы, а также каковы ограничения Data Science в социальных исследованиях — рассказывает Дарья Радченко, заместитель руководителя Центра городской антропологии КБ «Стрелка».

Как вычислить TF-IDF?

Интуитивно задачу TF-IDF решает каждый, кто делал запрос в Гугле: нужно догадаться, какие слова ярче всего характеризуют запрос и «спросить» именно их. Хороший поисковик, если он хочет выдать релевантные результаты, тоже вычислит, какие слова несут больше всего смысла в текстах и соответствуют запросам. Как получить численные ответы на вопросы о том, какие слова важнее других и что это значит, читайте в глоссарии «Системного Блока»

цифровой музей

Онлайн-выставки, цифровое кураторство и музейные IT: интервью с Владимиром Определеновым

Коронавирус повысил важность цифровой трансформации для музеев. Когда физический поход на выставку становится невозможен, остается надеяться на онлайн. Мы поговорили об оцифровке музейных коллекций, онлайн-выставках и роли музея в интернет-экологии с заместителем директора по цифровому развитию ГМИИ им. Пушкина Владимиром Определеновым

Как работают трансформеры — крутейшие нейросети наших дней

Трансформер — самая модная сегодня нейросетевая архитектура. Она появилась в 2017 и перевернула всю обработку языка машинами. Мы расскажем о структуре трансформера без кода — чтобы потом при взгляде на код вы могли понять, что он делает

Обучаем Word2vec: практикум по созданию векторных моделей языка

Как использовать в своей повседневной работе векторные семантические модели и библиотеку Word2Vec? Это несложно: понадобится немного кода на Python и (для второй части) готовые векторные модели — например, с сайта RusVectores. Публикуем наш тьюториал по Word2vec

Hello world: музыкальный альбом от искусственного интеллекта

История взаимодействия искусственного интеллекта и музыки совсем не нова. Еще в 1958 году ИИ использовался для создания композиций, подражающих Баху. Как нейросети развили свои музыкальные навыки за 60 лет, рассказываем на примере альбома Hello World.

Эмоции есть? А если найду?

Пока вы переживаете о повсеместном использовании технологий распознавания лиц, техногиганты считывают ваши эмоции и используют против вас. От пищевых пристрастий до политических взглядов — все можно оценить, изучая ваши эмоции, пока вы листаете ленту. Они даже могут сказать, кто вам больше нравится, кошечки или собачки. И это проблема

Стереть нельзя оцифровать: эпиграфика открывает второе дыхание

Допустим, историк нашел древнюю надпись на скале — и хочет ее сохранить. Что делать? Классические методы: переписывание текста, зарисовка или эстампирование (создание оттиска) — часто приводят к неточностям и ошибкам. Но с изобретением цифровой фотографии и 3D-моделирования документирование эпиграфического памятников изменилось

Сексизм, лукизм и профессионализм: проблемы студенческой оценки преподавателей

Студенческая оценка преподавания кажется прекрасной идеей. Можно дать обратную связь, посигналить о неудачном опыте, а то и сообщить о преподавателе-абьюзере, который злоупотребляет властью. Но есть и проблемы. Например, ученые выяснили, что внешность преподавателя и общая оценка преподавания связаны. А еще у студентов очень разные стандарты для оценки мужчин и женщин...

Как распределяются крупные государственные субсидии

С конца 2019 года российские власти публикуют список топ-20 крупнейших государственных субсидий. Их получатели — РЖД, Сбербанк, телеканал Russia Today и другие организации и госструктуры. «Системный Блокъ» изучил этот список — и визуализировал для вас, кто, откуда и сколько миллиардов получил

Запутать нельзя угадать: как нейросети генерируют ложные приманки для тестов

Составлять тесты сложно: кроме правильного ответа надо придумать хотя бы три неправильных. Причем придумать их с умом: чтобы варианты не были слишком очевидно неверными — но и не оказались бы при этом подходящей альтернативой верному варианту. Хорошая новость в том, что скоро эту головоломную работу смогут выполнить за вас нейросети

Над пропастью поржи: интервью с техноблогером Вастриком

Технологический блогер vas3k (в миру программист Василий Зубарев) известен всему просвещенному интернету как автор постов о машинном обучении, VR, машинном переводе, цифровой фотографии, блокчейне и других хайповых технологиях. Посты Вастрика — это панк-версия журнала «Юный техник» для читателей 18+. «Системный Блокъ» поговорил с Вастриком о вдохновении для постов, зацикленности IT на себе же и о том, почему в закрытых сообществах не работает демократия

Кино, игры, YouTube: что изучают археологи медиакультуры?

В современном мире мы то и дело сталкиваемся с новыми явлениями в культуре. Вернее, они кажутся новыми. С точки зрения медиаархеологии, все эти явления уже были известны и не раз повторялись. Рассказываем о том, чем занимаются археологи медиа и как запросы аудитории влияют на эволюцию технологий в сфере развлечений

Как взглянуть на миграцию афроамериканцев через GIS-систему

Движение #BlackLivesMatter показало, что проблема совместного проживания черных и белых в США по-прежнему далека от решения: системный расизм порождает жестокий ответ, и общий антагонизм не утихает. Важный исторический аспект этого конфликта — волны миграции чернокожего населения с севера на юг и обратно в поисках справедливости и лучшей жизни. Изучаем географию афроамериканской миграции в США в период с 1920-х по 1970-е годы через веб-сервис с GIS-системой

Как на домах появились номера: адреса сегодня и 300 лет назад

Мы уже не представляем современный город без адресной системы. Номера на домах — элемент повседневности, и, казалось бы, что в них может быть интересного? Но вспомните, например, Бейкер-стрит 221Б или улицу Садовую, 302-бис. Вроде бы обычные сочетания улицы и порядкового номера дома, но за ними скрываются истории, вписанные в наш культурный код. А какова же реальная история за номерами на домах? Разбираемся, когда на домах появились адреса, кому они понадобились, как связаны с Просвещением, призывом в армию и дискриминацией евреев в Европе

Искусственный интеллект изучает законы физики

Алгоритмы искусственного интеллекта неплохо работают с текстами или картинками. А вот адекватное понимание машиной физической реальности до сих пор остается слабым местом. Разбираемся, как работают алгоритмы, которые умеют понимать и предсказывать кинетику предметов

Виртуальный театр: VR-спектакли в США позволяют побыть отцом Гамлета

Как технологии виртуальной реальности позволяют зрителю перевоплотиться в участника сценического действа — например, в тень отца Гамлета? Рассказываем об использовании VR режиссерами американских театров

Как устроена музыкальная «база знаний» Genius

Если вы давно думали о data-исследованиях в популярной музыке, не могли найти хорошие данные, то Genius — ваш вариант. На этом ресурсе есть 25 миллионов песен, богатые метаданные о треке и его исполнителе, и даже что-то вроде краудсорсингового «историко-филологического комментария» к отдельным строчкам. Примеры и подробности — в нашей статье

Стеклянные негативы блудного фотографа и другие приключения русских в американской библиотеке

Филиал России в Америке — это не только про русскую мафию или русских на Брайтон-Бич в Нью-Йорке. Это еще и архивы библиотеки Конгресса США. Системный Блокъ разбирается, что есть русского в главной библиотеке Америки

География данных. Какой статистикой государства делятся охотнее всего?

В современном мире государству не очень прилично быть закрытым. Все больше граждан приходят к мысли, что государственные данные — еще одно общественное благо, а не тайна за колючей проволокой и караульными будками. От открытости данных выигрывают и бизнес, и гражданское общество, и сами госструктуры. Рассказываем, какой информацией сегодня делятся государства и кто лидер открытости

Цифровая филология 1910: как Андрей Белый вычислял отклонения ямба

Попытки применять точные методы в исследованиях стихотворений делались литературоведами задолго до возникновения компьютерных технологий и digital humanities. В начале XX века к точности в анализе поэтических текстов стремился русский поэт-символист Андрей Белый. Он одним из первых ввел в исследование стиха количественные методы

Европейский авангард возрождается в цифре

Изучаем творчество авангардных художников Польши, Хорватии, Бельгии и Эстонии в мультимедийном проекте «Забытое наследие». Здесь есть сеть связей художников друг с другом и с художественными школами, интерактивные таймлайны с работами и другие способы путешествовать по истории авангарда

Что не скрывает Конгресс США?

Крупнейшая в мире библиотека Конгресса США ничего не скрывает, хотя многое хранит — и это не только книги, но и фото, видео, аудио, плакаты, комиксы. СБъ погрузился в диджитал-архивы библиотеки и вернулся с отчетом

Gallica — французская библиотека будущего

Вместе с СБъ разбираемся в пользе электронного формата, пасхальных яйцах и твиттере французской электронной библиотеки Gallica

Автор статей

язык произведений русской литературы

Опознаете ли вы Пушкина из параллельного мира: тест по векторной литературе

Сможем ли мы отличить «Мастера и Маргариту» от «12 стульев»? Скорее всего, не ошибемся. А что если заменить некоторые слова из оригинальных произведений на близкие по значению с помощью векторной модели на базе word2vec? Предлагаем вам пройти наш тест и проверить, насколько хорошо получится опознать классические тексты, если некоторые слова в них будут модифицированы.

Программирование для филологов и нейропоэзия: интервью с Борисом Ореховым

Для чего филологу учиться программировать? Зачем учить нейросети писать стихи? Как мы опираемся на корпусные методы исследования языка в повседневной жизни, даже не замечая этого? Системный Блокъ поговорил с цифровым филологом Борисом Ореховым — доцентом школы лингвистики НИУ ВШЭ и постоянным ведущим нашей рубрики «Нейростихи».

дата-журналист

От данных — к людям: что такое дата-журналистика

Анализ смертей от алкоголизма в России и визуализация травм протестующих в Беларуси, изучение статистики наркопреступлений и расследование пыток в силовых структурах на основе тысяч приговоров — все это примеры журналистики данных. Разбираемся, чем занимаются data-журналисты и что в их работе главное. Спойлер: главное — не данные!

что такое стилометрия

Стилометрия: как в разное время люди искали авторов текстов

Сегодня для того, чтобы понять, кто написал текст под псевдонимом, у исследователей есть количественные методы анализа, в основе которых – подсчет служебных слов в тексте. О том, как люди к этому пришли, рассказываем в материале об истории стилометрии

Иллюстратор: Анна Руденко

«Цифровой антрополог отличается от Data Scientist’а вниманием к деталям»: интервью с Дарьей Радченко (КБ «Стрелка»)

COVID-19 изменил повседневные практики миллионов людей — и это видно по их «цифровым следам». Что говорят об эффективности весеннего карантина данные Инстаграма и других соцмедиа, как люди на самоизоляции «переоткрыли» заново свои спальные районы, а также каковы ограничения Data Science в социальных исследованиях — рассказывает Дарья Радченко, заместитель руководителя Центра городской антропологии КБ «Стрелка».

Над пропастью поржи: интервью с техноблогером Вастриком

Технологический блогер vas3k (в миру программист Василий Зубарев) известен всему просвещенному интернету как автор постов о машинном обучении, VR, машинном переводе, цифровой фотографии, блокчейне и других хайповых технологиях. Посты Вастрика — это панк-версия журнала «Юный техник» для читателей 18+. «Системный Блокъ» поговорил с Вастриком о вдохновении для постов, зацикленности IT на себе же и о том, почему в закрытых сообществах не работает демократия

Цифровая этнография и «дьявольский значок» уведомлений

В книге «Жизнь онлайн: исследование реального опыта в виртуальном пространстве» цифровой этнограф Аннет Маркхэм показывает, как личность, социум и отношения между людьми трансформируются под действием виртуальной среды, насколько реален цифровой опыт и что с этим делать исследователю. В интервью «Системному Блоку» Маркхэм рассказала, какие социальные стереотипы мы переносим в нашу виртуальную жизнь и другие этические проблемы будущего, что меняют в нашем поведении и восприятии Google и Netflix, а еще — как можно изучать самого себя в цифровой среде (и почему после этого люди начинают ненавидеть уведомления)

«Если бы по Евангелию жили бездумные роботы, они были бы одноглазые, однорукие и одноногие»

Как сочетаются компьютерные технологии и Церковь? Зачем настоятелю монастыря алгоритм дистрибутивной семантики word2vec? Исследовать церковные тексты количественными методами — это вообще нормально? Системный Блокъ поговорил об этом с настоятелем Свято-Троицкого Данилова монастыря игуменом Пантелеимоном

Мы вытаскиваем людей из небытия

В России трудно найти семью, где не было бы родственника-участника ВОВ. Но многие почти ничего не знают о судьбе близких, побывавших на войне. К 22 июня «Системный Блокъ» подготовил интервью с Виктором Тумаркиным — техническим руководителем проектов ОБД «Мемориал» и «Подвиг народа», на которых можно узнать о судьбах миллионов участников войны.

Сети Чехова: откуда вырос «Вишневый сад»

А.П. Чехов переизобрел драматический театр. Его роль в истории драматургии сравнима с ролью Эйнштейна в физике и Джобса — в мобильной электронике. В день 160-летия Чехова рассказываем о том, как посмотреть на его творчество через цифровую оптику — и что может дать такой взгляд.

Ищем смыслы: как сделать тематическое моделирование корпуса текстов

Тематическое моделирование — легкий способ понять смысловой состав большой коллекции текстов, которую невозможно быстро прочесть глазами. Пользоваться инструментами тематического моделирования может каждый — а научиться можно в нашем тьюториале. Здесь вы найдете пошаговое руководство с решением основных технических трудностей

Семантические сети: как представить значения слов в виде графа

Компьютерные лингвисты из Вышки, университета Тренто и университета Осло разработали vec2graph — инструмент для визуализации семантической близости слов в виде сети. Воспользоваться vec2graph может любой желающий. Рассказываем, как это работает и зачем нужно

"Объединить классических филологов и специалистов по цифре"

Какие возможности даёт историческому лингвисту программирование? Об этом в интервью Системному Блоку рассказал Йоханн-Маттис Лист — исследователь в области исторической лингвистики и разработчик цифровых методов для сравнительного анализа языков

Под зонтиком Digital Humanities

Ученый и писатель Роман Лейбов о том, что делать с корпусом, учить ли гуманитарию математику и чем заниматься в Рунете, если ты его пионер

Электронный след Анны Ахматовой

Учимся визуализировать открытые геоданные на примере Ахматовских мест в Москве. К 130-летию Анны Ахматовой.

Цифровая история польских евреев

Последний путь Януша Корчака и 200 детей из дома сирот, истребление Варшавского гетто, истории обычных людей — на карте, в скетчах и комиксах. Изучаем, как прошлое можно оживить цифровыми инструментами

«Хочу сделать Sci-Hub легальной платформой»

Создатель Sci-Hub Александра Элбакян — о том, как работает Sci-Hub, что нужно, чтобы этот ресурс стал легальным, и чем грозит изоляция Рунета.

Москва, мэрия, миллиарды: что расследовал Иван Голунов

Инфографика по расследованиям арестованного спецкора «Медузы» Ивана Голунова

Гуманитарии должны прогнозировать культуру

Лев Манович — о будущем соцсетей, смещении глобальных культурных центров и экспорте русского страдания

Сгоревший Нотр-Дам может спасти компьютерная игра (на самом деле нет)

Assassin’s Creed снова был готов выручить мировую культуру, но на этот раз не сложилось

Цифра на службе у филолога

“Гумилёва считали?”: лингвист и популяризатор Александр Пиперски рассказывает, как открыл для себя количественные методы, что из этого получилось и зачем они нужны филологу-исследователю

Смерть у Шекспира

Шекспир не щадил своих персонажей — каждая вторая пьеса кончалась горой трупов. Но как именно они умерли? Какие виды смерти предпочитал Шекспир?

Жутко громко, запредельно тихо: звуки в романах

Крик, рёв, бормотание, шепот: измеряем громкость в литературе

Бандитский Лондон: интерактивная карта

«Два гребца забили человека веслами», «священник из ревности заколол соперника» — криминальная хроника средневекового Лондона с привязкой к координатам

5 лучших новогодних инфографик

Зачем елке аспирин, что говорят политики в новогодних обращениях и как правильно приготовить селедку под шубой

Рембрандт к успеху шел — не фартануло

Как анализ данных предсказывает успех художника

Как нейросеть пишет песни

Языковую модель на основе рекуррентной нейросети научили подбирать тексты под мелодию с учетом пауз и длительности нот. Разбираемся, как это сделано

Не бездушная машина

Могут ли роботы сострадать? Искусственный интеллект для тяжелых эмоций и сложных ситуаций

Искусственный интеллект смотрит сериалы

Распознавание лиц используют не только в камерах слежения. Можно следить и за героями сериалов! Зачем — читайте в нашей статье!

Большой Брат узнает по походке

Прятать лицо от камеры слежения скоро станет бесполезно

Нейросеть вернула Хану Соло лицо

Технология deepfake подходит не только для создания поддельного порно со знаменитостями

Большие данные Большого террора

Каждый год у Соловецкого камня в Москве читают имена жертв репрессий — 12 часов подряд, без остановки. Но сможем ли мы когда-нибудь перечислить всех? Рассказываем о базах данных «Международного Мемориала»

Мозг против компьютера

Идею нейросетевых алгоритмов люди подсмотрели в устройстве мозга. Но современный искусственный интеллект — вовсе не копия человеческого. Разбираемся, в чем главные отличия

Как впечатлить робота: собеседование с искусственным интеллектом

Как машинное обучение и нейро-игры оценивают кандидатов при приеме на работу — и почему в интервью с бездушной машиной все еще важна внешность

Во что превращается жизнь без любви

Как компьютеры сравнивают значения слов, и почему это бывает смешно

Нейросеть научилась диагностировать депрессию

Скоро у тебя в смартфоне появится автоматический диагност, который первым заметит, что ты чот приуныл

Лампочка светит, а лапочка — нет: как компьютеры «вычисляют» значения слов

Откуда поисковики знают, что «пожрать», «поесть» и «кафе» — это близкие вещи? Как можно научить алгоритм различать слова по смысловой близости?

Праздник или смерть? Драма в сети!

Чем отличаются социальные сети трагедий и комедий?

Жарим стейк онлайн — с учеными из MIT

Веб-сервис от физиков из Массачуссетса для прожарки мяса по-научному

Зомбоящик опасен для вашего (искусственного) интеллекта

Нейросеть научилась проходить компьютерные игры благодаря имитации «любопытства». Но когда в один из уровней добавили телевизор — алгоритм залип над его просмотром и остановился...

Потрошим письма «Джека Потрошителя»

Как статистика и лингвистический анализ помогли опознать еще одно письмо знаменитого английского маньяка

Геоинформационный анализ поэтического вдохновения

Анализ маршрутов путешествий английских литераторов XVIII века средствами современной геоинформатики

Смертельный твит

Смертность от сердечно-сосудистых болезней можно предсказать с помощью лингвистического анализа сообщений в Twitter

Государевы потехи и «чюланы с вином» у Кремля

Изучаем старые карты России в современном веб-сервисе с геопривязкой — и испытываем эстетический оргазм

Ночь перед дедлайном или Рамадан: жизнь ученых в разных странах по логам Sci-Hub

Французские ученые любят пообедать, их русские коллеги жертвуют работе воскресенье, а Москва иногда все-таки спит. Но Новосибирск спит больше

Что такое N-граммы и с чем их едят?

Вы могли уже встречать термин N-грамма. Если вас пугало или вы хотели получше разобраться, что это, то этот пост для вас