Фото автора

Вера Шимко

Редактор, автор

Специалист научно-методического центра компьютерной лингвистики ВГУ. Интересуюсь педагогикой высшей школы, межкультурной коммуникацией, диалектами английского языка. В свободное время пробую себя в писательстве, увлекаюсь посткроссингом и путешествую.

Редактор статей

От древнерусского до корпуса блогов: как изменился Национальный корпус русского языка после редизайна 

Национальный корпус русского языка (НКРЯ) — важнейший инструмент любого исследователя, который занимается русским языком, русской литературой и вообще русской словесной культурой. Изменения в работе НКРЯ были заметны ещё в 2019 году: тогда лингвисты высказали опасения о возможном закрытии сервиса. К счастью, проблемы оказались временными, и НКРЯ не только не прекратил свою работу, но и заметно изменился и расширился. Самым заметным обновлением стал новый дизайн сайта, но есть и много глубоких содержательных перемен. Об основных обновлениях в корпусе, очевидных и не очень — в нашем сегодняшнем материале.

Что такое transfer learning в обучении нейросетей

Как нейросеть, обученная под одну задачу, решает другую? Может ли она использовать свой «предыдущий опыт»? Почему это важно и почему корпорации спешат внедрить эту технологию? Рассказываем о популярном методе «переноса знаний» в машинном обучении на примерах языков, ягод и Достоевского.

Ищем следы нижегородского фуникулера на старых открытках

Историческая часть Нижнего Новгорода расположена на Дятловых горах, комплексе из семи холмов по высокому берегу рек Оки и Волги. Связь между городскими районами затрудняло то, что город строился как на самих холмах, так и у их подножий. На почтовых открытках из собрания проекта «Пишу тебе» — два элеватора (фуникулера), с помощью которых в конце XIX века в Нижнем Новгороде решили эту проблему.

Нижегородская «Гранд-опера»: здание Николаевского городского театра в Нижнем Новгороде

Всякий турист, хоть раз бывавший в Нижнем Новгороде, обязательно совершал прогулку по одной из центральных улиц города — по улице Большой Покровской. В дореволюционное время здесь селились состоятельные люди, сначала дворяне, к концу XIX в. — представители купечества. Сегодня улица Большая Покровская — главный пешеходный маршрут и центр культурной жизни Нижнего Новгорода. Изображенное на открытке здание городского театра, расположенное на Большой Покровской, по своей красоте занимает центральное место в архитектурном ансамбле улицы

Еврейская культура в музеях РФ и США: в чем разница и как ее объяснить

Музейные коллекции пополняются очень разными способами: в разное время туда попадали и военные трофеи, и частные покупки коллекционеров. Ну а сами музеи существуют не в вакууме, и конечно на отбор экспонатов влияет политика, идеология, государственное и общественное устройство. Разбираемся в том, каким искажениям подвержены цифровые музейные коллекции, на примере еврейской культуры.

Как писатели XIX века предсказали мессенджеры, интернет на Марсе и нейросети

Научная фантастика в русской литературе имеет давнюю историю. Писатели XIX и первой половины XX века предсказали многое: от телевидения до космических полетов. А насколько хорошо они предвидели современные информационные технологии? Удивительно, но современники Пушкина и Толстого смогли предсказать мессенджеры, генеративные нейросети, 3D-кино и что-то вроде интернета на Марсе.

Что говорит о персонажах «Войны и мира» их речь

Из уроков литературы мы помним долгие обсуждения монологов героев в «Войне и мире» Льва Толстого. Но что, если взглянуть на прямую речь персонажей под другим углом? Рассказываем, как цифровые методы анализа прямой речи персонажей помогают узнать, кто из героев ближе всех к светскому обществу, у кого самая «живая» и самая «сухая» речь, и в чем драматическое различие между речью Наташи Ростовой и Андрея Болконского.

Капитализм слежки: как нас продают корпорациям, государству и хакерам

Нам говорят: «Мы используем файлы cookies для вашего удобства» — но просил ли я об этом удобстве? Мы ставим галочку «Я согласен на обработку персональных данных» — а если не согласен? Нас уверяют: «Мы не продаем персональные данные третьим лицам» — а как проверить? Разбираемся, почему в Интернете нас везде просят на что-то согласиться и что на самом деле за этим стоит.

Эволюция приемов в кино: фильмы с нарушенной хронологией

Людьми часто движет любопытство. Мы хотим узнать, чем кончится история, были ли мы правы, что же автор всё-таки имел в виду, и так далее. Поэтому мы ходим на квесты, участвуем в викторинах и… смотрим фильмы, где ничего не понятно, но всё очень интересно. А некоторым учёным интересно, почему это интересно нам — об этом и будет наша статья.

Что такое гражданская наука и как участвовать в контроле воздуха

Можно ли принимать участие в экологических проектах, не будучи экологом? Можно! Ведь существует гражданская наука. Рассказываем, как каждый из нас может внести вклад в мониторинг чистоты воздуха.

Chekhov Digital: как Чехов писал письма жене и куда течет время в его текстах

Знали ли вы, что слово «время» в произведениях А. П. Чехова имеет определенные схемы употребления, повторяющиеся от тома к тому? Могли ли подумать о том, что письма к любимой супруге Ольге Леонардовне драматург писал как к чужому человеку? Как связаны стили Чехова-писателя и Чехова-личности? Ответы на эти вопросы читайте в продолжении статьи о семантическом издании Chekhov Digital.

Цифровой Чехов: как устроено семантическое издание и где искать 4500 писем Чехова

Каждый филолог желает знать, что такое семантическое издание. В этой статье мы расскажем вам об одном из них. В нем можно исследовать социальные сети Чехова и посмотреть, кого писатель упоминал в своей обширной переписке.

Кто скрывается за псевдонимом «Элена Ферранте»: стилометрия против мистификаций

Системный Блокъ много писал о стилометрии: об атрибуции и верификации авторства, анализе эмоций в песнях и стиля переводчика. Теперь на примере известного итальянского автора рассказываем, как стилометрия помогает раскрывать литературные мистификации.

Не навреди: новейшие способы изучения «Мира мертвых»

Мексиканские ученые предложили изучать древние города с помощью георадаров и томографии, чтобы не разрушить их.

Трекер вашего настроения может продавать данные

Анализ приложений для ментального здоровья, духовных практик и для поддержки людей в сложных жизненных ситуациях показал, что некоторые из них нарушают приватность: следят за пользователями и продают данные третьим лицам.

Что такое 3D-фотограмметрия?

Археологические исследования Средних веков восстанавливают историю, осваивая глубины морей и земли. На дне моря находят артефакты: не только обломки судов, но и, к примеру, керамику, которую они перевозили. Рассказываем, как с помощью фотограмметрии с высокой точностью удалось сохранить венгерский шлем X века.

Google AI Research представила новую языковую модель PaLM

Новая модель содержит 540 миллиардов параметров, за счет чего способна объяснять шутки и угадывать фильмы по эмодзи.

Тревоги «маленьких людей» Англии XVI-XVIII веков

В наши дни подписание петиций или краудфандинговый сбор средств на чьи-нибудь нужды стали привычным делом. Кажется, постоянный фидбек прочно вошел в нашу повседневность: прежде чем купить новую вещь или посетить мероприятие мы тщательно проверяем отзывы. В Англии XVII-XVIII веков тоже можно было подать жалобы или петицию. Новый цифровой проект английских ученых позволяет проанализировать обращения крестьян и горожан в вышестоящие инстанции.

«Метр и смысл» стихотворения: связь формы и содержания в европейской поэзии

Существует ли связь между стихотворным размером и тематикой стихотворения? Можно ли стихи, написанные одним размером, объединить в связанные по смыслу группы? Ищем ответы на эти вопросы в европейской поэзии с помощью тематического моделирования

Отличить Святополка от Святослава: цифровая генеалогия Древней Руси

Схемы, модели и другие способы наглядно представить информацию давно стали неотъемлемой частью повседневной жизни. В исторической науке к методу визуализации часто прибегают, чтобы изобразить генеалогии династий или браков. В статье расскажем о том, что такое просопография, а также о цифровых методах, которые помогают ученым анализировать прошлое.

Ученые нашли способ предсказывать вероятность терактов

Придуман новый метод борьбы с терроризмом. Ученые натренировали алгоритм анализировать факторы, связанные с наибольшей вероятностью возникновения терактов. На повышенный риск террористической угрозы влияют высокая плотность населения и развитая транспортная инфраструктура.

Данные будут закрыты — как и границы с Европой

Российские власти скрыли данные о закупках компаний, попавших под западные санкции. «Системный Блокъ» поговорил с экспертом в области данных Иваном Бегтиным о том, как это влияет на всех нас и почему открытость данных — неотъемлемое право каждого человека и гражданина.

«Изучаю историю своего народа», или коллекция открыток Еврейского музея

Каждый день коллекция проекта «Пишу тебе» пополняется новыми открытками. На данный момент открыток в нашей базе насчитывается уже более трех тысяч. Как они попадают к нам в руки? В этой подборке расскажем об открытках из московского Еврейского музея и центра толерантности.

Транспортное освоение России: как увидеть жизнь за пределами основной полосы расселения?

Обосновано ли разделение России на «освоенную» и «неосвоенную» части? Карты плотности автодорог, железнодорожного полотна и аэропортов доказывают обратное.

Что такое дальнее чтение?

Франко Моретти пишет: «Мы умеем читать тексты, теперь нужно научиться не читать их». Возможно ли исследование литературы без детального чтения текстов? Возможно. При помощи дальнего чтения и инструментария digital humanities.

Цифровой культурный колониализм в Google Arts&Culture

Пандемии, кризисы и войны бьют не только по людям, но и по культуре. Многие музеи оказываются недоступны, а то и вовсе лишаются своих фондов. В феврале 2011 года Google запустил агрегатор изображений произведений искусства в высоком качестве — Google Art Project (GA&C) с целью сделать культуру более доступной и сохранить ее в цифровой форме. Но во всём ли многообразии культура доступна в GA&C, или там есть подвохи?

Пожар в Киото и коллекционер марок из будущего: проект «Пишу тебе» принял участие в SPB DHWeek 2022

24 января команда проекта «Пишу тебе» приняла участие в мероприятиях Недели цифровой гуманитаристики в Санкт-Петербурге и провела воркшоп по расшифровке дореволюционных почтовых открыток. Мероприятие было организовано DH-центром Университета ИТМО. Рассказываем о некоторых открытках, расшифрованных в рамках проекта.

Пушкинский дом обновил корпус нарративной прозы XIX века

С ноября 2021 года пользователям доступна вторая, улучшенная версия датасета.

Современный урок математики в цифровую эпоху

Всеобщая цифровизация повлияла и на школьные уроки математики. Интерактивная доска Miro, программа для визуализации графов Gephi и другие цифровые инструменты помогают разобраться с абстрактными понятиями и побороть математическую тревожность

Айтрекинг и сканпафы: как движения глаз выдают неуверенного читателя

Движения глаз при чтении исследуется еще с шестидесятых годов двадцатого века. Однако лишь недавно исследователи из Центра языка и мозга Высшей школы экономики и Городского университета Нью-Йорка перешли от описания локальных параметров движений глаз при чтении отдельных слов в предложении к описанию глобального рисунка чтения целых предложений в разных русскоязычных группах. Помог им в этом новый метод анализа.

Госдума разогнала бешеный принтер

Независимые исследователи и аналитики ОВД-Инфо* измерили скорость принятия законов депутатами разных созывов. *Внесен в реестр СМИ-иноагентов

Джон Донн уснул: Кем были англиканские священники в XVI-XIX вв.?

Возникшая в период Реформации англиканская церковь была и остаётся сложной и разветвлённой организацией. Разобраться во всём многообразии священнослужителей, их перемещениях и особенностях церкви изнутри было нереально, пока не была создана база данных. Разбираемся, как она устроена

Алгоритмы и дискриминация на рынке труда. Чему мы научили искусственный интеллект?

В 2014 году Amazon разработал технологию с ИИ, которая присваивала рейтинг каждому отклику на вакансии. Вскоре обнаружилось, что при этом робот занижал баллы женщинам. Выясняем, как часто происходит такая дискриминация, и что можно с этим сделать

Как робот-художник пишет портреты и пугает таможенников

Человекоподобный робот AI-Da пишет абстрактные картины, распознает лица для создания портретов людей, восхищается Пикассо и цитирует Оруэлла. Разбираемся, как она появилась и почему у нее недавно прошла собственная выставка в Лондоне

Британская библиотека оцифровала иллюстрации из старых книг

Сканированные изображения из книг XVII-XIX веков теперь находятся в свободном доступе на сайте Flickr благодаря новому проекту Британской библиотеки. Любую картинку можно скачать и свободно использовать в научных работах или статьях

Компьютерное моделирование психических процессов: как компьютеры имитируют человека

В 1950 году Алан Тьюринг написал работу Computing Machinery and Intelligence («Вычислительные машины и разум»). Уже тогда, на заре развития кибернетики, люди задумывались о создании компьютера, который бы мог думать подобно человеку. Вслед за инженерами к проблеме и подключились психологи. Моделирование психических процессов до сих пор остается одной из самых разрабатываемых областей когнитивной науки.

Российская историческая статистика теперь доступна онлайн

Весной 2021 года был опубликован Электронный архива российской исторической статистики — «Ристат». Теперь статистические данные прошлых лет доступны каждому

«Ход Королевы» и «Корона»: виртуальная выставка костюмов из сериалов

Бруклинский музей в коллаборации с Netflix организовал виртуальную выставку костюмов, посвященную сериалам «Корона» и «Ход королевы». Приглашаем прогуляться по виртуальному пространству, в деталях рассмотреть костюмы и познакомиться с их историей

Русские в Китае 100 лет назад: контент-анализ жизни эмигрантов в Харбине

Каким образом подданные бывшей Российской империи очутились в северо-восточном Китае и как они обустраивали быт, превратив Харбин в «Дальневосточную Москву». И почему их называли «редисками» (нет, знаменитый комедийный фильм тут ни при чем). Рассказываем о жизни русских эмигрантов в Китае с применением цифровых методов

управление жестами

Культурные жесты: американцы и китайцы свайпают по-разному

Выбор жестов для управления бесконтактными интерфейсами зависит от происхождения пользователей, выяснили исследователи из Государственного колледжа информационных наук и технологий Пенсильвании

Подборка интерактивных карт по истории

Крутим глобус времен динозавров, запускаем навигатор по античным дорогам и созерцаем, как менялся мир под воздействием человека в последние тысячелетия

Ученые доказали: поисковики меняют нашу память

Американские ученые опубликовали исследование о влиянии интернета на память людей. Теперь, когда человеку нужна какая-либо информация, он вспоминает не сами факты, а где можно их найти

рост ВВП

Рост экономики Европы отразился в портретах XIV – XXI веков

Развитие портретной живописи с XIV по XXI век связали с подъемом уровня социального доверия, причина которого – в экономике

европа xviii век

Царские свитки и биография Конфуция: что есть в корпусе русских переводов общественно-политических сочинений XVIII века

Корпус переводов общественно-политических текстов XVIII века помогает проследить формирование русского политического языка. В корпусе есть философские трактаты, художественные произведения политического характера, учебники и словари

Digital Mappa против Google Maps

Мир глазами средневекового книжника: как разобраться в карте, если север слева, река впадает в круг, а посреди города сидит лев? Сравниваем средневековые карты с современными

звук губами

Нейросеть определяет дипфейки по губам

Группа исследователей из Беркли и Стэнфорда разработала инструмент, который находит нестыковки в аудио-визуальном потоке между положениями губ и произносимыми звуками

dall e

Редька-балерина и кресло-авокадо: нейросеть научилась рисовать изображения на заказ

DALL-E — нейросеть-трансформер с 12 миллиардами параметров, которую обучили генерировать изображения по произвольному текстовому описанию. Например, пишете ей «кресло в виде авокадо» — и получаете изображение, которое почти неотличимо от фотографии из салона дизайнерской мебели. Рассказываем, что еще умеет DALL-E

расизм

Не стреляйте черных роботов: расизм, смерть и машины

Если ввести в поисковую строку браузера слово «робот»‎, на большинстве картинок роботы окажутся белыми или серебристыми. Исследование 2018 года показало, что это может быть неслучайно: расовая нетерпимость распространяется не только на людей.

авторский текст

По словам их узнаете их: как вычисляли автора «Беовульфа»

Рассказываем, как одни ученые устанавливали авторство знаменитого древнеанглийского эпоса «Беовульф» при помощи статистики, а другие с ними спорили. Ведь научные споры цифровых филологов — это интересно!

чат-бот Meena

Давай поговорим: как работает «человечный» чат-бот Google

В Google попытались сделать чат-бота, который заточен на максимально осмысленные и человекоподобные ответы. Рассказываем, как он устроен

big data

Большой атлас больших данных

Круги вместо стран: на основе больших данных создан мировой атлас, в котором можно сравнить страны мира по разным параметрам

Опубликован открытый корпус европейских романов

Проект «Дальнее чтение для европейской литературной истории» выпустил собрание старых произведений. В коллекцию вошли 884 романа на 18 языках

память мозга

Память человека оказалась избирательной на слова

Человеческий мозг способен устанавливать связи между объектами, словами и изображениями из нашего прошлого опыта. Чем чаще мозг обращается к словам из прошлого опыта человека, тем они лучше запоминаются. Ученые подозревают, что мы гораздо лучше запоминаем те слова, которые служат для создания связей между воспоминаниями

шрифт уличной вывески

Нейросеть читает вывески на улицах Лондона

Маленькие дети радуются, когда удается прочитать вывеску на улице. Нейросети тоже читают вывески, а некоторые еще и шрифт определяют. И если по почерку человека можно узнать его характер, то какую информацию о жителях городского района позволяет получить почерк улицы?

Эрмитаж онлайн

Как сходить в Эрмитаж онлайн

Как посмотреть коллекцию одного из самых известных музеев мира, спланировать посещение или просто насладиться искусством, не тратя время на очереди или деньги на билеты — и не рискуя подхватить COVID. Эрмитаж теперь можно посетить онлайн

минералогия

Интерактивная минералогия: как старинные рисунки камней стали цифровым проектом

В начале 19 века британский натуралист Джеймс Саубери издал 7-томный сборник с рисунками минералов. Теперь насладиться эстетикой «Британская и экзотическая минералогия» можно онлайн. Все рисунки собраны на одной веб-странице в огромный интерактивный постер

похожие картины

Алгоритм находит скрытые связи между картинами

В MIT научились автоматически выявлять похожие полотна в музейных коллекциях. Алгоритм строит «дерево близости» картин и позволяет выявить культурные влияния в живописи

Самоуправляемый автомобиль научился понимать водителя

Команда ученых из MIT запрограммировала автомобиль определять социотипы других водителей. Как это может повлиять на развитие самоуправляемых автомобилей?

перспектива роботизации

Роботы против рабства

Оптимистичные футурологи уверяют, что выносливые, не требующие пищи, дешевые роботы заменят рабский труд (да-да, он до сих пор существует, и это массовая проблема). Звучит хорошо, но что-то не верится. Разберемся подробнее

Автор статей

Ищем следы нижегородского фуникулера на старых открытках

Историческая часть Нижнего Новгорода расположена на Дятловых горах, комплексе из семи холмов по высокому берегу рек Оки и Волги. Связь между городскими районами затрудняло то, что город строился как на самих холмах, так и у их подножий. На почтовых открытках из собрания проекта «Пишу тебе» — два элеватора (фуникулера), с помощью которых в конце XIX века в Нижнем Новгороде решили эту проблему.

Сигнал в будущее: ваш кот сообщает о ядерной угрозе

Как сделать так, чтобы наши далекие потомки не отнеслись к нашим предупреждениям о реальной опасности так, как мы относимся к проклятиям на египетских пирамидах? В качестве возможных решений - атомное братство, угрожающие постройки и даже меняющие цвет коты. Разбираемся в ядерной семиотике

Музыка нас связала: универсалии в музыке мира

Новое исследование выявило общие акустические признаки у песен определенных жанров в разных культурах и предположило наличие универсальных когнитивных механизмов в основе мировой музыки

280 символов Трампа: как Твиттер стал оружием в политической гонке

Как гневные твиты, написанные КАПСОМ, помогли Дональду Трампу завоевать пост президента США? Разбираются ученые

Как я перестал беспокоиться и полюбил СССР: операция Барбаросса на карте США

Карта времен Второй Мировой войны показала американцам масштабы военных действий и помогла ленд-лизу

Странные языки

Чем английский необычнее венгерского? Лингвисты вычислили странность 239 языков мира и составили рейтинг

Фасолина или яйцо? С чем сравнивают размеры вещей

Какие метафоры популярны при описании габаритов предмета, как они изменялись со временем и почему из сравнений исчезли голубиные яйца

Не Эллочка-людоедка: рэперы с самым богатым словарным запасом

Тексты Шекспира, Мелвилла и современных хип-хоп-музыкантов сквозь призму методов лексического анализа и ранжирование рэперов по количеству уникальных слов