«Дисциплинировать литературоведческую мысль может только рациональный метод»: научное завещание Бориса Ярхо

Борис Ярхо — один из самых недооцененных филологов знаменитого поколения «русских формалистов» 1910-х — 1920-х. В отличие от куда более известных Проппа, Шкловского, Тынянова и Эйхенбаума, Ярхо оставался неизвестен на Западе и малоизвестен в России вплоть до начала XXI века, когда его пионерские работы по количественному литературоведению стали актуальны с приходом цифровых методов. Чтобы немного восстановить справедливость, «Системный Блокъ» подготовил «посмертное интервью» с Ярхо на основе его главной книги.

Специальные рубрики

Наши статьи

«Гипотеза Поллианны»: насколько позитивна детская зарубежная литература?

Что такое «гипотеза Поллианны»? Как она проявляется в зарубежной детской и юношеской литературе? Какие существуют методы, чтобы ее подтвердить или опровергнуть? В материале рассказываем о том, как исследователи провели сентимент-анализ корпусов англоязычной и немецкоязычной детской литературы и какие результаты они получили.

Наперекор всему. Как выживают правосторонние шрифты в цифровом пространстве?

Адаптированы ли современные цифровые инструменты для работы с системами письменности, которые пишут справа налево, как арабская вязь или еврейское письмо? Как «сломать» Word или VS Code, смешав текст на латинице и арабице? И почему крупные разработчики ПО не обращают внимание на эту проблему?

Как биологи и лингвисты вместе изучают эволюцию языков

Язык — естественная система. Он распространяется, развивается и даже мутирует, подчиняясь законам естественных наук. Можно ли с его помощью реконструировать эволюцию человечества? Рассказываем, как генеалогические деревья объединили биологов и лингвистов и какой вклад в языкознание внес Чарльз Дарвин.

Дата-центры стоимостью 500 млрд долларов, ИИ-агенты и открытый конкурент OpenAI o1

OpenAI и SoftBank должны создать инфраструктуру для ИИ стоимостью 500 млрд долларов по предложению Дональда Трампа, сразу несколько компаний выпустили ИИ-системы для автоматического выполнения задач на компьютере, китайская DeepSeek выложила конкурента модели o1 от OpenAI в открытый доступ — что произошло в мире ИИ за последнее время.

Сложно ли учиться в Zoom после 55: как устроено цифровое образование для старших возрастов

После 55 лет жизнь человека словно замедляется и становится менее интересной… но точно не для тех, кто даже в таком возрасте не боится сесть за парту и шагнуть навстречу новым знаниям и технологиям. В нашем материале читайте о том, что сфера цифрового образования сейчас предлагает самым старшим.

Письменности Западной Африки в цифровом мире

Западная Африка — место жительства более 450 млн человек, говорящих на сотнях разных языков. Это регион огромного культурного, этнического и языкового разнообразия. Рассказываем, как некоторые из западноафриканских языков обрели свою письменность, как она сохраняется и распространяется в цифровом мире и почему это помогает людям заявить о своей идентичности.

Взламывая шифр Зодиака: как энтузиасты разгадали послание серийного убийцы

Современные технологии хорошо помогают в криптоанализе: программы, перебирающие тысячу вариантов за несколько секунд, в разы превосходят возможности человека. Однако слепого применения софта недостаточно, особенно если речь идёт о самом приоритетном неразгаданном шифре в списке ФБР — криптограмме серийного убийцы Зодиака. В новом материале разбираемся, какие вообще бывают шифры, почему шифр Зодиака не могли дешифровать на протяжении 50 лет и как криптографам всё-таки удалось его раскусить.

¡Escándalo! Классификаторы токсичности против drag queens

Со словами I don’t need luck. I’m about to slay this thing дрэг-королева Miss Vanjie отправляется покорять жюри реалити-шоу RuPaul’s Drag Race. «Это на 33% токсичное высказывание. Не желаете заблокировать?» — говорит ИИ. Разбираемся, почему классификаторы токсичности иногда и сами не прочь «потоксичить».

Играем по-серьёзному: как Serious Games меняют подход к обучению

Современное образование требует современных подходов, которые помогут ученикам и студентам не просто выучить, но понять материал. Одно из решений — серьёзные игры, симбиоз обучения и игры. Что это такое? Есть ли исследования, подтверждающие пользу серьёзных игр? В чём отличия от обычных компьютерных игр и симуляторов? Спойлер: серьёзные игры действительно ведут к серьёзным успехам.

Прогулка по древней Москве: виртуальная реконструкция Белого города

Как реконструировать исторический облик города, который постоянно меняется? Гуляем по Белому городу Москвы XVI–XVIII веков вместе с проектом исторического и механико-математического факультетов МГУ.

История развития диалоговых систем: от распознавания цифр до Siri

В какой момент чат-боты стали повсеместными онлайн-собеседниками? И как у них получается воспроизводить естественный разговор? Краткий обзор того, как говорящие машины постепенно учились и становились более человечными.

Думать или делать: исследуем глаголы в английской литературе

Что важнее для создания целостного образа персонажа в литературе: его слова или его действия? Как выбор глаголов отражает индивидуальность героя? Рассказываем о недавнем исследовании корпуса английской прозы, которое даёт ответы на эти (и не только) вопросы.

k-pop

Как английский вытесняет корейский в K-pop музыке: анализ данных и визуализация

Как международная популярность корейских поп-групп повлияла на тексты их песен? Как часто исполнители используют английские слова? Как отличаются песни о любви у мужских и женских групп? Этими вопросами задались студенты-востоковеды из Высшей школы экономики. Публикуем результаты их исследования.

Разметка по правилам: как Национальный корпус русского языка помогает изучать орфографию

Ветреный или ветренный, ожёг и ожог, приставки пре- и при-, стеклянный, оловянный, деревянный... В жизнь каждого школьника рано или поздно приходит экзамен по русскому языку, а нудные примеры из учебников вызывают скуку. А если взять произведения, которые читают сами дети, и разметить в них сложные места русской орфографии? Именно такой инструмент готовят в Национальном корпусе русского языка. Эллина Куцевал, создательница алгоритма, рассказывает, как создавалась разметка.

Тест: угадайте, Путин или нейросеть

Мы попросили нейросети сгенерировать новогодние обращения Владимира Путина, стилизуя их под разные года и события. Пройдите тест и проверьте, сможете ли вы отличить настоящее обращение президента России от созданного нейросетью.

«Системный Блокъ»: лучшее за 2024 год

В 2024 году «Системный Блокъ» опубликовал 180 материалов. В этом посте мы рассказываем о наших итогах года: о запуске новых рубрик, лучших публикациях, создании DH-портала и других новостях. Несмотря ни на что, наша команда собирала для вас всё самое интересное из сферы цифровых гуманитарных исследований. Это наш способ сделать мир — если не лучше, то хотя бы понятнее.

Новые рассуждающие модели от OpenAI и Google, open-source-конкурент GPT и Claude

Новая модель o3 от OpenAI вырывается вперёд, китайская DeepSeek создала конкурента для лучших LLM, Google выпустила свою первую рассуждающую модель — что произошло в мире ИИ за последнее время.

Визуализируя воспоминания: как AR- и VR-технологии погружают в прошлое

Прошлое, какое бы оно ни было, всегда удостоено особого отношения к себе. События можно забыть или, наоборот, вернуть из глубин памяти. Исторический опыт влияет на человека: меняет его и выстраивает его представления о действительности. У современного человека появились новые инструменты сохранения памяти. Исследуем, как цифровые технологии помогают сохранять и переживать опыт прошлого.

Как изучать наскальные изображения оленей Чукотки с помощью нейросетей

Петроглифы — небольшие древние наскальные изображения — часто сложно датировать и атрибутировать. При этом для некоторых рисунков может быть очень много однотипных образцов — например, таковы петроглифы с изображениями оленей в долине чукотской реки Пегтымель. Выпускница магистратуры Digital Humanities НИУ ВШЭ рассказывает, как можно классифицировать петроглифы по типам при помощи нейросети.

Холм невзгод: когда наступает возраст несчастья

Официально диагноза «кризис среднего возраста» не существует. Но что происходит в этот период? Узнаем, как связаны возраст и несчастье и почему кривая несчастья похожа на холм.

Создай метательный аппарат и пробей крепостную стену: как понять науку через симуляторы

Хотите смоделировать процесс эволюции или работу человеческого глаза? Не можете разобраться в баллистике? Тогда воспользуйтесь интерактивным симулятором. Мы собрали самые интересные и рассказали, как они делают науку понятней и ближе.

Иллюстрация: Надя Луценко

Как провести анализ тональности текста

Эмоции и их выражение в тексте — важная часть человеческой коммуникации. Но как зафиксировать эти тонкие и динамичные изменения, особенно в больших текстах? Как формально визуализировать эмоциональное содержание текста, превратив его в график? Ответы на эти и многие другие вопросы можно получить, построив кривые эмоциональной тональности выбранных текстов. О том, как это сделать, вам расскажет этот гайд!

Новинки от OpenAI, новая LLM от Google, модель для генерации изображений от лаборатории Маска

OpenAI составляет «адвент-календарь» из новых релизов, Google обновил свою LLM, а xAI Илона Маска выпустила нейросеть для генерации изображений — что произошло в мире ИИ за последнее время.

Бешеный принтер 2020–2022: как плодятся «чрезвычайные» законы

Чрезвычайные события, такие как пандемия или военные действия, порождают ограничительные законы. При этом многие законодательные изменения, изначально принимавшиеся как «чрезвычайные», оказываются долгосрочными и становятся нормой. Например, «ковидные ограничения» уже пять лет выступают формальной причиной запрета акций протеста. Рассказываем, как политологи исследуют переход временных ограничительных мер в постоянные, опираясь на статистику законотворчества.

A real area: что такое ареальная типология и как её изучают цифровыми методами

В мире почти 7000 языков, и они очень разные. Лингвистическая типология — раздел науки о языке, описывающий эти различия. Часто, хотя и не всегда, сходство языков обусловлено географически — тогда языки можно даже объединить в языковые ареалы. Но выделять их вручную — задача трудоёмкая и полная неоднозначностей. Тут на помощь исследователям приходят вычислительные методы.

Утечка доступа к Sora, открытые аналоги OpenAI o1, протокол общения между LLM и приложениями от Anthropic

Художники, получившие доступ к модели для генерации видео Sora от OpenAI, слили доступ в сеть, китайские лаборатории выпустили модели-аналоги OpenAI o1, Anthropic представила открытый протокол общения между LLM и приложениями — что произошло в мире ИИ за последнее время.

Учебники советской школы: возрождение в цифре

Век цифровых технологий и новых образовательных стандартов не смог стереть интерес к старым, в том числе советским и дореволюционным, учебникам. Почему люди продолжают искать эти книги? Рассказываем в нашем исследовании архивов учебной литературы. Где их можно найти, кто их оцифровывает и что привлекает читателей?

«Все мы немножко более дикие, чем могли бы быть»: интервью с Даниилом Скоринкиным

Что важнее: наука, преподавание или популяризация науки? Чем отличаются Digital Humanities в России и за рубежом? Какова цель существования «Системного Блока»? Свои ответы на эти вопросы дал главный редактор нашего издания Даниил Скоринкин.

Языковые модели упёрлись в потолок, AlphaFold3 в открытом доступе, новые LLM для генерации кода

Компаниям, работающим над языковыми моделями, стало сложнее их улучшать, нейросеть для расшифровки белков AlphaFold3 теперь доступна исследователям, новые версии моделей от Qwen для генерации кода — что произошло в мире ИИ за последнее время.

Как найти в геноме проблему? Зачем секвенировать здоровых людей

Секвенирование генома — это способ «прочитать» ДНК человека, который преобразил генетику и уже стал частью рутинных исследований. Сегодня этот метод используют, чтобы точнее ставить диагнозы при генетических заболеваниях и выявлять редкие мутации. Но как диагностике помогает массовое секвенирование геномов здоровых людей? Рассказываем в нашем материале.

Поисковики с ChatGPT и Gemini, новые релизы от Anthropic, открытые модели для генерации видео

OpenAI и Google объединяют LLM и поисковые системы, Anthropic обновила свои языковые модели, а компания Genmo выпустила самую большую на сегодня открытую модель для генерации видео с 10 млрд параметров.

Машинное обучение и японская уличная мода: как возникают и распространяются стили

Зачем компьютерные науки изучают уличную моду? Можно ли с помощью цифровой базы изображений одежды предсказывать появление и угасание новых стилей? Правда ли, что женский костюм отражает экономическое состояние страны? На примере японского цифрового архива моды CAT STREET рассказываем об исследованиях на стыке антропологии и машинного обучения.

Тысяча монгольских буддистских монастырей на одной интерактивной карте

Интересуетесь буддизмом, Внутренней Азией, Монголией? Посмотрите на карту более чем тысячи буддистских монастырей на территории Монголии! Рассказываем про онлайн-проект Mapping a Thousand Buddhist Monasteries in Mongolia, где помимо карты монастырей можно найти устные истории, образцы религиозной живописи, биографии лам.

Нобелевские премии за нейросети, ИИ-функции в приложениях Adobe, новые модели от Mistral

Две нобелевские премии вручены за работы, связанные с машинным обучением, Adobe добавила новые ИИ-функции в свои продукты, Mistral представила новые компактные языковые модели — рассказываем, что произошло в мире ИИ за последнее время.

10 слов машинного обучения

Что такое языковые модели, как их обучают и зачем нужна тестовая выборка? Объясняем основные термины машинного обучения.

Тест: угадайте произведение по частотным словам из Национального корпуса русского языка

В каком произведении школьной программы умирают лягушки, а в каком — скачут блохи? Пройдите наш тест на основе Национального корпуса русского языка и попробуйте отличить Гоголя от Салтыкова-Щедрина, а Лермонтова от Блока.

Гендерное неравенство в литературе: от персонажей до писательниц

Проблема гендерного неравенства заметна во всех сферах общества — в том числе в литературе. Писательниц было традиционно меньше, чем писателей, сюжетные линии между персонажами разного пола представлены неравномерно, а гендерные стереотипы касаются и героев, и героинь произведений. В подборке материалов «Системного Блока» мы рассказываем о роли женщин в литературном процессе и о том, почему представители обоих полов по-разному воспринимаются как авторами, так и читателями.

Что изучают антропологи в интернете? Подборка материалов «Системного Блока»

Развитие интернета и цифровых технологий открыло новое поле исследований для антропологов. Учёные осознали, что в онлайн-среде формируются уникальные сообщества, культуры и практики, которые можно и нужно изучать. Публикуем подборку наших материалов о цифровой антропологии. Из неё вы узнаете, какие методы можно применить к исследованию интернет-пространства, как за последние 40 лет изменились интернет-интерфейсы и зачем собирать слухи в соцсетях?

Все художественные тексты похожи друг на друга: как сюжетные тенденции выражаются на уровне слов

Знакомясь с новой книгой, вы наверняка замечали, что с чем-то подобным вам уже приходилось сталкиваться. Герой покидает дом в поисках чего-то ценного. Герой находит большую любовь в конце истории или, наоборот, трагически погибает. Таинственный незнакомец приносит вести, становящиеся фундаментом для завязки сюжета. А как выглядит «усреднённая» история? Существуют ли слова, которые наиболее характерны для завязки или финала книги? Попробуем разобраться, используя методы цифровой гуманитаристики!

Что почитать про цифровое образование ко Дню учителя

5 октября в России и других странах отмечали профессиональный праздник — День учителя (World Teachers' Day). История этого праздника начинается в 1966 году, когда была принята Рекомендация «О положении учителей» — первый международный документ о правах и условиях труда педагогов. «Системный Блокъ» сделал подборку статей, которые будут полезны преподавателям. В этих материалах мы рассказываем о тенденциях в современном образовании и конкретных профессиональных инструментах.

Большие изменения в OpenAI, долгожданное обновление голосового режима GPT, новые LLama

Техническая директриса OpenAI ушла из компании, а сооснователь перешёл к конкуренту, GPT получила обновлённый голосовой режим, Meta и Google выпустили новые модели — что произошло за последнее время в мире ИИ.

Как поймать бактерию на плагиате: чем поиск переноса генов похож на NLP

Не только филологов и юристов волнует проблема авторства. Живые организмы тоже могут списывать друг у друга — прямо из генетического кода! Рассказываем, как и зачем биологи ищут в геномах фрагменты ДНК, заимствованные у других организмов, и какие компьютерные алгоритмы для этого используются.

Что можно узнать о ругательствах с помощью Национального корпуса русского языка?

Кто из русских писателей больше ругался? Какое имя теперь раньше было обычным, а теперь стало обидным? Можно ли обнаружить, в какой момент нейтральное слово становится бранным? Пройдите наш тест и узнайте, как можно изучать ругательства с помощью Национального корпуса русского языка.

Запрограммированная сюита: взлёт и падение механического пианино на перфоленте

Мы уже рассказывали о роли перфолент в истории компьютеров. А какую роль они сыграли в истории музыкальных технологий? Исследователь истории науки и техники, сотрудник Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ Антон Басов рассказывает, как появилось механическое фортепиано и зачем в нём перфолента.

Тест: как найти свой восточный язык?

Иногда сложно понять, какой язык нам ближе и нужнее. Хочется и аниме, и корейские дорамы смотреть в оригинале без субтитров, а то и отправиться в Китай или подняться на верхний этаж небоскрёба в ОАЭ. Если вы вдруг решили изучать восточную культуру и начать с языка, но никак не можете определиться, то этот тест для вас.

Новые модели от OpenAI, Mistral делает ИИ доступнее и запаздывающий Apple Intelligence

OpenAI представила модель, способную «рассуждать», француский стартап Mistral снизил цены на свои модели, Apple отстаёт в гонке за ИИ машинного обучения в смартфонах — что произошло за последнее время в мире ИИ.

Телеграф, телетайп, компьютер: всемирная история перфолент

Хотя перфолента появилась раньше перфокарт, применение ей нашлось не сразу. Исследователь истории науки и техники, сотрудник Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ Антон Басов рассказывает о том, как с помощью перфолент постепенно удалось улучшить телеграф, а затем и компьютерные интерфейсы 1960-х годов.

«Предсказание революций и землетрясений мало чем отличаются»: интервью с Андреем Коротаевым о смертности в 90-е, клиодинамике и прогнозировании социальных взрывов

Можно ли моделировать исторические процессы при помощи баз данных и математических инструментов? Что даёт такое моделирование и каковы его границы? Почему после распада СССР смертность в России и Эстонии была гораздо выше, чем в Грузии, Армении или Узбекистане? Какие факторы позволяют предсказать социальный взрыв и почему повышение качества жизни может привести к революции? Об этом в интервью «Системному Блоку» рассказал доктор исторических наук Андрей Коротаев.

Виртуальная валюта в образовании: мотивируют ли учиться игровые деньги?

Образовательные технологии (эдтех) заимствуют у игровой индустрии способы мотивации учащихся. Среди них — внедрение виртуальной валюты. Но подтверждается ли эффективность виртуальных денег в образовании? Эксперименты показывают, что всё не так однозначно, иначе обучающиеся в школах и на курсах давно стали бы «виртуальными миллионерами».

Библиотека Faststylometry: стилометрия на Python

«Системный Блокъ» часто пишет о стилометрии и выпустил несколько учебных материалов (базовый, продвинутый и ещё один) о том, как провести собственное исследование с помощью библиотеки Stylo для языка R. А что делать тем, для кого Python удобнее? Рассказываем в новом тьюториале о стилометрии для англоязычных текстов, используя библиотеку Faststylometry.

AlphaProteo, стартап Ильи Суцкевера привлёк огромные инвестиции и самый мощный кластер для компаний Илона Маска

Нейросеть для генерации белков от Google DeepMind, экс-исследователь OpenAI привлекает миллиард долларов, Илон Маск обзавелся самым мощным кластером для обучения нейросетей — что прошло в мире ИИ за последнее время.

Перфокарта: от механических баз данных к цифровым

В первой части рассказа о перфокартах мы узнали о том, как причудливо прошла история перфокарт от древнего ремесла ткачества до аналитических машин. Во второй части «Системный Блокъ» изучает, что же произошло дальше. А произошло немало: перфокарты через гомеопатию, переписи населения и первые базы данных привели к созданию компьютеров! Исследователь истории науки и техники, сотрудник Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ Антон Басов описывает, какое наследие технологии из XVIII века мы имеем сейчас.

Чему учат в цифровой школе? Альтернативное расписание уроков к 1 сентября от «Системного Блока»

Как бы выглядела школа «Системного Блока» и чему бы в ней учили? К началу учебного года мы составили альтернативное расписание и подобрали материалы.

Патинко: взгляд нейробиолога, медика, DH-исследователя и киноведа

Игровые автоматы патинко появились в Японии ещё до Второй мировой войны и за свою историю успели пережить запрет и возрождение. В преддверии выхода второго сезона одноимённого сериала поговорим о том, как патинко исследуют нейробиологи и медики, разберёмся, что привлекательного обнаруживают в их интерфейсах цифровые гуманитарии и почему стоит посмотреть сериал, даже если вы не учёный.

Тексты, звуки, экспонаты: подборка интервью о цифровых коллекциях

Оцифровка и сохранение артефактов культуры — одна из важнейших задач цифровой гуманитаристики. Мы собрали для вас интервью четырёх исследователей и одного гражданского активиста о том, кто, зачем и для кого коллекционирует цифровые данные.

Может ли робот прочитать папирус: как ИИ помогает восстанавливать утраченные тексты

Кажется, история из «‎Гостьи из будущего», где один из героев спасал рукописи из Александрийской библиотеки, стала реальностью. В начале 2024 года исследователям удалось прочитать сгоревший папирус из Геркуланума с помощью искусственного интеллекта.

Перфокарта: от ткацкого станка до аналитической машины

Помните ли вы времена, когда компьютеры работали на перфокартах? Листы плотной бумаги с дырочками — они использовались до того, как появились дискеты, компакт-диски и флешки. Начав свою историю с ткацких станков, перфокарты помогли создать первые базы данных и сыграли важную роль в создании вычислительных машин. Исследователь истории науки и техники, сотрудник Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ Антон Басов изучает, как изобретение XVIII века заложило основу цифровой эпохи. Публикуем первую часть «биографии» перфокарт.

Тайны древней ДНК: как палеогенетика и биоинформатика помогают археологам

Можно ли узнать, чем болели люди в каменном веке, изучив остатки ДНК из их зубов? Да, если на помощь придут палеогенетика в связке с биоинформатикой. Палеогенетика изучает древнюю ДНК, чтобы понять, куда и откуда мигрировали древние люди, какие возбудители вызывали эпидемии, какие виды гибризовались, чтобы получился современный человек. Об этих подходах рассказывает Андрей Макашов, преподаватель специалитета в Высшей школе биомедицинских систем и технологий петербургского Политеха.

Цифровая охота: как «поймать» всех животных в тексте

Что влияет на распределение содержательных слов в тексте сильнее: литературная традиция или внешние факторы? Кирилл Маслинский, исследователь литературы, сотрудник Пушкинского дома и создатель Деткорпуса, изучает процесс создания контента. Он использует модель роста словаря, чтобы оценить разнообразие концептов семантической области «‎‎животные»‎ в разных жанрах детской литературы, и вычисляет, какие животные вероятнее встретятся в каждом жанре. В ужастиках, конечно, на первом месте — змеи, а вот в научной фантастике частыми гостями неожиданно становятся морские обитатели. Расскажем о методе и результатах этого исследования.