Фото автора

Системный Блокъ

Маскот

Коллективный автор

Автор статей

«Еще мужчинестее быть»: из чего сделаны поздравления с 23 февраля

Стихотворные поздравления на 23 февраля — не менее одиозный жанр, чем сексистские вирши на 8 марта или слащавые стишки на День святого Валентина. «Системный Блокъ» решил исследовать этот жанр количественными методами. А в качестве бонуса мы сделали собственный генератор абсурдных поздравлений с Днем защитника Отечества. Впрочем, порожденные генератором тексты оказались не более абсурдны, чем вся атмосфера 23 февраля, превратившегося из профессионального праздника военных — в офисный «день коллег мужского пола» с нелепыми рудиментами милитаризма.

5 российских библиотек с богатыми цифровыми коллекциями

Оцифровка культурных данных — необходимая база для цифровых гуманитарных исследований. Делимся списком крупных коллекций, созданных российскими библиотеками

Многомерное «Слово о полку Игореве»: от кукушки до алкогольного брендинга

Когда мобильный интернет был экзотикой, а отчёты по грантам сдавали на 3,5-дюймовых дискетах... в Рунете уже были цифровые гуманитарные проекты! Рассказываем в лицах и деталях об одном из них — о параллельном корпусе переводов поэмы «Слово о полку Игореве», которая отметила 13-летие. В конце поста бонус — обзор исследований на основе корпуса

Вебинар «Математика для Data Science»

Машинное обучение и Data Science похожи на ядерную физику в начале 50-х или кибернетику в 60-е. Мечтают делать многие, понимают немногие, делают — совсем немногие. Главная преграда — математика. Рассказываем про вебинар наших партнеров из OTUS

Лица Системного Блока

В 2019 году наша команда спецпроектов знакомила вас с учеными, популяризаторами науки, которые применяют цифровые методы в своих гуманитарных исследованиях. А 2020-й мы решили начать со знакомства с участниками самого Системного Блока. Кто, как и почему делает этот проект — расскажем в нашем праздничном интервью

«Best of Блокъ»: лучшие посты 2019 года

Весь 2019 год «Системный Блокъ» рассказывал, как высокие технологии становятся частью современной науки, культуры и повседневности, принося хорошее и плохое. Мы писали о последних прорывах в автоматической обработке языка и о методах борьбы с фейк ньюс, объясняли на пальцах, как работают нейросети, машинный перевод и фильтры в инстаграме, учили обкачивать VK, твиттер и HTML-страницы и делать корпусные исследования, рассказывали про статистические исследования в истории, литературе и искусстве, а еще много исследовали сами... За год в «СБъ» вышло больше 220 материалов. Предлагаем вам подборку из 12 постов, которые стоит перечитать. Можно как раз под бой курантов 🥂

Где учить Python: обзор онлайн-курсов от «Системного Блока»

Научиться программировать мечтают многие, но как выбрать подходящий курс из сотен доступных вариантов? Мы сделали обзор курсов по Python, которые проходили сами

Скажи мне, какой у тебя индекс Хирша, и я скажу, кто ты

Разбираемся, можно ли измерить вклад учёного в науку и стоит ли это делать

YouTube на русском, зулусском и урду: как тестируют перевод интерфейсов

Видеохостинг YouTube имеет локализации в 100 с лишним странах — это значит, что для них есть специальная локальная версия сайта (а то и не одна). Например, когда вы заходите в YouTube из России, вы видите меню на русском языке. Такие же меню есть не только на языках-гигантах вроде английского, испанского или китайского, но и, к примеру, на суахили, эстонском, зулусском, урду, африкаансе, узбекском... А как оценивать качество перевода всех этих кнопочек в меню и их понятность для пользователей?

Я/МЫ НКРЯ: что происходит с национальным корпусом

...зачем в этом разбираться и почему мы волнуемся за НКРЯ

Машинный перевод становится синхронным

Вавилонская рыбка все ближе к вашему уху! Синхронный машинный переводчик STACL начинает выдавать перевод предложения до того, как прозвучит окончание фразы на языке оригинала. Но получится ли сравниться по качеству с человеком?

Женщины и власть

Маргарет Тэтчер, Екатерина Великая, Индира Ганди, Ангела Меркель… Вряд ли вы сможете добавить в этот список больше 5-10 имен. Женщин-политиков, которым довелось управлять государствами, совсем немного. А что происходит в парламентах и руководстве компаний? И как настроено общественное мнение по отношению к женщинам-руководителям?

Как машинный перевод оценивает… машина?

Если качество машинного перевода проверяет человек, то это долго и дорого. А если нужно быстро и дёшево?

Когда вандалы не вандалы

Быт и нравы древних германцев в рунических надписях

Из пикселей — в буквы: как работает распознавание текста

— Я угадаю это слово с трех букв! — Угадывай! Рассказываем о том, как устроены системы оптического распознавания символов (OCR)

Все смерти «Илиады»: кровавая инфографика по Гомеру

Великий эпос Гомера рассказывает о Троянской войне — неудивительно, что к концу действия половина героев погибает

Берестяные грамоты от раскопа до компьютера. Памяти А.А. Зализняка. Часть I

Аесова и другие: откуда и благодаря кому мы знаем, как ругались русские люди в XII веке?

GPT-2

Второе поколение генеративных языковых моделей GPТ. Cпособна обучаться решать новые задачи на основе всего нескольких примеров

Кошмарные сны нейросетей

Как алгоритмы научились видеть ночные кошмары и рисовать «под Ван Гога»

BERT

Одна из первых больших языковых моделей, использующих архитектуру Transformer

ELMo

Языковая модель, позволяющая получать векторные представления слова, учитывающие его контекст

GPT

Одна из первых больших генеративных языковых моделей с архитектурой Transformer

FastText

Модель учитывает семантику частей слов, за счёт чего лучше понимает слова с опечатками и слова не из словаря.

ResNet

Архитектура нейросети, благодаря которой стало возможным обучать очень глубокие нейросети

GloVe

Улучшение Word2Vec, которое учитывает не только локальные взаимосвязи слов, но и связи слов в рамках всего корпуса

VGG

Модель, которая продемонстрировала, что глубина нейронной сети играет важную роль

Word2Vec

Модель, которая преобразовывает слова в числовые векторы, отражающие семантические значения и взаимосвязи слов

AlexNet

Первая глубокая свёрточная нейронная сеть, показавшая беспрецендентые результаты в задаче распознавания изображений

LeNet

Первая свёрточная нейронная сеть, совершившая революцию в области компьютерного зрения и ИИ в целом