Фото автора

Системный Блокъ

Маскот

Коллективный автор

Редактор статей

Что такое мешок слов

Рассказываем, что такое мешок слов и как он может помочь в задачах автоматической обработки текста

Автор(ы) умер(ли), а проблемы остались

Продолжаем разгадывать вечную тайну «Беовульфа» и рассказывать о том, как цифровые филологи строят научный диалог в поисках правды.

«У нас в культуре надо не думать, а надо прыгать»: интервью с психологом Марией Фаликман

Мария Фаликман — доктор психологических наук, профессор департамента психологии факультета социальных наук НИУ ВШЭ, специалист в области когнитивной науки. «Системный Блокъ» расспросил Марию о том, чем занимаются когнитивные исследователи, как связаны когнитивная наука и искусственный интеллект, а также почему воспоминания со временем искажаются.

Что такое нейросеть GPT-3 и зачем она нужна

Общение с чат-ботами и голосовыми помощниками стало частью повседневного опыта. Мы спрашиваем у нейросетей о погоде и пробках, просим переводить и сочинять тексты, проверяем их способности стихосложения и иногда даже делимся сокровенными секретами. СБъ уже не раз рассказывал о работе языковых моделей, которые делают боты более человечными. Предлагаем освежить знания и прочитать материал из глоссария про наиболее крупную и продвинутую языковую модель в мире – GPT-3

Отмороженный искусственный интеллект: зима (не) близко

Многие представляют себе искусственный интеллект по фантастике. Альтрон из «Железного человека», ВИКИ Азимова, «Мир Дикого запада» и «Апгрейд» — все это выглядит, как торжество развития технологии, способной и улучшить жизнь человечества, и положить ему конец. Правда, реальный искусственный интеллект пока далек от того, что показывают нам в фильмах и книгах. Но это не повод расстраиваться — ведь в истории ИИ были и куда более тёмные времена

В российскую медицину приходит ИИ: чего ждать и где он появится раньше

В России в апреле официально зарегистрирован первый искусственный интеллект в медицине. Неужели из-за COVID? (Спойлер: нет; но к борьбе с коронавирусом его все равно привлекли)

Сейчас вылетит птичка: что внутри у платформ для изучения языка?

Мы часто воспринимаем платформы для изучения языка как волшебные инструменты, с помощью которых и вправду можно выучить японский за тридцать дней. Приложения типа Lingualeo или Memrise добросовестно напоминают нам о необходимости пройти новый раздел грамматики или повторить слова, сопровождают каждый урок смешными примерами и вообще предлагают довольно широкий выбор тем — интересно будет и маленькому ребёнку, и начинающему новый язык взрослому. Но как именно организовать такой обширный материал? Давайте разберёмся на примере всем известного Duolingo

Цифровое окно в природу

Миллионы людей по всему миру помогают науке, собирая фотографии живых организмов и пополняя гигантскую базу iNaturalist. Из-за пандемии снимать стало сложнее, но помочь науке все равно можно. Рассказываем, как это сделать

Zoom ему пухом

Разбираемся, как прямые трансляции похорон в Zoom и Facebook спасают ритуальную индустрию и влияют на участников церемонии

Стали ли современные поп-песни грустнее за последние 50 лет?

Поп-музыка — практически неограниченное пространство для исследователя. Можно попробовать изучать ее инструментами социологии, теории музыки, культурологии и еще десятка дисциплин, но самый простой способ — проверить, как меняются тексты в самом распространенном музыкальном стиле последнего столетия

Белкография: кто и зачем считает белок в Центральном парке?

Если вы учитесь на картографа и не знаете, чем заняться в жизни, не переживайте: всегда есть вероятность, что вас попросят нанести на карту пару тысяч белок. Подробнее о потенциальном рабочем месте — в этой статье

Есть ли стиль у переводчика? А если найдем?

Как инструменты стилометрии помогают исследовать относительную силу стилистического отпечатка автора и переводчика в художественном тексте

На распутье Digital Humanities

Недотехнари, псевдоученые, шарлатаны — как только не называли цифровых гуманитариев (и как они сами себя только не называли). Представители этого направления проводят исследования, выигрывают гранты, и при этом Digital Humanities все еще не имеет до конца сформированной методологии и научной базы. Так кто же такие дигитальные гуманитарии и что их ждет в будущем?

Как GPS делает нас тупее — и как этому противостоять

Все еще пользуетесь навигатором, катаясь на машине по родному городу? Постоянно заглядываете в Google.Карты во время пеших прогулок? Альцгеймер уже идет к вам!

«Шахерезада»: робот, рассказывающий истории

Разбираемся, как работает алгоритм генерации историй «Шахерезада»

Невидимые кинозвезды: как Голливуд не замечает женщин-режиссеров

В 2010 году «Оскар» за лучшую режиссуру впервые получила женщина — Кэтрин Бигелоу с фильмом «Повелитель бури». Стали ли после этого режиссеры женского пола более заметными фигурами в киноиндустрии? Редакция «Системного Блока» провела исследование, проследив динамику упоминаний женщин-режиссеров в статьях популярных киножурналов

Вавилонская нейросеть для многоязычного перевода

Не так давно заговорили о том, что система нейронного машинного перевода от Google сама научилась переводить в языковых парах, для которых у неё нет параллельных корпусов. Действительно ли онлайн-переводчик изобрел собственный универсальный язык, машинную интерлингву?

Роботы вступают в гонку вооружений: военные применения ИИ

Военные используют искусственный интеллект с момента его появления. Самонаводящиеся ракеты с компьютерным зрением поступили на вооружение еще в разгар Холодной войны, с начала 2000-х активно применяются беспилотные ударные дроны, обретающие все больше самостоятельности в решении вопросов жизни и смерти... Что дальше?

Тест Тьюринга для киберпоэтов

Как обычный «слепой тест» по отделению машинной поэзии от той, что написана людьми, приводит ученых к философскому спору об относительности понятия «человека» в искусстве

Как провести корпусное исследование? Помогите!

Рассказываем, что такое mystem и antconc, для чего они нужны, и как ими пользоваться

Гуманитарии должны прогнозировать культуру

Лев Манович — о будущем соцсетей, смещении глобальных культурных центров и экспорте русского страдания

Зачем нужны гуманитарии в эпоху машинного обучения?

Если ты гуманитарий — не отчаивайся. Если технарь — дружи с гуманитариями!

Роботы-симпатяжки втираются в доверие

Как стать больше, чем просто роботом-доставщиком, и научиться коммуницировать с людьми? Надо быть милым, выучить «словарь поведения» и уступать человекам дорогу

Полезные ресурсы для digital гуманитариев. Документы и слайды

Этот материал для вас, если вы до сих пор пользуетесь пакетом Microsoft Office и носите презентации на флешке

Нейросеть и ведьма Винни: алгоритмы добрались до детских книжек

Искусственный интеллект научился разбираться в художниках

Земля ему пуховик. Как работает Т9?

Почти всё, что мы называем Т9, на самом деле не Т9

Нейросеть вернула Хану Соло лицо

Технология deepfake подходит не только для создания поддельного порно со знаменитостями

Нейровоскрешение великого битника

Писатель-призрак и писатель-робот создали «посмертную» книгу Джека Керуака

Спасительный луч для поехавшей крыши

Знаменитому итальянскому собору грозит разрушение. Космическое излучение может его спасти

За гранью разумного: нейросеть придумала кино

Не знаете, что посмотреть? Попробуйте фильм, сценарий к которому написала нейросеть!

Автор статей

Как прийти к «сильному» искусственному интеллекту. Первый выпуск подкаста НИИ

Эта страничка — дополнение к первому выпуску подкаста «Неопознанный Искусственный Интеллект». Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки.

Системный Блокъ на самоизоляции

Как вы проводите время на самоизоляции? Наш урбанист Оля, например, встречается с друзьями в Zoom на кулинарных пятницах, куратор Ира ходит на британские онлайн-спектакли, а главред Даня путешествует по району до самой дальней мусорки. Во втором интервью с участниками проекта Системный Блокъ мы расскажем о том, как карантин изменил нашу жизнь, что нового мы узнали о себе и чем еще можно заняться, чтобы скрасить последние недели самоизоляции

Как измеряют эффект Вертера

Но не тот, о котором вы подумали. Мы расскажем не о последствиях трагической любви, которые заставляют молодых людей с разбитым сердцем сводить счеты с жизнью, а о том, как «Страдания юного Вертера» перекликаются с окружающими его текстами

Цифровые актеры: фантастика и реальность (к 80-летию Аль Пачино)

Аль Пачино знают по «Крестному отцу» и «Лицу со шрамом», но в его репертуаре есть и кино, связанное с тематикой искусственного интеллекта и симуляции разума. В 2002 году Аль Пачино сыграл кинорежиссера, создавшего виртуальную актрису. В день 80-летия актера мы решили узнать, не стала ли эта фантазия реальностью в наш век дипфейков

Как знание языков прокачивает мозг: 5 бонусов многоязычия

Быть полиглотом круто не только потому, что вам будет проще заказать пиво в отпуске за границей. У многоязычного сознания есть и более глубокие внутренние преимущества. Исследования показывают, что использование нескольких языков может отсрочить старческую деменцию и болезнь Альцгеймера, помогает усваивать новые знания и лучше справляться с некоторыми когнитивными тестами. Правда, эти бонусы подтверждаются не во всех экспериментах

Нейронные сети придумал Леонардо да Винчи

На самом деле нет. Но возможность стилизовать современную статью по Data Science под рукописи титана Возрождения — это круто. Спасибо сверточным нейросетям и исследователю из Вышки Борису Орехову.

Зомби против вируса: как игры помогают пережить карантин

Самоизоляция в Fortnite, пары по программированию в Minecraft, обитаемые 3D-модели университетов и мемы про военку в Counter-Strike: как игровая среда заменяет людям реальность в дни пандемии

Как управлять мамонтом: генерируем нужные тексты с помощью моделей Plug and Play

Нейросети хорошо порождают правдоподобный текст. Но как заставить их писать на нужную тему, да еще и с нужным отношением к этой теме (положительным, нейтральным или отрицательным)? Рассказываем про решение, которое позволяет «донастраивать» языковую модель под себя

5 дизайн-вдохновений Стива Джобса

Сегодня, 24 февраля 2020, исполнилось бы 65 лет Стиву Джобсу — создателю Apple, эстету, скандалисту и визионеру. Джобс сделал почти невозможное: он стал глобальным технологическим революционером, не будучи технарем. Гений Джобса всегда был в области дизайна, эргономики и общей эстетики. Но оказалось, что в XXI веке именно это отличает великого производителя электроники — от заурядных и просто хороших

«Еще мужчинестее быть»: из чего сделаны поздравления с 23 февраля

Стихотворные поздравления на 23 февраля — не менее одиозный жанр, чем сексистские вирши на 8 марта или слащавые стишки на День святого Валентина. «Системный Блокъ» решил исследовать этот жанр количественными методами. А в качестве бонуса мы сделали собственный генератор абсурдных поздравлений с Днем защитника Отечества. Впрочем, порожденные генератором тексты оказались не более абсурдны, чем вся атмосфера 23 февраля, превратившегося из профессионального праздника военных — в офисный «день коллег мужского пола» с нелепыми рудиментами милитаризма.

5 российских библиотек с богатыми цифровыми коллекциями

Оцифровка культурных данных — необходимая база для цифровых гуманитарных исследований. Делимся списком крупных коллекций, созданных российскими библиотеками

Многомерное «Слово о полку Игореве»: от кукушки до алкогольного брендинга

Когда мобильный интернет был экзотикой, а отчёты по грантам сдавали на 3,5-дюймовых дискетах... в Рунете уже были цифровые гуманитарные проекты! Рассказываем в лицах и деталях об одном из них — о параллельном корпусе переводов поэмы «Слово о полку Игореве», которая отметила 13-летие. В конце поста бонус — обзор исследований на основе корпуса

Вебинар «Математика для Data Science»

Машинное обучение и Data Science похожи на ядерную физику в начале 50-х или кибернетику в 60-е. Мечтают делать многие, понимают немногие, делают — совсем немногие. Главная преграда — математика. Рассказываем про вебинар наших партнеров из OTUS

Лица Системного Блока

В 2019 году наша команда спецпроектов знакомила вас с учеными, популяризаторами науки, которые применяют цифровые методы в своих гуманитарных исследованиях. А 2020-й мы решили начать со знакомства с участниками самого Системного Блока. Кто, как и почему делает этот проект — расскажем в нашем праздничном интервью

«Best of Блокъ»: лучшие посты 2019 года

Весь 2019 год «Системный Блокъ» рассказывал, как высокие технологии становятся частью современной науки, культуры и повседневности, принося хорошее и плохое. Мы писали о последних прорывах в автоматической обработке языка и о методах борьбы с фейк ньюс, объясняли на пальцах, как работают нейросети, машинный перевод и фильтры в инстаграме, учили обкачивать VK, твиттер и HTML-страницы и делать корпусные исследования, рассказывали про статистические исследования в истории, литературе и искусстве, а еще много исследовали сами... За год в «СБъ» вышло больше 220 материалов. Предлагаем вам подборку из 12 постов, которые стоит перечитать. Можно как раз под бой курантов 🥂

Где учить Python: обзор онлайн-курсов от «Системного Блока»

Научиться программировать мечтают многие, но как выбрать подходящий курс из сотен доступных вариантов? Мы сделали обзор курсов по Python, которые проходили сами

Скажи мне, какой у тебя индекс Хирша, и я скажу, кто ты

Разбираемся, можно ли измерить вклад учёного в науку и стоит ли это делать

YouTube на русском, зулусском и урду: как тестируют перевод интерфейсов

Видеохостинг YouTube имеет локализации в 100 с лишним странах — это значит, что для них есть специальная локальная версия сайта (а то и не одна). Например, когда вы заходите в YouTube из России, вы видите меню на русском языке. Такие же меню есть не только на языках-гигантах вроде английского, испанского или китайского, но и, к примеру, на суахили, эстонском, зулусском, урду, африкаансе, узбекском... А как оценивать качество перевода всех этих кнопочек в меню и их понятность для пользователей?

Я/МЫ НКРЯ: что происходит с национальным корпусом

...зачем в этом разбираться и почему мы волнуемся за НКРЯ

Машинный перевод становится синхронным

Вавилонская рыбка все ближе к вашему уху! Синхронный машинный переводчик STACL начинает выдавать перевод предложения до того, как прозвучит окончание фразы на языке оригинала. Но получится ли сравниться по качеству с человеком?

Женщины и власть

Маргарет Тэтчер, Екатерина Великая, Индира Ганди, Ангела Меркель… Вряд ли вы сможете добавить в этот список больше 5-10 имен. Женщин-политиков, которым довелось управлять государствами, совсем немного. А что происходит в парламентах и руководстве компаний? И как настроено общественное мнение по отношению к женщинам-руководителям?

Как машинный перевод оценивает… машина?

Если качество машинного перевода проверяет человек, то это долго и дорого. А если нужно быстро и дёшево?

Когда вандалы не вандалы

Быт и нравы древних германцев в рунических надписях

Из пикселей — в буквы: как работает распознавание текста

— Я угадаю это слово с трех букв! — Угадывай! Рассказываем о том, как устроены системы оптического распознавания символов (OCR)

Все смерти «Илиады»: кровавая инфографика по Гомеру

Великий эпос Гомера рассказывает о Троянской войне — неудивительно, что к концу действия половина героев погибает

Берестяные грамоты от раскопа до компьютера. Памяти А.А. Зализняка. Часть I

Аесова и другие: откуда и благодаря кому мы знаем, как ругались русские люди в XII веке?

GPT-2

Второе поколение генеративных языковых моделей GPТ. Cпособна обучаться решать новые задачи на основе всего нескольких примеров

BERT

Одна из первых больших языковых моделей, использующих архитектуру Transformer

ELMo

Языковая модель, позволяющая получать векторные представления слова, учитывающие его контекст

GPT

Одна из первых больших генеративных языковых моделей с архитектурой Transformer

FastText

Модель учитывает семантику частей слов, за счёт чего лучше понимает слова с опечатками и слова не из словаря.

ResNet

Архитектура нейросети, благодаря которой стало возможным обучать очень глубокие нейросети

GloVe

Улучшение Word2Vec, которое учитывает не только локальные взаимосвязи слов, но и связи слов в рамках всего корпуса

VGG

Модель, которая продемонстрировала, что глубина нейронной сети играет важную роль

Word2Vec

Модель, которая преобразовывает слова в числовые векторы, отражающие семантические значения и взаимосвязи слов

AlexNet

Первая глубокая свёрточная нейронная сеть, показавшая беспрецендентые результаты в задаче распознавания изображений

LeNet

Первая свёрточная нейронная сеть, совершившая революцию в области компьютерного зрения и ИИ в целом