
Компьютер учит срамоту
Как обучить нейросеть генерировать жёлтые тексты в духе самых трешовых баннеров? Наш автор Иван Торубаров погрузился в глубины кликбейта и спешит поделиться с вами тем, что он там нашел
Как обучить нейросеть генерировать жёлтые тексты в духе самых трешовых баннеров? Наш автор Иван Торубаров погрузился в глубины кликбейта и спешит поделиться с вами тем, что он там нашел
В младенчестве нам предстояло выучить незнакомый язык на основе речи вокруг себя. Как мы осваивали язык и отделяли слова друг от друга? Рассказываем о речевых подсказках для младенцев и о том, как мы прибегали к статистике уже в 7 месяцев
Визуализация геоданных подтвердила утечку персональной информации.
Язык интернета имеет свои характерные черты. И если исследованию языка Рунета посвящено множество работ, то DarkNet все еще остается серым пятном в этом плане. С помощью анализа тональности текстов выясняем, какая лексика характерна для отзывов о запрещенных веществах.
Наш проект по оцифровке открыток «Пишу тебе» продолжает исследовать свою постоянно растущую коллекцию. На этот раз мы изучили поздравительные открытки, написанные как до, так и после революции. Некоторые популярные поздравления сегодня выглядят неожиданно, хотя раньше были распространены повсеместно.
Именно с такими впечатлениями от посещения Крыма и черноморского побережья пришлось столкнуться участникам первого занятия лаборатории по расшифровке почтовых открыток от проекта «Пишу тебе». Рассказываем, как прошла лаборатория и что мы планируем дальше
Людвиг ван Бетховен создал девять симфоний, а еще он успел набросать несколько заметок и к симфонии № 10. Рассказываем, как ученые с помощью ИИ закончили это произведение «в стиле Бетховена».
Сможем ли мы отличить «Мастера и Маргариту» от «12 стульев»? Скорее всего, не ошибемся. А что если заменить некоторые слова из оригинальных произведений на близкие по значению с помощью векторной модели на базе word2vec? Предлагаем вам пройти наш тест и проверить, насколько хорошо получится опознать классические тексты, если некоторые слова в них будут модифицированы.
Разбираемся, как работает DraCor — программируемый корпус текстов на 11-ти языках, с помощью которого можно прочитать пьесу, наглядно рассмотреть отношения между персонажами и даже поиграть в карточную игру
Уже минула середина лета, кто-то еще только в предвкушении отпуска, а кто-то возвращается из поездок, путешествий, приключений. Такие моменты хочется разделять с близкими людьми. В дореволюционное и советское время популярным способом поделиться впечатлениями из поездки было отправление почтовых открыток с изображением городских достопримечательностей. Проект «Пишу тебе» сделал подборку летних почтовых открыток, где люди рассказывают об отдыхе и путешествиях.
Для исторической науки важны не только битвы, революции, переселения народов, смены экономических укладов и политических режимов. Важно еще понимать, кем были все те люди, чьими руками и умами велись сражения и торговля, совершались великие географические открытия, создавались новые государства, в общем — творилась история. Рассказываем о просопографии и просопографических базах данных
GPT-3 — самая известная из современных нейросетевых моделей языка. Вокруг нее много мифов, но модель действительно умеет впечатлить. Она отлично справляется с написанием целых эссе на заданную тему, удачно отвечает на вопросы, а также пишет стихи и программный код. Рассказываем, как работает GPT-3.
Сегодня каждая большая IT-корпорация пытается сделать «еще более умную» нейросетевую языковую модель, которая решала бы сразу множество задач: и ответы на вопросы, и порождение правдоподобного текста по заданной теме, и краткий пересказ. Мы уже писали о BERT от Google и семействе GPT от OpenAI — настал черед UniLM от Microsoft
Материал о том, как Розелла Бискотти с помощью ткани и ячеек разных цветов и узоров визуализировала данные о жителях родного города.
Правозащитный проект ОВД-Инфо запустил сервис анализа и визуализации открытых данных по статистике судебных решений по уголовным делам в России. «Системный Блокъ» разбирается с тем, как сервис становится проводником диалога судебной власти и общества, и зачем это нужно
Сможет ли человечество построить искусственный интеллект, не уступающий человеческому, и надо ли его строить? «Системный Блокъ» обсудил это с Константином Воронцовым, одним из известнейших специалистов по машинному обучению в России. Публикуем его ответы на наши вопросы
Сегодня Системный Блокъ отмечает свой третий день рождения. День рождения - очень добрый праздник. В этот день именинник получает приятные пожелания от близких людей. И никакие расстояния не помеха чтобы сказать теплые слова дорогому человеку. Сейчас нам не составит труда позвонить имениннику или отправить ему пожелания в мессенджере. А в начале XX века единственным способом поздравить на расстоянии человека было отправление почтовых открыток или писем.
Женщины и мужчины спорят о равенстве или превосходстве и никак не могут прийти к соглашению. Что если дело в том, что они просто говорят на разных языках? Такой вывод напрашивается после прочтения исследований о зависимости речи от гендера. По мотивам этих исследований мы создали небольшой тест, чтобы проверить, настолько ли заметна разница в коммуникации мужчин и женщин.
Сегодня в России более 1,3 млн учителей средних школ. «Системный Блокъ» решил узнать, насколько учитель средней школы в России подходит под критерий среднего класса. Говоря геймерским языком: насколько трудно «проходить Россию» на уровне сложности «medium teacher»
Рассматривая расписную тарелку дома у бабушки, мало кто задумывается, что декоративно-прикладное искусство — важная часть визуальной культуры. А еще старинные орнаменты отлично вдохновляют современных дизайнеров. Рассказываем про проект «Орнамика», собирающий узоры в цифровом формате
80 лет назад, 22 июня 1941 года, началась Великая Отечественная война. В военное время было особенно важно сообщить вести о себе своим близким, друзьям, знакомым. Проект «Пишу тебе» отобрал фронтовые открытки, посвященные тем временам. Эти открытки наполнены любовью, заботой и надеждой на встречу с родными
Сколько ваших знакомых без проблем смогут прочитать рукописи Пушкина? А петровскую скоропись? А рецепт своего лечащего врача? Чтобы разобрать написанное, часто нужен натренированный глаз. Добиться этого можно двумя способами: мы можем тренировать собственное зрение, а можем — компьютерное. Как и зачем тренируют модели распознавания рукописного текста — рассказывают исследовательницы классической сирийской литературы Юлия Фурман и Анна Черкашина
Эта страничка — дополнение к XI выпуску подкаста «Неопознанный Искусственный Интеллект». В этом выпуске мы общались с Борисом Янгелем из команды разработки беспилотных автомобилей в Яндексе. Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки
BERT — нейросетевая модель-трансформер от Google, на которой сегодня строится большинство инструментов автоматической обработки языка. Модель появилась в начале 2018-го, а уже в октябре того же года Google встроил модель в свой поисковик. Разбираемся, что же представляет из себя модель BERT и как она работает
Согласно данным проекта Periscopic, на 2021 год приходится пик так называемых «смертей от отчаяния» - преждевременных смертей американцев без высшего образования. Разбираемся, почему каждый год умирает все больше белых жителей США средних лет и как с этим связан русский алкоголизм
Цифровой архив «Документы Победы» хранит свидетельства о том, как управлялись войска, оборонная промышленность и прочие отрасли хозяйства во время Великой Отечественной войны.
1 июня — международный день защиты детей. К этому дню проект «Пишу тебе» собрал подборку старых открыток, написанных детьми. Юные авторы открыток рассказывают родителям о понравившихся игрушках, школьных отметках и последствиях употребления рыбьего жира.
Мы проанализировали все речи президентов, которые произносились в честь 9 мая с 2000 года. О том, как эти выступления влияют на нашу коллективную память и помогают легитимировать власть, читайте в исследовании СБъ
Со временем машины получают все больше способностей. Одной из них стало творчество. Произведения искусства, созданные автономными механизмами, существовали еще несколько веков назад, но расцвет этого вида творчества происходит в наши дни благодаря развитию технологий. Рассказываем о прошлом, будущем и настоящем генеративного искусства
Развитие технологий порождает новые этические проблемы. Например, голосовые помощники могут отражать и укреплять гендерные стереотипы. Мы проверили это, протестировав реакцию российских голосовых ассистентов «Алису» и «Маруси» на флирт, вопросы о гендере и оскорбления.
Для чего филологу учиться программировать? Зачем учить нейросети писать стихи? Как мы опираемся на корпусные методы исследования языка в повседневной жизни, даже не замечая этого? Системный Блокъ поговорил с цифровым филологом Борисом Ореховым — доцентом школы лингвистики НИУ ВШЭ и постоянным ведущим нашей рубрики «Нейростихи».
Продолжая осваивать виртуальную реальность как медиум, режиссеры и художники создают 360° VR-фильмы по мотивам шедевров мировой живописи. С изображений «снимают рамы» и превращают картины в трехмерные миры, доступные через VR-шлем или очки. Рассказываем, как оживают герои с картин, как меняется восприятие живописи и какую роль здесь играет зритель.
После 2020 мы все усвоили, что вирусные заболевания очень хорошо распространяются воздушно-капельным путем. Но какой еще невидимый глазом враг может таиться в воздухе?
Публикуем материалы к восьмому выпуску подкаста «Неопознанный Искусственный Интеллект»: текст расшифровки выпуска, оглавление, полезные ссылки и термины.
Нейролингвисты из Вышки исследовали, насколько легко обмануть мозг с помощью текстовых уловок. Спойлер: очень легко
Крутим глобус времен динозавров, запускаем навигатор по античным дорогам и созерцаем, как менялся мир под воздействием человека в последние тысячелетия
К грядущему 300-летию одного из самых цитируемых философов мира специалисты из Центра социально-гуманитарной информатики Балтийского федерального университета реконструируют дом своего земляка в Кёнигсберге XVIII в. Виртуальная реконструкция ведется на основе письменных источников, а также единичных старых фотографий и картин
Театральная и перформативная коллекции в Музее Виктории и Альберта представлены как самостоятельный отдел. Он хранит уникальные артефакты: от сборников времен Шекспира до плакатов Sex Pistols. В пандемию доходы музея сильно упали, поэтому отдел хотят закрыть. Даже государственная поддержка не может компенсировать колоссальные убытки музея
Починка человеческих душ — теперь и в виртуальном пространстве! В этой статье мы расскажем, как современные технологии помогают преодолевать фобии и реабилитировать людей после травм. Статья подготовлена факультетом психологии МГУ им. Ломоносова в рамках совместного проекта с изданием «Системный Блокъ».
Что такое нарратив и из чего складывается повествование? О способах конструировать сюжет рассказываем в новом материале
Пройдите тест, который покажет, кто вы в мире цифровых гуманитарных исследований. А заодно — познакомьтесь с известными цифровыми гуманитариями.
Как работают современные методы переноса стиля? Могут ли они быть полезны или опасны? И при чём здесь «бутылочное горлышко» нейросети?
Корпус переводов общественно-политических текстов XVIII века помогает проследить формирование русского политического языка. В корпусе есть философские трактаты, художественные произведения политического характера, учебники и словари
Мы писали о том, как оцифровывают почти все, даже алтари. Но можно ли перевести ткани в цифровой формат? Разбираемся, как сохраняют узоры на текстиле
Когда мы читаем книгу, то иногда отвлекаемся на нумерацию страниц, перечитываем оглавление или сравниваем обложку с содержанием. Так происходит, потому что все эти элементы являются паратекстом. О том, что означает этот термин и какие функции несёт, расскажем в нашей статье
Сюжеты фантастических фильмов, где людей не отличить от роботов, ближе, чем мы думаем. Конечно, современным андроидам нужны еще годы разработок до стопроцентной идентичности, но об их месте среди людей стоит задуматься уже сейчас. Производство двойников и клонов – это неизбежное технологическое будущее или губительная для психики практика, которая не вписывается в этические нормы (даже очень размытые)?
Мир глазами средневекового книжника: как разобраться в карте, если север слева, река впадает в круг, а посреди города сидит лев? Сравниваем средневековые карты с современными
Формат дистанционного обучения кажется относительно новым, но он старше, чем кажется. Разбираемся, когда на самом деле появился так надоевший в 2020 дистант и какую страну можно считать его родиной
Под влиянием культурных и социальных условий наш язык трансформируется. В эпоху Интернета эти изменения происходят гораздо чаще, и принять их бывает трудно. Разбираемся, достоин ли «великий и могучий» русский язык называться таковым после языка падонкафф, где грань между лол и кек и почему нельзя повышать шрифт на кого попало
Анализ смертей от алкоголизма в России и визуализация травм протестующих в Беларуси, изучение статистики наркопреступлений и расследование пыток в силовых структурах на основе тысяч приговоров — все это примеры журналистики данных. Разбираемся, чем занимаются data-журналисты и что в их работе главное. Спойлер: главное — не данные!
Разбираем сложные технологии глубокого обучения, чтобы они становились понятны каждому
Работа мозга - одна из самых малоизученных сфер в науке, а лечение психических расстройств и заболеваний мозга очень востребовано. Нейробиологам из США и Южной Кореи удалось найти подход к борьбе с психическими расстройствами с помощью мозговых имплантов и смартфона
Может ли сеть средневековых писем рассказать исследователям о политических связях византийцев? Видно ли в ней наступление разобщенности элит, за которым последовал политический кризис и новый виток гражданской войны? Рассказываем о теории графов (network theory) на службе у медиевиста
Как технологии меняют юриспруденцию? Что такое цифровой суд? Можно ли автоматизировать работу юриста? Ответы на эти и другие вопросы читайте в нашем материале о legal tech
До начала XIX века память об умершем сохранялась в произведениях искусства и письменных источниках. Два столетия спустя человека стало возможно увековечить… целиком. Теперь внешность, голос, мимика и движения — потенциальный материал для виртуальной копии. Да-да, это реальность, а не один из эпизодов «Чёрного зеркала». Разбираемся в тонкостях цифрового бессмертия, бизнесе «двойников» и этике воскрешения
Сегодня для того, чтобы понять, кто написал текст под псевдонимом, у исследователей есть количественные методы анализа, в основе которых – подсчет служебных слов в тексте. О том, как люди к этому пришли, рассказываем в материале об истории стилометрии
Публикуем материалы к седьмому выпуску подкаста «Неопознанный Искусственный Интеллект»: текст расшифровки выпуска, оглавление, полезные ссылки и термины.
Если ввести в поисковую строку браузера слово «робот», на большинстве картинок роботы окажутся белыми или серебристыми. Исследование 2018 года показало, что это может быть неслучайно: расовая нетерпимость распространяется не только на людей.
Модели компьютерного зрения обычно без труда распознают стул, стоящий на кухне, но перевернутый стул в спальне ставит их в тупик. Создатели ObjectNet постарались решить проблему с помощью датасета с тысячами необычных фотографий
Быть студентом в Средние века — это вам не с айфона шпоры списывать. Но многие знакомые современным студентам вещи были в университетах уже тогда. Например, землячества или материальная помощь для малообеспеченных. Проверьте ваши знания об университетской жизни в Средневековье.