Компания Anthropic научила ИИ-продавца зарабатывать
ИИ-агент управлял автоматизированным магазином в офисах компании. Ему удалось получить прибыль, однако он остается уязвимым и нуждается в помощи людей
ИИ-агент управлял автоматизированным магазином в офисах компании. Ему удалось получить прибыль, однако он остается уязвимым и нуждается в помощи людей
Наверняка вы не раз сталкивались с тестами: сдавали экзамены в школе или проходили собеседование. Но всегда ли им можно доверять? Как отличить хороший тест от плохого? И что нужно знать, чтобы составить грамотный тест самостоятельно? Ответы дает психометрика — наука о том, как создавать обоснованные измерительные инструменты.
От аппаратов, обследовавших реакторы на Фукусиме, до беспилотников и сканеров, которые помогали восстанавливать Нотр‑Дам-де-Пари — разбираемся, как устроены роботы-спасатели и чем они могут быть полезны пожарным, инженерам и реставраторам.
Остаётся ли завтрак завтраком, если в течение дня нет ни обеда, ни ужина? С точки зрения лингвистики, это непростой вопрос. В лингвистике существует множество теорий, чтобы описать значение в естественном языке. Большинство из них абстрактны и редко находят практическое применение, но есть исключение — фреймовая семантика. О том, что такое семантический фрейм, как устроены базы данных таких фреймов, как специалисты по NLP применяют их для анализа рынка ценных бумаг и что такое на самом деле «завтрак», читайте в новом материале «Системного Блока»
Если ученики используют ИИ — это плагиат или прогресс? Ответ зависит от того, какие «правила игры» приняты на занятиях. Рассказываем, как преподавателю выстраивать границы в использовании ИИ, как их удерживать и как понять, что они нарушены.
Каомодзи — японские смайлики, с помощью которых можно передать эмоции без слов. Попробуйте определить, что означает каждый из них: радость, грусть, злость или смущение. Этот короткий тест покажет, насколько хорошо вы понимаете язык японских выражений в интернете.
Нейросети становятся частью образовательной реальностью. Означает ли это, что академическая честность сойдёт на нет? Или мы просто становимся свидетелями появления новой — цифровой академической этики? Рассказываем, как школы и вузы учатся регулировать использование ИИ.
За что и как наказывали людей в прошлом? Как судебные архивы превращаются в базы данных, а историки — в дата-аналитиков? Чем историкам права помогают цифровые методы? На примере проекта The Old Bailey Proceedings Online рассказываем, что можно узнать из решений центрального лондонского уголовного суда за 250 лет.
Когда у канадца Шона Пауэра украли MacBook, он с помощью программы для отслеживания получил фото человека, который использовал его устройство. Пауэр написал об этом в Twitter (сейчас X), и интернет-детективы, активно включившись в расследование, установили местонахождение вора. Они поговорили с ним и … ноутбук вернулся к хозяину без обращения в полицию. Это лишь один из сотен случаев, когда обычные пользователи, блогеры и гражданские активисты помогают раскрыть преступление с помощью технологий. Рассказываем, как цифровые инструменты от карт Google до анализа метаданных в соцсетях меняют криминалистику.
Цифровизация затрагивает все сферы жизни человека, включая образование. Если использование технологий на уроках истории или физики уже никого не удивляет, то с физической культурой всё не так очевидно. Рассказываем, как существующие цифровые технологии могут трансформировать традиционные уроки физкультуры и сделать их более увлекательными и эффективными для школьников.
Что происходит с памятью, когда она становится цифровой? В новой подборке интервью «Системного Блока» — истории тех, кто превращает архивы в цифровые пространства, пересобирает музеи в онлайн-формате и осмысляет, как современные инструменты помогают сохранять культурное наследие.
5 октября в России отмечается День учителя. В честь праздника мы собрали наши статьи, полезные и для тех, кто учит, и для тех, кто учится. Рассказываем, как технологии меняют образование детей и взрослых, сравниваем цифровых помощников и делимся готовыми промптами для нейросетей.
Бывает ли так, что вы ловите себя на мысли, что текст слишком сложный и непонятный, хотя написан не на иностранном языке, а на вашем родном? А встречали ли вы такие тексты в школьных учебниках, которые, казалось бы, и нужны для того, чтобы объяснять непонятное? Сложность текста можно определить субъективно, но лучше сделать это автоматически. Рассказываем, зачем это нужно и какие сервисы для этого существуют.
Сложно назвать историческую эпоху, о которой существует столько же стереотипов и заблуждений, как о Средневековье. Медиевисты делают все возможное, чтобы развенчать мифы о невежестве и антисанитарии и сделать наше представление об этом периоде более адекватным. «Системный Блокъ» собрал несколько материалов о том, как им в этом помогают цифровые методы.
Датасет в машинном обучении — структурированный набор данных, который используется для тренировки моделей. Чтобы обучить большую языковую модель (LLM), датасеты должны быть крупными. Сегодня посмотрим на инструмент BunkaTopics, который позволяет исследовать их — узнавать тематическую составляющую, очищать и проверять, нет ли в данных смещения.
Они пересказывают тексты, находят скрытые смыслы и даже сочиняют истории. Читайте в нашей подборке, как большие языковые модели обнаруживают неожиданные параллели в произведениях, соревнуются с писателями и какие приемы помогут вам получать от них лучшие ответы.
Прогресс больших языковых моделей через увеличение их размеров застопорился: их масштабирование уже почти не дает прироста качества. Выход ищут в новом подходе — рассуждающих языковых моделях. Рассказываем, как работают рассуждающие языковые модели, как они решают проблемы современных LLM и создают новые.
Когда мы говорим о писательницах и поэтессах в обязательной программе по литературе, первыми приходят в голову Анна Ахматова и Марина Цветаева. Но ведь они не единственные женщины, попавшие в списки для чтения. Понятно, что кроме них школьники изучают и других — например, Зинаиду Гиппиус и Туве Янссон (да! давайте больше читать про муми-троллей). Проверим, насколько хорошо вы знакомы с писательницами, которые удостоились чести оказаться в русском литературном каноне.
Еще век назад к Москве стекались финансы из регионов. Откуда мы это знаем? Благодаря цифровым инструментам для анализа вексельных операций удалось узнать, кто были ключевыми клиентами московского отделения Санкт-Петербургского международного коммерческого банка. Связи между компаниями и банками (в том числе и личные), география сделок, отрасли — посмотрим, как были устроены кредитные отношения в начале XX в. Рассказывает автор исследования, специалист по исторической информатике Андрей Кулагин.
Исследователи античности очень гордятся тем, что использование цифровых методов в гуманитарных науках началось именно с классической филологии. Это произошло еще в 1960-х годах — с тех пор и возможности компьютеров шагнули далеко вперед, и количество доступных инструментов значительно возросло. Читайте в материалах нашей подборки, как классики используют 3D-модели, ГИСы, стилометрию, базы данных, сетевой анализ и многое другое, чтобы разгадывать загадки прошлого.
Мы очень любим наших художников и дизайнеров инфографики. Иногда их работы говорят больше, чем слова. Мы собрали несколько примеров — попробуйте угадать, какие публикации они иллюстрируют.
В Национальном корпусе русского языка за последние годы появилось много новых инструментов. Один из них — это «Портрет слова», который не только содержит информацию о морфологических признаках и морфемах каждого слова, но и дает представление, например, о его семантических соседях. В статье мы покажем, как пользоваться этим и другими заметными нововведениями, и расскажем, какие технологии за ними стоят.
Многие школы и ученики до сих пор подвергаются кибератакам. При этом уроки кибербезопасности по-прежнему факультативны. Разбираемся, как превратить правила безопасности в привычку и почему игры эффективнее лекций и запретов.
Карфаген должен быть разрушен — но почему именно он? Возможно, дело вовсе не в злопамятности римлян, а в географии. Точнее, в транспортной сети, которую можно сегодня смоделировать с помощью ORBIS — цифрового проекта Стэнфорда. Методы сетевого анализа позволяют взглянуть на Римскую империю как на систему дорог, портов и городов, от которой в империи напрямую зависело все: торговля, власть, снабжение и, наконец, ее распад.
Кто-то, где-то, что-то, как-то, почему-то. Все мы часто используем неопределенные местоимения. Они спасают нас в минуту неуверенности и незнания. В 1997 году лингвист Мартин Хаспельмат описал, какие значения они могут выражать и какие закономерности есть в употреблении неопределенных местоимений. Рассказываем, чем эта классификация помогает ученым и как с помощью вычислительных методов можно показать стремление языков к оптимальности.
Слова, как и люди, любят компанию. У каждого есть свой круг «общения» — другие слова, которые часто встречаются рядом с ним в схожих контекстах. Однако этот круг меняется со временем. В XIX веке у слова могли быть одни «приятели», а в XXI — совершенно другие. С помощью Национального корпуса русского языка мы можем заглянуть в прошлое и увидеть, как трансформировались эти семантические окрестности. Сможете ли вы опознать слово, зная лишь его «компанию» из разных эпох? Пройдите наш тест и проверьте свою лингвистическую интуицию!
Готовы почувствовать себя Шерлоком Холмсом? Проверьте свои знания о криминалистической биоинформатике: как с помощью ДНК, пыли, грибов и микробиомов можно раскрыть преступления.
Как «разложить» все книги мира на одной гигантской полке? 📚 Оказывается, для этого достаточно внимательно посмотреть на коды ISBN. Рассказываем, как превратить набор цифр в книжную вселенную в одном визуальном пространстве, по которому можно гулять.
Готовы ли вы совершить захватывающее путешествие в мир древности, используя современные технологии? Палеогенетика и биоинформатика воссоздают историю наших предков через анализ их ДНК. Пройдите наш тест и проверьте свои знания о том, как наука помогает расшифровывать загадки прошлого!
Можно ли с помощью нейросетей находить скрытые цитаты, аллюзии и сближения в художественных текстах? Конечно! Что будет, если объединить силу LLM с экспертизой литературоведов, — читайте в материале математика, специалиста по Computer Science и одновременно литературоведа Евгения Обухова.
Хотите узнать, какие страны воевали больше всего? Сколько было войн и где происходили ключевые битвы? Рассказываем о Всемирной базе данных исторических сражений, которая содержит информацию о более чем 8000 военных конфликтах — от древности до наших дней.
Как современные технологии меняют подход к изучению древних надписей? Какие методы используют исследователи для сохранения исторического наследия? Пройдите наш тест и выясните, насколько хорошо вы разбираетесь в цифровой эпиграфике.
Каждый, кто говорит по-русски, знает, что роль играют, условия выдвигают, а глаза бывают карими, но не коричневыми. Такие устойчивые словосочетания называются коллокациями, и существовать без них не может ни один язык. Мы уже рассказывали о том, как коллокации помогают гуманитариям, а теперь сделали тест, который поможет вам разобраться в этой теме. Готовы проверить свои знания?
В новой подборке мы рассказываем об инструментах, которые используют востоковеды для изучения японского языка и цифровых исследований японских текстов: от онлайн-словарей до продвинутых методов стилометрии.
Ухемоль, лоландер, рудада — спорим, вы не слышали таких слов? Мы тоже, пока не начали составлять этноботаническую базу данных PhytoLex. Рассказываем, для чего используется эта база данных и что можно узнать с ее помощью: от этимологии слова до его эволюции сквозь века.
Коллокации — это словосочетания, в которых слова часто встречаются рядом. Рассказываем, как устроены коллокации и какие есть способы их выявлять. А также изучим с помощью коллокаций в НКРЯ, что представлял собой антисемитизм в Российской империи второй половины XIX века.
Геоглифы Наски известны людям с XVI века — о них упоминали конкистадоры, которые проходили через пустыню. Тем не менее научное изучение геоглифов началось сравнительно недавно, чуть менее 100 лет назад, и стало возможным благодаря новым технологиям. С тех пор было открыто более 430 фигуративных, то есть составляющих изображение, геоглифов, а также множество линий, пересекающих пустыню.
Интернет и программирование: как много в этом звуке для сердца русского слилось! Читайте в нашей подборке, как писатели в начале XX века предсказали интернет, как в Советском Союзе пытались создать суверенную электронную сеть и почему советские и русские программисты стали цениться во всем мире.
Большой египетский музей (The Grand Egyptian Museum) в Гизе — огромный проект-долгострой с самой большой коллекцией египетских древностей. Рассказываем, как цифровые инновации вписались в проектирование и строительство музея.
Можно ли применять алгоритмы определения авторства к текстам древних исландских саг? Какие гипотезы о создателях этих текстов помогает подтвердить метод дельты, который ранее применяли для поиск поддельных стихов XIX века и раскрытия псевдонима Джоан Роулинг? Рассказываем про исследование исландского лингвиста Хёйка Торгейрссона.
Кто из древних людей пережил последний ледниковый период, а кому холода принесли смерть и исчезновение навсегда? Как останки зубов помогли открыть «бутылочное горлышко», через которое прошло всё человечество и едва не вымерло? Рассказываем, как палеогенетики изучали ранние миграции людей в Европе и выясняли, какие популяции Homo Sapiens исчезли навсегда
Как на базе мемуаров можно вычислить характер исторических личностей? О чем писали в газете заключенных на Соловках? Как с помощью анекдотов разобраться в перипетиях отношений между советской властью и гражданами? «Системный Блокъ» рассказывает, что такое контент-анализ и как в историческую науку внедряются цифровые методы.
Где искать в интернете японские словари? Какие из них вызывают доверие у востоковедов-японистов? «Системный Блокъ» рассказывает об онлайн-словарях японского языка и их особенностях. Три системы письменности, развитая лексическая многозначность, непростая история японского языка и культуры — все это определяет, как выглядят словари в цифровую эпоху
Иногда сложно понять, что же хотел сказать автор своим сочинением, а пересказать текст кажется нереальной задачей — из-за необычной структуры повествования или при использовании разных рассказчиков. Как справляются с подобными задачами LLM? Ученые Колумбийского университета спросили у самих писателей.
Что такое «гипотеза Поллианны»? Как она проявляется в зарубежной детской и юношеской литературе? Какие существуют методы, чтобы ее подтвердить или опровергнуть? В материале рассказываем о том, как исследователи провели сентимент-анализ корпусов англоязычной и немецкоязычной детской литературы и какие результаты они получили.
Западная Африка — место жительства более 450 млн человек, говорящих на сотнях разных языков. Это регион огромного культурного, этнического и языкового разнообразия. Рассказываем, как некоторые из западноафриканских языков обрели свою письменность, как она сохраняется и распространяется в цифровом мире и почему это помогает людям заявить о своей идентичности.
Современные технологии хорошо помогают в криптоанализе: программы, перебирающие тысячу вариантов за несколько секунд, в разы превосходят возможности человека. Однако слепого применения софта недостаточно, особенно если речь идёт о самом приоритетном неразгаданном шифре в списке ФБР — криптограмме серийного убийцы Зодиака. В новом материале разбираемся, какие вообще бывают шифры, почему шифр Зодиака не могли дешифровать на протяжении 50 лет и как криптографам всё-таки удалось его раскусить.
Ветреный или ветренный, ожёг и ожог, приставки пре- и при-, стеклянный, оловянный, деревянный... В жизнь каждого школьника рано или поздно приходит экзамен по русскому языку, а нудные примеры из учебников вызывают скуку. А если взять произведения, которые читают сами дети, и разметить в них сложные места русской орфографии? Именно такой инструмент готовят в Национальном корпусе русского языка. Эллина Куцевал, создательница алгоритма, рассказывает, как создавалась разметка.
Прошлое, какое бы оно ни было, всегда удостоено особого отношения к себе. События можно забыть или, наоборот, вернуть из глубин памяти. Исторический опыт влияет на человека: меняет его и выстраивает его представления о действительности. У современного человека появились новые инструменты сохранения памяти. Исследуем, как цифровые технологии помогают сохранять и переживать опыт прошлого.
Петроглифы — небольшие древние наскальные изображения — часто сложно датировать и атрибутировать. При этом для некоторых рисунков может быть очень много однотипных образцов — например, таковы петроглифы с изображениями оленей в долине чукотской реки Пегтымель. Выпускница магистратуры Digital Humanities НИУ ВШЭ рассказывает, как можно классифицировать петроглифы по типам при помощи нейросети.
Эмоции и их выражение в тексте — важная часть человеческой коммуникации. Но как зафиксировать эти тонкие и динамичные изменения, особенно в больших текстах? Как формально визуализировать эмоциональное содержание текста, превратив его в график? Ответы на эти и многие другие вопросы можно получить, построив кривые эмоциональной тональности выбранных текстов. О том, как это сделать, вам расскажет этот гайд!
В каком произведении школьной программы умирают лягушки, а в каком — скачут блохи? Пройдите наш тест на основе Национального корпуса русского языка и попробуйте отличить Гоголя от Салтыкова-Щедрина, а Лермонтова от Блока.
Развитие интернета и цифровых технологий открыло новое поле исследований для антропологов. Учёные осознали, что в онлайн-среде формируются уникальные сообщества, культуры и практики, которые можно и нужно изучать. Публикуем подборку наших материалов о цифровой антропологии. Из неё вы узнаете, какие методы можно применить к исследованию интернет-пространства, как за последние 40 лет изменились интернет-интерфейсы и зачем собирать слухи в соцсетях?
Знакомясь с новой книгой, вы наверняка замечали, что с чем-то подобным вам уже приходилось сталкиваться. Герой покидает дом в поисках чего-то ценного. Герой находит большую любовь в конце истории или, наоборот, трагически погибает. Таинственный незнакомец приносит вести, становящиеся фундаментом для завязки сюжета. А как выглядит «усреднённая» история? Существуют ли слова, которые наиболее характерны для завязки или финала книги? Попробуем разобраться, используя методы цифровой гуманитаристики!
Кто из русских писателей больше ругался? Какое имя теперь раньше было обычным, а теперь стало обидным? Можно ли обнаружить, в какой момент нейтральное слово становится бранным? Пройдите наш тест и узнайте, как можно изучать ругательства с помощью Национального корпуса русского языка.
Иногда сложно понять, какой язык нам ближе и нужнее. Хочется и аниме, и корейские дорамы смотреть в оригинале без субтитров, а то и отправиться в Китай или подняться на верхний этаж небоскрёба в ОАЭ. Если вы вдруг решили изучать восточную культуру и начать с языка, но никак не можете определиться, то этот тест для вас.
Сотни тысяч школьников ищут способ упростить себе подготовку к экзамену по литературе. Кто-то ищет краткие пересказы произведений, а кто-то просит помощи у нейросети, не догадываясь, что та может оказать им медвежью услугу. Насколько точен и адекватен анализ от ИИ? Чтобы узнать это, мы провели эксперимент и протестировали три самых популярных нейросети.
«Системный Блокъ» рассказывает о первой в Японии VR-школе. Ученики этой школы посещают занятия онлайн в Метавселенной, выбрав 3D-аватар в стиле аниме. Несмотря на необычный формат, проект одобрен Минобразования Японии, учебный план соответствует стандартам, а выпускные документы имеют официальный статус.
Даже заядлому поклоннику ночного сёрфинга по страницам Википедии может быть непросто собирать и систематизировать большой объём информации из свободной энциклопедии. Для работы с такими данными были созданы Викиданные (Wikidata) — большая и удобная база данных на основе Википедии. Разберёмся, как с ней работать и когда она может быть полезна.
Современным археологам недостаточно лопаты, мастерка и кисточки для полевой работы. Чтобы обнаружить скрытые в густых лесах под слоем почвы города и дороги, учёные сканируют пространство с помощью лазера. Рассказываем, как работает LiDAR — технология, которая сегодня есть в обычном айфоне, и как LiDAR помогает делать археологические открытия в джунглях Амазонки, на Тихоокеанских островах и прямо посреди Европы.