Google представила экспериментальную модель Gemini 2.5 Pro
Модель занимает первое место на платформе LMArena и доступна через API в бесплатной и платной версиях.
Модель занимает первое место на платформе LMArena и доступна через API в бесплатной и платной версиях.
Средневековые студенты часто перемещались из одного университета в другой, чтобы получить всестороннее образование и ученую степень. Все это, наряду с их происхождением, статусом и другими характеристиками, тщательно документировалось. В результате сегодня ученые могут создавать базы данных выпускников и преподавателей прошлого. Об одной из них — Repertorium Academicum Germanicum — рассказываем в нашем новом материале.
OpenAI выступила за ужесточение доступа к чипам, экспортируемым из США, Google и Mistral обновили свои открытые модели — что произошло в мире ИИ за последнее время.
Aozora Bunko — это цифровая библиотека, где собраны произведения японской классической литературы, которые находятся в открытом доступе. «Системный Блокъ» рассказывает, как устроена библиотека, какие правовые нормы приняты в Японии и о том, как автоматически собрать свой корпус из материалов «Аодзора-бунко».
Могут ли Объединенные Арабские Эмираты конкурировать с мировыми державами за первенство в сфере искусственного интеллекта? Рассказываем, что ОАЭ делают (а также НЕ делают) для того, чтобы к 2031 году стать лидером в области ИИ, и как страна реагирует на риски, связанные с быстрым развитием генеративного ИИ.
Компактная модель улучшила результаты в задачах на понимание языка и логическое рассуждение.
Компания предлагает ограничить использование чипов для китайских ИИ-моделей в рамках инициативы AI Action Plan.
Большой египетский музей (The Grand Egyptian Museum) в Гизе — огромный проект-долгострой с самой большой коллекцией египетских древностей. Рассказываем, как цифровые инновации вписались в проектирование и строительство музея.
Могут ли новые технологии помочь прочесть нечитаемую древнюю надпись на камне? Как трехмерные модели старинных надгробий, крестов, камней и эпиграфических табличек позволяют не только сохранить эти памятники в цифровой форме, но и добыть новое знание о прошлом? Знакомимся с проектом «Свод русских надписей», проблемами работы эпиграфистов и тем, как решать насущные проблемы в этом направлении.
Благодарим за помощь в написании статьи сотрудника проекта «Свод русских надписей» Анну Зиганшину.
Модель поддерживает обработку текста и изображений и опережает конкурентов на платформе LMArena.
Можно ли применять алгоритмы определения авторства к текстам древних исландских саг? Какие гипотезы о создателях этих текстов помогает подтвердить метод дельты, который ранее применяли для поиск поддельных стихов XIX века и раскрытия псевдонима Джоан Роулинг? Рассказываем про исследование исландского лингвиста Хёйка Торгейрссона.
Более человечная GPT-4.5, новая флагманская модель от Anthropic и OCR от Mistral — что произошло в мире ИИ за последнее время.
В честь Международного женского дня мы собрали для вас подборку полезных и познавательных публикаций, в которых мы напоминаем о сферах, где все еще сохраняется неравенство, изучаем, чем занимаются DH-исследовательницы, и ищем различия между мужской и женской речью.
Для того, чтобы определить степень родства двух языков, часто сравнивают их лексический состав. Рассказываем о списке Сводеша — инструменте, созданном американским лингвистом Моррисом Сводешем для сравнения языков.
Кто из древних людей пережил последний ледниковый период, а кому холода принесли смерть и исчезновение навсегда? Как останки зубов помогли открыть «бутылочное горлышко», через которое прошло всё человечество и едва не вымерло? Рассказываем, как палеогенетики изучали ранние миграции людей в Европе и выясняли, какие популяции Homo Sapiens исчезли навсегда
Рутинная работа и борьба за ресурсы изматывают благотворительные организации, но технологии могут стать их спасением. Искусственный интеллект уже помогает находить доноров, писать гранты и прогнозировать социальные изменения. Рассказываем, как технологии помогают решать глобальные задачи благотворительности и какие риски они несут в мир добрых дел.
Вы закончили писать рабочий отчет, перевели его, проверили онлайн на плагиат и отправили в зарубежный филиал. И… теперь отчет может быть доступен не только иностранным коллегам, но и любому пользователю, умеющему гуглить. Звучит как паранойя? Вовсе нет. Утечка данных через онлайн-сервисы — реальная угроза. В чужих руках оказывается и безобидная переписка, и конфиденциальная информация. Рассказываем, как личные данные попадают в открытый доступ через редакторы текста, переводчики, антиплагиат-сервисы и умные колонки.
Как учить русскому языку иностранцев? Как перестать путать звуки [ы] и [и], если русский для вас не родной? Как технологии помогают понять Толстого и Достоевского в оригинале? В статье собрали основные цифровые инструменты для изучения русского языка как иностранного.
Как на базе мемуаров можно вычислить характер исторических личностей? О чем писали в газете заключенных на Соловках? Как с помощью анекдотов разобраться в перипетиях отношений между советской властью и гражданами? «Системный Блокъ» рассказывает, что такое контент-анализ и как в историческую науку внедряются цифровые методы.
Лаборатория Илона Маска обновила модель Grok, лучшая нейросеть для генерации видео от Google стала доступна, бывшая топ-сотрудница OpenAI рассказала про свой новый стартап — что произошло в мире ИИ за последнее время.
Болезни Альцгеймера подвержены миллионы людей по всему миру, и с каждым годом число заболевших продолжает расти. Однако традиционные методы диагностики этого заболевания имеют свои ограничения, что делает их недостаточно эффективными. Рассказываем, как искусственный интеллект и анализ речи могут предложить новый способ решения этой сложной проблемы.
Где искать в интернете японские словари? Какие из них вызывают доверие у востоковедов-японистов? «Системный Блокъ» рассказывает об онлайн-словарях японского языка и их особенностях. Три системы письменности, развитая лексическая многозначность, непростая история японского языка и культуры — все это определяет, как выглядят словари в цифровую эпоху
В 2024 году А. С. Пушкину исполнилось 225 лет, а его фамилия стала словом года. Возможно ли собрать двухсотлетнее наследие Пушкина и пушкинистики в единую систему? Рассказываем о проекте, который сэкономит фанатам поэта 58 лет чтения.
Иногда сложно понять, что же хотел сказать автор своим сочинением, а пересказать текст кажется нереальной задачей — из-за необычной структуры повествования или при использовании разных рассказчиков. Как справляются с подобными задачами LLM? Ученые Колумбийского университета спросили у самих писателей.
Просопография занимается тем, что собирает данные о жизни и связях людей прошлого. Оцифрованные просопографические базы могут много рассказать о круге общения или перемещениях целых социальных групп или классов. На примере проекта Romans One by One рассказываем, как историки собирают такие базы, анализируют их и какие драматические сюжеты там могут скрываться.
Можно ли повысить качество ответов языковых моделей с помощью более продуманных промтов? Как сделать так, чтобы ответы LLM следовали определенному формату? Как заставить модели объяснять свои ответы? Рассказываем о методах формулирования эффективных запросов к LLM в нашем материале.
Что происходит после выхода нашумевших моделей от DeepSeek, как работает новый автономный исследователь от OpenAI, какие обновления получили LLM семейства Gemini от Google — рассказываем, что произошло в мире ИИ за последнее время.
Борис Ярхо — один из самых недооцененных филологов знаменитого поколения «русских формалистов» 1910-х — 1920-х. В отличие от куда более известных Проппа, Шкловского, Тынянова и Эйхенбаума, Ярхо оставался неизвестен на Западе и малоизвестен в России вплоть до начала XXI века, когда его пионерские работы по количественному литературоведению стали актуальны с приходом цифровых методов. Чтобы немного восстановить справедливость, «Системный Блокъ» подготовил «посмертное интервью» с Ярхо на основе его главной книги.
Что такое «гипотеза Поллианны»? Как она проявляется в зарубежной детской и юношеской литературе? Какие существуют методы, чтобы ее подтвердить или опровергнуть? В материале рассказываем о том, как исследователи провели сентимент-анализ корпусов англоязычной и немецкоязычной детской литературы и какие результаты они получили.
Адаптированы ли современные цифровые инструменты для работы с системами письменности, которые пишут справа налево, как арабская вязь или еврейское письмо? Как «сломать» Word или VS Code, смешав текст на латинице и арабице? И почему крупные разработчики ПО не обращают внимание на эту проблему?
Язык — естественная система. Он распространяется, развивается и даже мутирует, подчиняясь законам естественных наук. Можно ли с его помощью реконструировать эволюцию человечества? Рассказываем, как генеалогические деревья объединили биологов и лингвистов и какой вклад в языкознание внес Чарльз Дарвин.
OpenAI и SoftBank должны создать инфраструктуру для ИИ стоимостью 500 млрд долларов по предложению Дональда Трампа, сразу несколько компаний выпустили ИИ-системы для автоматического выполнения задач на компьютере, китайская DeepSeek выложила конкурента модели o1 от OpenAI в открытый доступ — что произошло в мире ИИ за последнее время.
После 55 лет жизнь человека словно замедляется и становится менее интересной… но точно не для тех, кто даже в таком возрасте не боится сесть за парту и шагнуть навстречу новым знаниям и технологиям. В нашем материале читайте о том, что сфера цифрового образования сейчас предлагает самым старшим.
Западная Африка — место жительства более 450 млн человек, говорящих на сотнях разных языков. Это регион огромного культурного, этнического и языкового разнообразия. Рассказываем, как некоторые из западноафриканских языков обрели свою письменность, как она сохраняется и распространяется в цифровом мире и почему это помогает людям заявить о своей идентичности.
Современные технологии хорошо помогают в криптоанализе: программы, перебирающие тысячу вариантов за несколько секунд, в разы превосходят возможности человека. Однако слепого применения софта недостаточно, особенно если речь идёт о самом приоритетном неразгаданном шифре в списке ФБР — криптограмме серийного убийцы Зодиака. В новом материале разбираемся, какие вообще бывают шифры, почему шифр Зодиака не могли дешифровать на протяжении 50 лет и как криптографам всё-таки удалось его раскусить.
Со словами I don’t need luck. I’m about to slay this thing дрэг-королева Miss Vanjie отправляется покорять жюри реалити-шоу RuPaul’s Drag Race. «Это на 33% токсичное высказывание. Не желаете заблокировать?» — говорит ИИ. Разбираемся, почему классификаторы токсичности иногда и сами не прочь «потоксичить».
Современное образование требует современных подходов, которые помогут ученикам и студентам не просто выучить, но понять материал. Одно из решений — серьёзные игры, симбиоз обучения и игры. Что это такое? Есть ли исследования, подтверждающие пользу серьёзных игр? В чём отличия от обычных компьютерных игр и симуляторов? Спойлер: серьёзные игры действительно ведут к серьёзным успехам.
Как реконструировать исторический облик города, который постоянно меняется? Гуляем по Белому городу Москвы XVI–XVIII веков вместе с проектом исторического и механико-математического факультетов МГУ.
В какой момент чат-боты стали повсеместными онлайн-собеседниками? И как у них получается воспроизводить естественный разговор? Краткий обзор того, как говорящие машины постепенно учились и становились более человечными.
Что важнее для создания целостного образа персонажа в литературе: его слова или его действия? Как выбор глаголов отражает индивидуальность героя? Рассказываем о недавнем исследовании корпуса английской прозы, которое даёт ответы на эти (и не только) вопросы.
Как международная популярность корейских поп-групп повлияла на тексты их песен? Как часто исполнители используют английские слова? Как отличаются песни о любви у мужских и женских групп? Этими вопросами задались студенты-востоковеды из Высшей школы экономики. Публикуем результаты их исследования.
Ветреный или ветренный, ожёг и ожог, приставки пре- и при-, стеклянный, оловянный, деревянный... В жизнь каждого школьника рано или поздно приходит экзамен по русскому языку, а нудные примеры из учебников вызывают скуку. А если взять произведения, которые читают сами дети, и разметить в них сложные места русской орфографии? Именно такой инструмент готовят в Национальном корпусе русского языка. Эллина Куцевал, создательница алгоритма, рассказывает, как создавалась разметка.
Мы попросили нейросети сгенерировать новогодние обращения Владимира Путина, стилизуя их под разные года и события. Пройдите тест и проверьте, сможете ли вы отличить настоящее обращение президента России от созданного нейросетью.
В машинном обучении не обойтись без данных. Точнее — без датасетов. Разбираемся, какие датасеты нужны моделям для «учёбы» и где их можно найти.
В 2024 году «Системный Блокъ» опубликовал 180 материалов. В этом посте мы рассказываем о наших итогах года: о запуске новых рубрик, лучших публикациях, создании DH-портала и других новостях. Несмотря ни на что, наша команда собирала для вас всё самое интересное из сферы цифровых гуманитарных исследований. Это наш способ сделать мир — если не лучше, то хотя бы понятнее.
Новая модель o3 от OpenAI вырывается вперёд, китайская DeepSeek создала конкурента для лучших LLM, Google выпустила свою первую рассуждающую модель — что произошло в мире ИИ за последнее время.
Прошлое, какое бы оно ни было, всегда удостоено особого отношения к себе. События можно забыть или, наоборот, вернуть из глубин памяти. Исторический опыт влияет на человека: меняет его и выстраивает его представления о действительности. У современного человека появились новые инструменты сохранения памяти. Исследуем, как цифровые технологии помогают сохранять и переживать опыт прошлого.
Петроглифы — небольшие древние наскальные изображения — часто сложно датировать и атрибутировать. При этом для некоторых рисунков может быть очень много однотипных образцов — например, таковы петроглифы с изображениями оленей в долине чукотской реки Пегтымель. Выпускница магистратуры Digital Humanities НИУ ВШЭ рассказывает, как можно классифицировать петроглифы по типам при помощи нейросети.
Официально диагноза «кризис среднего возраста» не существует. Но что происходит в этот период? Узнаем, как связаны возраст и несчастье и почему кривая несчастья похожа на холм.
Хотите смоделировать процесс эволюции или работу человеческого глаза? Не можете разобраться в баллистике? Тогда воспользуйтесь интерактивным симулятором. Мы собрали самые интересные и рассказали, как они делают науку понятней и ближе.
Эмоции и их выражение в тексте — важная часть человеческой коммуникации. Но как зафиксировать эти тонкие и динамичные изменения, особенно в больших текстах? Как формально визуализировать эмоциональное содержание текста, превратив его в график? Ответы на эти и многие другие вопросы можно получить, построив кривые эмоциональной тональности выбранных текстов. О том, как это сделать, вам расскажет этот гайд!
OpenAI составляет «адвент-календарь» из новых релизов, Google обновил свою LLM, а xAI Илона Маска выпустила нейросеть для генерации изображений — что произошло в мире ИИ за последнее время.
Чрезвычайные события, такие как пандемия или военные действия, порождают ограничительные законы. При этом многие законодательные изменения, изначально принимавшиеся как «чрезвычайные», оказываются долгосрочными и становятся нормой. Например, «ковидные ограничения» уже пять лет выступают формальной причиной запрета акций протеста. Рассказываем, как политологи исследуют переход временных ограничительных мер в постоянные, опираясь на статистику законотворчества.
В мире почти 7000 языков, и они очень разные. Лингвистическая типология — раздел науки о языке, описывающий эти различия. Часто, хотя и не всегда, сходство языков обусловлено географически — тогда языки можно даже объединить в языковые ареалы. Но выделять их вручную — задача трудоёмкая и полная неоднозначностей. Тут на помощь исследователям приходят вычислительные методы.
Как онлайн-кинотеатры определяют, какой фильм вам порекомендовать, а маркетплейсы — какой похожий товар предложить? Как интернет-поисковики находят темы, которые отвечают теме запроса? И, наконец, может ли компьютер отличить мем с пёсиком от мема с котиком? Разбираем, что такое косинусная близость и как с помощью неё машина сравнивает объекты.
Художники, получившие доступ к модели для генерации видео Sora от OpenAI, слили доступ в сеть, китайские лаборатории выпустили модели-аналоги OpenAI o1, Anthropic представила открытый протокол общения между LLM и приложениями — что произошло в мире ИИ за последнее время.
Век цифровых технологий и новых образовательных стандартов не смог стереть интерес к старым, в том числе советским и дореволюционным, учебникам. Почему люди продолжают искать эти книги? Рассказываем в нашем исследовании архивов учебной литературы. Где их можно найти, кто их оцифровывает и что привлекает читателей?