Регулярный дайджест ИИ
Мы сделали регулярным дайджест новостей из мира нейросетей и искусственного интеллекта. С марта вышло 18 выпусков, в которых мы рассказываем о новых больших языковых моделях, продуктах и сервисах с использованием ИИ.
Дата-отдел выпустил новые исследования
Наш дата-отдел и 2024 году продолжал свою работу. Мы выпустили большой проект «Классное чтение», в котором исследовали школьные программы по литературе с 1919 по 2022 годы. Вместе с благотворительной организацией «Ночлежка», Благотворительной больницей и платформой «Если быть точным» мы проанализировали, что влияет на причины смертности бездомных женщин и мужчин. А ещё мы изучали рынок young-adult-литературы, качество воды в московских родниках и использование реагента «Бионорд» в городах России.
Точка входа в DH
На нашем сайте появился раздел «DH: точка входа». На одной странице мы собрали всё, что нужно знать начинающему цифровому гуманитарию: методы DH, основные понятия, список экспертов, полезное чтение и образовательные программы.
Глоссарий
Наша постоянная рубрика «Глоссарий» продолжала объяснять непонятные слова. Мы разобрались, что такое сетевой анализ, косинусная близость и лемматизация, а также расшифровали аббревиатуры RAG и KNN.
Интервью c исследователями
В 2024 году мы опубликовали девять интервью. Мы поговорили:
- с основателем центра изучения эго-документов «Прожито» Михаилом Мельниченко о перезапуске проекта;
- директором Центра языка и мозга НИУ ВШЭ Ольгой Драгой о соединении нейролингвистических экспериментов с машинным обучением;
- с антропологом Александрой Архиповой о пользе цифровых баз данных для изучения фольклора и слухов;
- с Татьяной Шавриной, руководительницей исследовательской команды в проекте LLAMA, о перспективах больших языковых моделей;
- с замдиректора Института языкознания РАН по науке Игорем Исаевым о диалектологии и проблемах различения языков;
- с Игорем Мельчуком, одним из основоположников российской математической лингвистики и Московской семантической школы, о начале машинного перевода в СССР, нетрадиционной лингвистике и о теории «Смысл ↔ Текст»;
- с историком Андреем Коротаевым о количественных исследованиях в истории, клиодинамике и прогнозировании социальных взрывов;
- с социологом, исследователь истории интернета Леонидом Юлдашевым о прошлом глобальной сети и вариантах ее развития;
- с нашим главным редактором Даниилом Скоринкиным о «Системном Блоке», исследованиях, преподавании и популяризации науки.
Ищем связи между биологами и филологами
В 2024 году мы запустили рубрику «Биоинформатика», в которой рассказываем, как исследование данных используется в биологических науках. Мы написали о том, как по мельчайшим следам пыльцы находят преступников, сравнили перенос генов с NLP и выяснили, зачем секвенируют геномы здоровых людей.
Тесты
Мы продолжаем делать для вас веселые и познавательные тесты. В этом году мы угадывали птиц по фотографиям, изучали ругательства в НКРЯ и разбирались в значениях эмодзи.
Летняя школа
В этом году мы вышли в офлайн, сделав свою мастерскую по дата-журналистике на Летней школе. Читать лекции и вести мастер-классы мы позвали ведущих экспертов по данным и визуализации: Надю Андрианову и Алексея Смагина из «Яндекс.Исследований», Анастасию Кокоурову и Витовта Копытока из «Если быть точным», Сергея Антонова из Т-Ж, Алексея Новичкова из Вышки, Ксению Орлову из «Инфокультуры», Татьяну Мелентьеву и Ольгу Добровидову из ИТМО, Юлию Криган из «Точки», Андрея Дорожного из «Дата-студии Андрея Дорожного» и других прекрасных людей. Участники мастерской изучали инструменты работы с данными, учились делать красивые и понятные визуализации, а в конце представили собственные проекты.
Самые популярные материалы года
И напоследок — самые популярные материалы на нашем сайте, опубликованные в этом году:
Мы разные, но равные: как с помощью цифровых инструментов сделать образование более инклюзивным
Учебники советской школы: возрождение в цифре
Горький урок ABBYY: как лингвисты проиграли последнюю битву за NLP
Больше, чем энциклопедия: 4 истории о том, что такое Википедия
Как автоматически расшифровать аудио: пошаговая инструкция для Whisper
Религии Африки через данные: во что и как верит самый религиозный континент Земли
Из семинарии в Совет экспертов: кто и как попадает в иранскую коллегию выборщиков
Кто какую часть произведения написал? Выясняем с помощью Stylo
KuroNet: как работает модель для распознавания старых японских иероглифов
До встречи в новом году!