Наверняка вы не раз сталкивались с тестами: сдавали экзамены в школе или проходили собеседование. Но всегда ли им можно доверять? Как отличить хороший тест от плохого? И что нужно знать, чтобы составить грамотный тест самостоятельно? Ответы дает психометрика — наука о том, как создавать обоснованные измерительные инструменты.
Иллюстрация: Надежда Луценко
Недавно мы рассказывали про доказательное образование как научный способ проверки эффективности образовательных методик. Сегодня разберемся в том, как психометрика помогает измерять компетенции учеников на примере школьных тестов по математике и разберем основные рекомендации по составлению заданий.
Психометрика — это направление на стыке социальных наук и математики, целью которого является измерение как наблюдаемых переменных (поведения), так и скрытых от глаз наблюдателя конструктов (знаний, навыков, мотивации, ценностей и др.). Психометрика охватывает весь процесс создания теста: от формулирования целей измерения до рекомендаций по составлению заданий и подсчету баллов.
Основоположниками современной психометрики называют французских психологов Альфреда Бине и Теодора Симона, которые в начале XX века разработали первый в мире тест для оценки интеллекта. Тест сделали в связи с введением во Франции обязательного всеобщего образования. Стояла задача отделить детей, готовых к обучению в общеобразовательной школе, от детей с когнитивными особенностями, которым больше подошли бы специализированные учебные заведения.
Тесты получили бурное распространение в США. Их стали использовать шире: от оценки школьной успеваемости до профессионального отбора на должности и набора в армию.
Сегодня тесты и психометрика применяются в самых разных областях. Помимо описанных выше сфер жизни, тесты используются в:
Психометрические тесты помогают делать выводы и принимать решения, в том числе жизненно важные, в самых разных сферах (например, это может быть поступление в вуз или принятие на работу). Чем значимее выводы по результатам теста, тем дороже и сложнее его создание, которое в некоторых случаях может доходить до миллионов долларов. Такие сложные и дорогие тесты используются в том числе в международных исследованиях образования, например, PISA [1], TIMSS и PIRLS [2]. В рамках этих проектов тесты оценивают ряд компетенций у сотен тысяч школьников из разных стран. Цель такого тестирования — мониторинг как предметных, так и непредметных (универсальных) навыков.
Некоторые правила, которых придерживаются разработчики тестов в крупных проектах, будут полезны и при разработке небольших тестов, например, по математике для начальных классов. Но сначала коротко обсудим, в чем сложность создания хороших тестов и зачем нужно придерживаться рекомендаций по составлению заданий.
Разработанные в рамках психометрики тесты минимизируют риски ошибочных выводов. Иногда ученик выбирает неверный вариант ответа не из-за незнания темы, а из-за ошибки, содержащейся в формулировке вопроса или задания. В результате ученик лишается возможности показать свои истинные знания из-за внешних факторов, например, субъективности или неоднозначности формулировки вопроса (подробнее об этих ошибках — в следующем разделе). Психометрика же помогает избежать таких ситуаций.
Некоторые ошибочно полагают, что эксперт в какой-либо области автоматически может составить грамотное задание по этой теме. Однако основная компетенция, например, учителя — объяснить материал так, чтобы ученики его усвоили и смогли применять эти знания в будущем. Составление же тестовых заданий — это отдельная компетенция и искусство. В крупных проектах специалисты в предметной области отвечают за содержание теста. Психометрик берет интервью у эксперта и на основе полученных материалов составляет задания, которые затем согласовываются со специалистом.
Многие уверены, что тесты не способны проверить знания учеников, а верный ответ можно угадать. Однако правильно составленные задания минимизируют возможность угадывания.
В рамках психометрики исследователи разрабатывают продвинутые способы подсчета баллов, которые помогают учесть возможность угадывания верного ответа. Главным же достоинством тестов (в том числе онлайн-формата) является то, что они позволяют быстро оценить компетенции огромного числа учеников и мгновенно показать результаты как самому ученику, так и учителю. А еще психометрики приближаются к тому, чтобы анализировать «клики» учеников при выполнении онлайн-заданий (чаты, электронная почта, поисковик и др.), что позволяет изучать поведение учеников в процессе выполнения заданий и корректировать учебный процесс. Например, частые изменения ответов, возвраты к предыдущим заданиям могут говорить о неуверенности ученика в своих знаниях или попытках угадать верный ответ.
Теперь же вернемся к тесту по математике и на простых примерах разберем основные рекомендации и частые ошибки.
Рекомендации составлены прежде всего для преподавателей и встраиваются в образовательный процесс. Однако они универсальны и подходят для любой сферы, где применяются тесты [3].
Чтобы составить хороший тест, начните с определения: что он должен измерить и насколько широко охватить измеряемую компетенцию или характеристику.
Затем тщательно поработайте над формулировками вопросов и заданий.
Длина прямоугольника 8 дм, а ширина на 30 см меньше. Найди площадь этого прямоугольника. Ответ запиши в метрах.
В этом задании проверяется сразу две компетенции: навык вычисления площади и перевода единиц измерения из одной в другую. Правильнее будет разделить их на два задания.
Представь, что на перемене ты помогаешь директору вашей школы составлять онлайн-заказ на новые стулья с целью обеспечения учебного заведения необходимым для образовательного процесса инвентарем. В каждом из 24 учебных классов нужно поставить по 18 новых стульев. Вычисли, какое общее количество стульев необходимо заказать.
Первое предложение перегружено деталями, которые не относятся к сути задания. Если вы составляете тест для учеников пятого класса, то формулировки должны быть адаптированы для этого возраста, уровня мышления и речи. Более понятной будет следующая формулировка:
Представь, что ты составляешь заказ на новые стулья в свою школу. В каждом из 24 учебных классов нужно по 18 новых стульев. Вычисли, какое общее количество стульев необходимо заказать.
Безусловно, формулировку задания можно сократить еще больше. Однако если для оценки компетенций в заданиях нужен сторителлинг, то не стоит совсем от него отказываться. Важно искать баланс между краткостью и привлекательной подачей заданий.
Задание. Маша купила 3 тетради по 25 рублей каждую и 2 ручки. За всю покупку она заплатила 120 рублей. Какое из следующих действий является самым логичным первым шагом для нахождения стоимости одной ручки?
Варианты ответа:
А) 120 – 25;
Б) 3 × 25;
В) 25 + 25;
Г) 3 + 2.
Верный ответ: Б.
Понятие «самый логичный» субъективно. Ученик может рассуждать иначе, но прийти к верному ответу. Например, ученик может сначала посчитать, сколько всего предметов купила Маша (вариант Г), а может сначала вычесть из общей суммы покупки стоимость одной тетради (вариант А), чтобы затем вычесть стоимость второй и т. д. Эти варианты ответа не являются ошибочными, но, выбрав их, ученик не получит баллы из-за субъективности составителя задания.
Одна из самых сложных задач при составлении теста — разработка дистракторов (неверных вариантов ответа). Сформулировать верный ответ обычно легко, а вот подобрать подходящие дистракторы бывает довольно сложно. Однако это необходимо для составления хорошего задания.
Задание. У Васи было 5 яблок, а Маша дала ему еще 3. Сколько всего яблок стало у Васи?
Варианты ответа:
А) 8 яблок;
Б) 7 яблок (Вася съел одно, пока считал);
В) Целый мешок яблок!
Г) 6 яблок.
Ученику будет очень легко угадать верный вариант ответа А, поскольку дистракторы Б и В имеют явно шуточный характер. Выбрать дистрактор Г будет также достаточно сложно, поскольку к такому ответу можно прийти только в результате ошибки в сложении. Более логичным мог бы стать дистрактор «2 яблока», поскольку ученик мог перепутать сложение с вычитанием.
Лучшие дистракторы основаны на распространенных ошибках, которые могут допустить тестируемые. Для этого вы можете представить себя на месте ученика и предположить, где он мог ошибиться, находясь на своем уровне знаний.
Отметь вариант ответа, в котором x = 15:
А) x – 7 = 8;
Б) x : 3 = 5;
В) 45 : x = 3;
Г) x + 15 = 30;
Д) Все перечисленные.
Поскольку в задании нужно выбрать один вариант ответа, то уже после решения двух первых уравнений ученик догадается, что остальные два так же будут верными, поэтому сразу выберет последний вариант ответа. Кроме того, подобные формулировки повышают тестовую тревожность учеников и заставляют дополнительно сомневаться в своем ответе. Лучше всего работают задания с соотношением верных ответов к общему числу вариантов 1/4, 2/5 и 3/6.
Установи соответствие между фигурой и ее свойством.
| Название фигуры | Свойство фигуры |
| 1. Квадрат | А) Имеет только один прямой угол |
| 2. Прямоугольный треугольник | Б) Имеет только прямые углы |
| 3. Равнобедренный треугольник | В) Имеет только две равные стороны |
Помимо подсказки в самих названиях фигур, ученик, верно соотнеся два свойства из трех, автоматически находит и последнее соответствие. Поэтому рекомендуется добавить еще одну фигуру или свойство, чтобы ученик приложил усилие по поиску последнего соответствия и не получал дополнительный балл просто так.
Будьте предельно осторожны и внимательны, когда используете тесты из интернета для оценки профессиональных или личных качеств человека. Например, популярный тест интеллекта Векслера последний раз адаптировали на русский язык еще в 90-х годах. Эта версия уже не подходит для оценки интеллекта современных детей и подростков. Новые версии, распространенные в интернете, — это либо устаревшие копии оригинального теста, либо некачественные фрагментарные переводы без необходимой доказательной базы.
Запомните: каждый этап разработки теста должен быть подчинен его цели. Это отличает психометрические тесты от развлекательных тестов «Какой ты котик?» или «С какой начинкой ты пирожок?», где связь между ответами и результатами часто произвольна.
Примеры использования хороших тестов на русском языке для более серьезных целей из разных сфер вы сможете найти на сайтах Центра психометрики НИУ ВШЭ, платформы «Россия — страна возможностей», Лаборатории «Гуманитарные технологии», компаний «Экопси», «Форматта» и «Профилум».
Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время
Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст
Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно, а через реальные задачи. Объясняем, какие разделы действительно нужны джуну,…