Педагогические тесты: надежный способ оценки и повышения уровня знаний
Разработка общих принципов методологии оценивания до сих пор остается проблемой потому, что исключительно трудно осуществить последовательное сопоставление целей образования с достигаемыми результатами обучения. Цели выражены, как правило, в весьма общих и потому абстрактных категориях: «подготовить квалифицированного специалиста», «сформировать научное мировоззрение», «вооружить научной методологией» и т. п. Измерение же результатов обучения проводится на совсем ином уровне — более узком, более конкретном, более осязаемом. Получается, что конечные цели образования и результаты обучения, проверяемые в конкретной оценочной ситуации, формулируются на разных языках. Цели — на языке интегральных, общих категорий, а результаты — на языке конкретных знаний, умений, навыков, то есть языке действий. Для выработки эффективных и достаточно строгих критериев оценивания необходимо стараться излагать цели и результаты обучения на одном и том же языке, в одних и тех же понятиях и терминах, что не всегда представляется возможным.
Сложность оценивания усугубляется тремя глобальными тенденциями, свойственными мировой педагогической практике. Во-первых, в индивидуальном плане происходит переход от так называемой «классической культуры» к «мозаичной», описанный французским социологом А. Молем. Классическая система образования, сложившаяся в XVII-XVIII столетиях, давала относительно стройную, иерархическую систему знаний о мире, отличающуюся системным характером. Учащийся усваивал их по принципу «ступеней», отталкиваясь от ядра фундаментальных понятий, он овладевал другими понятиями, спускаясь к ним с помощью системы логических связей. Ныне характер приобретения знаний существенно изменился. Современный человек значительную, если не большую часть знаний получает не в системе рационального образования. «Оснащение» его ума происходит сейчас не столько через систему образования, сколько через средства массовой коммуникации. Вот такую культуру и именуют «мозаичной».
Во-вторых, в сфере образования отчетливо проявляется тенденция технократизма, связанная с резко возросшей технической мощью и энергетическим оснащением человечества. Произошло перемещение центра тяжести в сторону функциональных характеристик личности, в сторону профессионализма, дефицит которого уже невозможно компенсировать простым усердием. А в образовании это привело к нарушению гармонии между специальными знаниями и духовной культурой.
В-третьих, качественно изменяется само положение педагога в системе образования, что вызывается прежде всего интенсивной информатизацией и компьютеризацией. Меняется его роль. Если раньше он в основном выполнял функцию накопителя и распространителя научной информации, то теперь его центральная задача — управлять познавательной активностью учащихся и контролировать ее результаты.
Переходим к тестовым процедурам
Осознание всех этих тенденций подтолкнуло нас к поиску альтернативных форм обучения и оценки знаний, к отходу от привычных стандартов, к свободному педагогическому эксперименту. И вот уже наряду с традиционными методиками оценивания все шире используется тестовый контроль знаний. Происходит тщательная эмпирическая проверка и шлифовка стандартных предметных тестов, и постепенно меняется психологическая привычка учителей и учащихся к самой процедуре тестирования.
Постепенно учитель начинает осознавать явный приоритет письменной формы оценки знаний перед устной. Повышается объективность и надежность оценивания, уменьшается стресс у учащихся, снижается субъективизм учителя, связанный с симпатиями и антипатиями, возможностью негативной отметкой наказать ученика за различные проступки. Суммирование результатов текущего (рубежного) и итогового контроля стимулирует ученика к систематической работе в течение года, а использование индивидуального рейтинга как основного показателя успехов в обучении порождает состязательность в учебе, положительно влияет на мотивацию учащихся, сводит до минимума случайность в оценивании и т. п.
Вместе с тем, следует сказать, что прежде чем применять тестовые процедуры, их нужно хорошенько изучить и адаптировать к существующими реалиям. Не следует идти путем механического копирования, теряя собственные практические наработки. Серьезные преобразования целесообразно осуществлять лишь после тщательной методической и психологической подготовки к ним преподавателей и учащихся.
Инструмент, дающий качественную и надежную информацию
Педагогический тест — это инструментальное средство контроля знаний, возможность с заданной точностью определить надежность проводимых измерений. Применение тестовой методики позволяет осуществлять количественный анализ успешности обучения по различным учебным классам, что невозможно в рамках традиционной системы. Профессионально составленный тест позволяет за короткий промежуток времени проверить знания большого количества учащихся по полной программе преподаваемой дисциплины, в то время как традиционные экзамены представляют собой лишь выборочную проверку знаний. Тесты как измерительный инструмент используются в большинстве стран мира. Они не являются универсальным средством, границы их использования достаточно хорошо известны. Известно, например, что профессионально подготовленный и использованный тестовый инструмент дает качественную и надежную информацию, соответствующую реальному положению дел.
Тесты, как показывает опыт, являются значительно более качественным и объективным способом оценивания. Объективность тестирования достигается путем стандартизации процедуры его проведения и проверки показателей качества заданий и тестов целиком. Тесты — более емкий инструмент, их показатели ориентированы на измерение степени, определение уровня усвоения ключевых понятий, тем и разделов учебной программы, умений, навыков, а не на констатацию наличия у учащихся определенной совокупности усвоенных знаний. Стандартизированная форма оценки, используемая в тестах достижений, позволяет соотнести уровень успехов учащегося по тому или иному предмету как в целом, так и по отдельным разделам со средним уровнем достижений учащихся в классе. К тому же тесты — более объемный инструмент. Выполняя тестовые задания, каждый ученик использует знания по всем темам, предусмотренным программой. Еще одно существенное отличие тестов от традиционных методов аттестации состоит в том, что использование при тестировании процедур и единых критериев оценки приводит к снижению экзаменационных стрессов. Тест — широкий инструмент и с точки зрения интервала оценивания. Если провести аналогию с прыжками в высоту, то традиционная контрольная работа представит собой не линейку, а палочку, на которой нанесены три риски — 5, 4 и 3. В случае выполнения учеником всех заданий он получает отличную отметку. При этом совершенно не ясно, перепрыгнул он палочку с запасом в несколько раз или пролетел прямо над ней. То же можно сказать и про нижнюю отметку. При сравнении тестирования и традиционного оценивания можно увидеть, что первое предоставляет возможность расширить шкалу оценивания как вверх, так и вниз. Означает ли тот факт, что если ученик не выполнил ни одного задания, что он ничего не знает? Скорее всего, нет. Давая широкие возможности для проявления достижений, тест представляет собой измерительный инструмент примерно трехметровой высоты, риски на котором расположены практически от земли. В этом отношении тестирование приходит в противоречие с учительским стереотипом о том, что отличную оценку нужно выставлять только в том случае, если все задания выполнены правильно. Можно отметить и гуманизм тестирования, который заключается в том, что всем предоставляются равные возможности, а широта теста дает возможность ученику показать свои достижения на широком поле материала. Таким образом, ученик получает некоторое право на ошибку, которого он лишен при традиционном способе оценивания.
Привлекательными оказываются тесты и с точки зрения управления. Они дают возможность для варьирования сложности тестового материала, широты охвата, целевой направленности, включения нескольких компонентов структуры знаний, что позволяет создать инструмент, учитывающий самые взыскательные требования. Система показателей качества дает возможность оценить, насколько реально созданный инструмент соответствует этим требованиям, и использовать его строго в соответствии с ними. Кроме того, тесты эффективны и с экономической точки зрения. При тестировании основные затраты приходятся на составление качественного инструментария, то есть носят разовый характер, а при увеличении количества аттестуемых эти затраты распределяются на них пропорционально, что приводит к снижению общих затрат.
В основе тестирования лежат достаточно простые, логичные, не противоречащие здравому смыслу правила и законы. Однако тесты достижений не являются инструментом для определения всего спектра школьных достижений. Определение достижений в социальной сфере необходимо проводить специальным инструментом, на это рассчитанным и для этих целей разрабатываемым. Еще одним из существенных ограничений применения тестирования школьных достижений являются ограничения, которые накладываются на ответы, в силу чего анализ способов решения задач, мыслительных операций, которые использует ученик, в большинстве случаев затруднен или невозможен. Существует и ряд других ограничений. Однако и в рамках существующих на сегодняшний день ограничений метод тестирования является наиболее мощным, надежным и объективным средством решения широкого спектра педагогических задач. К сожалению, пока еще в нашей стране он недостаточно теоретически и практически разработан.
Совокупность заданий возрастающей сложности
Педагогический тест — это «совокупность взаимосвязанных заданий возрастающей сложности, позволяющих надежно и валидно* оценить знания и другие интересующие педагога характеристики личности». Очень существенно, что основной упор в данном определении делается на систему взаимосвязанных заданий возрастающей сложности.
Педагогические тесты весьма разнообразны. С точки зрения целей применения можно выделить: тесты достижения; критериально-ориентированные тесты, позволяющие сопоставить уровень индивидуальных учебных достижений с полным объемом знаний, умений и навыков; нормативно-ориентированные тесты, сравнивающие испытуемых друг с другом по уровням и учебным достижениям; аттестационные тесты, определяющие степень обученности; тесты прогнозирования результатов обучения. Тесты могут использоваться для всесторонней оценки состояния испытуемых, например, до начала процесса их интеллектуального развития, способностей к конкретному учебному предмету, установления уровня обучаемости, уровня достижений в рассматриваемой области знаний.
Методику разработки тестов можно разбить на несколько исследовательских этапов: подбор типичных ситуаций; перевод ситуаций на язык педагогических задач; разработка различных вариантов решения педагогических задач; определение ценности (веса) различных решений по каждой конкретной педагогической задаче; установление правильной последовательности предъявления системы заданий, составляющих тест.
В зависимости от характера деятельности испытуемого при выполнении теста различают: тесты со свободно конструируемыми ответами; тесты на дополнение ответов, приведенных в заданиях; тесты выбора верных ответов из общего числа предложенных в задании (альтернативные тесты); комбинированные тесты. Для оценки дидактических возможностей перечисленных тестов необходимо остановиться на характерных особенностях тестирования вообще и его отдельных видов в частности. Каждое из заданий теста содержит информацию к решению, ее характер и объем может варьироваться как дидактическая помощь испытуемому. Избыток такой помощи может играть положительную роль в тестах, используемых в режиме обучения и даже диагностики, но оказаться нежелательным в тестах для оценки достижений, где основной функцией является контроль.
Следующая особенность теста — он может ограничивать испытуемых в их действиях, поисках решения. Как и в предыдущем случае, оценка этой особенности не однозначна. Все зависит от целей тестирования. Так, нередко одно и то же задание может быть выполнено на основе различных идей, методов решения. Но если нам надо оценить, насколько испытуемый овладел некоторым конкретным методом, такую возможность следует исключить. Из всех видов тесты выбора имеют преимущество в предоставлении испытуемым свободы в ответах на задания. Это достигается путем включения в число ответов к заданиям альтернативного варианта ответа. Еще одна особенность тестов заключается в том, что конкретные формулировки заданий могут навязывать испытуемому вполне определенный порядок действий при их выполнении и логику поиска решения. Хорошо это или плохо — оценить однозначно невозможно. Все зависит от целей тестирования. Например, если основной целью является обучение, то рассматриваемая особенность дает возможность формировать у испытуемых определенные методы рассуждений. От вида теста самым существенным образом зависит, насколько проста и технологична обработка результатов тестирования. В этом смысле вне конкуренции тесты выбора. Тогда как при свободном конструировании ответов оказывается исключительно сложно обрабатывать результаты. Заканчивая рассмотрение видов тестов, следует упомянуть о так называемых ситуационных тестах. К ним относятся тесты в форме программ решения задач и алгоритмов определенного типа, последовательность заданий диктуется логикой решения рассматриваемых задачных ситуаций, а результаты выполнения одних заданий могут быть использованы при выполнении последующих.
Как было отмечено выше, наиболее широкое распространение в педагогическом тестировании получили тесты выбора. Сравнивая их с другими видами, следует отметить простоту обработки результатов выполнения, что в рамках массового обучения имеет особую ценность. Имеются и другие ценные дидактические качества этих тестов. Они являются средством доведения до испытуемых новой для них учебной информации и показа различных мнений по одному и тому же вопросу, идей, принципов, на основе которых может решаться рассматриваемая проблема.
Наборы ответов к заданиям — это средство диагностики, поскольку появляется возможность в число альтернативных ответов включать конкретные ошибки, что позволяет установить причины их возникновения. Появляется возможность обеспечить «обратную связь» для внесения коррективов в обучение. Работа с тестом выбора является эффективным средством развития мышления, поскольку по своей сути она складывается из операций сравнения, поиска альтернатив. Суждение о том, что ознакомление испытуемых с ложными ответами нежелательно, что эти ошибки могут закрепиться в их памяти, несостоятельно. Наоборот, работа с такими ответами позволяет вскрыть и разрушить ошибочные мнения.
Ответы к заданиям теста могут находиться в различных отношениях друг к другу: противопоставления, противоположности, когда выбор одного из них в качестве верного является утверждением ошибочности всех остальных; равноправия, когда верными могут оказаться несколько из предложенных ответов; дополнения друг друга, когда только несколько отобранных ответов в сумме дают законченный ответ на поставленный в задании вопрос.
Дело трудоемкое и ответственное
Процесс составления педагогических тестов — дело исключительно ответственное и трудоемкое, поскольку они являются основой контроля и диагностики в управлении процессом обучения. Отсюда и исключительно высокие требования к их содержанию и форме. Если сказать в самом общем виде, то тест должен быть пригодным (валидным) с точки зрения поставленных перед ним целей измерения. Понятие валидности трактуется довольно широко. В теории тестирования различают два типа валидности: внешнюю и внутреннюю. Внешняя присуща тестам, не имеющим сходных компонентов с оцениваемой системой. Внутренняя свойственна тем тестам, которые содержат в себе компоненты оцениваемой педагогической системы. Мера валидности теста определяется несколькими способами, например, сравнением с тестом-эталоном и сопоставлением с более объективными показателями, полученными другими методами. Сопоставление с объективными показателями предусматривает сравнение достижений испытуемого в тесте с результатами, полученными с помощью экспертов. В этом случае обычно берутся оценки, выставляемые испытуемому преподавателями-экспертами традиционным образом, без использования тестов, после чего результаты по заданиям теста и по оценкам экспертов коррелируются. Если получены однотипные измерения общих результатов, то считается, что тест обладает валидностью. Мера согласованности указывает на меру валидности.
Следует заметить, что тест нельзя назвать валидным или невалидным без указания сферы его применения. Тест считается содержательно валидным, если аспекты измерения соответствуют целям тестирования (аспектная полнота теста). При этом основное внимание в тесте (наибольшее число заданий) уделено наиболее важным из аспектов измерения (тест сбалансирован). Наконец, последовательность, в которой расположены задания и ответы к ним, логически обоснована, и тест представляет собой единое целое (конструктивно целостный). В педагогических тестах, разрабатываемых для контроля, диагностики знаний, решающую роль играет валидность по содержанию.
Выбор критериев, по которым предстоит оценивать результаты работы испытуемых с тестом, должен быть безупречен (критериальная валидность), гарантируя надежность, объективность, обеспечивая нужную точность измерения, давая возможность разделить испытуемых (дифференцирующие возможности теста). Считается, что к тестовым заданиям относятся те, которые отвечают одновременно трем требованиям — корректности содержания, форме и наличию системообразующих свойств. Первому требованию отвечают задачи, вопросы, и потому этот признак необходим, но не достаточен. Тестовые задания представляют собой не вопросы и не задачи, а утверждения, которые в зависимости от ответов испытуемых могут превращаться в истинные или ложные высказывания. При разработке педагогических тестов придерживаемся данного утверждения. Традиционные вопросы не бывают ложными или истинными, а ответы на них бывают столь неопределенными и многословными, что для выявления их истинности требуются большие затраты интеллектуальной энергии и преподавательского труда. В этом смысле традиционные вопросы и ответы не технологичны, вследствие чего их не рекомендуется включать в тест.
Задание в тестовой форме — это задание, к которому, помимо содержания, предъявляются требования более лаконичных формулировок. Самые жесткие требования предъявляются к языку теста — однозначность его понимания испытуемыми, выразительность, лаконичность.
Для разработки и применения в учебном процессе рассмотренных выше педагогических тестов необходимо учитывать объективные характеристики подготовительного процесса. А для этого нужно: выделить цели тестирования; отобрать педагогические ситуации; перевести (смоделировать) педагогические ситуации на язык учебных задач; переконструировать учебные задачи в тестовые задания; выбрать и оценить эталоны ответов; разработать план теста (предполагается раскладка необходимого числа заданий, исходя из общего предельного числа заданий разного уровня сложности); выделить аспекты тестирования; составить тест (эта работа должна проводиться опытными преподавателями); расположить задания в тесте с учетом системообразующих связей. Отметим, что педагогический тест должен включать в себя задания различного уровня сложности, начиная с легких и кончая трудными, на которые могут правильно ответить несколько испытуемых в тестируемой группе; проверить разработанный тест экспериментально. И последнее — эффективность педагогического теста определяется творческим подходом составителей к разработке системы заданий, соответствующих конкретным целям тестирования.
_________________________________________
*От английского слова valid — годный, пригодный.
Источник