Педагогическое тестирование как объективный способ оценивания

педагогический тест КАК ОБЪЕКТИВНЫЙ СПОСОБ ОЦЕНИВАНИЯ

Классификация педагогических тестов У Основные определения У Виды тестирования

gt; Компьютерное тестирование

Тест (от англ, test — испытание, проверка) — стандартизованные, краткие, ограниченные во времени испытания, предназначенные для установления количественных и качественных индивидуальных различий [8].

По мере использования тестов была сформирована их классификация по цели и содержанию: тесты личности — для оценки эмоционально-волевых качеств индивидуума; тесты интеллекта — для анализа уровня развития познавательных процессов и функций мышления; тесты способностей — для оценки возможности в овладении различной деятельностью; тесты достижений, с помощью которых оценивают развитие знаний, умений, навыков после обучения.

Из всего многообразия типов стандартизованных тестов в образовании используют тесты достижений. Они создавались для проверки результатов обучения на разных ступенях получения образования, измерения эффективности программ и процесса обучения. Тесты достижений принято противопоставлять тестам способностей, состоящим из тестов общего интеллекта, комплексных батарей способностей и тестов специальных способностей. Можно сказать, что тесты способностей измеряют эффективность обучения в относительно неконтролируемых и неизвестных условиях, в то время как тесты достижений измеряют эффективность обучения при частично известных и контролируемых условиях [3].

Первое применение тестов в системе образования относится к 1904 г., когда французский психолог А. Вине использовал серию тестов для отбора детей с пониженным уровнем интеллек

туального развития. Термин же «коэффициент интеллектуального развития IQ», который применяется и сейчас, уже в его современной интерпретации, был предложен учеными Стэнфордского университета США.

В начале прошлого столетия появились первые тесты по измерению результатов школьного обучения.

В настоящее время целесообразно отделить педагогический инструмент от психологического. Можно считать, что педагогические тесты направлены на выявление тех личностных новообразований и приращений, которые получены в результате систематического обучения. Психологические же тесты направлены на выявление особенностей, полученных в результате всей жизнедеятельности. Соответственно, различны и принципы построения и обработки этих двух типов тестов.

В настоящее время формируется «прикладное направление научной педагогики — педагогическая тестология, призванная заниматься научными вопросами разработки тестов, применяемых для объективного контроля учебных достижений». При этом само понятие «педагогический тест» необходимо использовать в двух смыслах: как метод педагогического измерения и как результат применения теста.

Понятийный аппарат тестологии еще только формируется, поэтому возможно использование разными специалистами различных трактовок одного и того же понятия.

Например, ранее мы использовали определение А. Н. Майорова: «Тест (в том числе педагогический) — это инструмент, состоящий из квалиметрически (с использованием различных методов определения качества) выверенной системы тестовых заданий, стандартизованной процедуры проведения и заранее спроектированной технологии обработки и анализа результатов, предназначенный для измерения качеств и свойств личности, измерение которых возможно в процессе систематического обучения» [9]. Это определение позволяет формально просто отделить тест от «не теста»: тест объединяет, как минимум, три составляющих элемента — систему заданий, технологию предъявления и отработанную систему проверки, обработки и анализа результатов.

Можно использовать и следующее определение В. С. Аванесова, по своей сути не противоречащее первому: «Педагогическим тестом называется система заданий специфической формы, определенного предметного содержания, возрастающей трудности для объективного оценивания структуры и уровня подготовленности учащихся в ограниченный промежуток времени» [2].

В этом определении слова «система заданий» означают, что в тесте собраны такие задания, которые обладают системообразующими свойствами, т. е. принадлежат к одной учебной дисциплине, связаны и упорядочены по мере возрастания их трудности.

Специфическая форма тестовых заданий проявляется в том, что «задания теста сформулированы в виде утверждений, которые, в зависимости от ответов, превращаются в истинное или ложное высказывание. Это их основное отличие от вопросов и задач, которые не бывают истинными или ложными, очень многословны и неопределенны по форме, поэтому нетехнологичны» [2].

Форма логического утверждения позволяет при минимуме средств (слов и лексических конструкций) добиться максимальной ясности смысла, не порождая многословности в ответах. Но это не означает, что условие тестового задания нельзя сформулировать в виде вопросов. Не стоит абсолютизировать форму логического высказывания и использовать ее в определении тестовых заданий, как это представлено у В. С. Аванесова.

Под определенным предметным содержанием же в этом определении подразумевается использование в тесте только такого контрольного материала, который соответствует содержанию учебного курса, т. е. в педагогическом тесте достижений исключается проверка внеучебного содержания (например, уровня интеллектуального развития), так как система построения психологических тестов совершенно иная.

Главным критерием упорядочивания содержания педагогического теста является критерий трудности заданий.

Характеристики тестов отвечают требованиям, которые предъявляются всем измерительным материалам. Наиболее существенными считаются следующие характеристики: валидность — соответствие проверочного материала целям контроля; надежность — устойчивость результатов тестирования при многократном использовании контрольного материала; репрезентативность — полнота охвата в тесте изученного материала; стандартизованность — единая процедура проведения и подведения итогов тестирования.

Кроме приведенной классификации тесты можно классифицировать еще по целому ряду оснований.

Стандартизация — последовательный ряд процедур по планированию, проведению оценивания и выставлению баллов. Цель стандартизации состоит в том, чтобы обеспечить всем учащимся возможность проходить оценивание в равных условиях, чтобы их оценки имели одинаковое значение и не подвергались влиянию различных условий. Это важная процедура, когда оценки планируется использовать для сравнения отдельных людей или групп.

В образовании можно выделить и ряд задач, которые могут быть решены не стандартизированными тестами, — в том числе текущий контроль знаний на этапе обучения. Однако для итоговой аттестации учащихся используются только стандартизованные тесты. По способу предъявления различают тесты: бланковые (машиночитаемые бланки, тестовые тетради); предметные (манипуляция материальными объектами рассчитана на быстроту реакции и четкость действий); аппаратурные (с использованием специальной аппаратуры — датчиков для фиксации сигналов); практические (аналоги лабораторных работ, но с тестовыми условиями заданий); компьютерные (как частный случай — адаптивные). По характеру действий тесты делят на: вербальные; невербальные. По ведущей ориентации выделяют: тесты на скорость; тесты на результативность (мощность); смешанные тесты. По степени однородности задач тесты делят на: гомогенные, позволяющие измерить одно качество (уровень подготовки по одному предмету) однородными по составу заданиями; гетерогенные (многомерные) — для измерения уровня подготовленности учащихся по нескольким учебным предметам и (или) свойствам личности.

¦ По целям использования в системе образования (классификация по книге Нормана Е. Гронлунда [9, 20]; названия даны в переводном варианте, — возможно, по мере внедрения в педагогическую практику они претерпят изменения):

• определяющий (знания или поведение обучаемого в начале обучения).

Для отечественной системы образования наиболее приемлемый и используемый педагогами термин — «входной тест».

Для чего это необходимо учителю-практику? Учащиеся в классе имеют разную подготовку, различные способности и различаются по мотивирующему фактору. В этой ситуации реализовать в большей мере личностно ориентированное обучение возможно при следующем подходе. Сначала следует провести входное тестирование, которое позволит разделить учащихся на две подгруппы. В первую попадают сильные учащиеся; при анализе выполнения ими входного теста прежде всего важна не степень их готовности к изучению нового материала (заранее понятно, что они готовы к этому), а оценка степени владения новым материалом, которая поможет учителю организовать его изучение на приемлемом уровне. Для второй группы учащихся на начальном этапе важно определить, каких базовых компонентов знаний им не хватает для успешного продолжения учения, и принять меры по устранению выявленных пробелов еще на первоначальном этапе. В этом случае учитель может подобрать такой метод обучения, который был бы наиболее эффективным для всей группы и позволил бы получить высокие результаты по окончании обучения. Сравнение же начального и конечного состояния обучаемых позволяет оценить прирост знаний; тогда во входном тестировании используется тестовый материал, незначительно отличающийся от материала для итогового контроля по изучаемой теме.

При первоначальном изучении материала учителю предстоит большая подготовительная работа по разработке собственного проверочного материала или по адаптации уже существующего; в дальнейшем же используется уже готовый материал и необходимы только незначительные его корректировки. Разумеется, эффективность такой работы с точки зрения потраченного учителем-предметником времени на подготовку определяется степенью владения компьютером и возможностью доступа учащихся в компьютерный класс при изучении других предметов.

Входное тестирование бесполезно, когда: учитель хорошо знает возможности обучаемых, поскольку давно работает с классом; специфика содержания нового материала такова, что не позволяет выделить круг базовых знаний, умений и навыков, необходимых к началу обучения; область планируемых к усвоению знаний достаточно новая, так что у учащихся не может быть никаких «заделов», либо трудно пока выделить качественный уровень усвоения (например, элективные курсы при профильном обучении).

• формирующий (тест прогресса, достигнутого в обучении).

В отечественной практике обычно используется понятие «обучающий тест». Формирующее тестирование направлено на реализацию дифференцирующего подхода в обучении. Для успевающих учеников с помощью формирующего тестирования можно выделить круг задач, мотивирующих обучение, благодаря оптимальному подбору трудности заданий позволяющих не потерять интерес сильных учащихся к обучению. Это весьма актуально, поскольку учитель обычно ориентируется на основную массу учащихся, испытывающих затруднения в обучении, тогда как сильные дети при этом выходят из поля зрения. Для слабо успевающих учеников с помощью формирующих тестов можно выявить пробелы, порождаемые излишне трудными учебными задачами, для выполнения которых необходима помощь учителя.

Формирующие тесты не следует путать с традиционными средствами текущего контроля знаний (такими, как самостоятельные работы, контрольные срезы и пр.), хотя они близки по времени использования. Традиционные средства ориентированы на реализацию информационной и мотивационной функций контроля, но не более того. Диагностическую функцию они не выполняют, т. е. на качество обучения влияют очень слабо. Формирующие же (обучающие) тесты предназначены для выявления пробелов в знаниях по группе дидактических единиц для своевременной коррекции процесса усвоения материала нескольких взаимосвязанных тем или даже разделов. При правильном положении вещей между формирующими тестами и

традиционными средствами контроля также имеются существенные различия как содержательного, так и технологического плана.

Логика формирующего (обучающего) тестирования понятна любому педагогу и легко реализуется им на практике. Если большинство учеников класса не справляется с заданиями формирующего теста, то процесс повторения и закрепления материала несколько удлиняется, увеличивается детализация, снижается трудность решаемых задач. Если же не справившихся с тестом — меньшинство, то проводится индивидуальная работа с отстающими. Вопрос лишь в том, как наилучшим образом выявить эти пробелы. Использование надежных формирующих тестов (в комплексе с диагностическими) по предметам позволяет существенно разгрузить преподавателей, а качество обучения при этом возрастает. Особенно эффективен процесс коррекции в ситуации, когда формирующее тестирование осуществляется в компьютеризированной форме: в этом случае коррекция проводится незамедлительно, поскольку после выявления очередного пробела компьютер сам подбирает нужный обучающий модуль и выдает его ученику.

• диагностический (тест на выявление трудностей в обучении и их источников).

Для отечественной педагогики наиболее приемлемое эквивалентное понятие — «корректирующий тест». Диагностический тест призван установить причины пробелов в знаниях, поэтому его следует использовать в комплексе с формирующим. Если при формирующем тестировании и последующей коррекции не удалось добиться заметного улучшения, то надо подключить соответствующий модуль диагностического теста. Последний должен включать в себя специально подобранные по содержанию задания с максимально детализированными шагами по их выполнению. Информация, которую получает учитель, при этом носит вполне конкретный характер и позволяет однозначно определить причину систематических неудач в обучении и внести требуемые коррективы (или принять иные административные решения).

Процесс составления высококачественных диагностических тестов достаточно сложен, поскольку существуют определенные ограничения в сфере их разработки и применения. Но результаты применения таких тестов могли бы коренным образом повлиять на качество учебного процесса.

• суммирующий (тест достижений в конце обучения).

Иначе такие тесты называют «итоговыми», «суммативны- ми», «тестами школьных достижений» и т. д. Целью итогового тестирования является обеспечение объективной оценки результатов обучения по завершении некоторого предметного курса. В отличие от других типов тестов, итоговые наиболее востребованы в настоящее время и должны проверять качество усвоения материала, наиболее важного для продолжения образования.

Следует подчеркнуть, что каждый из перечисленных выше видов тестов имеет свои особенности, которые еще не изучены до конца. Использование одних тестов вместо других может привести к серьезным негативным последствиям. Но вместе с тем тесты необходимо интегрировать в учебный процесс. Они обеспечивают объективность контроля, разнообразят учебную деятельность учащихся, экономят колоссальное количество времени, что очень важно при существующей перегрузке учителей и учащихся. Поэтому знание основ педагогических измерений необходимо каждому педагогу; только тогда можно говорить о корректном использовании тестовых материалов и процедур в учебном процессе.

Рассматривая различные виды тестов, мы то и дело приходили к выводу, что эффект от использования наиболее существенен при использовании компьютера. Обобщим наши предположения и попытаемся развернуть понятие «компьютерное тестирование».

В настоящее время получило распространение понятие «компьютерное адаптивное тестирование» (КАТ), означающее такое проведение теста при помощи компьютера, при котором представление вопросов зависит от ответов экзаменуемого на предыдущие вопросы. Обычно, если тестируемый отвечает на вопросы правильно, то следующий задаваемый ему вопрос бывает более сложным. И наоборот, если тестируемый отвечает неправильно, то следующий вопрос будет несколько легче. Таким образом, адаптивный тест «ориентирован» на уровень подготовки тестируемого [20].

В связи с вышесказанным представляется важным создание современных автоматизированных контрольно-обучающих программ, требующих, в свою очередь, разработки тестов, программно-инструментальных средств для выдачи обучающих заданий в адаптивном режиме и специальных программных средств для компьютерной поддержки процесса разработки тестов, основанного на современных моделях теории педагогических измерений [20]. Чтобы система внутришкольного контроля реально

заработала в общеобразовательных школах, необходимо осуществить и переподготовку преподавательского состава. Компьютерное тестирование по предметам как один из элементов системы внутришкольного контроля открывает широкие возможности для индивидуализации процесса усвоения знаний обучаемыми. Появляется реальная возможность эффективного решения целого ряда задач, способствующих повышению качества обучения не за счет увеличения нагрузки педагога, а путем внедрения в учебный процесс обучающих программ и тестов [16, 20]. Такая программа, связывая контроль и обучение, сначала с помощью входных тестов выявляет степень понимания учебного материала, затем анализирует трудности, с которыми учащимся приходится сталкиваться при выполнении заданий в режиме обучения, а далее на основе этого анализа в рамках программы проводится своевременная коррекция процесса усвоения новых знаний, в которой деятельностная роль педагога минимизирована. Заметим, что эта коррекция носит дифференцированный характер и сводится, как правило, к помощи обучаемому. В зависимости от рода ошибок коррекция усвоения может носить характер подсказки, предъявления образца задания, подробного рассмотрения базового теоретического материала, необходимого для выполнения задания, ссылки на соответствующий раздел учебника или рекомендации обратиться за консультацией к педагогу. Таким образом, участие педагога в процессе коррекции крайне незначительно, он подключается только на этапе выявления пробелов в подготовке ученика с помощью компьютера, когда затруднения ученика носят наиболее серьезный характер и ученик нуждается в развернутой и обстоятельной консультации педагога.

При разработке программного обеспечения для описываемой системы тестового контроля весь учебный материал разбивается на отдельные модули, которые на этапах входа, выхода и продвижения по модулю сопровождаются поясняющими тестами. Кроме того, программа обеспечивает возможность самоконтроля со стороны обучаемого в процессе выполнения заданий и позволяет учащемуся в случае необходимости обратиться к педагогу за помощью для выполнения отдельных самых трудных заданий. Добровольное обращение за помощью к преподавателю в процессе самоконтроля создает у учащегося дополнительные мотивы для его активной учебной деятельности, обеспечивает его стремление к получению новых знаний в сотрудничестве с педагогом.

Однако говорить о том, что педагогика располагает отработанной методикой создания адаптивных контрольно-обучающих программ для функционирования системы контроля, по меньшей мере, преждевременно. Многое здесь еще находится в стадии исследований и носит скорее научный, чем методический характер.

Еще меньше, чем теоретики, в этом направлении продвинулись практики. Большинство из рассмотренных преимуществ компьютеризованных систем контроля так и остались на уровне общетеоретических построений и не получили должного практического применения [20].

Все существующие на сегодня системы компьютерного тестирования имеют незавершенный вид. К полноценным программным продуктам, готовым к распространению и использованию в педагогической практике, их отнести нельзя. Как правило, тестирующие системы предоставляют возможность использования ограниченного набора тестовых заданий — в основном это задания с выбором одного или нескольких правильных ответов. В тестирующих системах обычно нет четкого разграничения обучающих и контролирующих тестов, а диагностические тесты отсутствуют совсем. Разработчиками не используется такой обязательный компонент процедуры тестирования, как ограничение по времени выполнения. Самый же важный недостаток существующих тестирующих систем — это отсутствие аналитических модулей для получения необходимых статистических характеристик и адекватной их интерпретации.

Источник