Технологии и системы тестирования
Проблема автоматизированного проектирования педагогических тестов, видимо, в ближайшее время не может быть корректно и достаточно полно разрешенной, в частности, из-за ситуационного многообразия и отсутствия четких критериев автоматизации такой плохоформализуемой проблемы. Тем не менее, попытаемся изложить основные принципы автоматизированной разработки тестов и тестирования.
Технология компьютеризированного тестирования должна обладать основными характеристиками:
- наличие интерактивной инструментальной среды;
- мультипредметное применение;
- адекватное отражение конструируемой модели предметной области в процессе тестирования;
- возможность выбора алгоритма тестирования;
- интегрируемость в различные образовательные технологии;
- профилируемость;
- масштабируемость;
- доступность;
- дружественность пользовательского интерфейса;
- ведение базы тестовых многоуровневых заданий;
- настриваемое планирование и управление;
- нацеленность на достижение более высоких результатов и повышение мотивации.
Компьютерные тесты обладают рядом преимуществ по сравнению с традиционными тестами.
Имеют они и недостатки, например, психологического, этического и правового плана.
В обучающих системах используют два принципа контроля знаний:
- оценка действий обучаемого и определение уровня его знаний по знаниям о предметной области и правилам оценки действий обучаемого;
- стандартизированный контроль знаний по выборке специальных заданий и по его ответам на них (тестовый).
Современное тестирование характеризуется интенсивной заменой классических тестов и классического тестирования так называемыми "адаптивными тестами" или "тестами с изменяющейся структурой".
Адаптивное тестирование определяется М.Б.Челышковой как "совокупность процессов генерации, предъявления и оценки результатов выполнения адаптивных тестов, обеспечивающая прирост эффективности измерений по сравнению с традиционным тестированием благодаря оптимизации подбора характеристик заданий, их количества, последовательности и скорости предъявления применительно к особенностям подготовки тестируемых".
Автоматизированная система тестирования – интегрированный программно-технический комплекс для тестирования в автоматизированном (человеко-машинном) режиме.
Адаптивное тестирование – вариант автоматизированной системы тестирования, в которой априори известны параметры трудности и дифференцирующая способность каждого задания.
Адаптивное тестирование должно удовлетворять следующим требованиям:
- Регулируемость пропорций предъявляемых легких, средних и трудных заданий в зависимости от числа правильных ответов тестируемого.
- Регулируемость пропорций предъявляемых различных тематических разделов учебной программы в тесте.
- Регулируемость уровня сложности предъявляемых тестов с учетом семантической компетенции тестируемого.
- Включение адаптивного механизма перевода на более высокий уровень заданий на одном и том же уровне предъявляемых заданий
- Каждое задание более высокого уровня оценивается более высокими баллами.
Немалую роль в этом сыграло и развитие дистанционного обучения, WWW-ориентированное обучение (WBE – Web-Based Education или WBT – Web-Based Training). WWW-тестирование (часто называемое Интернет-тестированием) используется не только для обучения, но и для самообучения (самотестирования) в онлайновом обучении и контроле (on line – дословно "на линии").
Основные принципы, которые должны быть присущи веб-тестированию:
- гуманистичность;
- приоритетность педагогического подхода;
- адекватность выбора контента;
- обеспечение безопасности и конфиденциальности;
- тренинг, компьютерная грамотность;
- адекватность технологии и информационной модели предметной области;
- мобильность;
- гибкость;
- массовость;
- рентабельность и др.
Существующие WBE-среды различаются по типу и степени поддержки, которую они обеспечивают на каждом из упомянутых выше этапов. Простые системы обычно обеспечивают частичную поддержку некоторых из них, а развитые системы – полную и всех.
Различны и технологии поддержки, причем от них и зависит степень поддержки, в частности, форма хранения тестов – статическая (например, HTML-код) или динамическая (например, CGI-скрипты, Java-машина или GUI – специализированное графическое представление вопроса).
Различаются они и по форме генерации заданий:
- по простому статическому шаблону;
- простым непараметризованным выбором из банка;
- генерацией по поисковому образцу из базы;
- параметризованным выбором из базы с помощью метаданных задания (теста) – тип, ключевые слова, раздел, сложность.
Наиболее перспективный подход – адаптивная генерация заданий.
Такие системы генерируют задания, наиболее адаптированные к уровню достижений обучающегося.
К сожалению, Web–обучение имеет и отрицательные стороны, так как оно оторвано от обычного человеческого общения.
В последнее время активно развивается m-Learning ("Мобильное обучение", точнее, "Обучение на основе мобильных технологий и средств" – карманных компьютеров (КПК), смартфонов (сотовых телефонов с расширенным набором функций), ноутбуков или других устройств с минимальными ресурсами с минимальной необходимостью использования "специального" места обучаемого и "специального" времени для обучения).
В частности, в рамках программы Европейской комиссии "Leonardo da Vinci" (программа профессионального обучения в течение всей активной жизни) при поддержке компании Ericsson и некоторых европейских университетов дистанционного обучения в 2003 году реализован проект "From e-Learning to m-Learning" ("От электронного обучения – к мобильному"). Разработана специальная система mLMS (Mobile Learning Management System) для управления мобильным обучением (с помощью карманных компьютеров, мобильных телефонов).
Другой проект Евросоюза "m-Learning" (Великобритания, Италия, Швеция) ориентирован на молодежь с высоким фактором риска социального неравенства и разрабатывает систему LMS обеспечивающую доступ к интерактивным учебным материалам.
В Институте точной механики и оптики (С-Петербург) разработана система тестирования на основе карманных персональных компьютеров пользователей и удаленного сервера базы данных (тестов).
Принципы m-Learning используются активно за рубежом и начали использоваться и в нашей стране (например, в Интернет-университете информационных технологий http://www.intuit.ru).
Хотя возможности m-Learning и ограничены (трудно использовать страницы, рисунки, таблицы и меню большой разрешающей способности и размера, всплывающие диалоговые окна и др.), оно имеет большую инновационную привлекательность.
Инструментальные системы учебного назначения обычно предназначены для настройки на любую предметную область.
Существует множество автоматизированных систем обучения и контроля. Наиболее часто встречаются так называемые обучающие программы, разработанные на основе эмпирического подхода, определенный педагогический опыт и здравый смысл (системы "от учебного предмета"). Как правило, у них низкая дидактическая эффективность (по зарубежным оценкам, эффективными являются не более 10% таких программ, а число непригодных – около 90%).
Рассмотрим некоторые системы.
- Lotus Learning Space – средство разработки обучающих мультимедиа-курсов. Пакет Learning Space поддерживает три способа обучения: самостоятельное и пошаговое, без тьютора и контроля (материалы на веб-сервере, в базе данных или на носителе).
- ToolBook – средство создания мультимедиа–приложений обучающего характера. Позволяет создавать тесты, встраивать их в контент и проводить тестирование. Имеется также набор стандартных видов тестов, которые легко встраиваются в создаваемый контент.
- WebCT – интегрированная среда разработки и использования сетевых курсов. Тестирующая система WebCT позволяет использовать основные типы тестовых заданий, включая и развернутый ответ.
- eLearning Office – система разработки мультимедиа-приложений: электронных каталогов, энциклопедий, учебников, презентаций, поисковых систем и других. Включает систему интерактивного тестирования для самопроверки знаний учащегося с заданиями, которые могут быть трех типов (с вариантами выбора ответов, с вводом строки ответа и на соответствие ответа) и включать аудио- и видео-фрагменты, а также графические объекты. Есть режим контроля результатов тестирования. Преподаватель может выставлять оценки обучаемым автоматически или самостоятельно, контролируя неправильные ответы.
- tTester – разработка, которая позволяет создавать тесты, объединять тесты в один тест, редактировать тесты, создавать "бумажные" версии тестов и их печать и др.
- АСТ-Тест – инструментальная среда для разработки педагогических тестов и адаптивного тестирования с использованием OLE-технологии и мультимедиа. Имеет модули "Конструктор тестов", "Система тестирования".
- АИССТ – Автоматизированная Интерактивная Система Сетевого Тестирования для проведения контроля знаний обучающихся, создания и настройке предметного материала, администрирования работы системы.
- Гефест – сетевая адаптивная информационно-обучающая система, использующая методы теории автоматов и марковских процессов. В модель адаптивного управления обучением включены объекты "Устройство адаптивного обучения (формирование вопросов и задач, контроль ответов и оценка знаний)", "Модель обучающегося".
- LERSUS – программная система (редактор) для быстрой разработки и стандартизации электронных (в том числе, веб-контента с использованием видео, аудио, Java, Flash) или печатных учебных материалов в виде интерактивного веб-контента без непосредственного (процедурного) программирования и дизайнерских усилий, организует интерфейсную поддержку и импорт-экспорт при разработке тестов.
- М-Тест – инструментальная среда для поддержки адаптивного тестирования и аттестации сотрудников. Позволяет конструировать мультимедийные задания основных форм, используя технологию связывания объектов OLE, создавать банки таких заданий, визуализировать результаты тестирования (протоколирование), вести статистику.
- IRT–технология (методология) адаптивного тестирования, получившая название "Тест интеллектуального потенциала" для экспресс-диагностики интеллектуальных способностей людей различных возрастных групп.
Есть и другие аналогичные системы.
В заключение отметим, что системы обучения и контроля должны иметь критерии адекватности.
Отметим следующие критерии адекватности образовательных WWW-ресурсов:
- качество закрепления материала (в частности, для тестирующих систем);
- качество и структурированность учебного материала (для электронных учебников);
- актуализация структурированного знания (для поисковых систем);
- эффективная обратная связь (для образовательных телеконференций);
- визуализация (для визуальных сред программирования);
- виртуализация (для моделирующих сред);
- создание новых операционных возможностей или актуализация "старых" новыми структурами (для микромиров);
- связность нового и старого знания (для когнитивных сред);
- обеспечение перехода на новый продуктивный уровень деятельности обучаемых (для креативных средств и сред);
- снижение стоимости и времени (для CASE-систем);
- повышение интеллектуальной поддержки процесса принятия решений (для нейросистем);
- качество обеспечения коммуникативности (для интрасетей и экстрасетей) и др.
Образовательная система должна реагировать на наблюдаемые несоответствия и скачки в окружении, в обществе, адаптируясь и извлекая уроки из критических ситуаций.
Необходим переход от парадигмы обучения к парадигме учения, от парадигмы обучения к функционирующим изолированным системам. Необходима парадигма актуализации, усиления и изучения системно-синергетических связей открытой системы и ее окружения, изучения и предвидения эволюции систем. Особенно важно такое предвидение в образовательных системах, так как в них достаточно большой цикл эволюции.