Опубликован: 30.11.2014 | Уровень: для всех | Доступ: платный | ВУЗ: Кабардино-Балкарский государственный университет
Лекция 5:

Обоснование качества теста

< Лекция 4 || Лекция 5: 123456 || Лекция 6 >

5.3. Задачи и процедуры проверки законов распределений результатов

Рассмотрим задачу обоснования принятия различных гипотез в тестировании. Есть процедуры, позволяющие отвергнуть проверяемую гипотезу как противоречащую имеющимся данным, либо убедиться в том, что гипотеза этим данным не противоречит.

Располагая каким-то распределением данных тестирования, можно исследовать возможность описания этой совокупности каким-то типовым распределением, если тип распределения неизвестен, а затем найти неизвестный параметр распределения, а также эффективность описания.

Наиболее часто рассматриваются гипотезы, в основе которых лежат известные распределения: нормальное (Гаусса), "хи-квадрат" (\chi^2), Стьюдента и Фишера. Существуют различные процедуры проверки гипотезы о принадлежности заданного эмпирического распределения к некоторому теоретическому типу.

Рассмотрим нормальное распределение (распределение Гаусса). Это распределение – наиболее часто встречающееся непрерывное распределение (точнее было бы сказать, что это распределение, к которому "подгоняется" большинство изучаемых распределений). Такому закону или его различным модификациям подчиняются многие наборы случайных величин.

Общий вид нормального распределения задаётся функцией:

f(x)=\frac{1}{\sqrt{2\pi D(x)}}\exp\left [-\frac{(x-M(x))^2}{2D(x)}\right ].

Здесь М(х) – математическое ожидание рассматриваемой случайной величины х, D(х) - дисперсия.

Часто используется стандартное нормальное распределение или распределение вероятностей нахождения (попадания) случайной величины в интервал (a;b). Для вычисления значений такой функции используется интеграл (таблица значений этого, не берущегося в квадратурах, интеграла):

\Phi(x)=\int\limits_{-\infty}^x\frac{1}{\sqrt{2\pi}}\exp(-\frac{z^2}{2})dz.

Задача 8. Необходимо на основе имеющихся результатов тестирования проверить гипотезу нормального распределения результатов тестирования, например, достижений (очень простой вариант – в качестве достижения принять среднее арифметическое по всем тестам) тестированных в зависимости от выборки.

Оценку соответствия рассматриваемого распределения нормальному распределению можно осуществить также и по величине асимметрии:

K=\frac{\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar x)^3}{(\sqrt{\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar x)^2})^3}

Если имеет место левая асимметрия (сдвиг влево кривой распределения), то это говорит о том, что в тесте были облегченные задания, на которые сумели правильно ответить подавляющее большинство испытуемых, а также были усложненные задания, с которыми не смогли справиться подавляющее большинство испытуемых.

Если имеет место правая асимметрия (сдвиг вправо), то это говорит о том, что в тесте был очень низкий порог трудности для данного контингента испытуемых.

Алгоритм проверки гипотезы о нормальном законе распределения с помощью коэффициента асимметрии может реализовываться следующими шагами.

  1. Вычислить среднее арифметическое \bar x.
  2. Вычислить коэффициент асимметрии К по вышеприведенной формуле.
  3. Так как для нормальной кривой распределения характерна симметричность относительно среднего значения, то значение К, равное или достаточно близкое к нулю свидетельствует о симметричности распределения; чем больше значение К, тем больше отклоняется наиболее часто встречающаяся в распределении величина от средней (больше смещена ось симметрии, больше асимметрия кривой), а сдвиг "колоколообразной" части кривой влево или вправо свидетельствует от чрезмерной легкости или сложности заданий.
  4. Конец алгоритма.

Знание закона распределения баллов необходимо для выработки нормативной шкалы, которая позволит соотнести равные отрезки под кривой распределения равным количествам правильных ответов.

Распределение можно получить следующей процедурой:

  1. Сгенерировать случайную выборку тестируемых (из генеральной совокупности).
  2. Протестировать выборку и получить первичные баллы.
  3. Оценить баллами каждого испытуемого по отношению к баллам других участников.
  4. Найти число интервалов, на которые делится числовая прямая оценок и границы интервалов (например, для четырёхбальной системы оценок находим квартили). Обычно находят балл некоторого испытуемого как процентную долю испытуемых, первичный балл которых ниже первичного балла данного испытуемого.

Если распределение не подчиняется нормальному закону, то либо изменяют тесты до тех пор пока не получим нормальное распределение, либо принудительно нормализуют распределение, либо используют шкалы, ориентированные на другие типы распределений.

Необходимо искусственно приводить распределение первичных тестовых оценок к нормальному виду, так как она наиболее изучена (проста) в математической статистике и дает возможность описывать диагностические нормы в компактной форме.

Применение известных статистических программных пакетов позволяет автоматизировать подгонку требуемого преобразования первичных тестовых оценок к комбинациям различных базисных аналитических функций, что также позволяет стандартизировать тестовые оценки.

< Лекция 4 || Лекция 5: 123456 || Лекция 6 >
Александр Горшков
Александр Горшков

есть желание заново пройти курс "Тестирование в современном высшем образовании"

 

 

Анджелика Шарапова
Анджелика Шарапова

Оценки по каким дисциплинам идут в приложение к диплому по профессиональной переподготовке "Современные образовательные технологии"?