Опубликован: 16.11.2010 | Уровень: специалист | Доступ: свободно
Лекция 6:

Обработка результатов имитационного эксперимента

5.6. Критерий Вилькоксона

Как и в предыдущем случае решается следующая задача. Имеются две серии независимых наблюдений однородных случайных величин X и Y, причем значения x_{i} и y_{i} дают различные значения средних (\overline{x}\ne\overline{y}) или (и) различные рассеивания. Возникает вопрос: можно ли считать эти расхождения существенными или расхождения зависят от случайных выборок?

Простой в употреблении и вполне приемлемый по точности критерий для проверки гипотезы о тождественности функций распределения F(x) и F(y) предложил в середине прошлого века Вилькоксон. Критерий назван его именем.

Рассматривается нулевая гипотеза: F(x) = F(y). Конкурирующая гипотеза: F(x) <F(y).

Критерий основан на подсчете числа инверсий. Инверсии определяются так.

Измеренные значения x_{i} и y_{i}, i = \overline{1, N} располагаются в общую последовательность в порядке возрастания их значений. Пусть это будет, например, так:

y,x,x_{2},y_{2},y_{3},y_{4},x_{3},y_{5},y_{6},x_{4},

где x _{1} \ldots  x_{4} - члены, принадлежащие первой выборке;

y _{1} \ldots  y_{6} - члены второй выборки. Эта последовательность - не убывающая, содержащая m + n чисел, m - количество чисел последовательности x, n - последовательности y.

Если гипотеза F(x) = F(y) верна, то достаточно очевидно, что числа из обеих последовательностей хорошо перемешиваются. Степень перемешивания определяется числом инверсий членов первой последовательности относительно второй. Если в упорядоченной общей последовательности некоторому x предшествует одно значение y, это означает, что имеет место одна инверсия.

Если некоторому x предшествуют k значений y, то это значение x имеет k инверсий.

Для нашего примера член x _{1} имеет одну инверсию с y _{1} ; член x_{2} - тоже одну с y _{1} ; член x_{3} имеет четыре инверсии (с y _{1},y_{2}, y_{3}, y_{4} ); член x_{4} имеет шесть инверсий (с y _{1}, y_{2}, y_{3}, y_{4}, y_{5}, y_{6} ).

Таким образом, общее число инверсий:

\overline{u} = 1 + 1 + 4 + 6 = 12.

Показано, что случайная величина u уже при m + n > 20 и \min(m, n) \ge 3 дает хорошее приближение к нормальному распределению с матожиданием и дисперсией:

M[u]=\cfrac{m-n}{2},\,\,\,
D[u]=\cfrac{m\cdot n}{12}(m+n+1),\,\,\,
\sigma_u=\sqrt{D[u]}

При уровне значимости q% и нормальности распределения u вероятность попадания значения u в критическую область (что означает не подтверждение нулевой гипотезы) равна:

P\{|M[u]-\overline{u}|>t_{\alpha}\sigma_u\}=q=1=2\Phi(t_{\alpha}),\\
P\{|M[u]-\overline{u}|>t_{\alpha}\sigma_u\ > \overline{u} > M[u]+t_{\alpha}\sigma_{u}}\}=q.

Отсюда следует, что левая критическая граница и правая критическая граница (рис. 5.3) равны соответственно:

u_1=M[u]-t_{\alpha}\sigma_{u},\,\,\,u_2=M[u]+t_{\alpha}\sigma_{u}.
Левая и правая критические границы функции /(и) Значение t _{\alpha }определяется так:

Рис. 5.3. Левая и правая критические границы функции /(и) Значение t _{\alpha }определяется так:
1-2\Phi(t_{\alpha})=q;\,\,\,
2\Phi(t_{\alpha})=1-q;\,\,\,
\Phi(t_{\alpha})\cfrac{1-q}{2};\,\,\,
t_{\alpha}=\Phi^{-1}\left ( \cfrac{1-q}{2}\right ).

\Phi(t _{\alpha}) - функция Лапласа, с которой мы встречались ранее, она табулирована. Наиболее актуальные соответствия уровней значимости q   и аргументов функции Лапласа t_{\alpha}   указаны в табл. 5.4

Таблица 5.4. Уровни значимости и аргументы функции Лапласа
q% 2 5 10
t_{\alpha} 2,33 1,96 1,65

Пример 5.4. С целью проверки адекватности модели центра коммутации сообщений измерено время задержки передачи сообщений на модели центра и непосредственно на самом центре. Результаты измерений сведены в табл. 5.5.

Таблица 5.5. Результаты измерений задержки сообщений
x , сек 0,8 1,9 3,0 3,5 3,8 2,5 1,7 0,9 1,0 2,3
y , сек 1,4 2,1 3,1 3,6 2,7 1,8 1,1 0,2 1,6 2,8

Последовательность x - отклики модели, y - данные, измеренные на центре. Проверка адекватности модели состоит в проверке нулевой гипотезы, то есть в том, что данные измерений идентичны в статистическом смысле. Решение

Составим в порядке возрастания общую последовательность времен задержек x и y (табл. 5.6).

Таблица 5.6. Общая последовательность времен задержек сообщений
y_{1} x_{1} x_{2} x_{3} y_{2} y_{3} y_{4} x_{4} y_{5} x_{5}
0,2 0,8 0,9 1,0 1,1 1,4 1,6 1,7 1,8 1,9
y_{6} x_{6} x_{7} y_{7} y_{8} x_{8} y_{9} x_{9} y_{10} x_{10}
2,1 2,3 2,5 2,7 2,8 3,0 3,1 3,5 3,6 3,8

Расчет числа инверсий для х:

\overline{u} = 1 + 1 + 1 + 4 + 5 + 6 + 6 + 8 + 9 + 10 = 51.

Расчет характеристик:

M[u]=\cfrac{10\cdot 10}{2} = 50 c,\,\,\,
D[u]= \cfrac{10\cdot 10}{12}(10+10+1) =175 c^2,\\
\sigma_u=\sqrt{175}=13.23 c

Примем уровень значимости q = 5% . Тогда t_{\alpha } = 1,96.

Правая критическая точка:

u_{2} =M[u]+t_{\alpha }\sigma _{\alpha } =50 + 1.96?13.23\approx 74 .

Левая критическая точка:

u _{1} =M[u]-t_{\alpha }\sigma _{\alpha } =50-1.96\cdot 13.23 \approx 24.

Проверка гипотезы Н_{0}:

24 < 52 < 74.

Гипотеза об идентичности распределений времен ожиданий в модели и в объекте не опровергается.

В заключение отметим, что при малых m и n ( m + n < 20 ) для критерия Вилькоксона составлены таблицы критических точек u _{1 } и u_{2} для различных уровней значимости q . Эти таблицы приводятся в широко известных изданиях, например, Б. Л. ван дер Варден "Математическая статистика", Б. В. Гнеденко и др. "Математические методы в теории надежности".

Владислав Нагорный
Владислав Нагорный

Подскажите, пожалуйста, планируете ли вы возобновление программ высшего образования? Если да, есть ли какие-то примерные сроки?

Спасибо!

Лариса Парфенова
Лариса Парфенова

1) Можно ли экстерном получить второе высшее образование "Программная инженерия" ?

2) Трудоустраиваете ли Вы выпускников?

3) Можно ли с Вашим дипломом поступить в аспирантуру?

 

Александр Колунин
Александр Колунин
Россия, Большое Сорокино, МОУ СОШ №1, 2008
Лоя Фотт
Лоя Фотт
Россия, г. Юрга