Опубликован: 16.11.2010 | Доступ: свободный | Студентов: 5154 / 2848 | Оценка: 4.43 / 4.14 | Длительность: 27:21:00
Лекция 6:

Обработка результатов имитационного эксперимента

5.8. Выявление несущественных факторов

Большое количество факторов усложняет и снижает эффективность эксперимента. Среди этого множества могут быть и несущественные факторы. Исключение их упростило бы эксперимент, не снижая его информативности.

Несущественный фактор выявляется так.

Выполняются первый эксперимент из N наблюдений с учетом проверяемого фактора и второй эксперимент также из N наблюдений - без него. В обоих случаях фиксируются отклики y. Делается предположение, что обе выборки принадлежат одной генеральной совокупности, то есть, что проверяемый фактор - несущественный (это нулевая гипотеза). Дальнейшие рассуждения должны либо не опровергнуть эту гипотезу, либо посчитать ее недостаточно обоснованной.

Итак, получены две последовательности откликов, в которой y_{i}^' и y_{i}^{''} - значения откликов в i -м наблюдении при наличии и отсутствии проверяемого фактора соответственно:

y^{'}_1,y^{'}_{2},y^{'}_{3},\ldots ,y^{'}_{i},\ldots ,y^{'}_{N};\\
y^{''}_{1}, y^{''}_{2} , y^{''}_{3},\ldots ,y^{''}_{i}:,\ldots ,y^{''}_{N}.

Согласно принятой гипотезе эти последовательности имеют одинаковые матожидания M[y] и дисперсии \sigma^{2}_{y}.

Рассмотрим случайную величину Z, реализациями которой является последовательность случайных чисел

z_{i}=y^{'}_i - y^{''}_i, i =\overline{1,N}.

При независимости z_{i} и достаточно большом числе наблюдений N согласно центральной предельной теореме:

M [\overline{z}]  =M [ z ] = 0,\,\,\, \sigma_{\overline{z}} =   \cfrac{\sigma_z}{\sqrt{N}}.

Очевидно:

\sigma_z^2=2\sigma_y^2,\,\,\,\sigma_z==\sigma_y\sqrt{2}.

Как отделить случайные отклонения \overline{z} от нуля от тех, которые мы будем считать не подтверждающими принятую гипотезу?

Такое разделение осуществляется по следующему правилу: если вычисленная величина \overline{z} окажется маловероятной, в рамках нормального распределения и данном среднеквадратическом отклонении \sigma_{z}, то такое отклонение \overline{z} от нуля считается не соответствующим принятой гипотезе.

Эту малую вероятность называют уровнем значимости и обозначают q . Обычно q = 2%, 5%, 10% - в зависимости от степени опасности совершения ошибки первого или второго рода.

На графике плотности распределения f(\overline{z}) уровень значимости q показан заштрихованным участком (рис. 5.4).

Для нормального закона распределения случайной величины \overline{z} вероятность превышения \overline{z} некоторого значения определяется известным выражением:

P\left ( | \overline{z}-0|> t_{\alpha}\cfrac{\sigma_z}{\sqrt{N}}\right ) = 1-2\Phi(t_{\alpha})

где \Phi(t _{\alpha }) - функция Лапласа.

Плотность распределения функции f(z) Следовательно:

Рис. 5.4. Плотность распределения функции f(z) Следовательно:
  • граничное значение \overline{z}=t_{\alpha}\cfrac{\sigma_z}{\sqrt{N}}
  • [1-2\Phi(t_{\alpha})]=q

Аргумент функции Лапласа t_{\alpha } находим из соответствующего справочника согласно t_{\alpha}=\Phi^{-1}\left ( \cfrac{1-q}{2}\right ) и, как было указано ранее, \sigma_z=\sigma_y\sqrt{2}

Из изложенного следует:

  • если \overline{z} > t_{\alpha}\cfrac{\sigma_y\sqrt{2}}{\sqrt{N}}, принятая гипотеза о несущественности проверяемого фактора не подтверждается;
  • если \overline{z} \le t_{\alpha}\cfrac{\sigma_y\sqrt{2}}{\sqrt{N}}, принятая гипотеза не опровергается (в рамках принятого уровня значимости q ).

Обычно величина \sigma_y неизвестна, поэтому следует использовать ее оценку S_y:

S_y=\sqrt{\cfrac{1}{N-1}\sum\limits_{i=1}^{N}{(\overline{y}-y_i)^2}}

Оценку \overline{y} и ряд значений y_{i} можно получить из данных первого эксперимента ( y_{i}^{'} ) или второго ( y_{i}^{''} ), так как в силу рассматриваемой гипотезы они идентичны. Однако следует помнить, что если N < 100, то вместо аргумента функции Лапласа t_{\alpha } надо брать t _{\alpha }^{'} - аргумент функции Стьюдента.

Пример 5.6. Исследуется зависимость времени пребывания заявки в системе массового обслуживания от дисциплины выборки заявок из очереди: LIFO или FIFO. Проведены два эксперимента. Первый эксперимент из N = 100 наблюдений с дисциплиной FIFO и второй эксперимент также из N = 100 наблюдений с дисциплиной LIFO.

Решение

Выдвигается гипотеза о несущественности влияния на время пребывания заявки в системе массового обслуживания изменения дисциплины FIFO на LIFO.

Результаты измерений и вычислений:

  • \overline{z} = 1,8мин, S_y =2мин ;
  • для уровня значимости q = 5%, t_{\alpha } = 1.96
\overline{z}_q\le t_{\alpha}\cfrac{S_y\sqrt{2}}{\sqrt{N}}=1.96\cfrac{2\cdot 1.41}{10}=0.55

Так как \overline{z} = 1.8 > \overline{z} = 0.55, то гипотеза не подтверждается. Для времени пребывания заявки в очереди в системе массового обслуживания не безразлично, какая дисциплина выборки заявок из очереди применена.

В заключение отметим, что рассмотренную проблему можно решать и методом однофакторного анализа. Однако если m = 2 (при сравнении двух выборок) целесообразно использовать изложенный метод.

Владислав Нагорный
Владислав Нагорный

Подскажите, пожалуйста, планируете ли вы возобновление программ высшего образования? Если да, есть ли какие-то примерные сроки?

Спасибо!

Лариса Парфенова
Лариса Парфенова

1) Можно ли экстерном получить второе высшее образование "Программная инженерия" ?

2) Трудоустраиваете ли Вы выпускников?

3) Можно ли с Вашим дипломом поступить в аспирантуру?