Опубликован: 16.11.2010 | Уровень: специалист | Доступ: свободно
Лекция 5:

Планирование экспериментов

< Лекция 4 || Лекция 5: 12345 || Лекция 6 >

4.6. Точность и количество реализаций модели при определении средних значений параметров

Найдем функциональную связь точности е и достоверности а с количеством реализаций модели, когда в качестве показателей эффективности выступают матожидание и дисперсия некоторой случайной величины (времени, расстояния и т. п.).

4.6.1. Определение оценки матожидания

Найдем искомую связь для случая, когда целью эксперимента является определение оценки матожидания некоторой случайной величины.

В N прогонах модели получены независимые значения интересующего нас показателя эффективности:

a _{1}, a _{2}, \ldots, a_{i}, \ldots, a_{N} .

В качестве оценки матожидания возьмем выборочное среднее (среднее арифметическое):

\overline{a}=\cfrac{\sum\limits_{i=1}^{N}{a_i}}{N}

В последующей теме мы покажем, что оценка такого вида является наилучшей.

Согласно центральной предельной теореме, если значения a_{i } независимы и имеют конечные дисперсии одного порядка, то при большом числе слагаемых N случайная величина \overline{a} имеет практически нормальное распределение с матожиданием и дисперсией соответственно:

M[\overline{a}]=M[a],\,\sigma_{\overline{a}}^2=\cfrac{\sigma_{a}^2}{N},\,\,
\sigma_{\overline{a}}=\cfrac{\sigma_{a}}{\sqrt{N}}

где \sigma_{a}^2 - дисперсия искомой случайной величины a.

Следовательно, справедливо

P(|\overline{a}-M[a]|< t_a\sigma_{\overline{a}}) = \Phi^*(t_{\alpha}),

где \Phi^*(t_{\alpha}) = \cfrac{2}{\sqrt{2\pi}}\int\limits_{0}^{t_{\alpha}}{e^{-\frac{z^2}{2}}dz} - интеграл вероятности.

В некоторых изданиях под интегралом вероятности понимают несколько иное выражение, поэтому целесообразно пользоваться интегралом Лапласа, который связан с интегралом вероятности

так: \Phi^{*}(t _{\alpha }) = 2\Phi(t _{\alpha }). \Phi(t _{\alpha }) - интеграл Лапласа. Из приведенного следует:

P(|\overline{a}-M[a]|< t_a\sigma_{\overline{a}}) = 2\Phi(t_{\alpha}),

Сравнивая это выражение с выражением (4.1), имеем:

\varepsilon = t_{\alpha}\sigma_{\overline{a}}= t_{\alpha}\cfrac{\sigma_{\alpha}}{\sqrt{N}}=\alpha,\,\,
t_{\alpha}=\Phi^{-1}\left (\cfrac{\alpha}{2}\right )

Интеграл Лапласа табулирован, следовательно, задаваясь значением достоверности \alpha , определяется аргумент t_{\alpha }.

Итак, искомая связь между точностью \varepsilon , достоверностью \alpha и числом реализаций модели получена:

\varepsilon = t_{\alpha }\cfrac{\sigma_{\alpha}}{\sqrt{N}},\,\,
N = t^{2}_{\alpha } \cfrac{\sigma_{\alpha}^2}{\varepsilon^2} .

Из выражений (4.2) следует:

  • увеличение точности на порядок (уменьшение ошибки на порядок) потребует увеличения числа реализаций на два порядка;
  • число необходимых реализаций модели N не зависит от величины искомого параметра a, а от дисперсии \sigma_{a}^{2}.

Достоверность результата \alpha указана значением аргумента функции Лапласа t_{\alpha }. Связь значения t_{\alpha } с \alpha находится из таблицы значений функции (интеграла) Лапласа. Наиболее употребительные соответствия t_{\alpha } и \alpha приведены в табл. 4.3.

Таблица 4.3. Фрагмент таблицы функции (интеграла) Лапласа
\alpha 0.8 0.85 0.9 0.95 0.99 0.995 0.999
t_{\alpha} 1.28 1.44 1.65 1.96 2.58 2.81 3.30

Чтобы пользоваться формулами (4.2), нужно знать дисперсию \sigma^{2}_{a}. Очень редки случаи, когда значение дисперсии известно до эксперимента, поэтому возможны два способа предварительного определения дисперсии.

Первый способ. Иногда заранее известен размах значений искомой случайной величины:

R = \max {a_{i}} -\min{a_i}.

В предположении нормального распределения случайной величины a, можно с использованием "правила трех сигм" получить приближенную оценку \sigma_{\alpha}:

\cfrac{R}{2}\approx 3\sigma_{a},\,\,
\sigma_a\approx \cfrac{R}{6},\,\,
\sigma_a^2\approx \cfrac{R^2}{36}

Второй способ. Надо воспользоваться оценкой дисперсии. Для этого необходимо выполнить предварительный прогон модели в количестве N = 1000 реализаций. С использованием полученного ряда a_{i} , i =\overline{1, N}, найдем оценку дисперсии:

S_{\alpha}^2=\cfrac{1}{N^{*}-1}\sum\limits_{i-1}^N{(a_i-\overline{a})^2},\,\,
S=\sqrt{\cfrac{1}{N^{*}-1}\sum\limits_{i-1}^N{(a_i-\overline{a})^2}}

Здесь \overline{a} - среднеарифметическое значение по N^{*} измерениям. И в этом случае формулы (4.2) имеют вид:

N=t_{\alpha}^2\cfrac{S^2_{a}}{\varepsilon^2},\,\,
\varepsilon=t_{\alpha}\cfrac{S_a}{\sqrt{N}}

Вычисленную дисперсию S^{2}_a подставим в формулу для определения N. Если окажется N > N^*, то моделирование должно быть продолжено до выполнения N реализаций. Если же N \le N^*, то моделирование заканчивается. Необходимая точность \varepsilon оценки случайной величины a (искомого показателя эффективности) при заданной достоверности \alpha достигнута.

Если в технических условиях задана относительная точность d=\cfrac{\varepsilon}{\overline{a}}, то формулы (4.3) принимают вид:

N=t_{\alpha}^2\cfrac{S^2_{a}}{d^2\overline{a}^2},\,\,
d=t_{\alpha}\cfrac{S_a}{\overline{a}\sqrt{N}}

Значение \overline{a} определяется на основании N = 1000 прогонов модели. Все дальнейшие расчеты аналогичны только что рассмотренным аналитическим выражениям.

Вышеприведенные рассуждения и выражения были справедливы в предположении нормального закона распределения случайной величины a . Если в этом есть сомнение, то для определения связи \varepsilon, \alpha и N можно воспользоваться неравенством Чебышева П. Ф.:

P(|\overline{a}-M[a]|\ge \varepsilon) \le \cfrac{\sigma^2_{\alpha}}{N\sigma^2}

С учетом направления знаков неравенств получим:

\cfrac{\sigma^2_{\alpha}}{N\sigma^2}=1-\alpha
\Rightarrow
N = \cfrac{\sigma^2_{\alpha}}{\varepsilon^2(1-\alpha)}
\Rightarrow
\varepsilon =\sqrt{\cfrac{\sigma^2_{\alpha}}{N(1-\alpha)}}

Также как и в предыдущих случаях вместо неизвестной дисперсии \sigma^{2}_{a} следует использовать ее оценку S^{2}_a, вычисленную по данным N^* прогонов модели. И еще: обратим внимание, что в данном случае достоверность \alpha участвует в формулах в явном виде.

Итак, в выражениях (4.3) мы вместо неизвестной дисперсии \sigma_{а}^{2} используем ее оценку S^{2}_a. В этом случае вместо аргумента функции Лапласа t_{\alpha} надо использовать параметр распределения Стьюдента t^*_{\alpha}, значения которого зависят не только от уровня достоверности \аlpha, но и от числа так называемых степеней свободы k = N -1. Здесь, как и прежде, N - число прогонов модели. Вообще-то, при N \to\infty распределение Стьюдента стремится к нормальному распределению, но при малом числе прогонов модели t^*_{\alpha} заметно отличается от t_{\alpha}.

Для практических целей значения t^*_{\alpha} можно взять из табл. 4.4.

Из табл. 4.4 видно, что при k = N-1> 120 значения t^*_{\alpha} и t_{\alpha} практически совпадают. Но при меньших значениях N следует пользоваться величиной t^*_{\alpha}.

Таблица 4.4. Таблица значений t_{a}
k \alpha
0.8 0.9 0.95 0.99 0.999
10 1.37 1.81 2.23 3.17 4.6
20 1.33 1.73 2.1 2.85 3.73
30 1.31 1.7 2.04 2.75 3.65
40 1.3 1.68 2.02 2.7 3.55
60 1.3 1.67 2.0 2.67 3.41
120 1.29 1.66 1.98 2.62 3.37

4.6.2. Определение оценки дисперсии

Мы научились находить оценку матожидания \overline{a} некоторой случайной величины a с заданными точностью и достоверностью.

Теперь рассмотрим задачу определения оценки дисперсии S^2 случайной величины a также с заданными точностью и достоверностью.

Опустим вывод и приведем окончательный вид формул для расчета N и \varepsilon:

N=t_{\alpha}^2\cfrac{(\mu_4-\sigma^4)}{\varepsilon^2};\,\,
\varepsilon=t_{\alpha}\sqrt{\cfrac{(\mu_4-\sigma^4)}{\varepsilon^2}}

где \mu_{4} - эмпирический центральный момент четвертого порядка:

\mu_4=\cfrac{1}{N}\sum\limits_{i=1}^{N}{(a_i - \overline{a})^4}

Неизвестное значение \sigma заменяется оценкой S, как было рассмотрено ранее.

Если определяемая случайная величина имеет нормальное распределение, то \mu_{4} = 3\sigmа^{4}\approx 3S^{4} и выражения для N и \varepsilon принимают вид:

N=t_{\alpha}^2\cfrac{2S^4}{\varepsilon^2};\,\,
\varepsilon=t_{\alpha}\cfrac{S^2\sqrt{2}}{\sqrt{N}}

Как и ранее при малых значениях N ( N < 120 ) следует использовать параметр распределения Стьюдента t^*_{\alpha}.

Из сопоставления (4.3) и (4.4) следует, что одно и то же количество реализаций модели обеспечит разное значение ошибки \varepsilon при оценке матожидания случайной величины a и ее дисперсии - при одинаковой достоверности. И иначе: одинаковую точность определения оценок матожидания и дисперсии случайного параметра при одинаковой достоверности обеспечит разное число реализаций модели.

Пример 4.5. В результате предварительных прогонов модели N =1000 определена оценка дисперсии S^{2} = 10 ед^{2}.

Определить число реализаций модели N_{1} и N_{2} для определения оценок матожидания и дисперсии случайной величины a соответственно с точностью \varepsilon = 0,1 и достоверностью \аlpha = 0.9.

Решение

N_1=t_{\alpha}^2\cfrac{S^2}{\varepsilon^2}=1.65^2\cfrac{10}{0.1^2}\approx 2720 \\
N_2=t_{\alpha}^2\cfrac{2S^4}{\varepsilon^2}=1.65^2\cfrac{200}{0.1^2}\approx 54450 \\
< Лекция 4 || Лекция 5: 12345 || Лекция 6 >
Владислав Нагорный
Владислав Нагорный
Высшее образование
Лариса Парфенова
Лариса Парфенова
Экстерн
Петр Гончар-Зайкин
Петр Гончар-Зайкин
Россия
Борис Борисов
Борис Борисов
Казахстан, Алматы, Казахский государственный университет, 1983