НОУ ИНТУИТ | Компьютерное моделирование. Лекция 5: Планирование экспериментов

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Опубликован: 16.11.2010 | Доступ: свободный | Студентов: 5203 / 2886 | Оценка: 4.43 / 4.14 | Длительность: 27:21:00

Темы: Программирование, Алгоритмы и дискретные структуры

Специальности: Программист, Системный архитектор

|

Вам нравится? Нравится 50 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

4.6. Точность и количество реализаций модели при определении средних значений параметров

Найдем функциональную связь точности е и достоверности а с количеством реализаций модели, когда в качестве показателей эффективности выступают матожидание и дисперсия некоторой случайной величины (времени, расстояния и т. п.).

4.6.1. Определение оценки матожидания

Найдем искомую связь для случая, когда целью эксперимента является определение оценки матожидания некоторой случайной величины.

В прогонах модели получены независимые значения интересующего нас показателя эффективности:

$a _{1}, a _{2}, \ldots, a_{i}, \ldots, a_{N} .$

В качестве оценки матожидания возьмем выборочное среднее (среднее арифметическое):

$\overline{a}=\cfrac{\sum\limits_{i=1}^{N}{a_i}}{N}$

В последующей теме мы покажем, что оценка такого вида является наилучшей.

Согласно центральной предельной теореме, если значения $a_{i }$ независимы и имеют конечные дисперсии одного порядка, то при большом числе слагаемых случайная величина $\overline{a}$ имеет практически нормальное распределение с матожиданием и дисперсией соответственно:

$M[\overline{a}]=M[a],\,\sigma_{\overline{a}}^2=\cfrac{\sigma_{a}^2}{N},\,\, \sigma_{\overline{a}}=\cfrac{\sigma_{a}}{\sqrt{N}}$

где $\sigma_{a}^2$ - дисперсия искомой случайной величины

Следовательно, справедливо

$P(|\overline{a}-M[a]|< t_a\sigma_{\overline{a}}) = \Phi^*(t_{\alpha}),$

где $\Phi^*(t_{\alpha}) = \cfrac{2}{\sqrt{2\pi}}\int\limits_{0}^{t_{\alpha}}{e^{-\frac{z^2}{2}}dz}$ - интеграл вероятности.

В некоторых изданиях под интегралом вероятности понимают несколько иное выражение, поэтому целесообразно пользоваться интегралом Лапласа, который связан с интегралом вероятности

так: $\Phi^{*}(t _{\alpha }) = 2\Phi(t _{\alpha })$ . $\Phi(t _{\alpha })$ - интеграл Лапласа. Из приведенного следует:

$P(|\overline{a}-M[a]|< t_a\sigma_{\overline{a}}) = 2\Phi(t_{\alpha}),$

Сравнивая это выражение с выражением (4.1), имеем:

$\varepsilon = t_{\alpha}\sigma_{\overline{a}}= t_{\alpha}\cfrac{\sigma_{\alpha}}{\sqrt{N}}=\alpha,\,\, t_{\alpha}=\Phi^{-1}\left (\cfrac{\alpha}{2}\right )$

Интеграл Лапласа табулирован, следовательно, задаваясь значением достоверности $\alpha$ , определяется аргумент $t_{\alpha }$ .

Итак, искомая связь между точностью $\varepsilon$ , достоверностью $\alpha$ и числом реализаций модели получена:

$\varepsilon = t_{\alpha }\cfrac{\sigma_{\alpha}}{\sqrt{N}},\,\, N = t^{2}_{\alpha } \cfrac{\sigma_{\alpha}^2}{\varepsilon^2} .$

Из выражений (4.2) следует:

увеличение точности на порядок (уменьшение ошибки на порядок) потребует увеличения числа реализаций на два порядка;
число необходимых реализаций модели не зависит от величины искомого параметра а от дисперсии $\sigma_{a}^{2}.$

Достоверность результата $\alpha$ указана значением аргумента функции Лапласа $t_{\alpha }$ . Связь значения $t_{\alpha }$ с $\alpha$ находится из таблицы значений функции (интеграла) Лапласа. Наиболее употребительные соответствия $t_{\alpha }$ и $\alpha$ приведены в табл. 4.3.

Таблица 4.3. Фрагмент таблицы функции (интеграла) Лапласа
$\alpha$	0.8	0.85	0.9	0.95	0.99	0.995	0.999
$t_{\alpha}$	1.28	1.44	1.65	1.96	2.58	2.81	3.30

Чтобы пользоваться формулами (4.2), нужно знать дисперсию $\sigma^{2}_{a}$ . Очень редки случаи, когда значение дисперсии известно до эксперимента, поэтому возможны два способа предварительного определения дисперсии.

Первый способ. Иногда заранее известен размах значений искомой случайной величины:

$R = \max {a_{i}} -\min{a_i}.$

В предположении нормального распределения случайной величины , можно с использованием "правила трех сигм" получить приближенную оценку $\sigma_{\alpha}$ :

$\cfrac{R}{2}\approx 3\sigma_{a},\,\, \sigma_a\approx \cfrac{R}{6},\,\, \sigma_a^2\approx \cfrac{R^2}{36}$

Второй способ. Надо воспользоваться оценкой дисперсии. Для этого необходимо выполнить предварительный прогон модели в количестве N = 1000 реализаций. С использованием полученного ряда $a_{i} , i =\overline{1, N}$ , найдем оценку дисперсии:

$S_{\alpha}^2=\cfrac{1}{N^{*}-1}\sum\limits_{i-1}^N{(a_i-\overline{a})^2},\,\, S=\sqrt{\cfrac{1}{N^{*}-1}\sum\limits_{i-1}^N{(a_i-\overline{a})^2}}$

Здесь $\overline{a}$ - среднеарифметическое значение по $N^{*}$ измерениям. И в этом случае формулы (4.2) имеют вид:

$N=t_{\alpha}^2\cfrac{S^2_{a}}{\varepsilon^2},\,\, \varepsilon=t_{\alpha}\cfrac{S_a}{\sqrt{N}}$

Вычисленную дисперсию $S^{2}_a$ подставим в формулу для определения . Если окажется N > N^*, то моделирование должно быть продолжено до выполнения реализаций. Если же $N \le N^*$ , то моделирование заканчивается. Необходимая точность $\varepsilon$ оценки случайной величины (искомого показателя эффективности) при заданной достоверности $\alpha$ достигнута.

Если в технических условиях задана относительная точность $d=\cfrac{\varepsilon}{\overline{a}}$ , то формулы (4.3) принимают вид:

$N=t_{\alpha}^2\cfrac{S^2_{a}}{d^2\overline{a}^2},\,\, d=t_{\alpha}\cfrac{S_a}{\overline{a}\sqrt{N}}$

Значение $\overline{a}$ определяется на основании N = 1000 прогонов модели. Все дальнейшие расчеты аналогичны только что рассмотренным аналитическим выражениям.

Вышеприведенные рассуждения и выражения были справедливы в предположении нормального закона распределения случайной величины . Если в этом есть сомнение, то для определения связи $\varepsilon$ , $\alpha$ и можно воспользоваться неравенством Чебышева П. Ф.:

$P(|\overline{a}-M[a]|\ge \varepsilon) \le \cfrac{\sigma^2_{\alpha}}{N\sigma^2}$

С учетом направления знаков неравенств получим:

$\cfrac{\sigma^2_{\alpha}}{N\sigma^2}=1-\alpha \Rightarrow N = \cfrac{\sigma^2_{\alpha}}{\varepsilon^2(1-\alpha)} \Rightarrow \varepsilon =\sqrt{\cfrac{\sigma^2_{\alpha}}{N(1-\alpha)}}$

Также как и в предыдущих случаях вместо неизвестной дисперсии $\sigma^{2}_{a}$ следует использовать ее оценку $S^{2}_a$ , вычисленную по данным N^* прогонов модели. И еще: обратим внимание, что в данном случае достоверность $\alpha$ участвует в формулах в явном виде.

Итак, в выражениях (4.3) мы вместо неизвестной дисперсии $\sigma_{а}^{2}$ используем ее оценку $S^{2}_a$ . В этом случае вместо аргумента функции Лапласа $t_{\alpha}$ надо использовать параметр распределения Стьюдента $t^*_{\alpha}$ , значения которого зависят не только от уровня достоверности $\аlpha$ , но и от числа так называемых степеней свободы k = N -1 . Здесь, как и прежде, - число прогонов модели. Вообще-то, при $N \to\infty$ распределение Стьюдента стремится к нормальному распределению, но при малом числе прогонов модели $t^*_{\alpha}$ заметно отличается от $t_{\alpha}$ .

Для практических целей значения $t^*_{\alpha}$ можно взять из табл. 4.4.

Из табл. 4.4 видно, что при k = N-1> 120 значения $t^*_{\alpha}$ и $t_{\alpha}$ практически совпадают. Но при меньших значениях следует пользоваться величиной $t^*_{\alpha}$ .

Таблица 4.4. Таблица значений t_{a}
	$\alpha$
	0.8	0.9	0.95	0.99	0.999
10	1.37	1.81	2.23	3.17	4.6
20	1.33	1.73	2.1	2.85	3.73
30	1.31	1.7	2.04	2.75	3.65
40	1.3	1.68	2.02	2.7	3.55
60	1.3	1.67	2.0	2.67	3.41
120	1.29	1.66	1.98	2.62	3.37

4.6.2. Определение оценки дисперсии

Мы научились находить оценку матожидания $\overline{a}$ некоторой случайной величины с заданными точностью и достоверностью.

Теперь рассмотрим задачу определения оценки дисперсии S^2 случайной величины также с заданными точностью и достоверностью.

Опустим вывод и приведем окончательный вид формул для расчета и $\varepsilon$ :

$N=t_{\alpha}^2\cfrac{(\mu_4-\sigma^4)}{\varepsilon^2};\,\, \varepsilon=t_{\alpha}\sqrt{\cfrac{(\mu_4-\sigma^4)}{\varepsilon^2}}$

где $\mu_{4}$ - эмпирический центральный момент четвертого порядка:

$\mu_4=\cfrac{1}{N}\sum\limits_{i=1}^{N}{(a_i - \overline{a})^4}$

Неизвестное значение $\sigma$ заменяется оценкой , как было рассмотрено ранее.

Если определяемая случайная величина имеет нормальное распределение, то $\mu_{4} = 3\sigmа^{4}\approx 3S^{4}$ и выражения для и $\varepsilon$ принимают вид:

$N=t_{\alpha}^2\cfrac{2S^4}{\varepsilon^2};\,\, \varepsilon=t_{\alpha}\cfrac{S^2\sqrt{2}}{\sqrt{N}}$

Как и ранее при малых значениях ( N < 120 ) следует использовать параметр распределения Стьюдента $t^*_{\alpha}$ .

Из сопоставления (4.3) и (4.4) следует, что одно и то же количество реализаций модели обеспечит разное значение ошибки $\varepsilon$ при оценке матожидания случайной величины и ее дисперсии - при одинаковой достоверности. И иначе: одинаковую точность определения оценок матожидания и дисперсии случайного параметра при одинаковой достоверности обеспечит разное число реализаций модели.

Пример 4.5. В результате предварительных прогонов модели N =1000 определена оценка дисперсии $S^{2} = 10 ед^{2}$ .

Определить число реализаций модели $N_{1}$ и $N_{2}$ для определения оценок матожидания и дисперсии случайной величины соответственно с точностью $\varepsilon = 0,1$ и достоверностью $\аlpha = 0.9.$

Решение

$N_1=t_{\alpha}^2\cfrac{S^2}{\varepsilon^2}=1.65^2\cfrac{10}{0.1^2}\approx 2720 \\ N_2=t_{\alpha}^2\cfrac{2S^4}{\varepsilon^2}=1.65^2\cfrac{200}{0.1^2}\approx 54450 \\$

Дальше >>

Авторизоваться

Компьютерное моделирование

Планирование экспериментов

4.6. Точность и количество реализаций модели при определении средних значений параметров

4.6.1. Определение оценки матожидания

4.6.2. Определение оценки дисперсии

Вопросы и ответы