Высшее образование |
Планирование экспериментов
4.7. Точность и количество реализаций модели при определении вероятностей исходов
Мы рассматриваем случай, когда в качестве показателя эффективности выступает вероятность свершения (или не свершения) какого-либо события, например, поражения цели, выхода из строя техники, завершения комплекса работ в заданное время и др.
В качестве оценки вероятности события выступает частота его свершения:
где - число реализаций модели;
- число свершений данного события.
Использование частоты в качестве оценки искомой вероятности основано на теореме Я. Бернулли, которую в данном случае можно в формализованном виде записать так:
Точность и достоверность этой оценки связаны уже с известным определением достоверности:
Задача сводится к нахождению такого количества реализаций чтобы оценка отличалась от искомого значения менее, чем на с заданной достоверностью. Здесь, как и ранее, - абсолютное значение, характеризующее точность оценки.
Для нахождения функциональной связи между точностью, достоверностью и числом реализаций модели введем переменную - результат исхода -й реализации модели:
Тогда частота свершения события (оценка искомой вероятности) будет определяться следующим выражением:
Величина - случайная и дискретная. Она при таком задании имеет биномиальное распределение (распределение Бернулли) с характеристиками:
- матожидание
- дисперсия
Из этого следует:
В теории вероятностей есть теорема Лапласа (частный случай центральной предельной теоремы), сущность которой состоит в том, что при больших значениях числа реализаций биномиальное распределение достаточно хорошо согласуется с нормальным распределением.
Следовательно, можно записать:
Следуя рассуждениям, приведенным ранее, получим искомые формулы:
Как и ранее, - аргумент функции Лапласа,
Если априорные сведения хотя бы о порядке искомой вероятности неизвестны, то использование значения абсолютной ошибки может не иметь смысла. Например, может быть так, что исследователь задал значение абсолютной ошибки , а искомое значение вероятности оказалось . Очевидно, явное несоответствие. Поэтому целесообразно оперировать относительной погрешностью:
В этом случае формулы (4.5) принимают вид:
Из формул (4.6) следует, что при определении оценок малых вероятностей с приемлемо высокой точностью необходимо выполнить очень большое число реализаций модели. При отсутствии высокопроизводительного компьютера применение статистического моделирования становится проблематичным.
Определить число реализаций модели и затраты машинного времени для оценки данной вероятности с относительной точностью и достоверностью На выполнение одной реализации модели требуется 5 сек.
Решение
Из табл. 4.3 находим . Относительная точность .
Если на выполнение одной реализации требуется 5 сек, то затраты машинного времени составят
В формулах (4.5) и (4.6) для вычисления или присутствует та же неопределенность, которую мы обсуждали ранее: вычисления требуют знания вероятности , а она до эксперимента неизвестна. Эта неопределенность снимается так.
Выполняется предварительно прогонов модели. Обычно По данным этих прогонов вычисляют ориентировочное значение оценки вероятности , которую и подставляют в формулу вместо вероятности .
Если окажется , моделирование следует продолжить до выполнения реализаций.
Если окажется то моделирование заканчивается. При этом если то следует определить действительную точность или для реализаций. Очевидно, в этом случае достигнутая точность будет выше заданной (ошибка меньше заданной)
Но более удобно рассчитывать число реализаций на так называемый наихудший случай.
Вернемся к формуле (4.5)
Анализ формулы показывает, что число реализаций модели в зависимости от вероятности изменяется от (при ) до (при ), проходя через максимум. Максимальное значение принимает при :
То есть наибольшее число реализаций модели будет тогда, когда искомая вероятность равна .
В этом случае число реализаций определяется так:
Если в результате моделирования окажется, что искомая вероятность значительно отличается от 0,5 (в любую сторону), то точность моделирования будет выше заданной (ошибка меньше). Для определения этой точности следует воспользоваться уже известной формулой (4.5), но при
Пример 4.7. Сервер обрабатывает запросы, поступающие с автоматизированных рабочих мест (АРМ) с интервалами, распределенными по экспоненциальному закону со средним значением Вычислительная сложность запросов распределена по нормальному закону с математическим ожиданием и среднеквадратическим отклонением Производительность сервера по обработке запросов
Построить алгоритм имитационной модели с целью определения вероятности обработки запросов за время Исследовать зависимость вероятности обработки запросов от интервалов их поступления, вычислительной сложности и производительности сервера.
Решение
Для построения алгоритма имитационной модели введем следующие идентификаторы:
- текущее время поступления запроса;
- интервал поступления запросов;
- текущее время окончания обработки запроса;
- время обработки запроса;
- счетчик количества прогонов модели (реализаций);
- вероятность обработки запросов;
- счетчик количества обработанных запросов;
- заданное количество прогонов модели (реализаций);
- количество запросов за прогонов модели;
- время моделирования.
Алгоритм модели приведен на рис. 4.2.
Выберем интервалы варьирования уровней факторов.
- средний интервал поступления запросов.
Для изменения математического ожидания и среднеквадрати-ческого отклонения целесообразно ввести коэффициент, принимающий два значения, например, и . Тогда , , - производительность сервера.
В соответствии с интервалами варьирования представим уровни факторов таблицей (табл. 4.5). В табл. 4.5 индексы н и в - нижний и верхний уровни факторов соответственно.
Составим план факторного эксперимента:
№ | |||||
---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 |
1 | -1 | -1 | -1 | 0.375 | 0.375 |
2 | -1 | -1 | +1 | 0.584 | 0.583 |
3 | -1 | +1 | -1 | 0.166 | 0.167 |
4 | -1 | +1 | +1 | 0.32 | 0.319 |
5 | +1 | -1 | -1 | 0.64 | 0.642 |
6 | +1 | -1 | +1 | 0.809 | 0.808 |
7 | +1 | +1 | -1 | 0.376 | 0.375 |
Проведем эксперимент. Выполним первое наблюдение при прогонов модели. Получим вероятность обработки запросов . Занесем ее в табл. 4.5 (строка 1, столбец 5) Зададимся точностью и доверительной вероятностью . По таблице значений функции Лапласа найдем ее аргумент (см. табл. 4.3).
Рассчитаем требуемое количество прогонов модели при и :
При расчете числа прогонов для "худшего случая" (а такой вариант возможен, так как в табл. 4.6 мы видим, что есть ) получим: