Опубликован: 16.11.2010 | Уровень: специалист | Доступ: свободно
Лекция 5:

Планирование экспериментов

< Лекция 4 || Лекция 5: 12345 || Лекция 6 >

4.8. Точность и количество реализаций модели при зависимом ряде данных

До сих пор мы предполагали, что выходные данные модели образуют ряд значений a_{i}, статистически независимых и принадлежащих одному закону распределения. Однако это не всегда так.

Пусть, например, целью статистического моделирования будет определение матожидания времени пребывания заявки в очереди \overline{t}_{ож} одноканальной системы массового обслуживания.

В результате эксперимента с моделью будет получен ряд значений t_{ож i}, i = \overline{1,N}, которые заведомо статистически зависимы:

при большом времени ожидания k -й заявки значение t_{ож}_{k+1}, не может быть малым, если обе заявки находились одновременно в очереди. Связь точности оценки \varepsilon, среднего времени ожидания \overline{t}_{ож} с количеством реализаций N в этом случае выглядит иначе, чем было рассмотрено ранее. Мы рассмотрим метод определения точности и количества реализаций для статистически зависимых последовательностей - откликов модели, в основе которого лежит так называемый регенеративный анализ.

Допустим, что в результате эксперимента с имитационной моделью получен ряд значений t_{ожi}, приведенный в табл. 4.7.

Здесь i - порядковый номер поступающих заявок.

Таблица 4.7. Результаты эксперимента - время ожидания заявки в очереди
i 1 2 3 4 5 6 7 8 9 10 11
\overline{t}_{ож} 0 5 7 0 3 0 3 9 11 2 0

Обратим внимание на то, что заявка 1 застает канал обслуживания свободным: ее время ожидания в очереди равно нулю. Такая же ситуация возникла для заявок 4, 6 и 11. Период занятости и простоя канала обслуживания образуют цикл его работы. В табл. 4.7 можно выделить три таких цикла, в которые входят следующие наборы обслуженных заявок:

  • цикл 1 - заявки 1, 2, 3;
  • цикл 2 - заявки 4, 5;
  • цикл 3 - заявки 6, 7, 8, 9, 10.

Заявка 11 является началом нового цикла 4 и т. д.

Начала каждого цикла неотличимы друг от друга - заявка поступает на обслуживание без ожидания. Говорят так: система восстанавливается (регенерируется) к началу каждого цикла, следовательно, поведение системы в очередном цикле не зависит от ее поведения в предыдущих циклах.

Введем обозначения:

\Theta _{k} - сумма времен ожидания k -го цикла, k =\overline{1,n} ;

q_{k} - количество заявок, образующих k -й цикл. Для данных, приведенных в табл. 4.5:

\Theta_1=0+5+7=12,\,\,
\Theta_2=0+3=3,\,\,
\Theta_3=0+3+9+11+2=25,\ldots\\
q_1=3,\,\,q_2=2,\,\,q_3=5,\,\,\ldots

Таким образом, мы получили пары чисел - независимых и одинаково распределенных:

(\Theta_1,q_1), (\Theta_2,q_2), (\Theta_3,q_3).

Заметим, что числа \Theta _{k} и q_{k} между собой зависимы.

Целью дальнейших рассуждений является определение оценки

матожидания времени пребывания заявки в очереди \overline{t}_{ож}, отличающееся от M [t_{ож}] на величину не более \varepsilon при заданной достоверности \alpha . Так как

\sum\limits_{i=1}^{N}{t_{ожi}}=
\sum\limits_{k=1}^{n}{\Theta_k},\,\,
N=\sum\limits_{k=1}^{n}{q_k},

где n - число циклов, то оценка матожидания времени пребывания заявки в очереди определяется так:

\overline{t}_{ож}=\cfrac{\sum\limits_{i=1}^{N}{t_{ожi}}}{N}=
\cfrac{\sum\limits_{k=1}^{n}{\Theta_k}}{\sum\limits_{k=1}^{n}{q_k}}

Разделим числитель и знаменатель на число циклов N и получим:

\overline{t}_{ож}=\cfrac{\cfrac {\sum\limits_{k=1}^{n}{\Theta_k}}{n}}{\cfrac {\sum\limits_{k=1}^{n}{q_k}}{n}} = \cfrac{\overline{\Theta}}{\overline{q}}

В соответствии с центральной предельной теоремой оценка длительности цикла \overline{\Theta} при числе циклов n\to\infty есть случайная величина, распределенная по нормальному закону с математическим ожиданием и дисперсией соответственно:

M[\overline{\Theta}]=M[\Theta], \sigma_{\overline{\Theta}}^{2}=\cfrac{\sigma^2}{n}

где \sigma^{2} - дисперсия, представляющая собой сумму дисперсий зависимых между собой случайных величин {\Theta} и q .

Следовательно, имеет место уже знакомое нам выражение

P\left ( |\overline{\Theta}-M[{\Theta}]| < t_{\sigma}\cfrac{\sigma}{\sqrt{n}} \right ) =
2\Phi (t_{sigma})

Если \varepsilon - граничное значение ошибки для оценки \overline{t}_{ож}, то очевидно граничное значение ошибки для оценки \overline{\Theta} равно \varepsilon\overline{q}.

Тогда t_{\alpha}\cfrac{\sigma}{\sqrt{n}} = \varepsilon\overline{q}. Из этого следует:

Коэффициент t_{\alpha}, как и ранее, характеризует достоверность оценки \overline{t}_{ож} и является аргументом функции Лапласа:

t_{\alpha}=\Phi^{-1}\left ( \cfrac{\alpha}{2} \right )

Значения \sigma^2 и \overline{q} до эксперимента неизвестны. Их ориентировочные значения должны быть определены по данным предварительных прогонов модели в количестве n^* реализаций циклов. Обычно n^* =50\ldots100.

Оценку дисперсии \sigma^{2} обозначим S^{2}. Она вычисляется так:

S^{2}= S^{2}_{\Theta} - 2 \overline{t}_{ож}r_{\Theta,q} +t^2_{ож}S_q^2

Здесь:

S_{\Theta}^2=\cfrac{1}{n^*-1}\sum\limits_{k=1}^{n^*}{(\Theta_k-\overline{\Theta})^2} - оценка дисперсии \Theta ;

S_{q}^2=\cfrac{1}{n^*-1}\sum\limits_{k=1}^{n^*}{(q_k-\overline{q})^2} - оценка дисперсии q ;

r_{\Theta,q}=\cfrac{1}{n^*-1}\sum\limits_{k=1}^{n^*}{(q_k-\overline{q})(\Theta_k-\overline{\Theta})} - корреляционный момент случайных величин \Theta и q ;

\overline{\Theta}=\cfrac{\sum\limits_{k=1}^{n^*}{\Theta_k}}{n^*},\,\,
\overline{q}=\cfrac{\sum\limits_{k=1}^{n^*}{q_k}}{n^*},\,\,
\overline{t}_{ож}=\cfrac{\overline{\Theta}}{\overline{q}}

И, наконец, необходимое число циклов будет определено:

n = t_{\alpha}^2\cfrac{S^2}{\varepsilon^2\overline{q}^2}.

Если окажется n > n^* , то моделирование продолжается до достижения n циклов. Если же окажется n\le n^*, то моделирование заканчивается и, если необходимо, дается оценка достигнутой точности.

Признак конца моделирования: n = n_{зад} или количество обслуженных СМО заявок n = N_{зад} =n _{зад}\cdot \overline{q}.

4.9. Проблема начальных условий

К тактическому планированию эксперимента относится и решение так называемой проблемы начальных условий.

В отличие от реальной системы модель работает прогонами - для накопления нужной статистики. Поэтому при каждом новом прогоне модели требуется какое-то время, чтобы установился стационарный режим, характеристики которого интересуют исследователя.

То есть начальные условия искажают характеристики стационарного режима.

Например, моделируется функционирование направления связи. В установившемся режиме входной буфер направления имеет среднее заполнение поступившими, но не обработанными пока сообщениями. Но перед каждым очередным прогоном в модели устанавливаются нулевые начальные условия.

Или еще: вероятность обслуживания заявки в СМО имеет какое-то стационарное значение. Но в начальный момент эта вероятность равна нулю.

Следовательно, начальные установки регистрируемого параметра (показателя эффективности и др.) искажают результат.

Для устранения ошибок, вызываемых не соответствующей установкой начальных условий, возможно применение следующих мер:

  1. Ставить начальные условия, близкие значениям стационарного режима, то есть модель разрабатывается так, что условия функционирования системы типичны с самого начала.
  2. Увеличить интервал исследования ( 0\ldotsT ) так, чтобы он стал значительно больше предполагаемого времени установления стационарного режима.
  3. Отбросить информацию, снимаемую в промежутке времени от пуска ( t =0 ) до установившихся стационарных значений, и продолжить моделирование, собирая статистику, на которую уже не влияют нетипичные ситуации.

Первый подход требует от разработчика знания типичных условий работы и умения внести в модель эти условия. В моделях сложных систем это вряд ли выполнимо.

При втором подходе требуется слишком долгое моделирование до наступления такого состояния, когда исчезает влияние собранных неверных данных. Стоимость такого моделирования для сложных систем может оказаться слишком высокой, что делает этот подход нежелательным.

Третий подход оказывается наиболее удобным. Нужно на определенной стадии моделирования отбросить статистику с последующим продолжением моделирования без каких-либо модификаций модели. Такой подход используется в ряде систем моделирования. Заметим, однако, что время установки стационарных значений в модели трудно определить до эксперимента.

Все эти приемы могут уменьшить влияние переходных процессов в модели на результаты эксперимента, однако свести его к нулю не могут.

Вопросы для самоконтроля

  1. Что понимается под компьютерным экспериментом?
  2. Каковы цели планирования экспериментов?
  3. Что такое стратегическое и тактическое планирование?
  4. Что понимается под кибернетическим представлением эксперимента?
  5. Что такое реакция или отклик системы?
  6. Что такое факторы и уровни факторов?
  7. Приведите вариант классификации факторов.
  8. Симметричный факторный эксперимент.
  9. Полный факторный эксперимент (ПФЭ).
  10. Как определяется количество информационных точек в ПФЭ? В симметричном ПФЭ?
  11. Пути сокращения затрат на проведение эксперимента.
  12. Дайте определение точности и достоверности оценки характеристики случайной величины.
  13. Как получено выражение, связывающее точность и достоверность оценки с числом реализаций модели?
  14. Способы априорного определения оценки дисперсии.
  15. Как получено выражение N = t^2_{\alpha}\cfrac{P(1-P)}{\varepsilon^2}? Что означают аргументы этого выражения?
  16. Способы априорного определения вероятности \overline{P}.
  17. В результате прогонов имитационной модели ожидается получить три случайных показателя со следующими характеристиками:
    \sigma=0.6,\,\,\,\varepsilon=0.1,\,\,\,\alpha=0.95;\\
\sigma=1.2,\,\,\,\varepsilon=0.2,\,\,\,\alpha=0.95;\\
\sigma=1.8,\,\,\,\varepsilon=0.01,\,\,\,\alpha=0.9 \text{(распредлен не по нормальному закону)}.

    Определить требуемое количество N реализаций модели для достижения требуемой точности и достоверности.

  18. В чем состоит проблема начальных условий, и каковы пути ее разрешения?
< Лекция 4 || Лекция 5: 12345 || Лекция 6 >
Владислав Нагорный
Владислав Нагорный
Высшее образование
Лариса Парфенова
Лариса Парфенова
Экстерн
Петр Гончар-Зайкин
Петр Гончар-Зайкин
Россия
Борис Борисов
Борис Борисов
Казахстан, Алматы, Казахский государственный университет, 1983