Опубликован: 16.11.2010 | Уровень: специалист | Доступ: свободно
Лекция 6:

Обработка результатов имитационного эксперимента

5.4. Гистограмма

Одной из задач моделирования может быть определение закона распределения вероятностей исследуемой случайной величины и количественных значений его характеристик.

Аналогом, моделью плотности распределения вероятности случайной величины является гистограмма, которую можно построить (аналитически или графически) по данным имитационного моделирования.

Гистограмма (рис. 5.1) строится так.

Гистограмма

Рис. 5.1. Гистограмма

В результате N реализаций модели получен ряд случайных значений исследуемого параметра a : a_{1}, a_{2}, \ldots , a_{i} , \ldots , a_{N} . Весь диапазон значений a_{i} разбивается на l интервалов (разрядов). Числовой диапазон каждого интервала обозначим \Delta _{j} , j=\overline{1, l}. Обычно все числовые диапазоны одинаковые: \Delta _{l}=\Delta  .

Для каждого интервала подсчитываем число значений a_{i} , попавших в него - m_{j} .

На каждом интервале строят прямоугольник с высотой h_{j} :

h_j=\cfrac{m_j}{N\cdot\Delta}

Площадь каждого прямоугольника гистограммы равна относительной частоте \overline{P}_j:

\overline{P}_j=\cfrac{m_j}{N\cdot\Delta}\cdot\Delta=\cfrac{m_j}{N}

По выбору числа интервалов l существуют разные эмпирические рекомендации, например:

20 \le l \le 30, l = 5 \lgN.

Чем больше N и l, а меньше \Delta, тем ближе гистограмма совпадает с некоторым теоретическим распределением. Доказал это Валерий Иванович Гливенко - известный отечественный математик.

На основе очертания гистограммы делается предположение (выдвигается гипотеза) о совпадении полученного эмпирического распределения вероятностей с тем или иным теоретическим - нормальным, экспоненциальным, Вейбулла и т. д. Затем выполняется проверка этой гипотезы с помощью критериев согласия.В курсе высшей математики рассматриваются некоторые (критерий Колмогорова, критерий Смирнова и др.), наиболее популярными считают критерий хи-квадрат - критерий Пирсона, предложенный в 1903 г.

Оценки матожидания и дисперсии можно получить по данным гистограммы:

\overline{a}=\sum\limits_{j=1}^{l}{\overline{a}_j\overline{P}_j },\,\,\,
S^2=\sum\limits_{j=1}^{l}{\overline{a}_j^2\overline{P}_j^2 }-\cfrac{\Delta}{12}

где \overline{a} _{j} - среднее значение каждого интервала;

\overline{P}_ j - оценка по каждому интервалу;

\cfrac{\Delta }{12} - поправка Шеппарда.

5.4. Элементы дисперсионного анализа. Критерий Фишера

Приведем понятия, которые используем в дальнейшем. В математической статистике (а это основной математический аппарат обработки результатов моделирования) широко используется понятие гипотезы.

Гипотезой называется предположение о:

  • законах распределения вероятностей случайных величин;
  • значениях характеристик случайных величин;
  • совпадении законов распределения двух и более случайных величин и др.

Обычно исходную гипотезу называют нулевой и обозначают H_{0}. Противоположное утверждение называют конкурирующей гипотезой и обозначают H_{1}.

Гипотеза подвергается проверке. Смысл этой проверки в том, чтобы принять или отклонить ее с допустимым минимальным риском. При этом возможны ошибки:

  • забраковать проверяемую гипотезу, если она верна, что соответствует так называемой ошибке первого рода ;
  • принять проверяемую гипотезу, когда она не верна,значит совершить ошибку второго рода.

Правило, которому принимается суждение об истинности или ложности основной гипотезы H_{0} называют критерием проверки или критерием согласия.

В практике моделирования и обработки экспериментальных данных очень часто необходимо решать проблему подтверждения или опровержения гипотезы о принадлежности двух или более выборок одной генеральной совокупности.

К такой проблеме приводят такие задачи:

  • сравнительная оценка различных технологических процессов по их производительности, точности, экономичности;
  • сравнение конструктивных особенностей приборов, машин, средств вооружения и др.

Признаки, по которым проводится сравнительная оценка, часто не являются детерминированными, обладают рассеиванием. Например, точность никогда не может быть абсолютной, так как измерительные приборы всегда несут в себе ошибку.

Наиболее общим и часто применяемым на практике методом сравнения качеств объектов является дисперсионный анализ.

Сущность дисперсионного анализа состоит в проверке гипотезы о тождественности выборочных дисперсий одной и той же генеральной дисперсии.

Почему исследователей интересует сравнение именно дисперсий, а не каких-либо других характеристик? Заметим, что есть методики сравнения, например, матожиданий и др., но они не обладают такой общностью, как дисперсионный анализ.

А дело в том, что дисперсия характеризует важные конструкторские и технологические показатели как:

  • точность приборов;
  • рассеивание точек попадания при стрельбе и др.

И еще дисперсионный анализ одновременно решает проблему проверки гипотезы о равенстве средних значений выборок.

Задача сравнения дисперсий сводится к проверке исходной гипотезы (нулевой гипотезы H_{0} ) о принадлежности двух выборок

одной и той же генеральной совокупности.

Для проверки гипотезы о равенстве дисперсий нужно иметь независимую функцию, вычислимую по данным эксперимента.

Такой функцией является функция Фишера (распределение Фишера, F -распределение), определяемая так:

F=\cfrac{\cfrac{U}{k_1}}{\cfrac{V}{k_2}}

где U и V случайные величины, имеющие распределение \chi^{2} ;

k _{1} и k_{2} соответствующие степени свободы случайных величин U и V соответственно, k_{1}=N_{1}-1, k_{2} = N_{2}-1 ;

N _{1} и N_{2} - количество испытаний (объемы выборок).

Почему \chi^{2} является мерой сравнения дисперсий? А потому, что дисперсии, являясь суммой квадратов ошибок, имеют распределение \chi^{2} .

Распределение хи-квадрат определяется следующим образом:

f(x)=\{ 1/[2^{\nu/2}\cdot\Gamma(\nu/2)] \}\cdot [x^{(\nu/2)-1}*e^{-x/2}],\,\,\nu=1,2,\ldots,\,\, 0< x

где \nu - число степеней свободы, e - число Эйлера (2,71…), \Gamma - гамма-функция.

График плотности F -распределения показан на рис. 5.2.

Итак, случайная величина

F=\cfrac{S_1^2}{ S_2^2}

где S_{1}^{2} и S_{2}^{2} - несмещенные оценки дисперсий, полученных из независимых выборок, взятых из нормальных совокупностей, имеет распределение Фишера ( F -распределение).

График плотности F -распределения

Рис. 5.2. График плотности F -распределения

Величина F - случайна, поэтому судить однозначно по ее величине о подтверждении или опровержении гипотезы об однородности исследуемых выборок нельзя.

Поэтому вводится q% уровень значимости, численно равный вероятности неприемлемых отклонений от принятой гипотезы. Области неприемлемых значений F показаны на рис. 5.2 штриховкой. Граничные точки допустимых значений F определяются точками F_{1} и F_{2}, соответствующих вероятностям q/2.

Если вычисленное по данным эксперимента значение F попадает в область между точками F_{1} и F_{2}:

F_{1}\le F\le F_{2},

то принятая гипотеза не опровергается.

Заметим, что случайная величина

F^*=\cfrac{1}{F}=\cfrac{S^2_2}{S^2_1}

также имеет F -распределение со степенями свободы k_{2} = N_{2} -1 и k_{1} = N_{1} -1 соответственно. Следовательно, вероятность попадания числа F в левую критическую область равна:

P(F<F_1)= P\left ( \cfrac{1}{F}>\cfrac{1}{F_1}\right ) = P\left ( F^*>\cfrac{1}{F_1}\right )

Отсюда следует, что левая критическая точка F -распределения соответствует правой критической точке F^{*} -распределения. Т. е. правые точки распределений F и F^* определяют левую и правую точки F_{1} и F_{2}. Поэтому в таблицах представлены только правые F_{2} критические точки F -распределения.

В таблицах значения F_{2} приведены в зависимости от q/2, числа степеней свободы k _{1} = N_{1} -1 и k_{2} = N_{2} -1.

Обычно при вычислении F в числитель отношения \cfrac{S_1^2}{S_2^2} ставят значение большей дисперсии.

Итак, при F \le F_{2} принятая гипотеза не опровергается, при F > F_{2} - не подтверждается.

Пример 5.3. В часть поступили две буссоли. Первая из них при измерении пять раз одного и того же угла показала дисперсию S_{1} =0,1 град^{2}. По результатам семи измерений второй буссолью того же угла получена дисперсия S_{2} = 0,15 град^{2}.

Однотипны ли буссоли? Одинаковы ли они по точности измерения углов? Выдвинем и проверим гипотезу об их однотипности для уровня значимости q = 10%.

Решение

F=\cfrac{S_2^2}{S^2_1}=\cfrac{0.15}{0.1}=1.5;\,\,k_1=5-1;\,\,k_2=7-1=6

По таблицу F -распределения для степеней свобод k_{2} = 6 , соответствующей большей дисперсии, и k _{1} = 4, соответствующей меньшей дисперсии, и уровню значимости q/2, находим F_{2} =6.16.

Так как F = 1.5 < F_{2} = 6.16, то для уровня значимости q = 10% гипотеза об одинаковости буссолей не опровергается.

Итак: чем меньше уровень значимости q%, тем меньше вероятность забраковать проверяемую гипотезу, когда она верна, т. е. совершить ошибку первого рода.

Но с уменьшением уровня значимости (увеличения F_{2} ) расширяется область допустимых ошибок, что приводит к увеличению вероятности принятия неверного решения,т. е. совершения ошибки второго рода.

В заключение изложенного отметим, что как бы ни был велик объем статистического материала (N_{1} и N_{2}) критерий Фишера (впрочем, как и любой другой) не может дать абсолютно достоверный ответ о справедливости или несправедливости проверяемой гипотезы, так как мы оперируем случайными числами.

То есть, опровержение гипотезы ни в коем случае не означает категорического, логического опровержения гипотезы при F > F_{2}, равно как и подтверждение гипотезы при F \le F_{2} не означает категорического доказательства ее справедливости. Не исключено, что в том и в другом случае решение может оказаться ошибочным.

Суждение о подтверждении или отклонении выдвинутой гипотезы высказывается с определенной степенью достоверности.

Среди инженеров бытует шутливое изречение: статистика, как фонарный столб на улице: света дает мало, но при случае на него можно опереться.

Но свет-то дает! И другой альтернативы нет.

Владислав Нагорный
Владислав Нагорный

Подскажите, пожалуйста, планируете ли вы возобновление программ высшего образования? Если да, есть ли какие-то примерные сроки?

Спасибо!

Лариса Парфенова
Лариса Парфенова

1) Можно ли экстерном получить второе высшее образование "Программная инженерия" ?

2) Трудоустраиваете ли Вы выпускников?

3) Можно ли с Вашим дипломом поступить в аспирантуру?

 

Александр Колунин
Александр Колунин
Россия, Большое Сорокино, МОУ СОШ №1, 2008
Лоя Фотт
Лоя Фотт
Россия, г. Юрга