Подскажите, пожалуйста, планируете ли вы возобновление программ высшего образования? Если да, есть ли какие-то примерные сроки? Спасибо! |
Обработка результатов имитационного эксперимента
5.10. Обработка результатов эксперимента на основе регрессии
Часто целью исследования является определение функциональной связи между факторами и откликом (реакцией модели) по данным, полученным при экспериментах с моделью объекта или непосредственно с объектом. Такая цель достигается регрессионным анализом значений факторов и отклика
.
Под регрессией в теории вероятностей и математической статистике понимают зависимость среднего значения какой-либо величины от некоторой другой (других) величины. Регрессионный анализ - это совокупность методов построения и исследования регрессионной зависимости между величинами (в нашем случае между факторами и откликом) по статистическим данным. Статистические данные накапливаются при проведении эксперимента.
Формальная схема эксперимента выглядит так (рис. 5.6).
Прямоугольник представляет исследуемый объект или его математическую модель. Обозначения на рис. 5.6:
- значения факторов,
;
- случайный фактор, помеха. Будем считать, что эта случайная величина имеет нормальное распределение с матожиданием
. Влияние помехи на отклик аддитивное, то есть ее случайные значения прибавляются к значениям отклика;
- искомая функциональная зависимость между факторами и откликом.
Отклик - величина случайная.
представляет собой среднее значение отклика (так как
):
.
Исследуемый объект представляется как "черный ящик", никаких предположений о виде функции нет. Поэтому представим ее в виде аппроксимирующего полинома:
![\overline{y}=\beta_0+\beta_1 x_1+\beta_2 x_2 + \ldots + \beta_n x_n = \sum\limits_{i=0}^{n}{\beta_ix_i},\,\,\, x_0=1](/sites/default/files/tex_cache/a1d45d5eba9f673584b34ea2b84349ed.png)
Этот полином получил название уравнения регрессии, а коэффициенты - коэффициенты регрессии. От точности подбора коэффициентов регрессии зависит точность представления
.
Коэффициенты определяются путем обработки полученных в ходе эксперимента варьируемых значений факторов и откликов.
Однако из-за ограниченного числа наблюдений точные значения получить нельзя, будут найдены их оценки
:
![\overline{\beta _{i}}=b_{i}.](/sites/default/files/tex_cache/d949d7406e141365120cf8ccff755942.png)
Поэтому уравнение регрессии принимает вид:
![\overline{y}=b_0+b_1 x_1+b_2 x_2 + \ldots + b_n x_n = \sum\limits_{i=0}^{n}{b_ix_i},\,\,\, x_0=1](/sites/default/files/tex_cache/3d278e7572ecef85ea487e3a4132bc87.png)
Вообще-то метку над теперь надо бы изменить, так как вместо
в уравнении теперь стоят
, но мы этого делать не будем, чтобы не загромождать изложение новыми значками.
В уравнении регрессии могут участвовать и так называемые "совместные эффекты" ( и т. п.) или степени значений факторов (
и т. п.). Совместные эффекты и степени факторов можно обозначать обобщенным фактором. Например, уравнение регрессии
![\overline{y}=b_0+b_1x_1+b_2x_2+b_3x_1x_2+b_4x_2^2](/sites/default/files/tex_cache/26d17522437b4b08f8e04ce4ef295618.png)
можно представить так:
![\overline{y}=b_0+b_1x_1+b_2x_2+b_3x_3+b_4x_4,\,\,\,x_3=x_1x_2,\,\,\,x_4=x_2^2](/sites/default/files/tex_cache/bab4e18d2aadf54e0edc47a8960106cf.png)
Итак, для определения выражения надо:
- выбрать степень аппроксимирующего полинома - уравнения регрессии;
- определить коэффициенты регрессии.
Выбор уравнения регрессии обычно начинают с линейной модели. Например, для двухфакторного эксперимента ее вид:
![\overline{y}=b_0+b_1x_1+b_2x_2](/sites/default/files/tex_cache/9b681f95ecbf309a7f93d0c59aefea6d.png)
Если окажется, что такая аппроксимация дает неприемлемые отклонения при сравнении с экспериментальными точками отклика y , то модель усложняется, например, так:
или
и т.д.
Коэффициенты регрессии для выбранного уравнения определяются из условия минимума суммы квадратов ошибок, вычисленных по все экспериментальным точкам. Это делается так. Введем обозначения:
- значение
-го фактора в наблюдении номер
;
- значение отклика в
-м наблюдении;
- значение отклика, вычисленное по принятому уравнению регрессии и данным
.
Очевидно, сумма квадратов ошибок между экспериментальными значениями и вычисленными по уравнению регрессии
для всех
наблюдений равна:
![\delta=\sum\limits_{l=1}^{N}{(y_l-\overline{y}_l)^2}=\sum\limits_{l=1}^{N}{\left ( y_l -
\sum\limits_{i=0}^{n}{b_ix_{il}} \right )^2}](/sites/default/files/tex_cache/822326bab03e0202517c698bcbdea0bc.png)
Для определения минимума ошибки ?возьмем частные производные от по всем неизвестным коэффициентам регрессии
,
и приравняем их нулю:
![\cfrac{\partial\delta}{ \partial b_j} =-2\sum\limits_{l=1}^{N}{\left ( y_l -
\sum\limits_{i=0}^{n}{b_ix_{il}} \right )}x_{jl}=0](/sites/default/files/tex_cache/be56f031f20762bf1d0cc10b1846786d.png)
Нетрудно убедиться, что это условие минимума, а не максимума. Очевидно:
![\sum\limits_{l=1}^{N}{\left ( y_l -
\sum\limits_{i=0}^{n}{b_ix_{il}} \right )}x_{jl}=0,\\
\sum\limits_{l=1}^{N}{y_l x_{jl}}=\sum\limits_{l=1}^{N}{\sum\limits_{i=0}^{n}{b_i x_{il}x_{jl}}}.](/sites/default/files/tex_cache/5a1414e2b78df65b345eabde5e46595a.png)
Для лучшей наглядности выделим неизвестные коэффициенты регрессии и получим:
![\sum\limits_{l=1}^{N}{y_l x_{jl}}=
\sum\limits_{l=1}^{N}{b_i}\sum\limits_{i=0}^{n}{x_{il}x_{jl}}](/sites/default/files/tex_cache/fb8bf5c5141d546648bffec8cf57651c.png)
Выражение (5.3) представляет собой систему из уравнений для нахождения
неизвестных коэффициентов регрессии
, которые окончательно определят выбранное уравнение регрессии.
Нахождение коэффициентов регрессии справедливо при следующих допущениях:
- Случайный фактор
имеет нормальное распределение с матожиданием
.
- Результаты наблюдений
- независимые нормально распределенные случайные величины. Если это не соблюдается, то следует измерять другой отклик, удовлетворяющий этому условию, но функционально связанный с исследуемым откликом
- Точность наблюдений (количество реализаций модели) не меняется от наблюдения к наблюдению.
- Точность наблюдения
должна быть выше точности
.
Пример 5.8. На модели объекта проведен однофакторный эксперимент из пяти наблюдений, результаты которого сведены в таблицу (табл. 5.10).
Найти функциональную связь фактора с откликом
Фактор и отклики | Наблюдение | ![]() |
||||
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
![]() |
0 | 0,5 | 1,0 | 1,5 | 2,0 | 5 |
![]() |
7,0 | 4,8 | 2,8 | 1,4 | 0 | 16 |
![]() |
0 | 2,4 | 2,8 | 2,1 | 0 | 7,3 |
Решение
Примем, что кроме управляемого фактора при проведении эксперимента на объект воздействует случайный фактор, распределенный по нормальному закону с математическим ожиданием
. Также предположим, что эта связь - линейная, следовательно, уравнение регрессии нужно определять в виде:
![\overline{y} = b_{0} + b_{1}х_{1}.](/sites/default/files/tex_cache/c9ebe1edd40b56d915113e34c3a3274e.png)
Неизвестных коэффициентов два: и
. Запишем (5.3) в виде двух уравнений для
и в каждом из них разложим суммы по индексу
:
![\left \{
\begin{array}{l}
\sum\limits_{l=1}^{N}{y_lx_{0l}} =
b_0\sum\limits_{l=1}^{N}{x_{0l}x_{0l}} + b_1\sum\limits_{l=1}^{N}{x_{1l}x_{0l}},\\
\sum\limits_{l=1}^{N}{y_lx_{1l}} =
b_0\sum\limits_{l=1}^{N}{x_{0l}x_{1l}} + b_1\sum\limits_{l=1}^{N}{x_{1l}x_{1l}},
\end{array}](/sites/default/files/tex_cache/0038baf54fb0776f55667306d56fe18f.png)
Так как , получим:
![\left \{
\begin{array}{l}
\sum\limits_{l=1}^{N}{y_l} =
Nb_0 + b_1\sum\limits_{l=1}^{N}{x_{1l}},\\
\sum\limits_{l=1}^{N}{y_lx_{1l}} =
b_0\sum\limits_{l=1}^{N}{x_{1l}} + b_1\sum\limits_{l=1}^{N}{x_{1l}^2}.
\end{array}](/sites/default/files/tex_cache/f47afa0653dc1d181357048b644266ec.png)
Подставим данные эксперимента из табл. 5.10 в систему (5.4):
![\left \{ \begin{array}{l}
16=5b_0+5b_1,\\
7.3=5b_0+7.5b_1.
\end{array}](/sites/default/files/tex_cache/0632413b5c73d910405ca6f5b6161891.png)
Решим систему из двух уравнений и получим: ,
.
Следовательно, искомое уравнение регрессии:
![\overline{y} = 6.68-3.48х_{1}.](/sites/default/files/tex_cache/9f8432e9e777e449659978c92f86b59f.png)
Доверительные границы для истинных значений и
примера 5.8 определяются как обычно:
![b _{0} -t _{\alpha } ^{*} \sigma _{b0} \le \beta _{0} \le b _{0} +t _{\alpha }^{*} S_{b0} ;\,\,\, b _{1} -t_{\alpha } \sigma_{b1} \le\beta _{1}\le b _{1} +t_{\alpha } S_{b1},](/sites/default/files/tex_cache/e627c8d28bdf11a357f9eb04981310f3.png)
где - аргумент распределения Стьюдента;
- среднеквадратические отклонения величин
и
соответственно.
Значения определяются из таблицы распределения Стьюдента для
степеней свободы и задаваемом уровне достоверности
. Пусть
, тогда
.
Значения находятся по формулам:
![S_{b_0}=\sqrt{\cfrac{\sum\limits_{l=1}^{N}{d_{y_l}^2}}{N(N-2)}},\,\,
S_{b_0}=\sqrt{\cfrac {1}{N-2}\cfrac{\sum\limits_{l=1}^{N}{d_{y_l}^2}}{\sum\limits_{l=1}^{N}{d_{x_l}^2}}}.](/sites/default/files/tex_cache/28649cc688d5aa938f49079fda39e8ed.png)
Данные для вычисления ,
представлены в табл. 5.11.
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
---|---|---|---|---|---|---|---|
1 | 0 | 1,0 | 1,0 | 7,0 | 6,68 | -0,32 | 0,1024 |
2 | 0,5 | 0,5 | 0,25 | 4,8 | 4,94 | 0,14 | 0,0196 |
3 | 1,0 | 0 | 0 | 2,8 | 3,2 | 0,40 | 0,16 |
4 | 1,5 | -0,5 | 0,25 | 1,4 | 1,46 | 0,06 | 0,0036 |
5 | 2,0 | -1,0 | 1,0 | 0 | 0,28 | 0,28 | 0,0784 |
![\overline{x}=\cfrac{\sum\limits_{l=1}^{N}{x_l}}{N}=1,\,\,\,
\sum\limits_{l=1}^{N}{d_{x_l}^2} = 2.5,\,\,\,
\sum\limits_{l=1}^{N}{d_{y_l}^2} = 0.364.](/sites/default/files/tex_cache/fc09ed21403c254982d04b7721414e48.png)
![S_{b_0}=\sqrt{\cfrac{0.364}{5(5-2)}}=0.156,\,\,\,
S_{b_1}=\sqrt{\cfrac{0.364}{3\cdot 2.5}}=0.22.](/sites/default/files/tex_cache/4a426b280e93c1192500127ce7898879.png)
С уровнем достоверности
![6.68-2.35\cdot 0.156\le \beta_0\le 6.68+2.35\cdot 0.156,\,\,\, 6.31\le \beta_0\le 7.05;\\
-3.48-2.35\cdot 0.22\le \beta_1\le -3.48+2.35\cdot 0.22,\,\,\, -4.0\le \beta_1\le -2.96.](/sites/default/files/tex_cache/ca6c4ecec66d23cc5aa4577cc469d9db.png)
Большой размах доверительных границ объясняется малым числом наблюдений в данном эксперименте.
Доверительные границы для y принимают разные значения в зависимости от значений факторов [33].