Подскажите, пожалуйста, планируете ли вы возобновление программ высшего образования? Если да, есть ли какие-то примерные сроки? Спасибо! |
Обработка результатов имитационного эксперимента
5.10. Обработка результатов эксперимента на основе регрессии
Часто целью исследования является определение функциональной связи между факторами и откликом (реакцией модели) по данным, полученным при экспериментах с моделью объекта или непосредственно с объектом. Такая цель достигается регрессионным анализом значений факторов и отклика .
Под регрессией в теории вероятностей и математической статистике понимают зависимость среднего значения какой-либо величины от некоторой другой (других) величины. Регрессионный анализ - это совокупность методов построения и исследования регрессионной зависимости между величинами (в нашем случае между факторами и откликом) по статистическим данным. Статистические данные накапливаются при проведении эксперимента.
Формальная схема эксперимента выглядит так (рис. 5.6).
Прямоугольник представляет исследуемый объект или его математическую модель. Обозначения на рис. 5.6:
- значения факторов, ;
- случайный фактор, помеха. Будем считать, что эта случайная величина имеет нормальное распределение с матожиданием . Влияние помехи на отклик аддитивное, то есть ее случайные значения прибавляются к значениям отклика;
- искомая функциональная зависимость между факторами и откликом.
Отклик - величина случайная. представляет собой среднее значение отклика (так как ): .
Исследуемый объект представляется как "черный ящик", никаких предположений о виде функции нет. Поэтому представим ее в виде аппроксимирующего полинома:
Этот полином получил название уравнения регрессии, а коэффициенты - коэффициенты регрессии. От точности подбора коэффициентов регрессии зависит точность представления .
Коэффициенты определяются путем обработки полученных в ходе эксперимента варьируемых значений факторов и откликов.
Однако из-за ограниченного числа наблюдений точные значения получить нельзя, будут найдены их оценки :
Поэтому уравнение регрессии принимает вид:
Вообще-то метку над теперь надо бы изменить, так как вместо в уравнении теперь стоят , но мы этого делать не будем, чтобы не загромождать изложение новыми значками.
В уравнении регрессии могут участвовать и так называемые "совместные эффекты" ( и т. п.) или степени значений факторов ( и т. п.). Совместные эффекты и степени факторов можно обозначать обобщенным фактором. Например, уравнение регрессии
можно представить так:
Итак, для определения выражения надо:
- выбрать степень аппроксимирующего полинома - уравнения регрессии;
- определить коэффициенты регрессии.
Выбор уравнения регрессии обычно начинают с линейной модели. Например, для двухфакторного эксперимента ее вид:
Если окажется, что такая аппроксимация дает неприемлемые отклонения при сравнении с экспериментальными точками отклика y , то модель усложняется, например, так:
или
и т.д.
Коэффициенты регрессии для выбранного уравнения определяются из условия минимума суммы квадратов ошибок, вычисленных по все экспериментальным точкам. Это делается так. Введем обозначения:
- значение -го фактора в наблюдении номер ;
- значение отклика в -м наблюдении;
- значение отклика, вычисленное по принятому уравнению регрессии и данным .
Очевидно, сумма квадратов ошибок между экспериментальными значениями и вычисленными по уравнению регрессии для всех наблюдений равна:
Для определения минимума ошибки ?возьмем частные производные от по всем неизвестным коэффициентам регрессии , и приравняем их нулю:
Нетрудно убедиться, что это условие минимума, а не максимума. Очевидно:
Для лучшей наглядности выделим неизвестные коэффициенты регрессии и получим:
Выражение (5.3) представляет собой систему из уравнений для нахождения неизвестных коэффициентов регрессии , которые окончательно определят выбранное уравнение регрессии.
Нахождение коэффициентов регрессии справедливо при следующих допущениях:
- Случайный фактор имеет нормальное распределение с матожиданием .
- Результаты наблюдений - независимые нормально распределенные случайные величины. Если это не соблюдается, то следует измерять другой отклик, удовлетворяющий этому условию, но функционально связанный с исследуемым откликом
- Точность наблюдений (количество реализаций модели) не меняется от наблюдения к наблюдению.
- Точность наблюдения должна быть выше точности .
Пример 5.8. На модели объекта проведен однофакторный эксперимент из пяти наблюдений, результаты которого сведены в таблицу (табл. 5.10).
Найти функциональную связь фактора с откликом
Фактор и отклики | Наблюдение | |||||
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
0 | 0,5 | 1,0 | 1,5 | 2,0 | 5 | |
7,0 | 4,8 | 2,8 | 1,4 | 0 | 16 | |
0 | 2,4 | 2,8 | 2,1 | 0 | 7,3 |
Решение
Примем, что кроме управляемого фактора при проведении эксперимента на объект воздействует случайный фактор, распределенный по нормальному закону с математическим ожиданием . Также предположим, что эта связь - линейная, следовательно, уравнение регрессии нужно определять в виде:
Неизвестных коэффициентов два: и . Запишем (5.3) в виде двух уравнений для и в каждом из них разложим суммы по индексу :
Так как , получим:
Подставим данные эксперимента из табл. 5.10 в систему (5.4):
Решим систему из двух уравнений и получим: , .
Следовательно, искомое уравнение регрессии:
Доверительные границы для истинных значений и примера 5.8 определяются как обычно:
где - аргумент распределения Стьюдента; - среднеквадратические отклонения величин и соответственно.
Значения определяются из таблицы распределения Стьюдента для степеней свободы и задаваемом уровне достоверности . Пусть , тогда .
Значения находятся по формулам:
Данные для вычисления , представлены в табл. 5.11.
1 | 0 | 1,0 | 1,0 | 7,0 | 6,68 | -0,32 | 0,1024 |
2 | 0,5 | 0,5 | 0,25 | 4,8 | 4,94 | 0,14 | 0,0196 |
3 | 1,0 | 0 | 0 | 2,8 | 3,2 | 0,40 | 0,16 |
4 | 1,5 | -0,5 | 0,25 | 1,4 | 1,46 | 0,06 | 0,0036 |
5 | 2,0 | -1,0 | 1,0 | 0 | 0,28 | 0,28 | 0,0784 |
С уровнем достоверности
Большой размах доверительных границ объясняется малым числом наблюдений в данном эксперименте.
Доверительные границы для y принимают разные значения в зависимости от значений факторов [33].