Опубликован: 11.08.2009 | Уровень: для всех | Доступ: платный
Лекция 9:

Описание неопределенностей в теории принятия решений

Одна из ведущих научных школ в области анализа интервальных данных - это школа проф. А.П. Вощинина, активно работающая с конца 70-х годов. В частности, изучены проблемы регрессионного анализа, планирования эксперимента, сравнения альтернатив и принятия решений в условиях интервальной неопределенности.

Рассматриваемое ниже направление отличается нацеленностью на асимптотические результаты, полученные при больших объемах выборок и малых погрешностях измерений, поэтому оно и названо асимптотической статистикой интервальных данных.

Сформулируем сначала основные идеи асимптотической математической статистики интервальных данных. Следует сразу подчеркнуть, что основные идеи достаточно просты, в то время как их проработка в конкретных ситуациях зачастую оказывается достаточно трудоемкой.

Пусть существо реального явления описывается выборкой x_1, x_2 , \dots, x_n. В вероятностной теории математической статистики, из которой мы исходим, выборка - это набор n независимых в совокупности одинаково распределенных случайных величин. Однако беспристрастный и тщательный анализ подавляющего большинства реальных задач показывает, что статистику известна отнюдь не выборка x_1, x_2, \dots, x_n, а величины

y_j = x_j + \varepsilon _j,  j = 1, 2, \dots , n,

где \varepsilon _1, \varepsilon _2, \dots \varepsilon_n , некоторые погрешности измерений, наблюдений, анализов, опытов, исследований (например, инструментальные ошибки).

Одна из причин появления погрешностей - запись результатов наблюдений с конечным числом значащих цифр. Дело в том, что для случайных величин с непрерывными функциями распределения событие, состоящее в попадании хотя бы одного элемента выборки в множество рациональных чисел, согласно правилам теории вероятностей имеет вероятность 0, а такими событиями в теории вероятностей принято пренебрегать. Поэтому при рассуждениях о выборках из обычно используемых распределений (нормального, логарифмически нормального, экспоненциального, равномерного, гамма - распределений, распределения Вейбулла-Гнеденко и т.п.) приходится принимать, что эти распределения имеют элементы исходной выборки x_1, x_2 , \dots, x_n , в то время как статистической обработке доступны лишь искаженные значения y_j = x_j + \varepsilon_j .

Введем обозначения

x = (x_1, x_2 , \dots, x_n), y = (y_1, y_2 ,\dots, y_n), \varepsilon = (\varepsilon_1, \varepsilon_2, \dots , \varepsilon_n)

Пусть статистические выводы основываются на статистике f:R^n \to R^1 используемой для оценивания параметров и характеристик распределения, проверки гипотез и решения иных статистических задач. Принципиально важная для статистики интервальных данных идея такова: СТАТИСТИК ЗНАЕТ ТОЛЬКО f(y) , НО НЕ f(x) .

Очевидно, в статистических выводах необходимо отразить различие между f(y) и f(x) . Одним из двух основных понятий статистики интервальных данных является понятие нотны.

Определение. Величину максимально возможного (по абсолютной величине) отклонения, вызванного погрешностями наблюдений , известного статистику значения f(y) от истинного значения f(x) , т.е.

N_f(x) = \sup |f(y) - f(x)|,

где супремум берется по множеству возможных значений вектора погрешностей \varepsilon (см. ниже), будем называть НОТНОЙ .

Если функция f имеет частные производные второго порядка, а ограничения на погрешности имеют вид

|\varepsilon_i| \le \Delta, i=1,2, \dots, n ( 1)

причем \Delta мало, то приращение функции f с точностью до бесконечно малых более высокого порядка описывается главным линейным членом, т.е.

f(y)-f(x)=\sum_{1\le i \le n}\frac{df(x)}{dx_i}\varepsilon_i+O(\Delta^2)

Чтобы получить асимптотическое (при \Delta \to 0 ) выражение для нотны, достаточно найти максимум и минимум линейной функции (главного линейного члена) на кубе, заданном неравенствами (1).

Легко видеть, что максимум достигается, если положить

\varepsilon_i=\begin{cases}
\Delta, \frac {df(x)}{dx_i}\ge0\\
-\Delta, \frac{df(x)}{dx_i}<0
\end{cases}

а минимум, отличающийся от максимума только знаком, достигается при \varepsilon_i=-\varepsilon_i. Следовательно, нотна с точностью до бесконечно малых более высокого порядка имеет вид

N_f(x)=(\sum_{1 \le i \le n} |\frac{df(x)}{dx_i}|)\Delta

Это выражение назовем асимптотической нотной.

Условие (1) означает, что исходные данные представляются статистику в виде интервалов [y_i-\Delta; y_i+\Delta], i=1,2, \dots, n (отсюда и название этого научного направления). Ограничения на погрешности могут задаваться разными способами - кроме абсолютных ошибок используются относительные или иные показатели различия между x и y.

Если задана не предельная абсолютная погрешность \Delta, а предельная относительная погрешность \delta, т.е. ограничения на погрешности вошедших в выборку результатов измерений имеют вид

|\varepsilon_i|\le \delta|x_i|, i=1,2,\dots, n

то аналогичным образом получаем, что нотна с точностью до бесконечно малых более высокого порядка, т.е. асимптотическая нотна, имеет вид

N_f(x)=(\sum_{1 \le i \le n}| x_i \frac{df(x)}{dx_i}|)\delta

При практическом использовании рассматриваемой концепции необходимо провести в расчетных формулах тотальную замену символов x на символы y. В каждом конкретном случае удается показать, что в силу малости погрешностей разность N_f(y)-n_f(x) является бесконечно малой более высокого порядка сравнительно с N_f(x) или N_f(y)

Михаил Агапитов
Михаил Агапитов
ВКР
Подобед Александр
Подобед Александр
Как оплатить обучение?
Андрей Лужинский
Андрей Лужинский
Россия
Владимир Нестеренко
Владимир Нестеренко
Россия, Норильск, Норильский индустриальный институт, 1992