Здравствуйте! 4 июня я записалась на курс Прикладная статистика. Заплатила за получение сертификата. Изучала лекции, прошла Тест 1. Сегодня вижу, что я вне курса! Почему так произошло? |
Статистика интервальных данных
Необходимость учета погрешностей измерений. Положим



![]() |
( 13) |
В силу состоятельности оценки максимального правдоподобия из формулы (13) следует, что
по вероятности при
.
Согласно модели статистики интервальных данных результатами наблюдений являются не , а
, вместо
по реальным данным рассчитывают

Имеем
![]() |
( 14) |
В силу закона больших чисел при достаточно малой погрешности , обеспечивающей возможность приближения
для слагаемых в формуле (14), или, что эквивалентно, при достаточно малых предельной абсолютной погрешности
в формуле (1) или достаточно малой предельной относительной погрешности
имеем при






![]() |
( 15) |

Из формул для и
следует, что с точностью до бесконечно малых более высокого порядка
![]() |
( 16) |
С целью нахождения асимптотического распределения выделим, используя формулу (16) и формулу для
, главные члены в соответствующих слагаемых
![]() |
( 17) |
Таким образом, величина w представлена в виде суммы независимых одинаково распределенных случайных величин (с точностью до зависящего от случая остаточного члена порядка ). В каждом слагаемом выделяются две части - одна, соответствующая
, и вторая, в которую входят
. На основе представления (17) можно показать, что при
распределения случайных величин
и
асимптотически нормальны, причем
M(w)\approx M(v)+c,
D(w)\approx D(v).
Из асимптотического совпадения дисперсий и
, вида параметров асимптотического распределения (при
) оценки максимального правдоподобия
и формулы (15) вытекает одно из основных соотношений статистики интервальных данных о квадрате средней ошибки
![]() |
( 18) |
Соотношение (18) уточняет утверждение о несостоятельности . Из него следует также, что не имеет смысла безгранично увеличивать объем выборки
с целью повышения точности оценивания параметра
, поскольку при этом уменьшается только второе слагаемое в (18), а первое остается постоянным.
В соответствии с общим подходом статистики интервальных данных в стандарте [ [ 12.12 ] ] предлагается определять рациональный объем выборки nrat из условия "уравнивания погрешностей" (это условие было впервые предложено в монографии [ [ 1.15 ] ]) различных видов в формуле (18), т.е. из условия

Упрощая это уравнение в предположении , получаем, что

Согласно сказанному выше, целесообразно использовать лишь выборки с объемами . Превышение рационального объема выборки
не дает существенного повышения точности оценивания.
Применение методов теории устойчивости. Найдем асимптотическую нотну. Как следует из вида главного линейного члена в формуле (17), решение оптимизационной задачи


Однако при этом пары не образуют простую случайную выборку, так как в выражения для
входит
. Однако при
можно заменить
на
. Тогда получаем, что



Таким образом, с точностью до бесконечно малых более высокого порядка нотна имеет вид

Применим полученные результаты к построению доверительных интервалов. В постановке классической математической статистики (т.е. при ) асимптотический (при
) доверительный интервал для параметра формы
, соответствующий доверительной вероятности , имеет вид [
[
12.12
]
]:
![\left[
a^*-u\left(\frac{1+\gamma}{2}\right)\sigma^*(a^*);
a^*+u\left(\frac{1+\gamma}{2}\right)\sigma^*(a^*)
\right],](/sites/default/files/tex_cache/d277dfdfedc9f2097f124ebd8d5504ac.png)


![[\sigma^*(x^*)]^2=
\frac{a}{n(a^*\psi'(x^*)-1)},
\psi(a)=\left.\frac{d\Gamma(a)}{da}right/\Gamma(a).](/sites/default/files/tex_cache/51026e236606c51fe9d26cff18fa9c10.png)
В постановке статистики интервальных данных (т.е. при ) следует рассматривать доверительный интервал
![\left[
a^*-2(a^*)^2|c|-u\left(\frac{1+\gamma}{2}\right)\sigma^*(a^*);
a^*+2(a^*)^2|c|-u\left(\frac{1+\gamma}{2}\right)\sigma^*(a^*)
\right],](/sites/default/files/tex_cache/d4d6c252f2f868edbef92044e52dfdca.png)



Если ограничения наложены на предельную относительную погрешность, задана величина , то значение с можно найти с помощью следующих правил приближенных вычислений [
[
12.4
]
, с.142].
(I)Относительная погрешность суммы заключена между наибольшей и наименьшей из относительных погрешностей слагаемых.
(II) Относительная погрешность произведения и частного равна сумме относительных погрешностей сомножителей или, соответственно, делимого и делителя.
Можно показать, что в рамках статистики интервальных данных с ограничениями на относительную погрешность правила (I) и (II) являются строгими утверждениями при .
Обозначим относительную погрешность некоторой величины через
, абсолютную погрешность - через
.
Из правила (I) следует, что , а из правила (II) - что

Поскольку рассмотрения ведутся при то в силу неравенства Чебышева
![]() |
( 19) |

![[ab-db\sqrt{a};ab+db\sqrt{a}]](/sites/default/files/tex_cache/ece069255497bd4687f6dcd1d6f01045.png)

Поскольку при справедливости (19) с точностью до бесконечно малых более высокого порядка

![]() |
( 20) |
Применим еще одно правило приближенных вычислений [ [ 12.4 ] , с.142].
(III) Предельная абсолютная погрешность суммы равна сумме предельных абсолютных погрешностей слагаемых.
Из (20) и правила (III) следует, что .
Из (15) и (21) вытекает [
[
12.12
]
, с.44, форм. (18)], что , откуда в соответствии с ранее полученной формулой для рационального объема выборки с заменой
получаем, что

В частности, при получаем
, т.е. в ситуации, в которой были получены данные о наработке резцов до предельного состояния [
[
12.12
]
, с.29], проводить более 50 наблюдений нерационально.
В соответствии с ранее проведенными рассмотрениями асимптотический доверительный интервал для a, соответствующий доверительной вероятности , имеет вид
![\left[
a^*-4(a^*)^2\delta-1,96\sqrt{\frac{a^*(2a^*-1)}{n}};
a^*+4(a^*)^2\delta-1,96\sqrt{\frac{a^*(2a^*-1)}{n}}
\right].](/sites/default/files/tex_cache/52a50c0f3f652a735015daca34164299.png)
В частности, при имеем асимптотический доверительный интервал
вместо
при
.
При больших в силу соображений, приведенных при выводе формулы (19), можно связать между собой относительную и абсолютную погрешности результатов наблюдений
:
![]() |
( 21) |
Следовательно, при больших имеем

Таким образом, проведенные рассуждения дали возможность вычислить асимптотику интеграла, задающего величину .
Сравнение методов оценивания. Изучим влияние погрешностей измерений (с ограничениями на абсолютную погрешность) на оценку метода моментов. Имеем
.
Погрешность зависит от способа вычисления
. Если используется формула
![]() |
( 22) |
![\textit{АП}(x_i-\overline{x})^2=2\Delta,
\textit{АП}\left[(x_i-\overline{x})^2\right]\approx 2|x_i-\overline{x}|\Delta.](/sites/default/files/tex_cache/f061a200213ac18689d9d75d265537ca.png)
По сравнению с анализом влияния погрешностей на оценку здесь возникает новый момент - необходимость учета погрешностей в случайной составляющей отклонения оценки
от оцениваемого параметра, в то время как при рассмотрении оценки максимального правдоподобия погрешности давали лишь смещение. Примем в соответствии с неравенством Чебышева
![]() |
( 23) |
![\textit{АП}[(x_i-\overline{x})^2]\approx 2b\sqrt{a}\Delta,\;
\textit{АП}(s^2)\approx 2b\sqrt{a}\Delta.](/sites/default/files/tex_cache/69c26bb13b4fe8dee585e8f0c6814006.png)
![]() |
( 24) |

Из полученных результатов следует, что


Эта формула отличается от приведенной в [ [ 12.12 ] , с.44, форм. (19)]


Используя соотношение (23), мы характеризуем влияние погрешностей "в среднем".
Доверительный интервал, соответствующий доверительной вероятности 0,95, имеет вид \left[ \widehat{a}-2\widehat{a}(1+\sqrt{\widehat{a}})\delta-1,96\sqrt{\frac{2\widehat{a}(\widehat{a}+1)}{n}}; \widehat{a}+2\widehat{a}(1+\sqrt{\widehat{a}})\delta+1,96\sqrt{\frac{2\widehat{a}(\widehat{a}+1)}{n}} \right].
Если , то получаем доверительный интервал
вместо
при
. Хотя при
доверительный интервал для
при использовании оценки метода моментов
шире, чем при использовании оценки максимального правдоподобия
, при
результат сравнения длин интервалов противоположен.
Необходимо выбрать способ сравнения двух методов оценивания параметра , поскольку в длины доверительных интервалов входят две составляющие - зависящая от доверительной вероятности и не зависящая от нее. Выберем
, т.е.
. Тогда оценке максимального правдоподобия
соответствует полудлина доверительного интервала
![]() |
( 25) |

![]() |
( 26) |
Ясно, что больших или больших
справедливо неравенство
, т.е. метод моментов лучше метода максимального правдоподобия, вопреки классическим результатам Р.Фишера при
[
[
1.7
]
,с.99].
Из (25) и (26) элементарными преобразованиями получаем следующее правило принятия решений. Если







Пример анализа реальных данных опубликован в [ [ 12.12 ] ].
На основе рассмотрения проблем оценивания параметров гамма-распределения можно сделать некоторые общие выводы. Если в классической теории математической статистики:
а) существуют состоятельные оценки параметра
,

б) для повышения точности оценивания объем выборки целесообразно безгранично увеличивать;
в) оценки максимального правдоподобия лучше оценок метода моментов,
то в статистике интервальных данных, учитывающей погрешности измерений, соответственно:
а) не существует состоятельных оценок: для любой оценки существует константа
такая, что

б) не имеет смысла рассматривать объемы выборок, большие "рационального объема выборки" ;
в) оценки метода моментов в обширной области параметров лучше оценок максимального правдоподобия, в частности, при
и при
.
Ясно, что приведенные выше результаты справедливы не только для рассмотренной задачи оценивания параметров гамма-распределения, но и для многих других постановок прикладной математической статистики.