Опубликован: 09.11.2009 | Доступ: свободный | Студентов: 4080 / 1033 | Оценка: 4.66 / 4.45 | Длительность: 54:13:00
Специальности: Экономист
Лекция 12:

Статистика интервальных данных

12.2. Интервальные данные в задачах оценивания характеристик и параметров распределения

Поясним теоретические концепции статистики интервальных данных на простых примерах.

Пример 1. Оценивание математического ожидания. Пусть необходимо оценить математическое ожидание случайной величины с помощью обычной оценки - среднего арифметического результатов наблюдений, т.е.

f(x)=\frac{x_1+x_2+...+x_n}{n}.

Тогда при справедливости ограничений (1) на абсолютные погрешности имеем N_f(x)=\Delta. Таким образом, нотна полностью известна и не зависит от многомерной точки, в которой берется. Вполне естественно: если каждый результат наблюдения известен с точностью до \Delta, то и среднее арифметическое известно с той же точностью. Ведь возможна систематическая ошибка - если к каждому результату наблюдения добавить \Delta, то и среднее арифметическое увеличится на \Delta.

Поскольку

D(\overline{x})=\frac{D(x_1)}{n},
то в обозначениях предыдущего параграфа
\sigma^2=D(x_1).

Следовательно, рациональный объем выборки равен

n_{rat}=\frac{D(x_1)}{\Delta^2}.

Для практического использования полученной формулы надо оценить дисперсию результатов наблюдений. Можно доказать, что, поскольку мало, это можно сделать обычным способом, например, с помощью несмещенной выборочной оценки дисперсии

s^2(y)=\frac{1}{n-1}\sum_{1\le i\le n}(y_i-\overline{y})^2.

Здесь и далее рассуждения часто идут на двух уровнях. Первый - это уровень "истинных" случайных величин, обозначаемых " x ", описывающих реальность, но неизвестных специалисту по анализу данных. Второй - уровень известных этому специалисту величин " y", отличающихся погрешностями от истинных. Погрешности малы, поэтому функции от x отличаются от функций от y на некоторые бесконечно малые величины. Эти соображения и позволяют использовать s^2(y) как оценку D(x_1).

Итак, выборочной оценкой рационального объема выборки является

n_{sample-rat}=\frac{s^2(y)}{\Delta^2}.

Уже на этом первом рассматриваемом примере видим, что рациональный объем выборки находится не где-то вдали, а непосредственно рядом с теми объемами, с которыми имеет дело любой практически работающий статистик. Например, если статистик знает, что \Delta=\frac{\sigma}{6}, то n_{rat} = 36. А именно такова погрешность контрольных шаблонов во многих технологических процессах! Поэтому, занимаясь управлением качества, необходимо обращать внимание на действующую на предприятии систему измерений.

По сравнению с классической математической статистикой доверительный интервал для математического ожидания (для заданной доверительной вероятности \gamma ) имеет другой вид:

\left(
\overline(y)-\Delta-u(y)\frac{s}{\sqrt{n}};\overline(y)+\Delta+u(y)\frac{s}{\sqrt{n}},
\right) ( 4)
где u(\gamma) - квантиль порядка (1+\gamma)/2 стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1.

По поводу формулы (4) состоялась довольно жаркая дискуссия среди специалистов (ср. 8.1). Отмечалось, что она получена на основе Центральной предельной теоремы теории вероятностей и может быть использована при любом распределении результатов наблюдений (с конечной дисперсией). Если же имеется дополнительная информация, то, по мнению отдельных специалистов, формула (4) может быть уточнена. Например, если известно, что распределение x_i является нормальным, в качестве u(\gamma) целесообразно использовать квантиль распределения Стьюдента. К этому надо добавить, что по небольшому числу наблюдений нельзя надежно установить нормальность, а при росте объема выборки квантили распределения Стьюдента приближаются к квантилям нормального распределения. Вопрос о том, часто ли результаты наблюдений имеют нормальное распределение, подробно обсуждался среди специалистов. Выяснилось, что распределения встречающихся в практических задачах результатов измерений почти всегда отличны от нормальных [ [ 12.30 ] ]. А также и от распределений из иных параметрических семейств, описываемых в учебниках.

Применительно к оцениванию математического ожидания (но не к оцениванию других характеристик или параметров распределения) факт существования границы возможной точности, определяемой точностью исходных данных, неоднократно отмечался в литературе ([ [ 12.11 ] , с.121] и др.).

Пример 2. Оценивание дисперсии. Для статистики f(y) = s^2(y), где s^2(y) - выборочная дисперсия (несмещенная оценка теоретической дисперсии), при справедливости ограничений (1) на абсолютные погрешности имеем

N_f(y)=\frac{2\Delta}{n-1}\sum_{i=1}^n|y_i-\overline{y}|+O(\Delta^2).

Можно показать, что нотна N_f(y) сходится к 2\Delta M|x_i-M(x_1)| по вероятности с точностью до o(\Delta), когда n стремится к бесконечности. Это же предельное соотношение верно и для нотны Nf(х), вычисленной для исходных данных. Таким образом, в данном случае справедлива формула (2) с C=2M|x_1-M(x_1)|.

Известно, что случайная величина

\frac{s^2-\sigma^2}{\sqrt{n}}
является асимптотически нормальной с математическим ожиданием 0 и дисперсией D(x_1^2).

Из сказанного вытекает, что в статистике интервальных данных асимптотический доверительный интервал для дисперсии \sigma^2 (соответствующий доверительной вероятности \gamma ) имеет вид

(s^2(y)-A;s^2+A),\text{ где }A=\frac{u(\gamma)}{\sqrt{n(n-1)}}
\sqrt{\sum_{i=1}^n \left(y_i^2-\frac{1}{n}\sum_{i=1}^n y_j^2\right)^2}
+\frac{2\Delta}{n-1}\sum_{i=1}^n|y_i-\overline{y}|,
где u(\gamma) обозначает тот же самый квантиль стандартного нормального распределения, что и выше в случае оценивания математического ожидания.

Рациональный объем выборки при оценивании дисперсии равен

n_{rat}=\frac{D(x_1^2)}{4\Delta^2(M|x_1-M(x_1)|)^2},
а выборочную оценку рационального объема выборки n_{sample-rat} можно вычислить, заменяя теоретические моменты на соответствующие выборочные и используя доступные статистику результаты наблюдений, содержащие погрешности.

Что можно сказать о численной величине рационального объема выборки? Как и в случае оценивания математического ожидания, она отнюдь не выходит за пределы обычно используемых объемов выборок. Так, если распределение результатов наблюдений x_i является нормальным с математическим ожиданием 0 и дисперсией \sigma^2, то в результате вычисления моментов случайных величин в предыдущей формуле получаем, что

n_{rat}=\frac{\sigma^2}{\pi\Delta^2},
где \pi - отношение длины окружности к диаметру, \pi=3,141592.... Например, если \Delta=\sigma/6, то n_{rat} = 11. Это меньше, чем при оценивании математического ожидания в предыдущем примере.

Пример 3. Аддитивные статистики. Пусть g:R^1\rightarrow R^1 - некоторая непрерывная функция. Аддитивные статистики имеют вид

f(x)=\frac{1}{n}\sum_{1\le i\le n} g(x_i).

Тогда

\begin{aligned}
\sum_{1\le i\le n}\left|\frac{\partial f(x)}{\partial x_i}\right|=
\frac{1}{n}\sum\left|\frac{dg(x_i)}{dx_i}\right|
\rightarrow M\left|\frac{dg(x_i)}{dx_i}\right|, \\
\sum_{1\le i\le n}\left|x_i\frac{\partial f(x)}{\partial x_i}\right|=
\frac{1}{n}\sum\left|\frac{dg(x_i)}{dx_i}\right|
\rightarrow M\left|x_1\frac{dg(x_i)}{dx_i}\right|
\end{aligned}
по вероятности при n\rigtarrow\infty, если математические ожидания в правых частях двух последних соотношений существуют. Применяя рассмотренные выше общие соображения, получаем, что при малых фиксированных \Delta и \delta и достаточно больших n значения f(y) могут принимать любые величины из разрешенных (например, записываемых заданным числом значащих цифр) в замкнутом интервале
\left[
f(x)-\Delta M\left|\frac{dg(x_1)}{dx_1}\right|;
f(x)+\Delta M\left|\frac{dg(x_1)}{dx_1}\right|
\right] ( 5)
при ограничениях (1) на абсолютные ошибки и в замкнутом интервале
\left[
f(x)-\delta M\left|x_1\frac{dg(x_1)}{dx_1}\right|;\;
f(x)+\delta M\left|x_1\frac{dg(x_1)}{dx_1}\right|
\right] ( 6)
при ограничениях на относительные погрешности результатов наблюдений. Обратим внимание, что длины этих интервалов независимы от объема выборки, в частности, не стремятся к 0 при его росте.

К каким последствиям это приводит в задачах статистического оценивания? Поскольку для статистик аддитивного типа

f(x)=\frac{1}{n}\sum_{1\le i\le n}g(x_i)\rightarrow(x_1) ( 7)
по вероятности при n\rightarrow\infty, если математическое ожидание в правой части формулы (7) существует, то аддитивную статистику f(x) естественно рассматривать как непараметрическую оценку этого математического ожидания. Термин "непараметрическая" означает, что не делаются предположения о принадлежности функции распределения выборки к тому или иному параметрическому семейству распределения. Распределение статистики f(x) зависит от распределения результатов наблюдений. Однако для любого распределения результатов наблюдений с конечной дисперсией статистика f(x) является состоятельной и асимптотически нормальной оценкой для математического ожидания, указанного в правой части формулы (7).

Как известно, в рамках классической математической статистики в предположении существования ненулевой дисперсии Dg(x_1) в силу асимптотической нормальности аддитивной статистики f(x) асимптотический доверительный интервал, соответствующий доверительной вероятности \gamma, имеет вид

\left[
f(x)-u\left(\frac{1+\gamma}{2}\right)\frac{s(g(x))}{\sqrt{n}};
f(x)+u\left(\frac{1+\gamma}{2}\right)\frac{s(g(x))}{\sqrt{n}}
\right],
где s(g(x)) - выборочное среднее квадратическое отклонение, построенное по g(x_1), g(x_2),..., g(x_n), а u\left(\frac{1+\gamma}{2}\right) - квантиль стандартного нормального распределения порядка \frac{1+\gamma}{2}.

В рассматриваемой модели порождения интервальных данных вместо f(x) необходимо использовать f(y), а вместо g(x_i) - соответственно g(y_i), i-1,2,...,n. При этом доверительный интервал необходимо расширить с учетом формул (5) и (6).

В соответствии с проведенными рассуждениями для аддитивных статистик асимптотическая нотна имеет вид

N_f(x)=\Delta M\left|\frac{dg(x_1)}{dx_1}right|
при ограничениях (1) на абсолютную погрешность и
N_f(x)=\delta M\left|x_1\frac{dg(x_1)}{dx_1}right|
при ограничениях на относительную погрешность. В первом случае нотна является обобщением понятия предельной абсолютной систематической ошибки, во втором - предельной относительной систематической ошибки. Отметим, что, как и в примерах 1 и 2, асимптотическая нотна не зависит от точки, в которой вычисляется. Таким образом, она является константой для конкретного метода статистического анализа данных.

Поскольку n велико, а \Delta и \delta малы, то можно пренебречь отличием выборочного среднего квадратического отклонения s(g(y)), вычисленного по выборке преобразованных значений g(y_1),g(y_2),...,g(y_n) от выборочного среднего квадратического отклонения s(g(x)), построенного по выборке g(x_1),g(x_2),...,g(x_n). Разность этих двух величин является бесконечно малой, они приближаются к одной и той же положительной константе.

В статистике интервальных данных выборочный доверительный интервал для Mg(x_1) имеет вид

\left[
f(y)-N_f(y)-u\left(\frac{1+\gamma}{2}\right)\frac{s(g(y))}{\sqrt{n}};
f(y)+N_f(y)+u\left(\frac{1+\gamma}{2}\right)\frac{s(g(y))}{\sqrt{n}}
\right].

В асимптотике его длина такова:

2N_f(x)+2u\left(\frac{1+\delta}{2}\right)\frac{\sigma}{\sqrt{n}}, ( 8)
где \sigma^2 - дисперсия g(x_1), в то время как в классической теории математической статистики имеется только второе слагаемое. Соотношение (8) - аналог суммарной ошибки у метрологов. Поскольку первое слагаемое положительно, то оценивание Mg(x_1) с помощью f(y) не является состоятельным.

Для аддитивных статистик при больших n максимум (по возможным погрешностям) среднего квадрата отклонения оценки имеет вид

\max_{\varepsilon}M[f(y)-Mg(x_1)]^2=N_f^2(x)+\frac{Dg(x_1)}{n} ( 9)
с точностью до членов более высокого порядка. Исходя из принципа уравнивания погрешностей в общей схеме устойчивости [ [ 1.15 ] ], нецелесообразно второе слагаемое в (9) делать меньше первого за счет увеличения объема выборки n. Рациональный объем выборки, т.е. тот объем, при котором равны погрешности оценивания (или проверки гипотез), вызванные погрешностями исходных данных, и статистические погрешности, рассчитанные по обычным правилам математической статистики (при \varepsilon_i\equiv 0 ), для аддитивных статистик согласно (9) имеет вид
n_{rat}=\frac{Dg(x_1)}{N_f^2(x)}. ( 10)

В качестве примера рассмотрим экспоненциально распределенные результаты наблюдений x_i, причем M(x_1)=D(x_i)=1. Оцениваем математическое ожидание с помощью выборочного среднего арифметического при ограничениях на относительную погрешность. Тогда согласно формуле (10)

N_f(x)=\delta,n_{rat}=\frac{1}{\delta^2}.

В частности, если относительная погрешность измерений \delta=10%, то рациональный объем выборки равен 100. Формуле (10) соответствует также рассмотренный выше пример 1.

Пример 4. Оценивание медианы распределения с помощью выборочной медианы. Хотя нельзя выделить главный линейный член из-за недифференцируемости функции f(x), выражающей выборочную медиану через элементы выборки, непосредственно из определения нотны следует, что при ограничениях на абсолютные погрешности

N_f(x)=\Delta,
а при ограничениях на относительные погрешности
N_f(x)=\delta x_{med}
с точностью до бесконечно малых более высокого порядка, где x_{med} - теоретическая медиана. Доверительный интервал для медианы имеет вид
[a_1(x)-N_f(x);a_2(x)+N_f(x)],
где [a_1(x); a_2(x)] - доверительный интервал для медианы (см. 8.1), вычисленный по классическим правилам непараметрической статистики [ [ 12.38 ] ]. Для нахождения рационального объема выборки можно использовать асимптотическую дисперсию выборочной медианы. Она, как известно (см., например, [ [ 12.13 ] , с.178]), равна
\sigma^2(M)=\frac{1}{4np^2(x_{med})},
где p(x_{med}) - плотность распределения результатов измерений в точке x_{med}. Следовательно, рациональный объем выборки имеет вид
n_{rat}=\frac{1}{4p^2(x_{med})\Delta^2},
n_{rat}=\frac{1}{4p^2(x_{med})x_{med}^2\delta^2}
при ограничениях на абсолютные и относительные погрешности результатов измерений соответственно. Для практического использования этих формул следует оценить плотность распределения результатов измерений в одной точке - теоретической медиане. Это можно сделать с помощью тех или иных непараметрических оценок плотности (см. 5.6 и [ [ 12.38 ] ]).

Если результаты наблюдений имеют стандартное нормальное распределение с математическим ожиданием 0 и дисперсией 1, то

n_{rat}=\frac{\pi}{2\Delta^2}\approx\frac{1,57}{\Delta^2}.

В этом случае рациональный объем выборки в \pi/2 раз больше, чем для оценивания математического ожидания (пример 1 выше). Однако для других распределений рассматриваемое соотношение объемов может быть иным, в частности, меньше 1. Как вытекает из статьи А.Н.Колмогорова [ [ 12.18 ] ], рассматриваемое соотношение объемов может принимать любое значение между 0 и 3.

Пример 5. Оценивание коэффициента вариации. Рассмотрим выборочный коэффициент вариации

\nu=f(y_1,y_2,...,y_n)=
\frac{\left\{\frac{1}{n-1}\sum\limits_{1\le i\le n}(y_i-\overline{y})^2\right\}^{\frac12}}{\frac{1}{n}\sum\limits_{1\le i\le n}y_i}=\frac{s(y)}{\overline{y}}.

Как нетрудно подсчитать,

frac{\partial f}{\partial x_i}=\frac{n\overline{x}(x_i-\overline{x})-(n-1)s^2(x)}{n(n-1)(\overline{x})^2s(x)}.

В случае ограничений на относительную погрешность

\lim_{n\rightarrow\infty} N_f(x)=\frac{\delta}{(M(x_1))^2\sigma}M
|x_1\{[x_1-M(x_1)]M(x_1)-\sigma^2\}|.

На основе этого предельного соотношения и формулы для асимптотической дисперсии выборочного коэффициента вариации, приведенной в 8.1 и [ [ 12.38 ] ], могут быть найдены по описанной выше схеме доверительные границы для теоретического коэффициента вариации и рациональный объем выборки.

Замечание. Отметим, что формулы для рационального объема выборки получены на основе асимптотической теории, а применяются для получения конечных объемов - 11, 36 и 100 в примерах 1-3. Как всегда при использовании асимптотических результатов математической статистики, необходимы дополнительные исследования для изучения точности асимптотических формул при конечных объемах выборок.

Рассмотрим классическую в прикладной математической статистике параметрическую задачу оценивания. Исходные данные - выборка x_1 , x_2 , ..., x_n, состоящая из n действительных чисел. В вероятностной модели простой случайной выборки ее элементы x_1 , x_2 , ..., x_n, считаются набором реализаций n независимых одинаково распределенных случайных величин. Будем считать, что эти величины имеют плотность f(x). В параметрической статистической теории предполагается, что плотность f(x) известна с точностью до конечномерного параметра, т.е., f(x)=f(x,\theta_0) при некотором \theta_0\in\Theta\subseteq R^k. Это, конечно, весьма сильное предположение, которое требует обоснования и проверки; однако в настоящее время параметрическая теория оценивания широко используется в различных прикладных областях.

Все результаты наблюдений определяются с некоторой точностью, в частности, записываются с помощью конечного числа значащих цифр (обычно 2-5). Следовательно, все реальные распределения результатов наблюдений дискретны. Обычно считают, что эти дискретные распределения достаточно хорошо приближаются непрерывными. Уточняя это утверждение, приходим к уже рассматривавшейся модели, согласно которой статистику доступны лишь величины

y_j=x_j+\varepsilon_j, j=1,2,...,n,
где x_i - "истинные" значения, \varepsilon_1,\varepsilon_2,...,\varepsilon_n - погрешности наблюдений (включая погрешности дискретизации). В вероятностной модели принимаем, что n пар
(x_1,\varepsilon_1),(x_2,\varepsilon_2),...,(x_n,\varepsilon_n)
образуют простую случайную выборку из некоторого двумерного распределения, причем x_1,x_2,...,x_n - выборка из распределения с плотностью f(x)=f(x,\theta_0). Необходимо учитывать, что x_i и \varepsilon_i - реализации зависимых случайных величин (если считать их независимыми, то распределение y_i будет непрерывным, а не дискретным). Поскольку систематическую ошибку, как правило, нельзя полностью исключить, то необходимо рассматривать случай M\varepsilon_i\ne 0. Нет оснований априори принимать и нормальность распределения погрешностей (согласно сводкам экспериментальных данных о разнообразии форм распределения погрешностей измерений, приведенным в [ [ 12.38 ] , с.71-77], в подавляющем большинстве случаев гипотеза о нормальном распределении погрешностей оказалась неприемлемой для средств измерений различных типов). Таким образом, все три распространенных представления о свойствах погрешностей не адекватны реальности. Влияние погрешностей наблюдений на свойства статистических моделей необходимо изучать на основе иных моделей, а именно, моделей интервальной статистики.

Пусть \varepsilon - характеристика величины погрешности, например, средняя квадратическая ошибка \varepsilon=\sqrt{M(\varepsilon_i^2)}. В классической математической статистике \varepsilon считается пренебрежимо малой (\varepsilon\rightarrow 0) при фиксированном объеме выборки n. Общие результаты доказываются в асимптотике (n\rightarrow 0). Таким образом, в классической математической статистике сначала делается предельный переход \varepsilon\rightarrow 0, а затем предельный переход n\rightarrow 0. В статистике интервальных данных принимаем, что объем выборки достаточно велик (n\rightarrow 0), но всем измерениям соответствует одна и та же характеристика погрешности \varepsilon\ne 0. Полезные для анализа реальных данных предельные теоремы получаем при \varepsilon\rightarrow 0. В статистике интервальных данных сначала делается предельный переход n\rightarrow 0, а затем предельный переход \varepsilon\rightarrow 0. Итак, в обеих теориях используются одни и те же два предельных перехода: n\rightarrow 0 и \varepsilon\rightarrow 0, но в разном порядке. Утверждения обеих теорий принципиально различны.

В дальнейшем изложение идет на примере оценивания параметров гамма-распределения, хотя аналогичные результаты можно получить и для других параметрических семейств, а также для задач проверки гипотез (см. ниже) и т.д. Наша цель - продемонстрировать основные черты подхода статистики интервальных данных. Его разработка была стимулирована подготовкой ГОСТ 11.011-83 [ [ 12.12 ] ].

Отметим, что постановки статистики объектов нечисловой природы соответствуют подходу, принятому в общей теории устойчивости [ [ 1.15 ] , [ 12.38 ] ]. В соответствии с этим подходом выборке x=(x_1,x_2,...,x_n) ставится в соответствие множество допустимых отклонений G(x), т.е. множество возможных значений вектора результатов наблюдений y=(y_1,y_2,...,y_n). Если известно, что абсолютная погрешность результатов измерений не превосходит \Delta, то множество допустимых отклонений имеет вид

G(x,\Delta)=\{y:|y_i-x_i|\le\Delta,i=1,2,...,n\}.

Если известно, что относительная погрешность не превосходит \delta, то множество допустимых отклонений имеет вид

G(x,\delta)=
\left\{
y:\left|\frac{y_i}{x_i}-1\right|\le\delta,i=1,2,...,n
\right\}.

Теория устойчивости позволяет учесть "наихудшие" отклонения, т.е. приводит к выводам типа минимаксных, в то время как конкретные модели погрешностей позволяют делать заключения о поведении статистик "в среднем".

Оценки параметров гамма-распределения. Как известно, случайная величина X имеет гамма-распределение, если ее плотность такова [ [ 12.12 ] ]:

f(x;a,b)=
\left\{
\begin{aligned}
&\frac{1}{\Gamma(a)}x^{a-1}b^{-a}\exp\left\{-\frac{x}{b}\right\},x>0, \\
&0, x\le 0,
\end{aligned}
\right.
где a - параметр формы, b - параметр масштаба, \Gamma(a) - гамма-функция. Отметим, что есть и иные способы параметризации семейства гамма-распределений [ [ 12.35 ] ] (см также 6.1).

Поскольку M(X)=ab, D(X)=ab^2, то оценки метода имеют вид

\widehat{a}=\frac{(\overline{x})^2}{s^2},\;\widehat{b}=\frac{\overline{x}}{\widehat{a}}=\frac{s^2}{\overline{x}},
где \overline{x} - выборочное среднее арифметическое, а s^2 - выборочная дисперсия. Можно показать, что при больших n
M(\widehat{a}-a)^2=\frac{2a(a+1)}{n},
M(\widehat{b}-b)^2=\frac{b^2}{n}\left(2+\frac{3}{a}\right) ( 11)
с точностью до бесконечно малых более высокого порядка.

Оценка максимального правдоподобия a^* имеет вид [ [ 12.12 ] ]:

a^*=H\left(\frac{1}{n}\sum_{1\le i\le n}\ln\left(\frac{\overline{x}}{x_i}\right)\right), ( 12)
где H(\bullet) - функция, обратная к функции
Q(a)=\ln a-\left/\frac{d\Gamma(a)}{d(a)}\right/\Gamma(a).

При больших n с точностью до бесконечно малых более высокого порядка

M(a^*-a)^2=\frac{a}{n(a\psi'(a)-1)},
\psi(a)=\left.\frac{d\Gamma(a)}{d(a)}\right/\Gamma(a).

Как и для оценок метода моментов, оценка максимального правдоподобия b^* параметра масштаба имеет вид

b^*=\overline{x}/a^*.

При больших n с точностью до бесконечно малых более высокого порядка

M(b^*-b)^2=\frac{b^2\psi'(a)}{n(a\psi'(a)-1)}.

Используя свойства гамма-функции, можно показать [ [ 12.12 ] ], что при больших a

M(a^*-a)^2=\frac{a(2a-1)}{n},
M(b^*-b)^2=\frac{2b^2}{n}.
с точностью до бесконечно малых более высокого порядка. Сравнивая с формулами (11), убеждаемся в том, что средние квадраты ошибок для оценок метода моментов больше соответствующих средних квадратов ошибок для оценок максимального правдоподобия. Таким образом, с точки зрения классической математической статистики оценки максимального правдоподобия имеют преимущество по сравнению с оценками метода моментов.

Анастасия Маркова
Анастасия Маркова

Здравствуйте!

4 июня я записалась на курс Прикладная статистика. Заплатила за получение сертификата. Изучала лекции, прошла Тест 1.

Сегодня вижу, что я вне курса! Почему так произошло?