НОУ ИНТУИТ | Прикладная статистика. Лекция 2: Основы вероятностно-статистических методов описания неопределенностей

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Опубликован: 09.11.2009 | Уровень: для всех | Доступ: свободно

Вам нравится? Нравится 61 студенту

| Поделиться |

Поддержать программу

2.5. Основные проблемы прикладной статистики - описание данных, оценивание и проверка гипотез

Выделяют три основные области статистических методов обработки результатов наблюдений - описание данных, оценивание (характеристик и параметров распределений, регрессионных зависимостей и др.) и проверка статистических гипотез. Рассмотрим основные понятия, применяемые в этих областях.

Основные понятия, используемые при описании данных. Описание данных - предварительный этап статистической обработки. Используемые при описании данных величины применяются при дальнейших этапах статистического анализа - оценивании и проверке гипотез, а также при решении иных задач, возникающих при применении вероятностно-статистических методов принятия решений, например, при статистическом контроле качества продукции и статистическом регулировании технологических процессов.

Статистические данные - это результаты наблюдений (измерений, испытаний, опытов, анализов). Функции результатов наблюдений, используемые, в частности, для оценки параметров распределений и (или) для проверки статистических гипотез, называют "статистиками". (Для математиков надо добавить, что речь идет об измеримых функциях.) Если в вероятностной модели результаты наблюдений рассматриваются как случайные величины (или случайные элементы), то статистики, как функции случайных величин (элементов), сами являются случайными величинами (элементами). Статистики, являющиеся выборочными аналогами характеристик случайных величин (математического ожидания, медианы, дисперсии, моментов и др.) и используемые для оценивания этих характеристик, называют статистическими характеристиками.

Основополагающее понятие в вероятностно-статистических методах принятия решений - выборка. Как уже говорилось, выборка - это: 1) набор наблюдаемых значений или 2) множество объектов, отобранных из изучаемой совокупности. Например, единицы продукции, отобранные из контролируемой партии или потока продукции для контроля и принятия решений. Наблюдаемые значения обозначим x_1, x_2,..., x_n , где - объем выборки, т.е. число наблюдаемых значений, составляющих выборку. О втором виде выборок уже шла речь при рассмотрении гипергеометрического распределения, когда под выборкой понимался набор единиц продукции, отобранных из партии. Там же обсуждалась вероятностная модель случайной выборки.

В вероятностной модели выборки первого вида наблюдаемые значения обычно рассматривают как реализацию независимых одинаково распределенных случайных величин $X_1(\omega),X_2(\omega),...X_n(\omega),\omega\in\Omega$ . При этом считают, что полученные при наблюдениях конкретные значения x_1, x_2,...,x_n соответствуют определенному элементарному событию $\omega=\omega_0$ , т.е.

$x_1=X_1(\omega_0),x_2=X_2(\omega_0),...,x_n=X_n(\omega_0),\omega_0\in\Omega.$

При повторных наблюдениях будут получены иные наблюдаемые значения, соответствующие другому элементарному событию $\omega=\omega_1$ . Цель обработки статистических данных состоит в том, чтобы по результатам наблюдений, соответствующим элементарному событию $\omega=\omega_0$ , сделать выводы о вероятностной мере и результатах наблюдений при различных возможных $\omega=\omega_1$ .

Применяют и другие, более сложные вероятностные модели выборок. Например, цензурированные выборки соответствуют испытаниям, проводящимся в течение определенного промежутка времени. При этом для части изделий удается замерить время наработки на отказ, а для остальных лишь констатируется, что наработки на отказ для них больше времени испытания. Для выборок второго вида отбор объектов может проводиться в несколько этапов. Например, для входного контроля сигарет могут сначала отбираться коробки, в отобранных коробках - блоки, в выбранных блоках - пачки, а в пачках - сигареты, т.е. существуют четыре ступени отбора. Ясно, что выборка будет обладать иными свойствами, чем простая случайная выборка из совокупности сигарет.

Из приведенного выше определения математической статистики следует, что описание статистических данных дается с помощью частот. Частота - это отношение числа наблюдаемых единиц, которые принимают заданное значение или лежат в заданном интервале, к общему числу наблюдений , т.е. частота - это Х/n . (В более старой литературе иногда Х/n называется относительной частотой, а под частотой имеется в виду . В старой терминологии можно сказать, что относительная частота - это отношение частоты к общему числу наблюдений.)

Отметим, что обсуждаемое определение приспособлено к нуждам одномерной статистики. В случае многомерного статистического анализа, статистики случайных процессов и временных рядов, статистики объектов нечисловой природы нужны несколько иные определения понятия "статистические данные". Не считая нужным давать здесь такие определения, отметим, что в подавляющем большинстве практических постановок исходные статистические данные - это выборка или несколько выборок. А выборка - это конечная совокупность соответствующих математических объектов (чисел, векторов, функций, объектов нечисловой природы).

Число имеет биномиальное распределение, задаваемое вероятностью того, что случайная величина, с помощью которойp моделируются результаты наблюдений, принимает заданное значение или лежит в заданном интервале, и общим числом наблюдений . Из закона больших чисел (теорема Бернулли) следует, что

$\frac{X}{n}\rightarrow p$

при $n\rightarrow\infty$ (сходимость по вероятности), т.е. частота сходится к вероятности. Теорема Муавра-Лапласа позволяет уточнить скорость сходимости в этом предельном соотношении.

Чтобы от отдельных событий перейти к одновременному рассмотрению многих событий, используют накопленную частоту. Так называется отношение числа единиц, для которых результаты наблюдения меньше заданного значения, к общему числу наблюдений. (Это понятие используется, если результаты наблюдения - действительные числа, а не вектора, функции или объекты нечисловой природы.) Функция, которая выражает зависимость между значениями количественного признака и накопленной частотой, называется эмпирической функцией распределения. Итак, эмпирической функцией распределения F_n(x) называется доля элементов выборки, меньших . Эмпирическая функция распределения содержит всю информацию о результатах наблюдений.

Чтобы записать выражение для эмпирической функции распределения в виде формулы, введем функцию c(x,y) двух переменных:

$c(x,y)= \left\{ \begin{aligned} &0,\;x\le y, \\ &1, x>y. \end{aligned} \right.$

Случайные величины, моделирующие результаты наблюдений, обозначим $X_1(\omega),X_2(\omega),...,X_n(\omega), \omega\in\Omega$ . Тогда эмпирическая функция распределения Fn(x) имеет вид

$F_n(x)=F_n(x,\omega)=\frac{1}{n}\sum_{1\le i\le n} c(x,X_i(\omega)).$

Из закона больших чисел следует, что для каждого действительного числа эмпирическая функция распределения F_n(x) сходится к функции распределения F(x) результатов наблюдений, т.е.

$F_n(x)\rightarrow F(x)$

( 1)

при $n\rightarrow\infty$ . Советский математик В.И. Гливенко (1897-1940) доказал в 1933 г. более сильное утверждение: сходимость в (1) равномерна по

, т.е.

$\sup_x|F_n(x)-F(x)|\rightarrow 0$

( 2)

при $n\rightarrow\infty$ (сходимость по вероятности).

В (2) использовано обозначение $\sup$ (читается как "супремум"). Для функции g(x) под $\sup_x g(x)$ понимают наименьшее из чисел таких, что $g(x)\le a$ при всех . Если функция g(x) достигает максимума в точке x_0 , то $\sup_x g(x)=g(x_0)$ . В таком случае вместо $\sup$ пишут $\max$ . Хорошо известно, что не все функции достигают максимума.

В том же 1933 г. А.Н. Колмогоров усилил результат В.И. Гливенко для непрерывных функций распределения F(x) . Рассмотрим случайную величину

$D_n=\sqrt{n}\sup_x|F_n(x)-F(x)|$

и ее функцию распределения

$K_n(x)=P\{D_n\le x\}.$

По теореме А.Н. Колмогорова

$\lim_{n\rightarrow\infty}K_n(x)=K(x)$

при каждом

, где

- так называемая функция распределения Колмогорова.

Рассматриваемая работа А.Н. Колмогорова породила одно из основных направлений математической статистики - так называемую непараметрическую статистику. И в настоящее время непараметрические критерии согласия Колмогорова, Смирнова, омега-квадрат широко используются. Они были разработаны для проверки согласия с полностью известным теоретическим распределением, т.е. предназначены для проверки гипотезы $H_0:F(x)\equiv F_0(x)$ . Основная идея критериев Колмогорова, омега-квадрат и аналогичных им состоит в измерении расстояния между функцией эмпирического распределения и функцией теоретического распределения. Различаются эти критерии видом расстояний в пространстве функций распределения. Аналитические выражения для предельных распределений статистик, расчетные формулы, таблицы распределений и критических значений широко распространены [ [ 2.1 ] ], поэтому не будем их приводить.

Кроме эмпирической функции распределения, для описания данных используют и другие статистические характеристики. В качестве выборочных средних величин постоянно используют выборочное среднее арифметическое, т.е. сумму значений рассматриваемой величины, полученных по результатам испытания выборки, деленную на ее объем:

$\overline{x}=\frac{1}{n}\sum_{1\le i\le n}x,$

где

- объем выборки, x_i

- результат измерения (испытания)

-ого элемента выборки.

Другой вид выборочного среднего - выборочная медиана. Она определяется через порядковые статистики.

Порядковые статистики - это члены вариационного ряда, который получается, если элементы выборки x_1, x_2,...,x_n расположить в порядке неубывания:

$x(1)\le x(2)\le ...\le x(k)\le ...\le x(n)$

Пример 1. Для выборки x_1=1, x_2=7, x_3=4, x_4=2, x_5=8, x_6=0, x_7=5, x_8=7 вариационный ряд имеет вид 0, 1, 2, 4, 5, 7, 7, 8 , т.е. x(1)=0=x_6, x(2)=1=x_1, x(3)=2=x_4, x(4)=4=x_3, x(5)=5=x_7, x(6)=x(7)=7=x_2=x_8, x(8)=8=x_5 .

В вариационном ряду элемент x(k) называется -й порядковой статистикой. Порядковые статистики и функции от них широко используются в вероятностно-статистических методах принятия решений, в эконометрике и в других прикладных областях [ [ 2.16 ] ].

Выборочная медиана $\widetilde{x}$ - результат наблюдения, занимающий центральное место в вариационном ряду, построенном по выборке с нечетным числом элементов, или полусумма двух результатов наблюдений, занимающих два центральных места в вариационном ряду, построенном по выборке с четным числом элементов. Таким образом, если объем выборки - нечетное число, n = 2k+1 , то медиана $\widetilde{x} = x(k+1)$ , если же - четное число, n = 2k , то медиана $\widetilde{x}=[x(k) + x(k+1)]/2$ , где x(k) и x(k+1) - порядковые статистики.

В качестве выборочных показателей рассеивания результатов наблюдений чаще всего используют выборочную дисперсию, выборочное среднее квадратическое отклонение и размах выборки.

Согласно [ [ 2.1 ] ] выборочная дисперсия s^2 - это сумма квадратов отклонений выборочных результатов наблюдений от их среднего арифметического, деленная на объем выборки:

$s^2=\frac{1}{n}\sum_{1\le i\le n}(x_i-\overline{x})^2.$

Выборочное среднее квадратическое отклонение - неотрицательный квадратный корень из дисперсии, т.е. $s=+\sqrt{s^2}$ .

В некоторых литературных источниках выборочной дисперсией называют другую величину:

$s_0^2=\frac{1}{n-1}\sum_{1\le i\le n}(x_i-\overline{x})^2.$

Она отличается от s^2 постоянным множителем:

$s^2=\left(1-\frac{1}{n}\right)s_0^2.$

Соответственно выборочным средним квадратическим отклонением в этих литературных источниках называют величину $s_0=+\sqrt{s_0^2}$ . Тогда очевидно, что

$s=\sqrt{1-\frac{1}{n}}s_0.$

Различие в определениях приводит к различию в алгоритмах расчетов, правилах принятия решений и соответствующих таблицах. Поэтому при использовании тех или иных нормативно-технических и инструктивно-методических материалов, программных продуктов, таблиц необходимо обращать внимание на способ определения выборочных характеристик.

Выбор s_0^2 , а не s^2 , объясняется тем, что

$M(s_0^2)=D(X)=\sigma^2,$

где

- случайная величина, имеющая такое же распределение, как и результаты наблюдений. В терминах теории статистического оценивания это означает, что s_0^2

- несмещенная оценка дисперсии (см. ниже). В то же время статистика s^2

не является несмещенной оценкой дисперсии результатов наблюдений, поскольку

$M(s^2)=\left(1-\frac{1}{n}\right)\sigma^2.$

Однако у s^2 есть другое свойство, оправдывающее использование этой статистики в качестве выборочного показателя рассеивания. Для известных результатов наблюдений x_1, x_2,..., x_n рассмотрим случайную величину с распределением вероятностей

$P(Y=x_i)=\frac{1}{n},i=1,2,...,n,$

и

для всех прочих

. Это распределение вероятностей называется эмпирическим. Тогда функция распределения

- это эмпирическая функция распределения, построенная по результатам наблюдений x_1, x_2,..., x_n

. Вычислим математическое ожидание и дисперсию случайной величины

:

$M(Y)=\overline{x},D(Y)=s^2.$

Второе из этих равенств и является основанием для использования s^2 в качестве выборочного показателя рассеивания.

Отметим, что математические ожидания выборочных средних квадратических отклонений M(s) и M(s_0) , вообще говоря, не равняются теоретическому среднему квадратическому отклонению $\sigma$ . Например, если имеет нормальное распределение, объем выборки n=3 , то

$M(s)=0,724\sigma, M(s_0)=0,887\sigma.$

Кроме перечисленных выше статистических характеристик, в качестве выборочного показателя рассеивания используют размах - разность между -й и первой порядковыми статистиками в выборке объема , т.е. разность между наибольшим и наименьшим значениями в выборке: R=x(n)-x(1) .

В ряде вероятностно-статистических методов принятия решений применяют и иные показатели рассеивания. В частности, в методах статистического регулирования процессов используют средний размах - среднее арифметическое размахов, полученных в определенном количестве выборок одинакового объема. Популярно и межквартильное расстояние, т.е. расстояние между выборочными квартилями x([0,75n]) и x([0,25n]) порядка 0,75 и 0,25 соответственно, где [0,75n] - целая часть числа 0,75n , а [0,25n] -целая часть числа 0,25n .

Основные понятия, используемые при оценивании. Оценивание - это определение приближенного значения неизвестной характеристики или параметра распределения (генеральной совокупности), иной оцениваемой составляющей математической модели реального (экономического, технического и др.) явления или процесса по результатам наблюдений. Иногда формулируют более коротко: оценивание - это определение приближенного значения неизвестного параметра генеральной совокупности по результатам наблюдений. При этом параметром генеральной совокупности может быть либо число, либо набор чисел (вектор), либо функция, либо множество или иной объект нечисловой природы. Например, по результатам наблюдений, распределенных согласно биномиальному закону, оценивают число - параметр (вероятность успеха). По результатам наблюдений, имеющих гамма-распределение, оценивают набор из трех чисел - параметры формы , масштаба и сдвига . Способ оценивания функции распределения приведен в теоремах В.И. Гливенко и А.Н. Колмогорова. Оценивают также плотности вероятности, функции, выражающие зависимости между переменными, включенными в вероятностные модели экономических, управленческих или технологических процессов, и т.д. Целью оценивания может быть нахождение упорядочения инвестиционных проектов по экономической эффективности или технических изделий (объектов) по качеству, формулировка правил технической или медицинской диагностики и т.д. (Упорядочения в математической статистике называют также ранжировками. Это - один из видов объектов нечисловой природы.)

Оценивание проводят с помощью оценок - статистик, являющихся основой для оценивания неизвестного параметра распределения. В ряде литературных источников термин "оценка" встречается в качестве синонима термина "оценивание". Употреблять одно и то же слово для обозначения двух разных понятий нецелесообразно: оценивание - это действие, а оценка - статистика (функция от результатов наблюдений), используемая в процессе указанного действия или являющаяся его результатом.

Существуют два вида оценивания - точечное и с помощью доверительной области.

Точечное - способ оценивания, заключающийся в том, что значение оценки принимается как неизвестное значение параметра распределения.

Пример 2. Пусть результаты наблюдений x_1, x_2,..., x_n рассматривают в вероятностной модели как случайную выборку из нормального распределения $N(m,\sigma)$ . То есть считают, что результаты наблюдений моделируются как реализации независимых одинаково распределенных случайных величин, имеющих функцию нормального распределения $N(m,\sigma)$ с некоторыми математическим ожиданием и средним квадратическим отклонением $\sigma$ , неизвестными статистику. Требуется оценить параметры и $\sigma$ (или $\sigma^2$ ) по результатам наблюдений. Оценки обозначим m^* и $(\sigma^2)^*$ соответственно. Обычно в качестве оценки m^* математического ожидания используют выборочное среднее арифметическое $\overline{x}$ , а в качестве оценки $(\sigma^2)^*$ дисперсии $\sigma^2$ используют выборочную дисперсию s^2 , т.е.

$m^*=\overline{x}, (\sigma^2)^*=s^2.$

Для оценивания математического ожидания могут использоваться и другие статистики, например, выборочная медиана $\widetilde{x}$ , полусумма минимального и максимального членов вариационного ряда

$m^{**}=[x(1)+x(n)]/2$

и др. Для оценивания дисперсии $\sigma^2$ также имеется ряд оценок, в частности, s_0^2

(см. выше) и оценка, основанная на размахе

, имеющая вид

$(\sigma^2)^{**}=[a(n)R]^2,$

где коэффициенты a(n)

берут из специальных таблиц [ [ 2.1 ] ]. Эти коэффициенты подобраны так, чтобы для выборок из нормального распределения

$M[a(n)R]=\sigma.$

Наличие нескольких методов оценивания одних и тех же параметров приводит к необходимости выбора между этими методами.

Как сравнивать методы оценивания между собой? Сравнение проводят на основе таких показателей качества методов оценивания, как состоятельность, несмещенность, эффективность и др.

Рассмотрим оценку $\theta_n$ числового параметра $\theta$ , определенную при n = 1, 2,.. . Оценка $\theta_n$ называется состоятельной, если она сходится по вероятности к значению оцениваемого параметра $\theta$ при безграничном возрастании объема выборки. Выразим сказанное более подробно. Статистика $\theta_n$ является состоятельной оценкой параметра $\theta$ тогда и только тогда, когда для любого положительного числа $\varepsilon$ справедливо предельное соотношение

$\lim_{n\rightarrow\infty}P\{|\theta_n-\theta|>\varepsilon\}=0.$

Пример 3. Из закона больших чисел следует, что $\theta_n=\overline{x}$ является состоятельной оценкой $\theta=M(X)$ (в приведенной выше теореме Чебышева предполагалось существование дисперсии D(X) ; однако, как доказал А.Я. Хинчин [ [ 2.3 ] ], достаточно выполнения более слабого условия - существования математического ожидания M(X) ).

Пример 4. Все указанные выше оценки параметров нормального распределения являются состоятельными.

Вообще все (за редчайшими исключениями) оценки параметров, используемые в вероятностно-статистических методах принятия решений, являются состоятельными.

Пример 5. Так, согласно теореме В.И. Гливенко, эмпирическая функция распределения Fn(x) является состоятельной оценкой функции распределения результатов наблюдений F(x) .

При разработке новых методов оценивания следует в первую очередь проверять состоятельность предлагаемых методов.

Второе важное свойство оценок - несмещенность. Несмещенная оценка $\theta_n$ - это оценка параметра $\theta$ , математическое ожидание которой равно значению оцениваемого параметра: $M(\theta_n)=\theta$ .

Пример 6. Из приведенных выше результатов следует, что $\overline{x}$ и s_0^2 являются несмещенными оценками параметров и $\sigma^2$ нормального распределения. Поскольку $M(\widetilde{x})=M(m^{**})=m$ , то выборочная медиана $\widetilde{x}$ и полусумма крайних членов вариационного ряда $m^{**}$ - также несмещенные оценки математического ожидания нормального распределения. Однако

$M(s^2)\ne\sigma^2, M[(\sigma^2)^{**}]\ne\sigma^2,$

поэтому оценки s^2

и $(\sigma^2)^{**}$ не являются состоятельными оценками дисперсии $\sigma^2$ нормального распределения.

Оценки, для которых соотношение $M(\theta_n)=\theta$ неверно, называются смещенными. При этом разность между математическим ожиданием оценки $\theta_n$ и оцениваемым параметром $\theta$ , т.е. $M(\theta_n)-\theta$ , называется смещением оценки.

Пример 7. Для оценки s^2 , как следует из сказанного выше, смещение равно

$M(s^2)-\sigma^2=-\sigma^2/n.$

Смещение оценки s^2 стремится к 0 при $n\rightarrow\infty$ .

Оценка, для которой смещение стремится к 0, когда объем выборки стремится к бесконечности, называется асимптотически несмещенной. В примере 7 показано, что оценка s^2 является асимптотически несмещенной.

Практически все оценки параметров, используемые в вероятностно-статистических методах принятия решений, являются либо несмещенными, либо асимптотически несмещенными. Для несмещенных оценок показателем точности оценки служит дисперсия - чем дисперсия меньше, тем оценка лучше. Для смещенных оценок показателем точности служит математическое ожидание квадрата оценки $M(\theta_n-\theta)^2$ . Как следует из основных свойств математического ожидания и дисперсии,

$d_n(\theta_n)=M[(\theta_n-\theta)^2]=D(\theta_n)+(M(\theta_n)-\theta)^2,$

( 3)

т.е. математическое ожидание квадрата ошибки складывается из дисперсии оценки и квадрата ее смещения.

Для подавляющего большинства оценок параметров, используемых в вероятностно-статистических методах принятия решений, дисперсия имеет порядок 1/n , а смещение - не более чем 1/n , где - объем выборки. Для таких оценок при больших второе слагаемое в правой части (3) пренебрежимо мало по сравнению с первым, и для них справедливо приближенное равенство

$d_n(\theta_n)=M[(\theta_n-\theta)^2]\approxD(\theta_n)\approx\frac{c}{n},c=c(\theta_n,\theta),$

( 4)

где - число, определяемое методом вычисления оценок $\theta_n$ и истинным значением оцениваемого параметра $\theta$ .

С дисперсией оценки связано третье важное свойство метода оценивания - эффективность. Эффективная оценка - это несмещенная оценка, имеющая наименьшую дисперсию из всех возможных несмещенных оценок данного параметра.

Доказано [ [ 2.10 ] ], что $\overline{x}$ и s_0^2 являются эффективными оценками параметров и $\sigma^2$ нормального распределения. В то же время для выборочной медианы $\widetilde{x}$ справедливо предельное соотношение

$\lim_{n\rightarrow\infty}\frac{D(\overline{x})}{D(\widetilde{x})}=\frac{2}{\pi}\approx 0,637$

Другими словами, эффективность выборочной медианы, т.е. отношение дисперсии эффективной оценки $\overline{x}$ параметра к дисперсии несмещенной оценки $\widetilde{x}$ этого параметра при больших близка к 0,637. Именно из-за сравнительно низкой эффективности выборочной медианы в качестве оценки математического ожидания нормального распределения обычно используют выборочное среднее арифметическое.

Дальше >>

Авторизоваться

Прикладная статистика

Основы вероятностно-статистических методов описания неопределенностей

2.5. Основные проблемы прикладной статистики - описание данных, оценивание и проверка гипотез

Вопросы и ответы