Поволжский Государственный Университет Телекоммуникаций и Информатики
Опубликован: 13.08.2013 | Доступ: свободный | Студентов: 1280 / 383 | Длительность: 07:30:00
Специальности: Экономист
Лекция 1:

Общие сведения об экспериментальных исследованиях

При обработке числовых массивов результатов эксперимента, как случайных величин, на практике применяют следующие выборочные оценки [ 24 ] :

математическое ожидание

M_x=\frac 1 N \sum\limits_{i-1}^N x_i=\int\limits_{-\infty}^{+\infty} xf(x)dx ( 1.1)

дисперсия

D_x=\frac 1 {N-1}\sum\limits_{i-1}^N (x_i-M_x)^2=\int\limits_{-\infty}^{+\infty}(x_i-M_x)^2 f(x)dx ( 1.2)

коэффициент асимметрии

A=\frac {\frac 1 N \sum\limits_{i-1}^N(x_i-M_x)^3} {\sigma^3} ( 1.3)

коэффициент эксцесса

E=\frac {\frac 1 N \sum\limits_{i-1}^N(x_i-M_x)^4} {\sigma^4}-3 ( 1.4)

где x_i значение результата в i-ом опыте; N - число результатов в массиве; \sigma_x= \pm\sqrt D_x - среднеквадратичное отклонение.

Производная оценка от величины математического ожидания и дисперсии является коэффициент вариации, определяемый в процентах по формуле:

V=\frac {\sigma_x} {M_x} \cdot 100 ( 1.5)

Дисперсия, среднее квадратичное отклонение и коэффициент вариации являются количественными характеристиками, оценки рассеивания значений результатов эксперимента как случайной величины и применяются при изучении различных действий со случайным исходом. Коэффициент асимметрии и коэффициент эксцесса являются характеристиками высшего порядка. Первый характеризует "скошенность распределения", а второй – степень его "островершинности"

Вычисленные по экспериментально наблюдаемым случайным величинам и случайным функциям статистические характеристики несут информацию не обо всей генеральной совокупности, которая в общем случае бесконечна, а лишь о некоторой ее части — выборке, элементы которой измерены с определенными ошибками. В связи с этим в результате эксперимента получают лишь некоторые оценки параметров генеральной совокупности.

Следовательно, и любая выборочная оценка — это случайная величина, точность определения которой и возможные при этом ошибки необходимо контролировать. Следует также иметь в виду, что вычисленные моменты распределения являются точечными оценками выборочных величин, так как каждый из них оценивает параметры генеральной совокупности с помощью единственного числа. Они позволяют судить о значении вычисленной статистической характеристики в данной точке и ничего не говорят о возможных пределах варьирования самой оценки.

К вычисляемым в результате эксперимента оценкам случайных величин предъявляются три основных требования: состоятельности, несмещенности и эффективности. Полагают, что оценка состоятельна, если с ростом объема выборки она стремится по вероятности к истинному значению, несмещена, если ее математическое ожидание стремится к истинному значению, и эффективна, когда оценка обладает наименьшим рассеянием по сравнению с любыми другими оценками. Из двух оценок эффективнее та, которая обладает меньшей дисперсией, т. е. значения которой рассеиваются в более узком интервале.

На уровень рассеивания оценок значительное влияние оказывают ошибки, имеющие место при эксперименте.

При выборочном наблюдении встречаются ошибки трех видов: грубые, систематические и случайные.

Грубые ошибки, отличающиеся большим отклонением от центра группирования выборки, отсеиваются на этапе первичного анализа материалов.

Точность измерений любой физической величины характеризуется, абсолютной \triangle x=x-\overline x и относительной \frac {\triangle x} {\overline x} \cdot 100 ошибками (здесь  \overline x -истинное значение), которые, в свою очередь, состоят из суммы систематических \delta и случайных \varepsilon ошибок

Систематические ошибки \delta постоянны при определении каждого члена выборки и зависят от технического уровня измерительной аппаратуры и техники эксперимента. Эти ошибки можно свести к минимуму периодической тарировкой приборов с помощью более совершенных и повышением точности метода определения исследуемых переменных. Случайные ошибки обусловлены влиянием большого количества факторов. Их появление неодинаково и случайно от измерения к измерению и не может быть предварительно учтено из-за их зависимости от изменения условий измерений и изменчивости самих измеряемых величин. Однако при достаточно большом количестве экспериментов суммарное значение случайных ошибок, изменяющихся примерно одинаково в положительную и отрицательную сторону, приближается к нулю. Случайные ошибки в подавляющем большинстве подчиняются нормальному закону распределения с математическим ожиданием, равным "0".

В практике исследований систематические и случайные ошибки близки друг к другу и совместно определяют ошибку измерений. При оценке точности измерений рекомендуется учитывать суммарную ошибку

\varepsilon_{\sum}=\delta+\varepsilon \frac {\sigma_{\sum}} {\sqrt n} ( 1.6)
где \sigma_{\sum} — среднеквадратическое отклонение случайной величины при числе измерений n.

Для величин, определяемых косвенно — методом расчета по другим измеренным случайным величинам, оценка погрешностей осуществляется вычислением статистических оценок по соответствующим функциональным зависимостям.

Выборочные характеристики M_x, \sigma_x определяемые на основе ограниченного числа наблюдений, могут приближаться к истинным значениям характеристик генеральной совокупности M_x^0, \sigma_x^0 лишь с определенной точностью:

M_x^0=M_x+\varepsilon,\sigma_x^0=\sigma_x+\sigma_{\varepsilon} ( 1.7)

Точность выборочного наблюдения (эксперимента) может задаваться в единицах измерения исследуемой величины, в единицах выборочного значения \sigma_x и в процентах исследуемой величины или характеристики.

Систематическая ошибка, будучи постоянной, при этом может не учитываться.

Вероятность того, что истинное значение характеристик генеральной совокупности находится в отмеченных пределах, равна

P(M_x-\varepsilon<M^0_x<M_x+\varepsilon), P(\sigma_x-\sigma_{\varepsilon}<\sigma^0<\sigma _x+\sigma_{\varepsilon}} ( 1.8)
и называется надежностью данной оценки .

Так как математическое ожидание любой выборки само является случайной величиной, то полезно установить такой интервал, в котором с заданной степенью достоверности будет заключено значение оцениваемого параметра.

Интервал M_x+\varepsilon, в который в общем случае может быть произвольным [a_i,b_i], называется доверительными границами, а соответствующая вероятность - доверительной вероятностью или, как часто говорят, надежностью. Доверительную вероятность для удобства обозначают как

(1-\alpha)=P(a_i<M_x \leqslant b_i) ( 1.9)

Соответственно a есть вероятность ошибки, которая на кривой распределения изображается в виде двух половинок a/2.

Вероятность ошибки характеризует долю риска в оценке истинного значения оцениваемой величины и часто называется уровнем значимости. Для удобства величину доверительного интервала устанавливают в долях среднеквадратического отклонения \pm z \sigma_{\sum}. Тогда доверительную вероятность определяют, как площадь, ограниченную кривой нормального распределения на интервале \pm z \sigma_{\sum}. Используя формулу стандартного нормального распределения (9)

z=\frac {x-M_x} {\sigma_x} ( 1.10)
при M_x=0 и \sigma_x=1

доверительную вероятность, согласно (8), записывают в таком виде:

P( \overline x – z \frac {\sigma_x} {\sqrt n} \leqslant M_x \leqslant \overline x + z \frac {\sigma_x} {\sqrt n}) ( 1.11)
, где \overline x - оценка среднего значения генеральной совокупности

доверительный интервал для дисперсии

[ \frac {n\sigma_x^2} {x^2 \alpha/2} \leqslant D_x \leqslant \frac {n\sigma_x^2} {x^21- \alpha/2}] ( 1.12)

Определяют доверительный интервал в такой последовательности: вычисляют параметр выборки \overline x \approx M_x, выбирают доверительную вероятность, (1-\alpha) определяют соответствующее выбранному значению (1-\alpha) число из таблицы табулированных значений стандартного нормального распределения; вычисляют доверительный интервал \alpha \leqslant M_x < b.

С увеличением количества замеров достоверность эксперимента возрастает, а доверительный интервал уменьшается. Таблица используется в том случае, когда о дисперсии исследуемой величины нельзя составить определенного мнения. Если же на основании априорных сведений или предварительных опытов (среднее квадратичное отклонение), известно, то по формуле случайной выборочной ошибки, равной половине длины доверительного интервала

\varepsilon_{0,5}=z \frac {\sigma_x} {\sqrt n} ( 1.13)
определяют необходимое число замеров, гарантирующее требуемую надежность
n=\frac {z^2 \sigma_x^2} {\varepsilon^2} ( 1.14)

Точность и надежность оценки выборочных характеристик не следует смешивать с точностью исследования, которую часто вычисляют по такой формуле:

\triangle u= \frac v {\sqrt n} \delta ( 1.15)
где vкоэффициент вариации выборочного наблюдения, % (в случае оценки точности для сельскохозяйственных машин и процессов считается достаточным, если \triangle u  \leqslant 3…5%.

Кроме установления доверительных интервалов, задачи оценки случайных величин включают анализ законов распределения изучаемых величин, проверку принадлежности двух выборок к одной генеральной совокупности, сравнение средних дисперсий для различных выборок и др.

Рабочим инструментом статистического анализа при решении отмеченных задач оценки являются статистические гипотезы . Статистическими гипотезами именуются суждения, применяемые при различных видах анализа, касающихся, по существу, выяснения свойств некоторой генеральной совокупности случайных величин. Гипотеза в статистике трактуется как предположение о распределении случайных величин.

Гипотеза, отклонения от которой приписываются данному случаю, называется нулевой и обозначается hq. Альтернативная или противоположная гипотеза называется конкурирующей и обозначается H_0. Гипотезы проверяют при помощи специально подобранной случайной величины, распределение которой известно или может быть установлено при малом объеме выборки.