Опубликован: 18.04.2007 | Уровень: для всех | Доступ: свободно | ВУЗ: Кабардино-Балкарский государственный университет
Лекция 14:

Элементы теории вероятностей и математической статистики

< Лекция 13 || Лекция 14: 1234 || Лекция 15 >

Наиболее часто используются следующие оценки:

  1. размах r_x=x_{\max} -x_{\min} = x_n-x_1 ;
  2. среднее абсолютное отклонение x_{\text{ср}} = \frac 1n\sum\limits^n_{i=1}|x_i-\bar x|;
  3. среднеквадратичное отклонение \delta x= \sqrt{\frac 1n \sum\limits^n_{i=1} (x_i-\bar x)^2} = \sqrt
{\frac 1n \Bigl({\sum\limits^n_{i=1} x^2_i -n\bar x^2}\Bigr)};
  4. дисперсия
    D=\frac {1}{n-1} \sum\limits^n_{i=1}(x_i-\bar x)^2 = \frac {1}{n-1}
\Bigl(\sum\limits^n_{i=1}x^2_i - n\bar x^2\Bigr)
    (часто вместо n-1 берут значение n );
  5. стандартное отклонение: \sigma=\sqrt{D} ;
  6. коэффициент вариации: v=\sigma/\bar x .

Группировка - одна из основных операций, позволяющих "сужать" совокупности с необходимой мерой информативности получаемых групп, выборок, без потери информации о генеральной совокупности. Существуют различные методы и приемы группировки. Рассмотрим некоторые из них.

Пусть задан ряд статистических данных (генеральная совокупность) вида: x1, x2, ..., xn.

Квантиль - величина, большая части ряда или равная ей. Если в качестве квантиля взять медиану, то часть ряда, которая меньше ее (медианы), равна 1/2. Квантили делят выборку на две части.

Квартили - величины x(1), x(2), такие, что 1/4 часть всех наблюдений меньше или равны x(1), а 3/4 наблюдений меньше или равны x(2) ( x(2) - это медиана), x(1) - нижний квартиль, x(2) - верхний квартиль, ( x(2)-x(1)) - интерквартильная широта, (x(1)+x(2))/2 - средний квартиль. Квартили делят наблюдения на четыре части.

Аналогично вводятся децили, которые делят выборку на десять равных частей, и центили ( процентили ), которые делят выборку на 100 частей.

Для группировки в классы данных в некоторой выборке необходимо задать (определить) число классов ( групп ) N, тогда интервал классов c=(xn-x1)/N и xi будет отнесен в класс номер k=[(xi-x1)/c], i=1, 2, ..., N. Затем находят середину класса ( группы ) - xi=xi-1+c(i+0,5).

Гистограмма - диаграмма (обычно столбиковая) имеющая специальный метод построения. Изложим его. Для x1, x2, ..., xn находят число интервалов по формуле k=1+3,2\lg n и длину интервала h=(xn-x1)/k. Пусть в iинтервал попали ni элементов. Относительная частота попадания случайной величины в iинтервал равна p_i. Все точки, попавшие в iинтервал (класс), считаются эквивалентными середине класса: x_i=(xi-1+xi)/2. Диаграмма, где по оси Ox откладывают значения x1, x2 , ..., xn, а по Oy - значения pi=const для каждого интервала, и представляет собой гистограмму. Она имеет вид, изображенный на рис. 14.1 (по оси абсцисс - классы, точнее, интервалы класса, а по оси ординат - относител ьные частоты).

Вид гистограммы (влияния 11 загрязнителей на человека)

Рис. 14.1. Вид гистограммы (влияния 11 загрязнителей на человека)

Определим некоторые базовые понятия теории вероятностей.

Исход - одно из возможных заключений о рассматриваемом процессе (часто из двух - положительное или отрицательное заключение).

Выборочное пространство - множество всех исходов.

Наблюдение - информация, полученная осмотром, измерением, опросом, интервью, тестированием и т.п.

Событие - любое подмножество выборочного пространства. Пустое событие обозначают, как и в теории множеств, символом \emptyset. Событием можно считать и все выборочное пространство (универсальное событие).

Испытание - проверка всевозможных исходов события. В более широком смысле - это выполнение любой процедуры, которой соответствует выборочное пространство более чем из одного исхода.

Два испытания независимы, если любое событие, определенное на основе только одного из них, не зависит от любого события, определенного на основе другого.

Так как событие - это множество, то для него должны быть выполнимы основные операции с множествами: объединение, пересечение и дополнение.

Два события S1 и S2 несовместимы, если S_1\cap S_2=\emptyset .

События S1 и S2 образуют полную группу, если S_1\cup S_2=S (всему выборочному пространству).

События S1 и S2 - противоположны, если они несовместимы и образуют полную группу.

Пусть S - событие, n(S) - число случаев (исходов), в которых произошло событие S из проведенной серии n испытаний (в выборочном пространстве). Тогда \delta =n(S)/n - относительная частота события S.

При больших n (n\to \infty ), \delta \to p. Эта предельная частота называется вероятностью события S и обозначается как p(S) или просто p . Всегда p(S_1)\ge 0 \forall S_1\subset S, а p(S)=1.

Важно заметить, что указанный предел не может быть вычислен как предел функции (последовательности), так как ее просто нет.

Пусть имеется некоторое событие с множеством возможных исходов. Если X - множество этих исходов (состояний), то его любое подмножество Y можно отождествить с событием. Каждому событию (множеству) S можно приписывать некоторое число p(S), называемое вероятностью этого события и удовлетворяющее аксиомам алгебры множеств, в частности, следующим соотношениям:

  1. p(\emptyset)=0 ;
  2. p(X)=1 ;
  3. для любого события S верно неравенство 0\le p(S)\le 1 ;
  4. если p(S_1\cap S_2)=\emptyset, то p(S_1\cup S_2)=p(S_1)+p(S_2), S_1,  S_2 \subset X ;
  5. если S1 и S2 - противоположные события из X, то p(S2)+p(S1)=1 ;
  6. если событие S1 влечет за собой событие S2, то p(S_1)\le p(S_2).
< Лекция 13 || Лекция 14: 1234 || Лекция 15 >
Оксана Лебедева
Оксана Лебедева

Можно ли, используя функцию Дирихле, построить модель пространства, в котором нет иррациональных чисел, а есть только рациональные числа? Очевидно, нельзя построить плоскость, не используя при этом иррациональные числа, так как плоскость непрерывна. Но пространство обладает бо-льшим числом измерений и может сохранить непрерывность в каком-либо одном из них.

Марат Марат
Марат Марат

в лекции ​8 на второй странице в конце, вторая производная у меня получается 4/x3 ....

Александр Колесник
Александр Колесник
Россия, Редкино, МБОУ №3, 2013
Татьяна Талалуева
Татьяна Талалуева
Россия, г. Зеленоград