Уральский государственный экономический университет
Опубликован: 24.04.2013 | Доступ: свободный | Студентов: 2970 / 1148 | Длительность: 06:24:00
Специальности: Математик, Физик
Лекция 5:

Элементы математической статистики

Аннотация: Лекция посвящена описанию средств пакета MathCAD для решения основных задач математической статистики, в том числе методам генерации псевдослучайных последовательностей с заданным распределением, вычислению числовых характеристик случайных величин, определению закона распределения случайной величины.

Цель лекции. Показать методику и инструменты MathCAD для работы со случайными величинами.

5.1. Функции для решения задач математической статистики

Случайной величиной (СВ) называется величина, которая в результате опыта может принять только одно из множества значений, причем заранее, до опыта, неизвестно, какое именно. Случайная величина (СВ) может быть дискретной, в этом случае она принимает значение из дискретного числового множества M={1, 2, 3, 4, 5} [10,12]. Случайная величина может быть непрерывной, тогда принимает значения из непрерывного числового множества. Каждая СВ полностью определяется своей функцией распределения. Если X - СВ, возможные значения которой x1,x2,.. Функцией распределения F(x), или интегральным законом распределения, случайной величины X называется зависимость вероятности P выполнения неравенства X < х от возможных значений х

F(x)=P(X<x), ( 5.1)
где P - вероятность.

Функция распределения СВ содержит о ней всю информацию, поэтому важно изучение и исследование функции распределения СВ, которую часто называют просто распределением.

Непрерывную СВ можно также задать, используя другую функцию - плотность распределения или плотность вероятности или дифференциальную функцию.

Плотностью распределения вероятностей непрерывной случайной величины X называется функция f(x), являющаяся первой производной от функции распределения F(x) - f(x)=F'(x).

Из определения следует, что функция распределения является первообразной для плотности распределения. Если функция f(x) - плотность распределения непрерывной СВ, то для любых a < b

F(X)=\int\limits_{-\infty}^x f(x)dx ( 5.2)

Зная плотность вероятности, можно найти функцию распределения [10,12].

Функции для генерации последовательности случайных величин (СВ) находятся в категории Random numbers; имена функций начинаются на r, далее следует сокращённое название закона, например: - rnd (x) – генерирует одно число, равномерно распределённое от 0 до х; - rnorm (n, m, d) – генерирует n чисел, распределённых по нормальному закону с средним m и среднеквадратичным отклонением \sigma - rpois (n,p) – генерирует n чисел, распределённых по закону Пуассона с параметром р.

Функции распределения случайной величины находятся в категории Probaility distribution; имена функций начинаются на p, далее следует сокращённое название закона. Например: pnorm\ (x,\ m, \sigma) – рассчитывает в точке x значение функции распределения вероятности для нормального закона с средним m и среднеквадратичным отклонением \sigma ppois (n,p) – рассчитывает в точке x значение функции распределения вероятности для закона Пуассона с параметром p.

Функции плотности распределения случайной величины находятся в категории Probability density; имена функций начинаются на d, далее следует сокращённое название закона. Например: dunif (x, a, b).значение функции плотности вероятности в точке x для равномерного закона на интервале [a,b], a < b, - dpois (x,p)значение функции плотности вероятности в точке x для закона Пуассона с параметром p.

Функции для расчёта числовых характеристик случайных величин. При решении практических задач важно числовые параметры СВ - количественные критерии, которые позволяют дать оценку наиболее существенным признакам случайной величины. К таким величинам относятся: математическое ожидание (или среднее), дисперсия, среднеквадратическое отклонение и т.д. [10, 12]. Функции для расчёта числовых характеристик находятся в категории Statistics. Например, mean (v) – среднее значение, var (v)дисперсия;- stdev (v)среднеквадратичное отклонение и т.д. Здесь v - вектор значений случайной величины.

Все функции приведены в приложении.

5.2. Генерация случайных чисел

При генерации программа создаёт последовательность псевдослучайных чисел. Псевдослучайные величины вырабатываются алгоритмически и представляют последовательность чисел, обладающих свойствами случайных чисел. Псевдослучайные числа связаны с некоторым задаваемым стартовым значением. Для того, чтобы поменять саму последовательность сгенерированных случайным датчиком чисел, в MathCAD предусмотрена возможность определения начального – стартового значения. В меню Tools/ Worksheet Options (Инструменты/ Опции листа), на вкладке Built-in Variables (Встроенные переменные) в поле ввода Seed value for random устанавливается начальное (стартовое) значение для генератора псевдослучайных чисел. Альтернативный способ: использование встроенной функции seed(x) прямо в документе:

seed(x) функция установки нового начального значения для генератора псевдослучайных чисел, х — новое начальное значение для генератора псевдослучайных чисел (целое число от 1 до 2147483647) [3, 4].

Равномерное распределение - распределение с постоянной вероятностью

Пример 5.1

Построим 8000 чисел равномерно распределенной СВ в интервале от 0 до 10 и ее график.

Используем функцию rnd(x) из категории Random numbers.

Функция rnd(x) генерирует равномерно распределенное случайное число между 0 и x . [4, 9].

Для генерации массива используем ранжированную переменную. MathCAD создает массив СВ в виде вектора, значения которого представляются в виде таблицы, 1 столбец которой – номер, 2 столбец - значение случайной величины. Если массив большой, чтобы просмотреть все значения СВ – надо щелкнуть по таблице и использовать линейку прокрутки. Можно представить СВ в виде одномерной индексной переменной. На листинге решения (Рис.5.1) R – вектор случайной величины. График СВ построен на плоскости для индексной переменной и трехмерный для вектора R. Графики построены в виде точек.

ORIGIN:=1

rnd(x) - генерирует одно число, равномерно распределенное от 0 до x.

rnd(2)=2.537\times 10^{-3} - равномерно распределенное случайное число в интервале [0;2]

rnd(3)=0.58 - равномерно распределенное в интервале [0;3]

k:=0..8000

R_k:=rnd(10)

R=\begin{array}{|c|c|}
\hline  & 1 \\ \hline 
4456 & 1.052 \\ \hline 
4457 & 8.36 \\ \hline 
4458 & 4.844 \\ \hline 
4459 & 1.823 \\ \hline 
4460 & 2.199   \\ \hline 
4461 & \textbf{4.068}    \\ \hline 
4462 & 0.418    \\ \hline  
4463 & 1.853    \\ \hline 
4464 & 9.569    \\ \hline 
4465 & 8.844    \\ \hline 
4466 & 0.148    \\ \hline 
\end{array} R_1:=2.532 R_2:=9.82 R_5000:=0.612

 Листинг решения примера 5.1. Графики СВ одномерной индндексной переменной Rk  и матрицы R

Рис. 5.1. Листинг решения примера 5.1. Графики СВ одномерной индндексной переменной Rk и матрицы R

Нормальное распределение

Пример 5.2

Построим 1000 элементов СВ, распределенных по нормальному закону со средним m=1600 среднеквадратичным отклонением \sigma=100.

Для генерации используем функцию rnorm () из категории Random numbers.

Функция rnorm (n, m, \sigma).  - генерирует вектор n независимых случайных чисел, каждое из которых имеет нормальное распределение с средним m и среднеквадратичным отклонением \sigma;.

Функция rnorm() также создает массив СВ в виде вектора. . На листинге (Рис.5.2) NR – -вектор случайной величины. Как и в примере 5.1. построим график СВ на плоскости для индексной переменной NR_k в виде точек и линий и трехмерный точечный для матрицы NR.

ORIGIN:=1

m:=1600

\sigma:=100

NR:=rnorm(1000,m,\sigma)

NR=\begin{array}{|c|c|}
\hline 
989 & 1.674\times 10^3 \\ \hline 
990 & 1.69\times 10^3 \\ \hline 
991 & 1.725\times 10^3 \\ \hline 
992 & 1.476\times 10^3 \\ \hline 
993 & 1.591\times 10^3  \\ \hline 
994 & 1.649\times 10^3    \\ \hline 
995 & 1.582\times 10^3    \\ \hline  
996 & 1.573\times 10^3    \\ \hline 
997 & 1.436\times 10^3    \\ \hline 
998 & 1.329\times 10^3    \\ \hline 
999 & 1.639\times 10^3    \\ \hline 
1000& ...    \\ \hline 
\end{array}

 Листинг решения примера 5.2. Вектор СВ NR и графики вектора  NR .на плоскости и в простанстве

увеличить изображение
Рис. 5.2. Листинг решения примера 5.2. Вектор СВ NR и графики вектора NR .на плоскости и в простанстве

Числовые характеристики

Рассчитаем числовые характеристики СВ: среднее, минимальное, максимальное значение, дисперсию, среднеквадратичное отклонение . Используем функции из категории Statistics.

Числовые характеристики СВ с равномерным распределением для примера 5.1 .

mean(R)=5.013 - среднее

min(R)=3.286\times10^{-3} - минимальное

max(R)=10 - максимальное

var(R)=\vrule{} - дисперсия

stdev(R)=2.884 - среднеквадратичное отклонение

Числовые характеристики СВ с нормальным распределением для примера 5.2

mean(NR)=1.604\times10^3 - среднее

min(NR)=1.275\times10^3 - минимальное

max(NR)=1.906\times10^3 - максимальное

var(NR)=9.55\times10^3 - дисперсия

stdev(NR)=97.723 - среднеквадратичное отклонение