Можно ли, используя функцию Дирихле, построить модель пространства, в котором нет иррациональных чисел, а есть только рациональные числа? Очевидно, нельзя построить плоскость, не используя при этом иррациональные числа, так как плоскость непрерывна. Но пространство обладает бо-льшим числом измерений и может сохранить непрерывность в каком-либо одном из них. |
Элементы теории вероятностей и математической статистики
Элементы теории вероятностей и математической статистики
Пусть задан некоторый статистический ряд из элементов x1, x2,..., xn. Если эти элементы могут принимать все мыслимые допустимые значения, а объект с этими характеристиками рассматривается как единый (как система), то такую совокупность называют генеральной совокупностью ; часто при этом предполагается (как и нами везде ниже), что она является конечной и упорядоченной по возрастанию: .
Любое непустое подмножество генеральной совокупности называется выборкой . Если выборка осуществлена случайным образом, то она называется случайной выборкой. Далее мы часто под выборкой будем понимать ранжированную, упорядоченную выборку.
Средняя величина генеральной совокупности в целом называется общей средней . Она отражает общие черты всей совокупности. Средняя величина для отдельной выборки называется средней по выборке или выборочной средней . Она отражает общие черты группы.
Основная цель статистических расчетов, как правило, состоит в том, чтобы по характеристикам выборки получить достоверную информацию о свойствах исходных генеральных совокупностей.
Пример. Повышение среднемесячной зарплаты, например, от 1200 руб. до 1500 руб. отражает лишь общую тенденцию динамики зарплаты (ее рост) по всем категориям трудящихся. В различных группах средние величины по группе могут сильно различаться, а в некоторых группах и не возрастать. Сравнительный анализ групповых и общих средних может дать информацию для характеристики социально-экономических слоев населения, о наличии и степени расслоения общества, о наличии и силе связей между групповым (факторным) признаком и результативным показателем.
Существуют различные меры средних величин.
Чаще используется средняя арифметическая характеристика:
![\bar x = \frac {\sum\limits^n_{i=1} x_i}{n} =
\frac {x_1+x_2+\dotsc+ x_n}{n} .](/sites/default/files/tex_cache/468c90a88d296d9c4a291a0048354a10.png)
Она называется также выборочной средней или эмпирической средней.
Если измерения были неравноточными, или разной важности, то при вычислении средней арифметической характеристики используются весовые коэффициенты (например, отражающие точность измерения, инструмента) и такая средняя характеристика называется средневзвешенной оценкой . Она применяется также при вычислении общей средней (генеральной выборки) по выборочным средним (средним групп, выборок):
![\bar x = \frac
{\sum\limits^n_{i=1} x_i\omega_i}
{\sum\limits^n_{i=1} \omega_i},](/sites/default/files/tex_cache/d8172423af958d0321164bd167979f4d.png)
![\omega_i](/sites/default/files/tex_cache/3c24fe0fbcba0ef1f90aada88fb4e5f6.png)
При расчете средневзвешенных оценок по выборке важное значение имеет выбор веса и его обоснование. Средняя гармоническая величина, как и средняя арифметическая, может быть простой и взвешенной. Если все веса равны между собой, то можно использовать среднюю гармоническую в виде
![\bar x_{\text{гарм}} = \frac {n}{\sum\limits^n_{i=1}\frac {1}{x_i} }.](/sites/default/files/tex_cache/1bc6d905502b114e0589bd9095bf5d60.png)
Средняя квадратичная взвешенная величина вычисляется по формуле
![\bar x_{\text{кв}} = \sqrt {\frac
{\sum\limits^n_{i=1} x_i ^2\omega_i }
{\sum\limits^n_{i=1} \omega_i } } .](/sites/default/files/tex_cache/a62908f92a01f4ae7947e79e480186ec.png)
Если для всех i=1,2,...,n, то получаем просто среднее квадратичное. Эти величины характеризуют "концентрацию" данных выборки около среднего (или другой характерной тенденции).
К средним величинам, которые характеризуют структурные изменения, относятся мода и медиана. Они определяются лишь структурой распределения, и их часто называют структурными средними (позиционными средними).
Мода - наиболее часто встречающееся значение признака у элементов данной совокупности. Она соответствует определенному значению признака. Мода может быть и не единственной.
Часто важно знать, где у выборки находится "центр" данных.
Медиана - значение признака, которое делит элементы ранжированной выборки на две равные части. Это середина ранжированного ряда. Если число элементов n - четно, то это среднее арифметическое двух средних элементов (хотя это значение может и не быть элементом ряда).
Для данных, имеющих "хорошее поведение", медиана всегда лежит в промежутке между средним арифметическим и модой. Эти величины выстраиваются по возрастанию следующим образом (напомним про упорядоченность по возрастанию выборки, предполагаемую нами для любого статистического ряда): среднее, медиана, мода, или же в обратном порядке. Прямой или обратный порядок их расположения можно определить, вычислив коэффициент асимметрии:
![K= \frac {\frac {1}{n}\sum\limits^n_{i=1} (x_i-\bar x)^3}
{\Biggl(\sqrt{\frac {1}{n}\sum\limits^n_{i=1} (x_i-\bar x)^2} \Biggr) ^3}.](/sites/default/files/tex_cache/781b80a9d3c5cb70cff0275965cba13c.png)
Этот коэффициент (часто называемый третьим центральным моментом) отражает относительную изменчивость данных, их "поведение".
Группа оценок, называемых мерой рассеяния, разброса или вариацией, часто дает наиболее объективную характеристику.
Мера рассеяния - оценка, показывающая, как остальные элементы совокупности (выборки) группируются около средних величин.