Можно ли, используя функцию Дирихле, построить модель пространства, в котором нет иррациональных чисел, а есть только рациональные числа? Очевидно, нельзя построить плоскость, не используя при этом иррациональные числа, так как плоскость непрерывна. Но пространство обладает бо-льшим числом измерений и может сохранить непрерывность в каком-либо одном из них. |
Элементы теории вероятностей и математической статистики
Элементы теории вероятностей и математической статистики
Пусть задан некоторый статистический ряд из элементов x1, x2,..., xn. Если эти элементы могут принимать все мыслимые допустимые значения, а объект с этими характеристиками рассматривается как единый (как система), то такую совокупность называют генеральной совокупностью ; часто при этом предполагается (как и нами везде ниже), что она является конечной и упорядоченной по возрастанию: .
Любое непустое подмножество генеральной совокупности называется выборкой . Если выборка осуществлена случайным образом, то она называется случайной выборкой. Далее мы часто под выборкой будем понимать ранжированную, упорядоченную выборку.
Средняя величина генеральной совокупности в целом называется общей средней . Она отражает общие черты всей совокупности. Средняя величина для отдельной выборки называется средней по выборке или выборочной средней . Она отражает общие черты группы.
Основная цель статистических расчетов, как правило, состоит в том, чтобы по характеристикам выборки получить достоверную информацию о свойствах исходных генеральных совокупностей.
Пример. Повышение среднемесячной зарплаты, например, от 1200 руб. до 1500 руб. отражает лишь общую тенденцию динамики зарплаты (ее рост) по всем категориям трудящихся. В различных группах средние величины по группе могут сильно различаться, а в некоторых группах и не возрастать. Сравнительный анализ групповых и общих средних может дать информацию для характеристики социально-экономических слоев населения, о наличии и степени расслоения общества, о наличии и силе связей между групповым (факторным) признаком и результативным показателем.
Существуют различные меры средних величин.
Чаще используется средняя арифметическая характеристика:
Она называется также выборочной средней или эмпирической средней.
Если измерения были неравноточными, или разной важности, то при вычислении средней арифметической характеристики используются весовые коэффициенты (например, отражающие точность измерения, инструмента) и такая средняя характеристика называется средневзвешенной оценкой . Она применяется также при вычислении общей средней (генеральной выборки) по выборочным средним (средним групп, выборок):
где - веса (частоты).При расчете средневзвешенных оценок по выборке важное значение имеет выбор веса и его обоснование. Средняя гармоническая величина, как и средняя арифметическая, может быть простой и взвешенной. Если все веса равны между собой, то можно использовать среднюю гармоническую в виде
Средняя квадратичная взвешенная величина вычисляется по формуле
Если для всех i=1,2,...,n, то получаем просто среднее квадратичное. Эти величины характеризуют "концентрацию" данных выборки около среднего (или другой характерной тенденции).
К средним величинам, которые характеризуют структурные изменения, относятся мода и медиана. Они определяются лишь структурой распределения, и их часто называют структурными средними (позиционными средними).
Мода - наиболее часто встречающееся значение признака у элементов данной совокупности. Она соответствует определенному значению признака. Мода может быть и не единственной.
Часто важно знать, где у выборки находится "центр" данных.
Медиана - значение признака, которое делит элементы ранжированной выборки на две равные части. Это середина ранжированного ряда. Если число элементов n - четно, то это среднее арифметическое двух средних элементов (хотя это значение может и не быть элементом ряда).
Для данных, имеющих "хорошее поведение", медиана всегда лежит в промежутке между средним арифметическим и модой. Эти величины выстраиваются по возрастанию следующим образом (напомним про упорядоченность по возрастанию выборки, предполагаемую нами для любого статистического ряда): среднее, медиана, мода, или же в обратном порядке. Прямой или обратный порядок их расположения можно определить, вычислив коэффициент асимметрии:
Этот коэффициент (часто называемый третьим центральным моментом) отражает относительную изменчивость данных, их "поведение".
Группа оценок, называемых мерой рассеяния, разброса или вариацией, часто дает наиболее объективную характеристику.
Мера рассеяния - оценка, показывающая, как остальные элементы совокупности (выборки) группируются около средних величин.