Опубликован: 09.11.2009 | Доступ: свободный | Студентов: 4080 / 1033 | Оценка: 4.66 / 4.45 | Длительность: 54:13:00
Специальности: Экономист
Лекция 3:

Выборочные исследования

< Лекция 2 || Лекция 3: 12345 || Лекция 4 >

3.3. Проверка однородности двух биномиальных выборок

Проверка однородности - одна из базовых проблем прикладной статистики. Она часто обсуждается в литературе, а методы проверки однородности применяются при решении многих практических задач. Например, как сравнить две группы - мужчин и женщин, молодых и пожилых, и т.п.? В маркетинге это важно для сегментации рынка. Если две группы не отличаются по ответам, значит, их можно объединить в один сегмент и проводить по отношению к ним одну и туже маркетинговую политику, в частности, осуществлять одни и те же рекламные воздействия. Если же две группы различаются, то и относиться к ним надо по-разному. Это - представители двух разных сегментов рынка, требующих разного подхода при борьбе за их завоевание.

Обсуждаемая далее постановка задачи в терминах прикладной статистики такова. Рассматривается вопрос с двумя возможными ответами, например, "да" и "нет". В первой группе из n_1 опрошенных m_1 человек сказали "да", а во второй группе из n_2 опрошенных m_2 сказали "да". В вероятностной модели предполагается, что m_1 и m_2 - биномиальные случайные величины B(n_1,p_1) и B(n_2,p_2) соответственно. (Запись B(n,p) означает, что случайная величина m, имеющая биномиальное распределение B(n,p) с параметрами n - объем выборки и p - вероятность определенного ответа (скажем, ответа "да"), может быть представлена в виде m = X_1 + X_2 +...+X_n, где случайные величины X_1 + X_2 +...+X_n независимы, одинаково распределены, принимают два значения 1 и 0, причем P(X_i = 1) = p, P(X_i = 0)= 1-p, i=1,2,...,n.)

Однородность двух групп означает, что соответствующие им вероятности равны, неоднородность - что эти вероятности отличаются. В терминах прикладной математической статистики необходимо проверить гипотезу однородности

H_0:p_1=p_2\text{ при альтернативной гипотезе }H_1:p_1\ne p_2.

(Иногда представляют интерес односторонние альтернативные гипотезы H'_1:p_1>p_2 и H''_1:p_1>p_2.)

Оценкой вероятности p_1 является частота p_1^*=m_1/n_1, а оценкой вероятности p_2 - частота p_2*=m_2/n_2. Даже при совпадении вероятностей p_1 и p_2 частоты, как правило, различаются. Как говорят, "по чисто случайным причинам". Рассмотрим случайную величину р_1^* - р_2^*. Тогда

M(p_1^* - p_2^*) = p_1 - p_2 , D(p_1^* - p_2^*) = p_1 (1 - p_1 )/ n_1 + p_2 (1-p_2 )/ n_2 .

Из теоремы Муавра-Лапласа и теоремы о наследовании сходимости ( "Теоретическая база прикладной статистики" и [ [ 3.6 ] , п.2.4]) следует, что

\lim_{n_1\rightarrow\infty,n_2\rightarrow\infty}P
\{\frac{p_1^* - p_2^*-M(p_1^* - p_2^*)}{\sqrt{D(p_1^* - p_2^*)}}\le x\} = \Phi(x),
где \Phi(x) - функция стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1. Для практического применения этого соотношения следует заменить неизвестную статистику дисперсию разности частот на оценку этой дисперсии:
D^*(p_1^* - p_2^*) = p^*_1 (1 - p^*_1 )/ n_1 + p^*_2 (1-p^*_2 )/ n_2 .

(Могут использоваться и другие оценки рассматриваемой дисперсии, например, по объединенной выборке). С помощью указанной выше математической техники можно показать, что

\lim_{n_1\rightarrow\infty,n_2\rightarrow\infty}P
\{\frac{p_1^* - p_2^*-M(p_1^* - p_2^*)}{\sqrt{D^*(p_1^* - p_2^*)}}\le x\} = \Phi(x).

При справедливости гипотезы однородности M(p_1^* - p_2^*) = 0. Поэтому правило принятия решения при проверке однородности двух выборок выглядит так:

  1. Вычислить статистику
    Q=\frac{p_1^*-p_2^*}{\sqrt{\frac{p_1^*(1-p_1^*)}{n_1}}+\frac{p_2^*(1-p_2^*)}{n_2}}.
  2. Сравнить значение модуля статистика |Q| с граничным значением K. Если |Q|<K, то принять гипотезу однородности H_0. Если же |Q|>K, то заявить об отсутствии однородности и принять альтернативную гипотезу H_1.

Граничное значение K определяется выбором уровня значимости статистического критерия проверки однородности. Из приведенных выше предельных соотношений следует, что при справедливости гипотезы однородности H_0 имеем для уровня значимости \alpha=P(|Q|>K) (при n_1\rightarrow\infty,n_2\rightarrow\infty )

\alpha\rightarrow Phi(K)-\Phi(-K)=2\Phi(K)-1.

Следовательно, граничное значение (асимптотическое) в зависимости от уровня значимости целесообразно выбирать из условия

K=K(\alpha)=\Phi^{-1}\left(\frac{1+\alpha}{2}\right).

Здесь \Phi^{-1}(\cdot) - функция, обратная к функции стандартного нормального распределения. В социально-экономических исследованиях наиболее распространен 5% уровень значимости, т.е. \alpha=0,05. Для него K = 1,96.

Пример 2. Пусть в первой группе из 500 опрошенных ответили "да" 200, а во второй группе из 700 опрошенных - 350. Есть ли разница между генеральными совокупностями, представленными этими двумя группами, по доле отвечающих "да"?

Уберем из формулировки примера термин "генеральная совокупность". Получим следующую постановку.

Пусть из 500 опрошенных мужчин ответили "да, я люблю пепси-колу" 200, а из 700 опрошенных женщин 350 сказали "да, я люблю пепси-колу". Есть ли разница между мужчинами и женщинами по доле отвечающих "да" на вопрос о любви к пепси-коле?

В рассматриваемом примере нужные для расчетов величины таковы: n_1=500,p_1^*=200/500=0,4;n_2=700,p_2^*=350/700=0,5. Вычислим статистику

\begin{aligned}
Q&=\frac{0,4-0,5}{\sqrt{\frac{0,4\cdot 0,6}{500}+\frac{0,5\cdot 0,5}{700}}}
=\frac{-0,1}{\sqrt{\frac{0,24}{500}+\frac{0,25}{700}}}
=\frac{-0,1}{\sqrt{0,00048+0,0003571}}= \\
&=\frac{-0,1}{\sqrt{0,0008371}}=\frac{-0,1}{0,029}=-3,45.
\end{aligned}

Поскольку |Q| = 3,45 > 1,96, то необходимо отклонить нулевую гипотезу и принять альтернативную. Таким образом, мужчины и женщины отличаются по рассматриваемому признаку - любви к пепси-коле.

Необходимо отметить, что результат проверки гипотезы однородности зависит не только от частот, но и от объемов выборок. Предположим, что частоты (доли) зафиксированы, а объемы выборок растут. Тогда числитель статистики Q не меняется, а знаменатель уменьшается, значит, вся дробь возрастает. Поскольку знаменатель стремится к 0, то дробь возрастает до бесконечности и рано или поздно превзойдет любую границу. Есть только одно исключение - когда в числителе стоит 0. Следовательно, при строгом подходе к формулировкам вывод статистика должен выглядеть так: "различие обнаружено" или "различие не обнаружено". Во втором случае различие, возможно, было бы обнаружено при увеличении объемов выборок.

Как и для доверительного оценивания вероятности, во ВЦИОМ разработаны две полезные таблицы, позволяющие оценить вызванные чисто случайными причинами допустимые расхождения между частотами в группах. Эти таблицы рассчитаны при выполнении нулевой гипотезы однородности и соответствуют ситуациям, когда частоты близки к 50% (табл.3.10) или к 20% (табл.3.11). Если наблюдаемые частоты - от 30 до 70%, то рекомендуется пользоваться первой из этих таблиц, если от 10 до 30% или от 70 до 90% - то второй. Если наблюдаемые частоты меньше 10 или больше 90%, то теорема Муавра-Лапласа и основанные на ней асимптотические формулы дают не очень хорошие приближения, целесообразно применять иные, более продвинутые математические средства, в частности, приближения с помощью распределения Пуассона.

Таблица 3.10. Допустимые расхождения (в %) между частотами в двух группах, когда наблюдаются частоты от 30 до 70%
Объемы групп 750 600 400 200 100
750 6 7 7 10 12
600 7 8 8 11 13
400 7 8 10 11 14
200 10 11 11 13 16
100 12 13 14 16 18
Таблица 3.11. Допустимые расхождения (в %) между частотами в двух группах, когда наблюдаются частоты от 10 до 30% или от 70 до 90%
Объемы групп 750 600 400 200 100
750 5 5 6 8 10
600 5 6 7 8 10
400 6 7 8 9 11
200 8 8 9 10 12
100 10 10 11 12 14

В условиях разобранного выше примера табл.3.10 дает допустимое расхождение 7%. Действительно, объем первой группы 500 отсутствует в таблице, но строки, соответствующие объемам 400 и 600, совпадают для первых двух столбцов слева. Эти столбцы соответствуют объемам второй группы 750 и 600, между которыми расположен объем 700, данный в примере. Он ближе к 750, поэтому берем величину расхождения, стоящую на пересечении первого столбца и второй (и третьей) строк, т.е. 7%. Поскольку реальное расхождение (10%) больше, чем 7%, то делаем вывод о наличии значимого различия между группами. Естественно, этот вывод совпадает с полученным ранее расчетным путем.

Как и в табл. 3.5, значения в табл.3.10 и 3.11 несколько больше, чем рассчитанные по приведенным выше формулам. Как и раньше, дело в том, что таблицы ВЦИОМ связаны не с уровнем значимости \alpha=0,05 а с уровнем значимости \alpha=0,01 которому соответствует граничное значение 2,58.

Допустимое расхождение \Delta=\Delta(\alpha) между частотами нетрудно получить расчетным путем. Для этого достаточно воспользоваться формулой для статистики Q и определить, при каком максимальном расхождении частот все еще делается вывод о том, что верна гипотеза однородности. Следовательно, допустимое расхождение \Delta=\Delta(\alpha) находится из уравнения

K(\alpha)=\frac{\Delta(\alpha)}{\sqrt{\frac{p_1^*(1-p_1^*)}{n_1}}+\frac{p_2^*(1-p_2^*)}{n_2}}.

Таким образом,

\Delta(\alpha)=K(\alpha)
\sqrt{\frac{p_1^*(1-p_1^*)}{n_1}}+\frac{p_2^*(1-p_2^*)}{n_2}.

Для данных примера 2 \Delta=\Delta(\alpha)=1,96\times 0,029 = 0,057, или 5,7%, для уровня значимости 0,05.

Для других уровней значимости надо использовать другие коэффициенты K(\alpha). Так, K(0,01) = 2,58 для уровня значимости 1% и K(0,10) = 1,64 для уровня значимости 10%. Для данных примера \Delta=\Delta(\alpha)=2,58\times 0,029 = 0,7482 \approx 0,075, или 7,5%, для уровня значимости 0,01. Если округлить до ближайшего целого числа процентов, то получим 7%, как при использовании табл. 7 выше.

Анализ табл. 3.10 и 3.11 показывает, что для констатации различия частоты должны отличаться не менее чем на 6%, а при некоторых объемах выборок - более чем на 10%, при объемах выборок 100 и 100 - на 19%. Если частоты отличаются на 5% или менее, можно сразу сказать, что статистический анализ приведет к выводу о том, что различие не обнаружено (для выборок объемом не более 750).

В связи с этим возникает вопрос: каково типовое отличие частот в двух выборках из одной и той же совокупности? Разность частот в этом случае имеет нулевое математическое ожидание и дисперсию

p(1-p)
\left(
\frac{1}{n_1}+\frac{1}{n_2}
\right)
=\frac{p(1-p)(n_1+n_2)}{n_1n_2}.

Величина p(1-p) достигает максимума при p=1/2, и этот максимум равен 1/4. Если p=1/2, а объемы двух выборок совпадают и равны 500, то дисперсия разности частот равна

\frac{0,25\times 1000}{500\times 500}=\times{250}{250\times 1000}=\frac{1}{1000}.

Следовательно, среднее квадратическое отклонение \sigma равно 0,032, или 3,2%. Поскольку для стандартной нормальной случайной величины в 50% случаев ее значение не превосходит по модулю 0,67 (а в 50% случаев - больше 0,67), то типовой разброс равен 0,67\sigma, а в рассматриваемом случае - 2,1%. Приведенные соображения дают возможность построить метод контроля за правильностью проведения повторных опросов. Если частоты излишне устойчивы, значения при повторных опросах слишком близки - это подозрительно! Возможно, нарушены правила проведения опросов, выборки не являются случайными, и т.д.

Контрольные вопросы и задачи

  1. Почему выборочные исследования необходимы для решения многих практических задач?
  2. Рассчитайте коэффициент ценовой эластичности спроса по данным табл.1 при цене р = 35 и при цене р = 40.
  3. Какова роль теоремы Муавра-Лапласа в теории выборочных исследований?

    В задачах 4 - 7 выберите наиболее подходящий вариант ответа.

  4. При какой цене максимальна прибыль в условиях параграфа 3.1, если издержки (оптовая цена книги) равны 12?

    А) 30; Б) 32; В) 35.

  5. При исследовании предпочтений потребителей открытые вопросы:

    А) труднее для опрашиваемых, но легче для обработки;

    Б) легче для опрашиваемых, но труднее для обработки.

  6. Пусть из 657 опрошенных 289 сказали "да". Доверительный интервал для доли отвечающих "да" в генеральной совокупности, соответствующий доверительной вероятности 0,95, таков:

    А) [0,245; 0,398]; Б) [0,435; 0,445]; В) [0,405; 0,556];

    Г) [0,402; 0,478]; Д) [0,247; 0,633].

  7. Из 513 юношей 193 любят "Сникерс", а из 748 девушек - 327. Значение статистического критерия Q для проверки гипотезы о равенстве вероятностей равно:

    А) 3,38; Б) -2,176; В) 0,25; Г) 12,56; Д) -0,173.

    Гипотеза об одинаковой привлекательности "Сникерса" для юношей и девушек (на уровне значимости 0,05):

    А) принимается; Б) отклоняется.

  8. Как понятие допустимого расхождения между частотами можно использовать при планировании выборочных исследований?

Темы докладов, рефератов, исследовательских работ

  1. Проведите выборочное исследование с целью построения оценки функции ожидаемого спроса на выбранный Вами товар (услугу).
  2. Найдите адекватное приближение функции спроса в табл.1 с помощью метода наименьших квадратов.
  3. Постройте экономико-математическую модель оптимизации цены при заданных функциях спроса (в зависимости о цены) и издержек (в зависимости от выпуска).
  4. Сопоставьте теорию квотной выборки с теорией простой случайной выборки.
  5. Рассмотрите статистическую теорию доверительного оценивания и проверки гипотез о равенстве вероятностей ответов в случае нескольких возможных ответов (с использованием мультиномиального распределения вместо биномиального).
  6. В каких случаях может быть использована теория малых выборок (теорема Пуассона) для доверительного оценивания вероятности определенного ответа?
< Лекция 2 || Лекция 3: 12345 || Лекция 4 >
Анастасия Маркова
Анастасия Маркова

Здравствуйте!

4 июня я записалась на курс Прикладная статистика. Заплатила за получение сертификата. Изучала лекции, прошла Тест 1.

Сегодня вижу, что я вне курса! Почему так произошло?