Опубликован: 24.04.2015 | Уровень: для всех | Доступ: платный
Лекция 5:

Инструменты Gnumeric для статистиков

5.11 Два средних

Вложенное меню "Два средних" ("Статистика/Тесты с двумя выборками/Два средних") предоставляет набор инструментов для проверки гипотезы о равенстве (или неравенстве) средних значений выборок (генеральных совокупностей). В качестве исходных данных будем средствами Gnumeric генерировать выборки с нормальным распределением.

Настройка исходных данных для проверки гипотезы

Рис. 5.36. Настройка исходных данных для проверки гипотезы

5.11.1 Равные выборки: T-тест

Пусть известно, что в двух выборках имеется равное количество значений случайных величин, и известно, что у этих выборок равные дисперсии. В данном случае T-тест дает возможность определить дисперсии и средние значения для этих выборок и посчитать разницу между средними.

Для примера рассмотрим 25 нормально распределенных случайных значений со средним значением 5 и стандартным отклонением 1 (Выборка1) и 25 нормально распределенных случайных значений со средним значением 7 и стандартным отклонением 1 (Выборка2).

На вкладке "Ввод" диалога "Проверка различия двух средних" ("Статистика/Тесты с двумя выборками/Два средних/Равные выборки: T-тест...") указываем диапазоны для исходных данных, причем нужно проследить, чтобы все адреса были абсолютными (см. рис. 5.36). Режим "Метки", как всегда, позволяет использовать в выводе названия векторов данных.

На вкладке "Выборки" (рис. 5.37) указываем, что данные непарные, дисперсии неизвестны, но равны.

Настройка режимов анализа

Рис. 5.37. Настройка режимов анализа
Результаты проверки гипотезы

Рис. 5.38. Результаты проверки гипотезы

На рис. 5.38 показаны результаты вычислений, причем заметно прекрасное согласование результатов с заранее заданными параметрами выборок.

Проделав всё это с любыми модельными данными, в ячейках блока результатов можно увидеть формулы, по которым производятся расчеты.

Настройка режимов вычислений

Рис. 5.39. Настройка режимов вычислений

5.11.2 Неравные выборки, равные дисперсии: T-тест

Теперь рассмотрим ситуацию, когда выборки имеют разное количество точек. Пусть параметры Выборки1 остаются прежними (25 точек, нормальное распределение, среднее значение 5 стандартное отклонение 1), а для Выборки2 установим следующие параметры – нормальное распределение со средним 7, стандартным отклонением 1 и количеством точек 20.

В этом случае на вкладке "Выборки" диалога "Проверка различия двух средних" все оставляем по умолчанию (рис. 5.39), и наблюдаем результаты (рис. 5.40).

Настройки режимов вычислений в этом случае совпадают с предыдущим случаем.

Опять-таки наблюдается соответствие результатов расчетов с заранее определенными параметрами выборок.

5.11.3 Неравные выборки, неравные дисперсии: T-тест

Используя те же параметры распределения для Выборки1, что и в предыдущих случаях, для Выборки2 возьмем 20 точек, среднее значение 7 и стандартное отклонение 2.

На вкладке "Выборки" установим режимы в соответствии с рис. 5.41 и посмотрим результат (рис. 5.42).

Результаты проверки гипотезы

Рис. 5.40. Результаты проверки гипотезы
Настройка режимов вычислений

Рис. 5.41. Настройка режимов вычислений
Результаты проверки гипотезы

Рис. 5.42. Результаты проверки гипотезы
Настройка режимов вычислений

Рис. 5.43. Настройка режимов вычислений

5.11.4 Известные дисперсии: Z-тест

Применим эту процедуру к слегка измененным модельным данным. Пусть Выборка1 остается с прежними параметрами, а для Выборки2 (среднее 7, 20 точек) установим дисперсию 2, для чего стандартное отклонение должно быть установлено как 1,41.

На вкладке "Выборка" устанавливаем режимы и значения дисперсии в соответствии с рис. 5.43 и получаем результат, показанный на рис. 5.44.

Результаты проверки гипотезы

Рис. 5.44. Результаты проверки гипотезы
F-тест. Равные дисперсии

Рис. 5.45. F-тест. Равные дисперсии
Berkut Molodoy
Berkut Molodoy
Россия
Сергей Гутько
Сергей Гутько
Россия, ВИУ, 2003