Опубликован: 12.11.2009 | Уровень: специалист | Доступ: платный | ВУЗ: Национальный исследовательский университет "Высшая Школа Экономики"
Курс направлен на изучение методов количественной оценки случайных явлений, формирование умений содержательно интерпретировать полученные результаты.
В курсе рассматриваются: вопросы теории и практики проверки статистических гипотез; методы выборочного исследования; доверительное оценивание и проверка гипотез в гауссовских одновыборочных и двухвыборочных моделях; доверительное оценивание и проверка гипотез в одно- и двухвыборочным моделях: непараметрический случай; проверка однородности в двухвыборочной модели: непараметрический случай; проверка гипотезы о равенстве математических ожиданий двух выборок на основе критерия Вилкоксона и равенстве дисперсий на основе критерия Ансари-Бредли; сравнение статистических критериев.
Цель: Целью дисциплины является формирование у студентов научного представления о статистических методах исследования случайных явлений.
Необходимые знания: Курс требует предварительного изучения: теории вероятностей; линейной алгебры и математического анализа.

Предварительные курсы

План занятий

ЗанятиеЗаголовок <<Дата изучения
-
Лекция 1
Введение в анализ данных
Лекция посвящена повторению основных понятий теории вероятностей и математической статистики, необходимых для дальнейшего успешного освоения курса. Подробно разбираются вопросы нахождения квантилей, построения случайных величин (СВ), распределенных по законам хи-квадрат, Стьюдента и Фишера, оценивания неизвестных параметров распределения СВ по выборке. Указывается на ограничения классических методов статистики при работе с реальными данными, дается понятие непараметрической статистики и робастных методов оценивания.
Оглавление
-
Тест 1
21 минута
-
Лекция 2
Проверка статистических гипотез
Лекция посвящена вопросам теории и практики проверки статистических гипотез. Подробно разбираются понятия ошибок 1 и 2 рода, мощности критерия, дается понятие равномерно и локально наиболее мощного критерия, статистически состоятельного критерия. Разбирается проверка простой гипотезы при простой и сложной альтернативах, описывается порядок проверки параметрической гипотезы. Построение левосторонней и правосторонней критических областей иллюстрируется в задачах о частоте рождения мальчиков и о леди, дегустирующей чай.
Оглавление
-
Тест 2
18 минут
-
Лекция 3
Репрезентативная выборка и методы выборочного исследования
В лекции дается понятие репрезентативной выборки, случайного отбора, точности оценивания, вероятности получения оценки заданной точности. Основная часть лекция посвящена определению объема выборки, обеспечивающего заданную точность оценивания: выводу формулы для случая выборки с возращением, корректировке формулы для случая выборки без возвращения и случая стратифицированной выборки. Анализируются факторы, влияющие на необходимый размер выборки.
Оглавление
-
Тест 3
18 минут
-
Лекция 4
Доверительное оценивание и проверка гипотез в гауссовских одновыборочных и двухвыборочных моделях
В лекции ставится задача доверительного оценивания неизвестных параметров распределения СВ, дается определение доверительного интервала. Основная часть лекции посвящена использованию центральных статистик для построения доверительных интервалов для математического ожидания и дисперсии СВ (одновыборочная модель). Для двухвыборочной модели решается задача построения доверительного интервала для разности математических ожиданий двух совокупностей.
Оглавление
-
Лекция 5
Доверительное оценивание и проверка гипотез в одно- и двухвыборочным моделях: непараметрический случай
Рассмотрением проверки гипотезы о равенстве дисперсий в двухвыборочной гауссовской модели завершается тема доверительного оценивания и проверки гипотез для параметрического случая. Далее в лекции обосновывается необходимость использования непараметрических критериев, описывается использование критерия знаков для проверки гипотезы о равенстве медианы нулю или константе, а также подход Ходжеса-Лемана к построению точечной и интервальной оценки для медианы при неизвестном законе распределения выборки. Вводятся понятия однородных выборок, ранга, ранговых критериев, связки.
Оглавление
-
Тест 4
18 минут
-
Лекция 6
Проверка однородности в двухвыборочной модели: непараметрический случай
Лекция посвящена проверке гипотезы о равенстве математических ожиданий двух выборок на основе критерия Вилкоксона и равенстве дисперсий на основе критерия Ансари-Бредли. Указываются предположения критериев, их свойства, строятся статистики критерия и критические области для различных вариантов альтернативных гипотез. Подробно объясняется нахождение квантилей распределения данных критериев как для малых выборок, так и в асимптотическом случае.
-
Лекция 7
Сравнение статистических критериев
После введения понятия эмпирической функции распределения СВ и указания ее свойств как оценки функции распределения СВ в лекции рассматривается критерий Колмогорова-Смирнова для проверки однородности двух совокупностей. Подробно разбирается понятие асимптотической относительной эффективности критериев по Питмену и приводятся результаты сравнения относительной эффективности критериев, изученных в предыдущих лекциях (Вилкоксона, Стьюдента и критерия знаков).
Оглавление
-
Лекция 8
Робастные оценки
В лекции обосновывается необходимость использования робастных методов и оценок, дается понятие робастности по Хьюберу, кривой чувствительности, B-робастной оценки, локальной робастности и пороговой точки. Доказывается, что оценка математического ожидания в форме выборочного среднего не является B-робастной, в отличие от оценки в форме медианы. Вторая часть лекции посвящена параметрическому однофакторному дисперсионному анализу (ДА): ставится задача ДА, выводится разложение обшей суммы квадратов, описывается построение статистики и критической области.
Оглавление
-
Тест 5
18 минут
-
5 часов
-
Виталий Кириллов
Виталий Кириллов

Вопрос про точность исследования (погрешность). Как нужно  учитывать погрешность? В примере про выборы, например, если погрешность 3% такие вопросы:
1. Если кандидат имеет рейтинг 0% (никто из опрошенных не проголосовал), сможет ли теоретически кандидат набрать 3%? Считаем что опрос проведен максимально корректно (случайно, репрезентативно и т.д.)

2. Если за кандидата в опросе проголосовало 50% его фактический рейтинг должен быть от 47 до 53 или от 48,5 до 51,5?

Ирина Ященко
Ирина Ященко
Юлия Макаренко
Юлия Макаренко
Россия, Ставрополь, Ставропольский Государственный Педагогический Институт
Мария Родина
Мария Родина
Россия, Нижний Новгород, Нижегородский Государственный Университет им. Лобачевского, 2003