Прохожу курс статистический анализ данных. Видео к лекции 5 не доступно? Что сделать чтобы просмотреть эту лекцию и закончить курс? |
Статистические методы анализа данных: Информация
Автор: Елена Горяинова
Форма обучения:
дистанционная
Стоимость самостоятельного обучения:
бесплатно
Доступ:
свободный
Документ об окончании:
Вам нравится? Нравится 45 студентам
Уровень:
Специалист
Длительность:
1:12:00
Студентов:
2546
Выпускников:
359
Качество курса:
4.86 | 4.86
Курс посвящен изучению современных методов анализа данных.
Рассматриваются дисперсионный анализ, регрессионный анализ, факторный анализ, методы непараметрического анализа данных.
Темы: Базы данных, Математика
Теги: анализ, исследования
Предварительные курсы
План занятий
Занятие
Заголовок <<
Дата изучения
Проверка гипотез в однофакторном дисперсионном анализе: параметрический и непараметрический случаи
В лекции рассматривается параметрический дисперсионный анализ (ДА) - проверяется однородность пары выборок при отвержении гипотезы об однородности всех K выборок. Определяется понятие контраста, строится доверительный интервал и проверяется гипотеза о равенстве контраста нулю. В случае непараметрического ДА подробно рассматривается использование критериев Краскела-Уоллиса и Джонкхиера для проверки гипотезы об отсутствии влияния фактора на результат.
Оглавление
- Введение
- Модель однофакторного ДА, проверка гипотез
- Проверка однородности пары выборок при отвержении гипотезы об однородности всех K выборок в однофакторном ДА: параметрический случай
- Непараметрический ДА: использование критерия Краскела-Уоллиса
- Непараметрический ДА: использование критерия Джонкхиера
- Оценивание контраста при неизвестном законе распределения выборок. Оценка Ходжеса-Лемана
-
Двухфакторный дисперсионный анализ (ДА)
В лекции продолжает рассматриваться однофакторный ДА - приводятся непараметрические оценки Ходжеса-Лемана и Спетволля для параметра сдвига. На основе асимптотической относительной эффективности (АОЭ) делается сравнение критерия Краскела-Уоллиса с классическим. Основная часть лекция посвящена двухфакторному ДА: постановке задачи, описанию простейшей таблицы двухфакторного ДА. Подробно рассматривается вопрос проверки гипотезы об отсутствии влияния главного фактора на результат в параметрическом и непараметрическом случаях (критерии Фридмана и Пейджа). На основе АОЭ делается сравнение критерия Фридмана с классическим.
Оглавление
- Введение
- Проверка однородности выборок методом однофакторного дисперсионного анализа (параметрический случай)
- Непараметрические оценки параметров сдвига в модели однофакторного ДА
- Двухфакторный ДА: постановка задачи
- Двухфакторный ДА: проверка гипотезы об отсутствии влияния главного фактора на результат (параметрический случай)
- Двухфакторный ДА: проверка гипотезы об отсутствии влияния главного фактора на результат (непараметрический случай)
- Подведение итогов лекции
-
Исследование зависимостей между номинальными признаками
В лекции дается понятие шкалы измерения, описыватся наиболее распространенные шкалы. Вводится понятие таблицы сопряженности, подробно рассматривается проверка гипотез о независимости номинальных признаков. Вводятся меры связанности для таблиц сопряженности 2х2: коэффициенты контингенции и ассоциации Юла.
-
Меры связи номинальных признаков в таблицах сопряженности произвольного размера
В лекции рассматриваются показатели, позволяющие оценить силу связи номинальных признаков: основанные на статистике хи-квадрат (коэффициенты среднеквадратической сопряженности, взаимной сопряженности Пирсона, Крамера) и основанные на прогнозе (меры прогноза Гутмана и Краскела-Гудмана). Приводятся примеры.
-
Анализ статистической связи между парой порядковых переменных
В лекции вводятся два коэффициента, позволяющие оценить силу связи между двумя порядковыми переменными: коэффициент ранговой корреляции Спирмена и коэффициент корреляции ранжировок Кендэла. Проводится сравнительный анализ критериев, определяется сфера их применения. Описывается проверка гипотез о равенстве коэффициентов нулю. Приводятся примеры.
-
Анализ статистической связи между несколькими порядковыми переменными
В лекции описывается построение коэффициента, позволяющего оценить согласованность более, чем двух ранжировок, - коэффициента конкордации Кендэла. Указываются свойства коэффициента конкордации, схема проверки гипотезы о равенстве его нулю. Начинают рассматриваться вопросы изучения связи пары количественных переменных в случае их гауссовского распределения: дается определение независимости признаков, схема проверки гипотезы о независимости, построение доверительного интервала для коэффициента парной корреляции.
-
Исследование зависимостей между парой количественных признаков
В лекции описывается исследование связи двух количественных негауссовских признаков в случае их нелинейной связи на основе статистики хи-квадрат. Основная часть лекции посвящена такому показателю связи количественных признаков, как корреляционное отношение: определение, свойства, оценивание.
-
Анализ множественных связей в количественной шкале
В лекции дается определение частных, множественных коэффициентов корреляции, коэффициента множественной детерминации, описываются их свойства, схема проверки гипотез о равенстве нулю. Ставится задача построения функции регрессии, кратко описываются методы оценивания параметров регрессии (метод наименьших квадратов(МНК), взвешенный МНК, метод наименьших модулей).
-
Оценка параметров регрессий
В лекции делается обзор методов оценивания параметров регрессий (МНК, взвешенный МНК, метод наименьших модулей, R- и М-оценки). Подробно рассматриваются МНК-оценки и их свойства.
-
Исследование регрессионных моделей
Описывается вся схема исследования построенной регрессионной модели при справедливости предположения о гауссовости погрешностей. Рассматривается проблема мультиколлинеарности в регрессионных моделях: от выявления мультиколлинеарности до ее устранения с применением метода главных компонент.
Оглавление
- Введение
- Проверка значимости отдельных коэффициентов регрессии
- Выбор между двумя моделями
- Обзор методов оценивания параметров регрессионных моделей при нарушении различных предположений о свойствах погрешностей
- Проблема мультиколлинеарности
- Устранение мультиколлинеарности: регрессия на главных компонентах
-
Факторный анализ
Лекция посвящена описанию одного из метода снижения размерности признакового пространства - факторного анализа. Рассматриваются алгоритмы метода главных компонент, метода главных факторов и метода максимального правдоподобия. Обосновывается необходимость и указываются предпосылки сжатия данных. Приводятся примеры.
-