Опубликован: 22.04.2006 | Уровень: специалист | Доступ: платный
Лекция 8:

Основы анализа данных

< Лекция 7 || Лекция 8: 1234 || Лекция 9 >
Аннотация: Лекция посвящена основам анализа данных, рассмотрены основные характеристики описательной статистики, кратко изложена суть корреляционного и регрессионного анализа. Приведены примеры решения задач в Microsoft Excel.

В этой лекции мы рассмотрим некоторые аспекты статистического анализа данных, в частности, описательную статистику, корреляционный и регрессионный анализы. Статистический анализ включает большое разнообразие методов, даже для поверхностного знакомства с которыми объема одной лекции слишком мало. Цель данной лекции - дать самое общее представление о понятиях корреляции, регрессии, а также познакомиться с описательной статистикой. Примеры, рассмотренные в лекции, намеренно упрощены.

Существует большое разнообразие прикладных пакетов, реализующих широкий спектр статистических методов, их также называют универсальными пакетами или инструментальными наборами. О таких наборах мы подробно поговорим в последнем разделе курса. В Microsoft Excel также реализован широкий арсенал методов математической статистики, реализация примеров данной лекции продемонстрирована именно на этом программном обеспечении.

Следует заметить, что существует сложность использования статистических методов, так же как и статистического программного обеспечения, - для этого пользователю необходимы специальные знания.

Анализ данных в Microsoft Excel

Microsoft Excel имеет большое число статистических функций. Некоторые являются встроенными, некоторые доступны после установки пакета анализа. В данной лекции мы воспользуемся именно этим программным обеспечением.

Обращение к Пакету анализа. Средства, включенные в пакет анализа данных, доступны через команду Анализ данных меню Сервис. Если эта команда отсутствует в меню, в меню Сервис/Надстройки необходимо активировать пункт "Пакет анализа".

Далее мы рассмотрим некоторые инструменты, включенные в Пакет анализа.

Описательная статистика

Описательная статистика (Descriptive statistics ) - техника сбора и суммирования количественных данных, которая используется для превращения массы цифровых данных в форму, удобную для восприятия и обсуждения.

Цель описательной статистики - обобщить первичные результаты, полученные в результате наблюдений и экспериментов.

Пусть дан набор данных А, представленный в таблице 8.1.

Таблица 8.1. Набор данных А
x y
3 9
2 7
4 12
5 15
6 17
7 19
8 21
9 23,4
10 25,6
11 27,8

Выбрав в меню Сервис "Пакет анализа" и выбрав инструмент анализа "Описательная статистика", получаем одномерный статистический отчет, содержащий информацию о центральной тенденции и изменчивости или вариации входных данных.

В состав описательной статистики входят такие характеристики: среднее ; стандартная ошибка; медиана ; мода; стандартное отклонение ; дисперсия выборки; эксцесс ; асимметричность; интервал; минимум ; максимум; сумма; счет.

Отчет "Описательная статистика" для двух переменных их набора данных А приведен в таблице 8.2.

Таблица 8.2. Описательная статистика для набора данных А
x y
Среднее 6,5 17,68
Стандартная ошибка 0,957427108 2,210922382
Медиана 6,5 18
Стандартное отклонение 3,027650354 6,991550456
Дисперсия выборки 9,166666667 48,88177778
Эксцесс -1,2 -1,106006058
Асимметричность 0 -0,128299221
Интервал 9 20,8
Минимум 2 7
Максимум 11 27,8
Сумма 65 176,8
Счет 10 10
Наибольший (1) 11 27,8
Наименьший (1) 2 7
Уровень надежности (95,0%) 2,16585224 5,001457714

Рассмотрим, что же представляют собой характеристики описательной статистики.

< Лекция 7 || Лекция 8: 1234 || Лекция 9 >
Руслан Рекун
Руслан Рекун
Россия, г. Краснодар
Анна Анисимова
Анна Анисимова
Россия, Москва, МГУ имени М.В. Ломоносова, 2009