Статистическая обработка данных
11.7. Пакет STADIA
Пакет STADIA (Statistical Dialogue System) – универсальный статистический пакет, разработанный специалистами Московского государственного университета им. М.В. Ломоносова совместно с НПО "Информатика и компьютеры". Первая версия пакета была выпущена в 1989 году. На сегодняшний день разработана 7-я версия пакета STADIA 7.0.
По мнению разработчиков, пакет ориентирован на массового пользователя, имеющего небольшой опыт как в статистическом анализе, так и в общении с персональным компьютером, но нуждающегося в быстром и удобном средстве оформления и обработки данных.
Пакет предоставляет пользователям широкий набор методов статистического анализа данных: описательная статистика, дисперсионный, корреляционный и спектральный анализ, сглаживание, прогнозирование, простая, нелинейная регрессия, кластерный и факторный анализ, методы контроля качества, анализ и замена пропущенных значений. Также возможно построение и редактирование 2-х, 3-х и многомерной графики: зависимости, прогнозы, диаграммы рассеяния, карты, гистограммы, столбиковые, башенные и круговые диаграммы, установка размеров, надписей по осям и под рисунком и пр.
Достоинства STADIA:
- наличие системы контекстной экранной помощи, включающей объемный гипертекстстовый справочник и экспертную систему по выбору метода статистического анализа;
- обработка больших объемов данных (до 32 000 наблюдений);
- наличие режима выдачи оглавления архива данных с комментариями;
- селективный поиск файлов по контексту комментариев, присвоенных архиву с данными;
- для работы программы требуется лишь 8 MB оперативной памяти, сама программа занимает 4.1 MB на жестком диске компьютера;
- экспорт данных и результатов.
Недостатки STADIA:
- наличие только русскоязычной версии;
- несовместимость с операционными системами, отличными от Windows.
Внешний вид диалогового окна STADIA представлен на рис.11.7.
11.8. Пакет SAS
Пакет SAS (Statistical Analysis System) – профессиональный статистический пакет, разработанный компанией SAS Institute Inc. Первая версия пакета была выпущена в 1976 году. Последняя версия SAS Statistics позиционируется как статистический пакет для аналитической работы на современных предприятиях.
Разработчики утверждают, что пакет эффективно работает с данными различных типов: маркетинговые базы данных, результаты клинических испытаний, медико-санитарных обследований, исследований предпочтений потребителей, исследований рынка ценных бумаг и пр. Встроенные инструменты статистического анализа могут быть применены для решения широкого круга вопросов, относящихся к различным областям деятельности, например:
- промышленное производство;
- телекоммуникации (проведение исследования рынка для выявления предпочтений потребителей и моделей выбора новых услуг);
- правительство (применение статистических выборочных методов для разработки опросов общественного мнения);
- исследование окружающей среды (построение моделей загрязнения воздуха с использованием пространственной статистики);
- биотехнологии;
- розничная торговля (моделирование поведения потребителей для выявления потенциальных целевых рынков для новых проектов в области электронной коммерции).
Пакет предоставляет пользователям следующие возможности статистического анализа данных:
- смешанные модели;
- анализ категорийных данных;
- байесовский анализ;
- многомерный анализ;
- анализ выживаемости;
- психометрический анализ;
- анализ пропущенных значений.
Пакет позволяет проводить следующую работу с данными:
- ввод, восстановление, модификация и управление данными;
- написание отчетов и подготовка графиков;
- статистический анализ;
- бизнес планирование, прогнозирование и поддержка принятия решений;
- исследование операций и управление проектами;
- совершенствование качества;
- разработка приложений.
Достоинства SAS:
- быстрая обработка очень больших объемов данных;
- возможность преобразования математических формул в программный код;
- создание пользовательских модулей;
- получение консультативной помощи в выборе методов анализа и в интерпретации его результатов, а также рекомендаций по дальнейшей работе с исходными данными;
- совместимость с операционными системами Linux и Windows.
Недостатки SAS:
- сложен в освоении для неспециалистов;
- высокая стоимость.
11.9. Пакет BioStat
Пакет BioStat – специализированный статистический пакет компании AnalystSoft Inc14Официальный сайт компании: http://www.analystsoft.com. Первая версия пакета была выпущена в середине 80х годов. Последняя версия пакета – BioStat 2009.
Пакет создан для специалистов, работающих в области медицины, биологии и химии. Основан на базе известного пакета StatPlus и включает в себя почти весь его функционал, в том числе регрессионный анализ, анализ выживаемости, дисперсионный анализ. Программа использует электронную таблицу, совместимую с Microsoft Excel как по формату данных, так и по интерфейсу, что делает процесс изучения программы легким и быстрым.
Достоинства BioStat:
- экспорт/импорт данных в MS Excel;
- требуемая память на жестком диске компьютера 32 MB;
- проверка правописания;
- совместимость с операционными системами Windows и Mac.
Внешний вид диалогового окна BioStat представлен на рис.11.8.