Опубликован: 22.04.2006 | Уровень: специалист | Доступ: платный
Лекция 25:

Инструменты Data Mining. Программные продукты Cognos и система STATISTICA Data Miner

< Лекция 24 || Лекция 25: 1234 || Лекция 26 >

Система STATISTICA Data Miner

Назначение. Система STATISTICA Data Miner (разработчик - компания StatSoft [109]) спроектирована и реализована как универсальное и всестороннее средство анализа данных - от взаимодействия с различными базами данных до создания готовых отчетов, реализующее так называемый графически-ориентированный подход [110, 111].

Система STATISTICA предлагает:

  • Большой набор готовых решений;
  • Удобный пользовательский интерфейс, полностью интегрированный с MS Office;
  • Мощные средства разведочного анализа;
  • Полностью оптимизированный пакет для работы с огромным объемом информации;
  • Гибкий механизм управления;
  • Многозадачность системы;
  • Чрезвычайно быстрое и эффективное развертывание;
  • Открытая COM-архитектура, неограниченные возможности автоматизации и поддержки пользовательских приложений (использование промышленного стандарта Visual Basic (является встроенным языком), Java, C/C++).

Сердцем STATISTICA Data Miner является браузер процедур Data Mining (рис. 25.4), который содержит более 300 основных процедур, специально оптимизированных под задачи Data Mining, средства логической связи между ними и управления потоками данных, что позволит Вам конструировать собственные аналитические методы.

Браузер процедур Data Mining

Рис. 25.4. Браузер процедур Data Mining

Рабочее пространство STATISTICA Data Miner состоит из четырех основных частей (рис. 25.5):

Рабочее пространство STATISTICA Data Miner

Рис. 25.5. Рабочее пространство STATISTICA Data Miner
  1. Data Acquisition - сбор данных. В данной части пользователь идентифицирует источник данных для анализа, будь то файл данных или запрос из базы данных.
  2. Data Preparation, Cleaning, Transformation - подготовка, преобразования и очистка данных. Здесь данные преобразуются, фильтруются, группируются и т.д.
  3. Data Analysis, Modeling, Classification, Forecasting - анализ данных, моделирование, классификация, прогнозирование. Здесь пользователь может при помощи браузера или готовых моделей задать необходимые виды анализа данных, таких как прогнозирование, классификация, моделирование и т.д.
  4. Reports - результаты. В данной части пользователь может просмотреть, задать вид и настроить результаты анализа (например, рабочая книга, отчет или электронная таблица).
< Лекция 24 || Лекция 25: 1234 || Лекция 26 >
Руслан Рекун
Руслан Рекун
Россия, г. Краснодар
Анна Анисимова
Анна Анисимова
Россия, Москва, МГУ имени М.В. Ломоносова, 2009