Опубликован: 22.04.2006 | Доступ: платный | Студентов: 399 / 38 | Оценка: 4.27 / 3.83 | Длительность: 26:24:00
ISBN: 978-5-9556-0064-2
Лекция 25:

Инструменты Data Mining. Программные продукты Cognos и система STATISTICA Data Miner

< Лекция 24 || Лекция 25: 1234 || Лекция 26 >
Аннотация: В лекции рассмотрено два инструмента Data Mining. Первый из них - комплекс программных средств компании Cognos; описаны особенности методологии моделирования в системе. Второй инструмент - STATISTICA Data Miner, описаны средства анализа и схема работы.

Программные продукты Cognos (разработчик - компания Cognos [107]) - это инструменты интеллектуального или делового анализа данных (от англ. Business Intelligence Tools), или BI-инструменты. Представление о комплексе программных средств компании Cognos дает следующий рис. 25.1 [108].

Комплекс программных средств компании Cognos

Рис. 25.1. Комплекс программных средств компании Cognos

Ниже перечислены основные программные продукты Cognos, которые относятся к проблемным областям, указанным на рисунке.

  1. Работа с запросами и отчетами. Решения в области работы с отчетами ориентированы на различные типы пользователей. Продукты отличаются требованиями к уровню сложности отчетов и уровню навыков конечных пользователей:
    • Decision Stream - средство для создания витрин данных (data marts), оптимизированных на формирование запросов и построение отчетов;
    • Impromptu - средство для работы с запросами, а также со статическими и настраиваемыми отчетами;
    • PowerPlay - как средство построения многомерных отчетов;
    • Impromptu Web Reports - средства для работы со статическими отчетами через Web;
    • Cognos Query - средство для создания запросов, навигации и исследования данных в т.ч. через Web;
    • Visualizer - средство для работы с мощными визуальными отчетами.
  2. Анализ данных. Средства анализа данных предназначены для анализа критической информации и выявления значимых факторов. Этот процесс охватывает полный набор аналитических задач и задач по построению отчетов, включая работу с отчетами бизнес-уровня, возможность перехода к данным нижнего уровня, создание и просмотр представлений с целью выявления приоритетов. Интеграция средств позволяет удобно переходить от исследования и анализа данных при помощи отчетов бизнес-уровня к исследованию и анализу данных по отчетам нижнего уровня (функция drill through):
    • PowerPlay - средство многомерного (OLAP) анализа и построения бизнес-отчетов;
    • Impromptu - средство для просмотра отчетов с детальной информацией нижнего уровня (для Windows);
    • Impromptu Web Reports - средство для просмотра отчетов с детальной информацией нижнего уровня (для Web);
    • Visualizer - средство визуального представления данных.
  3. Визуализация и выявление приоритетов. К разделу визуализации информации и выявлению приоритетов можно отнести целый спектр продуктов. С их помощью пользователю становится доступна визуализированная информация, представленная в удобном виде для выявления критических факторов на больших массивах данных. В этих продуктах за основу принимается возможность анализа ключевых факторов, влияющих на рассматриваемую область знаний (бизнеса) при помощи широких возможностей по визуализации данных. Правильно выявленные приоритеты являются основой для принятия эффективных решений:
    • Visualizer - средство для представления информации в форме визуальных представлений с использованием визуальных элементов для выявления приоритетов;
    • PowerPlay как средство многомерного представления информации;
    • Impromptu как средство для работы с настраиваемыми отчетами;
    • Cognos Query - средство Web-пользователей для построения запросов.
  4. Разведка данных (data mining). Средства разведки и добывания данных предлагают целый ряд возможностей по автоматизированному просмотру данных, позволяя вскрывать скрытые тенденции, выявлять приоритетные решения и действия путем отображения тех факторов, которые более других влияют на исследуемые показатели:
    • Scenario - средство сегментации и классификации;
    • 4Thought - средство прогнозирования;
    • Visualazer как средство визуализации.
  5. Защита информации. Защита информации достигается за счет использования единого для всех приложений компонента, называемого Access Manager и позволяющего описывать классы пользователей и управлять ими для всех типов аналитических приложений Cognos. В дополнение к Access Manager, могут быть использованы также обычные возможности обеспечения безопасности на уровне базы данных и операционной системы. На практике возможно одновременное использование всех трех уровней защиты информации;
  6. Описание метаданных. В качестве средства описания метаданных может быть использован единый для всех Cognos BI продуктов компонент, называемый Cognos Architect. Достоинство использования единого для всех средств модуля заключается в возможности единообразного представления бизнес-информации. Единожды сформулированные метаданные становятся доступными в любом аналитическом приложении Cognos.
< Лекция 24 || Лекция 25: 1234 || Лекция 26 >