Компьютерные технологии интеллектуальной поддержки управленческих решений
8.2.2. Хранилища данных (DW)
Специфика КИС проявляется, в первую очередь, благодаря новой форме организации внутримашинной информационной базы, представляющей совокупность взаимосвязанных компонентов (рис. 8.2-2):
- операционная БД, служит для обеспечения работы функциональных модулей ERP-системы, составляет основу OLTP-системы обработки данных КИС (системы обработки данных транзакционного типа);
- специализированные "хранилища данных" (Data Warehouse - DW), основа OLAP-систем обработки данных для различных функциональных компонентов КИС.
Операционные БД КИС обеспечивают хранение данных КИС большого объема и сложной логической структуры, находятся под управлением мощных СУБД, как правило, реляционного типа (ORACLE, MS SQL Server, Informix, DB/2 и др.). Такие БД используются в составе многоуровневой клиент-серверной архитектуры КИС; они могут размещаться на одном или нескольких серверах БД. Как правило, БД отделены от программ функциональных модулей, использующих эти данные. Интерфейс пользователя (формы, отчеты, запросы и т. п.) находится на рабочей станции или специализированном сервере.
Основные проблемы ведения операционных БД КИС:
- обеспечение требуемого уровня производительности КИС (измеряется количеством транзакций в единицу времени) для реализации регламентированных приложений КИС;
- соответствие требованиям приложений по составу, структуре, объемам данных, времени получения и качеству выходной информации;
- обеспечение надежного хранения данных (периодическое архивирование БД, восстановления БД после сбоев из страховых копий, ведения журнала транзакций для их "отката" и т. п.).
Операционную БД вместе с внешними информационными источниками следует рассматривать как "сырье" для создания предметно-ориентированных, интегрированных, неизменяемых по структуре хронологических данных - хранилищ данных, анализируемых в системах поддержки принятия решений. Витрина (киоск) - подмножество хранилища данных, обеспечивает:
- необходимую производительность получения и анализа данных для конечных пользователей;
- защиту хранилища данных от несанкционированного доступа.
По определению Б. Инмона, хранилище данных (ХД) это - "предметно-ориентированный, интегрированный, неизменяемый, поддерживающий хронологию набор данных, организованный для целей поддержки принятия решений". Как правило, ХД ориентированы на решение определенных задач анализа и представления данных. В ХД имеются три категории данных:
- метаданные (сведения об источнике, методах сбора информации);
- детальные данные;
- агрегированные (сводные) данные.
Программное обеспечение ХД обеспечивает загрузку, форматирование, анализ и реструктуризацию данных; управление доступом к данным; построение витрин данных.
8.3. Аналитическая обработка данных
8.3.1. On-Line Analytical Processing (OLAP)
On-Line Analytical Processing (OLAP) - средства оперативной (в реальном масштабе времени) аналитической обработки информации, направленные на поддержку принятия решений и помогающие аналитикам отвечать на вопрос: "Почему объекты, среды и результаты их взаимодействия такие, а не другие?". При этом аналитик сам формирует версии отношений между множеством информации и проверяет их на основе имеющихся данных в соответствующих базах структурированной информации.
Для ERP-систем характерно наличие аналитических компонент в составе функциональных подсистем. Они обеспечивают формирование аналитической информации в режиме реального времени. Эта информация является основой большинства управленческих решений.
OLAP-технологии используют гиперкубы - специально структурированные данные (иначе называемые OLAP-кубами). В структуре данных гиперкуба различают:
Меры - количественные показатели (реквизиты-основания), используемые для формирования сводных статистических итогов.
Измерения - описательные категории (реквизиты-признаки), в разрезе которых анализируются меры.
Размерность гиперкуба определяется количеством измерений для одной меры. Например, гиперкуб СБЫТ содержит данные:
Измерения: Потребители, Даты операций, Группы товаров, Номенклатура, Модификации, Упаковки, Склады, Виды оплаты, Виды отгрузки, Тарифы, Валюта, Организации, Подразделения, Ответственные, Каналы распределения, Регионы, Города;
Меры: Количество плановое, Количество фактическое, Сумма плановая, Сумма фактическая, Платежи плановые, Платежи фактические, Сальдо плановое, Сальдо фактическое, Цена реализации, Срок исполнения заказа, Сумма возврата.
Такой гиперкуб предназначен для аналитических отчетов:
- Классификация потребителей по объемам покупок.
- Классификация продаваемых товаров по методу АВС.
- Анализ сроков исполнения заказов различных потребителей.
- Анализ объемов продаж по периодам, товарам и группам товаров, регионам и потребителям, внутренним подразделениям, менеджерам и каналам сбыта.
- Прогноз взаиморасчетов с потребителями.
- Анализ возврата товаров от потребителей и т. д.
Аналитические отчеты могут иметь произвольное сочетание измерений и мер, они используются для анализа принимаемых управленческих решений. Аналитическая обработка обеспечивается инструментальными и языковыми средствами. В общедоступной электронной таблице MS Excel представлена информационная технология "Сводные таблицы", исходными данными для их создания являются:
- список (база данных) MS Excel - реляционная таблица;
- другая сводная таблица MS Excel;
- консолидированный диапазон ячеек MS Excel, расположенных в одной и той же или различных рабочих книгах;
- внешняя реляционная БД или OLAP-куб, источник данных (файлы формата .dsn, .odc).
Для построения сводных таблиц на основе внешних БД используются драйверы ODBC, а также программа MS Query. Пример создания сводной таблицы для исходной БД MS Excel приведен на рис. 8.3-1.
Макет сводной таблицы имеет следующую структуру данных (рис. 8.3-2): Измерения - код подразделения, должность; Меры - Стаж работы, Оклад и Премия. Ниже представлена табл. 8.3-2, которая позволяет проанализировать связь среднего стажа работы и оклада, среднего стажа работы и премии, оклада и премии.
Код подразделения | Данные | Должность | Общий итог | |||
Бригадир | Монтер пути | Слесарь | Токарь | |||
Гараж | Средний стаж работы | 5,39 | 7,81 | 6,60 | ||
Фонд оплаты труда | 7000,00 руб. | 5600,00 руб. | 12600,00 руб. | |||
Фонд премии | 700,00 руб. | 560,00 руб. | 1260,00 руб. | |||
цех 1 | Средний стаж работы | 4,90 | 6,37 | 7,12 | 6,19 | |
Фонд оплаты труда | 7500,00 руб. | 10000,00 руб. | 11000,00 руб. | 28500,00 руб. | ||
Фонд премии | 525,00 руб. | 1600,00 руб. | 1100,00 руб. | 3225,00 руб. | ||
цех 2 | Средний стаж работы | 4,39 | 4,39 | |||
Фонд оплаты труда | 14430 руб. | 14430 руб. | ||||
Фонд премии | 1010,10 руб. | 1010,10 руб. | ||||
цех 3 | Средний стаж работы | 3,96 | 4,44 | 4,20 | ||
Фонд оплаты труда | 10200,00 руб. | 10170,00 руб. | 20370,00 руб. | |||
Фонд премии | 845,00 руб. | 711,90 руб. | 1556,90 руб. | |||
ИТОГ | Средний стаж работы | 5,15 | 5,53 | 5,17 | 5,33 | 5,30 |
Фонд оплаты труда | 14500,00 руб. | 20030,00 руб. | 20200,00 руб. | 21170,00 руб. | 75900,00 руб. | |
Фонд премии | 1225,00 руб. | 1570,10 руб. | 2445,00 руб. | 1811,90 руб. | 7052,00 руб. |
Для продолжения анализа средствами сводной таблицы можно:
- добавить новые итоговые показатели, например средний оклад, среднюю сумму премии и т. п.;
- использовать фильтрации записей и итогов сводной таблицы (например, по признаку "Пол", который помещается в макете в область "Страница");
- вычислить структурные показатели (например, распределение фондов оплаты труда и фонда премии по подразделениями - с помощью средств дополнительной обработки сводных таблиц, Доля от суммы по столбцу) и т. д.
MS Office позволяет публиковать данные электронных таблиц, включая сводные таблицы и сводные диаграммы в формате html.
Компонент Microsoft Office Web Components поддерживает работу с опубликованными данными в среде Internet Explorer, обеспечивая продолжение анализа (изменения структуры данных сводной таблицы, вычисление новых сводных итогов.