Технология баз информации. Информационное обеспечение процессов управления в экономике
7.6. Хранилища данных и их применение для формирования экономических решений
Дальнейшее развитие баз данных привело к появлению хранилищ данных (ХД) — предметно ориентированного, неизменяемого и поддерживающего хронологию набора данных. ХД используются для формирования решений. В отличие от баз данных, которые предназначены для обслуживания повседневной деятельности предприятия, ХД ориентированы на многолетний оперативный, многомерный анализ данных, результаты которого могут быть использованы для принятия решений.
Предметная ориентированность ХД означает, что данные должны представлять предметы (объекты), а не процессы (выписка счёта, продажа товара). Неизменяемость указывает на то, что данные не обновляются, а пополняются за счёт баз данных, а хронологическая поддержка указывает на обязательную привязку данных ко времени, так как они накапливаются на протяжении длительного периода (10—15 лет).
Моделью данных в ХД служат гиперкубы, т.е. многомерные базы данных, в ячейках которых находятся анализируемые данные. По осям многомерного куба указываются измерители объекта с различных точек зрения.
Измерение — это последовательность значений одного из анализируемых параметров. Например, для параметра "время" это последовательность месяцев, для параметра "регион" — список городов. Каждое измерение может быть представлено в виде иерархической структуры. Например, измерение "исполнитель" может иметь следующие иерархические уровни: предприятие — подразделение — служащий.
На пересечении осей измерения находятся данные, количественно характеризующие события, факты, процессы (объёмы продаж, остатки на складах, прибыль, затраты и т.д.).
Оси измерения позволяют создавать многомерную модель данных (гиперкуб), над которым можно выполнять следующие операции:
- срез;
- вращение;
- консолидация или детализация.
Операция среза позволяет выделить из многомерного куба те данные, которые соответствуют фиксированному значению одного или нескольких элементов измерений. Из одного куба можно создать множество срезов. Срезы позволяют представить информацию таким образом, что появляется возможность определить причины неудач в деятельности предприятия, выявить тенденции в тех или иных процессах, построить соответствующие диаграммы, что, в конечном счёте, обеспечивает формирование решения.
Пример операции среза представлен на рис.7.24, который иллюстрирует ХД, предназначенное для управления продажами.
В отличие от реляционной базы данных (показанной для сравнения на рис.7.24, а) срез позволяет подготовить информацию для принятия решения о том, какие товарные группы следует сворачивать, а какие развивать в различных регионах.
Для этого обратимся к более детальному представлению ХД в виде срезов, приведенных на рис.7.25. Базовый показатель, на основе которого принимается такое решение, — объём продаж. Он зависит от времени, группы товаров и региона. Для построения информационного куба, прежде всего, необходимо определить иерархию в измерении реквизитов-признаков показателя "объём продаж".
Объём продаж характеризуется следующими признаками:
- время (год— квартал— месяц— неделя— день);
- товар (товарная группа (ТГ) — подгруппа — наименование товаров);
- регион:
- 1-й уровень (Центральный, Уральский, Поволжье);
- 2-й уровень (Москва, Тула, Орел);
- 3-й уровень (Магазин-1, Магазин-2).
Рис. 7.25. Некоторые срезы информационного куба, позволяющие получить информацию об изменении объёма продаж каждой товарной группы (а) и товарной группы1 (б)
Получив необходимый срез информационного куба, можно извлечь следующую информацию:
- Как изменялся объём продаж по каждой товарной группе в течение 2003 г. в г. Туле (рис.7.25, а).
- Как изменялся объём продаж в г. Туле по ТГ1 за последние три года (рис.7.25, б).
Операция вращения — это изменение расположения измерений в пространстве, что, возможно, облегчит принятие решений. Например, измерение "время", ранее представленное горизонтально, можно повернуть и расположить вертикально, а товар показать горизонтально (рис.7.26). Возможно, именно эта операция поможет принять правильное решение.
Операции консолидации и детализации предназначены либо для агрегирования данных (обобщения), либо для их детализации. Осуществить эти операции можно благодаря иерархии, установленной среди измерителей. Рис.7.27 иллюстрирует эти операции.
Контрольные вопросы и упражнения
- Что представляет собой АРМ?
- Укажите назначение и охарактеризуйте обеспечение автоматизированного рабочего места (АРМ).
- Каковы роль и место АРМ в автоматизированной информационной системе?
- Какие виды обеспечения включает технологическое обеспечение АРМ?
- Как формируется организационное обеспечение?
- Для чего предназначено техническое обеспечение АРМ?
- На что ориентировано информационное обеспечение АРМ?
- Что включает в себя лингвистическое обеспечение АРМ?
- Что представляет собой математическое обеспечение?
- Как формируется программное обеспечение (ПО)?
- Что составляет основу системного ПО для АРМ различного назначения?
- Чем определяется состав специализированного прикладного ПО АРМ?
- Что представляет собой правовое обеспечение?
- Как формируется эргономическое обеспечение?
- Назовите отличительные особенности АРМ на современном этапе.
- Что относится к локальному ИО?
- Что представляет собой сетевое ИО?
- Что содержит сетевое ИО?
- На какие части делится локальное ИО АРМ?
- Поясните структуру внемашинного ИО АРМ.
- Что представляет собой экономический показатель?
- На какие группы делятся все управленческие документы?
- Какие факты фиксируются во входных оперативных документах?
- В чём разница между внемашинным и внутримашинным информационным обеспечением АРМ?
- Чем продиктовано деление информационного обеспечения на локальное и сетевое?
- Приведите пример экономического показателя и объясните его необходимость.
- Назовите основные формы организации внутримашинного информационного обеспечения.
- Что такое реляционная модель базы данных? Каким требованиям она должна удовлетворять?
- Каким образом реализуются принципы неизбыточности и независимости в реляционных базах данных?
- Представьте схематично пример процесса использования реляционной базы данных для решения задач.
- Почему возникла потребность в создании распределённых баз данных?
- В каких случаях целесообразны централизованные, а в каких — распределённые базы данных?
- В каких случаях целесообразно использовать частично распределённую базу данных?
- В чём разница между архитектурой сети вида "файл — сервер" и архитектурой "клиент — сервер"?
- Представьте схемы движения данных при следующих вариантах доступа к ним:
- доступ к удалённым данным;
- доступ к серверу баз данных;
- доступ с помощью сервера приложений.
- Каким образом представляются деревья вывода и как они используются для формирования решений?
- Что такое дерево целей и как оно используется для формирования решений?
- Представьте графически семантическую сеть и продемонстрируйте процесс получения ответов на запросы.
- Чем продиктована необходимость создания хранилищ данных?
- Приведите пример применения хранилища данных для формирования решений.
- Формирование решений осуществляется с помощью показателя "объём продаж", зависящего от товара, периода продаж и затрат на его реализацию. Представьте модель хранилища данных, которая позволит определить тенденцию изменения объёма продаж в 2003 г. в конкретном магазине по указанным товарам.