Россия |
Системы управления базами данных и поддержки информационных хранилищ (IBM DB2)
В настоящее время брэнд DB2 Information Management Software (DB2 IMS) представляет весь пакет решений по управлению информацией, интеграции информации, извлечению информации и управлению знаниями.
В состав программных средств DB2 IMS входят (рис. 6.11):
- Серверы DB2 Universal Database (универсальная база данных DB2 UDB) - программное обеспечение, позволяющее сохранять все виды электронной информации (реляционные базы данных, графику, изображения, мультимедиа (аудио и видео), документы и тексты на многих языках и т.д.).
- DB2 Content Management (управление контентом) - программные продукты, обеспечивающие возможность работы с неструктурированной информацией и любыми формами контента.
- DB2 Business Intelligence (<деловой интеллект>) - программные средства для анализа данных с целью поддержки принятия решений.
- DB2 IMS Tools (утилиты DB2 ) - программные средства, позволяющие выполнять автоматически (без участия человека) ряд функций администрирования баз данных.
- DB2 Information Integration (интеграция информации) - программные средства, обеспечивающие интеграцию информации, распределенной по разнородным средам.
Характерной особенностью IBM (отраженной и в названии компании) всегда была ориентированность на задачи из области бизнеса для крупных корпоративных клиентов. Отсюда и то, что решения IBM в области хранения данных предназначались, в первую очередь, для заказчиков, оперирующих с большими объемами данных и требующих от программных и аппаратных средств высокой надежности и безопасности.
Прикладные системы, которые используют средства DB2, - это, прежде всего, стандартные OLTP (On-Line Transaction Processing) системы. Кроме того, DB2 широко применяется в информационных системах различного назначения, в том числе при построении информационных хранилищ, при создании систем поддержки принятия решений (информационно-аналитических систем).
История развития продуктов DB2 начинается с 60-х годов прошлого столетия, когда компания IBM выпустила коммерческую базу с иерархической структурой данных Information Management System (IMS). В середине 70-х годов в исследовательских лабораториях IBM (Санта-Тереза, Калифорния) была разработана реляционная база данных System R, во многом определившая архитектуру современных реляционных баз данных. В 1981 году появился коммерческий продукт SQL/DS для операционной среды VM, а в 1983 - собственно DB2 для интерфейсов с операционной системой MVS/ESA. Первые версии DB2 были ориентированы на поддержку очень крупных централизованных систем, взаимодействие с транзакционными продуктами CICS, поддержку пакетной обработки больших объемов данных. В последующих версиях расширился круг поддерживаемых операционных платформ, возможности масштабируемого применения и поддержки архитектуры клиент-сервер.
В конце 80-х годов компания IBM начала работу над проектом Starburst, целью которого было создание расширяемой системы управления реляционными базами данных [6.6]. Под расширяемостью при этом понималась возможность поддерживать новые методы хранения данных, добавлять новые методы доступа к данным, предоставить пользователям возможность определять свои операции с данными и встраивать новые методы оптимизации запросов. Результатом проекта стало появление в середине девяностых годов семейства продуктов DB2 Common Server.
Основные тенденции развития DB2 - это наращивание производительности (определяется ростом объемов корпоративных баз данных) и укрепление интеграции с другими программными средствами, работающими на различных платформах. Так, в версии 3 DB2 для MVS [6.6], появившейся в 1992 году, была значительно увеличена производительность за счет распараллеливания операций ввода/вывода, поддержки работы с независимыми разделами дисковых устройств, использования возможностей аппаратного обеспечения и операционной системы при компрессии и сортировке данных.
В DB2 для MVS версии 4 важные добавления были сделаны для поддержки архитектуры клиент-сервер, использования DB2 в масштабируемой архитектуре Parallel Sysplex, распараллеленного исполнения запросов. Появились хранимые процедуры, как важное средство снижения сетевого трафика и перенесения бизнес-логики приложений на сервер баз данных. В отличие от СУБД других производителей, хранимые процедуры DB2 могут быть написаны на многих обычных языках программирования, а не только на специальном, приоритетном для данного производителя процедурном расширении SQL.
Возможности DB2 в области поддержки клиентов увеличились в этой версии до 25 тысяч на один сервер, а с учетом возможности параллельной работы в группе до 32 узлов DB2 Parallel Sysplex - до 800 тысяч клиентов.
Для архитектуры клиент-сервер наиболее важные улучшения были связаны с поддержкой клиентов по TCP/IP, хранением данных в ASCII-форматах, изменениями в поддержке хранимых процедур и стандартизации DB2 SQL, а также с появлением продукта DB2 WWW Connection для доступа к данным из Internet.
В условиях распространения архитектуры клиент-сервер оказалась необходимой поддержка удаленного доступа к базам данных на мэйнфреймах от персональных компьютеров и UNIX рабочих станций. Для решения этой задачи IBM предложила архитектуру DRDA (Distributed Relational Database Architecture). Реализация DRDA должна была позволить базам данных разных производителей взаимодействовать между собой, в частности, образовать единую распределенную базу данных.
В 2000 году вышла седьмая версия DB2. К этому времени за продуктами DB2, предназначенными для управления данными, уже закрепилось новое название - DB2 Universal Database (DB2 UDB). Седьмая версия являлась продолжением и развитием предшествующих продуктов управления данными [6.7]. К 2000 году оформилось расширенное понимание брэнда DB2 как объединения комплекса продуктов, ориентированных на управление информацией и включающих, помимо средств хранения данных, средства интеграции информации, интеллектуального анализа данных, управления знаниями. Ниже будут рассмотрены особенности продуктов, выполняющих эти функции.
Наконец, восьмая версия DB2 UDB V8 (2002 год) включила ряд дополнительных функций, например, таких как:
- автоматическая настройка, самовосстановление, автоматическая оптимизация запросов и защита данных;
- многомерная кластеризация, позволяющая средствами реляционной базы создавать аналоги многомерных баз, существенно повышая тем самым производительность аналитических вычислений;
- поддержка доступа к разнообразным типам данных;
- автоматическое обновление информации о производительности системы, предоставляемой администратору, и выработка рекомендаций по решению проблем, возникающих в базе данных или в приложениях;
- упрощение процедур создания и развертывания приложений на платформах Java и Microsoft;
- выполнение в режиме on-line операций реорганизации таблиц, ведения индексов и загрузки базы данных (ранее эти операции выполнялись в отключенном от сети состоянии).