Московский государственный университет путей сообщения
Опубликован: 13.04.2006 | Доступ: свободный | Студентов: 850 / 83 | Оценка: 4.41 / 3.73 | Длительность: 24:53:00
Лекция 11:

Системы управления базами данных и поддержки информационных хранилищ (IBM DB2)

< Лекция 10 || Лекция 11: 12345 || Лекция 12 >
Ключевые слова: DB2, information, management software, IMS, ПО, content management, e-business intelligence, IBM, очередь, OLTP, transaction processing, принятия решений, Managed System, база данных, system, SQL/DS, операционная среда, MVS, ESA, транзакционная, CIC, архитектура клиент-сервер, операции, оптимизация запросов, server, производительность, сервер, СУБД, SQL, TCP/IP, WWW, Connection, Internet, поддержка, мэйнфрейм, Unix, DRDA, distributed, relational database, architecture, распределенные базы данных, database, интеллектуальный анализ данных, кластеризация, развертывание приложений, параллельная обработка данных, SMPS, операторы SQL, процессор, место, транзакционная обработка, запрос SQL, администратор баз данных, загрузка, резервное копирование, создание индекса, расширение функции, Web, сложный тип данных, встроенные типы, пользователь, decimal, user-defined, UDFS, тип данных, angle, sine, вычисление, cosine, tangent, гигабайт, семантика, пользовательский тип, UDT, выделение подстроки, таблица, базы данных, функция, программа, FROM, целостность, атрибут объекта, оператор INSERT, уникальный ключ, функция уведомления, создание триггера, рекурсивный запрос, пользовательский тип данных, поиск, OLAP, spatial, data link, контроль целостности, wave, MIDI, I-MPEG, репрезентативность, AVI, quicktime, информационное наполнение, расходы, цифровая информация, доступ, компонент, portal, application server, XML, HTML, интеграция, программный продукт, Oracle, Sybase, централизованное управление, управление данными, стоимость, CNN, SMART, AND, resource, tuning, charger, intranet, размер пакета, AIX, SAP, гетерогенность, HP-UX, MP@ML, сетевая инфраструктура, счет-фактура, exchange, ERP, e-crm, интерфейс, программные средства, интеллект, analytical processing, data warehouse, intelligence, информационные системы, автор, реляционная модель данных, консолидация, OLAP-технология, статистический анализ, интеграция данных, объединение, представление данных, хранилище данных, источник данных, логическая модель реляционной базы данных, логическая модель данных, логическая модель, геометрическая фигура, куб данных, пункт, гиперкуб, избыточность, СППР, время реакции, многомерная модель, агрегация, elt, extract, facility, создание отчетов, синтаксический анализ, f-connector, бизнес-объекты, analysability, PMML, scoring, API, программный сервер, количество информации, потоки данных, анализ, knowledge discovery, KDD, Data Mining, работ, затраты, типы задач, разбиение множества, условная вероятность, копирование, значение, быстродействие, репликация, преобразование данных, оптимизация, среда окружения, информация

В настоящее время брэнд DB2 Information Management Software (DB2 IMS) представляет весь пакет решений по управлению информацией, интеграции информации, извлечению информации и управлению знаниями.

В состав программных средств DB2 IMS входят (рис. 6.11):

Состав программных продуктов IBM DB2 Information Management Software

Рис. 6.11. Состав программных продуктов IBM DB2 Information Management Software
  • Серверы DB2 Universal Database (универсальная база данных DB2 UDB) - программное обеспечение, позволяющее сохранять все виды электронной информации (реляционные базы данных, графику, изображения, мультимедиа (аудио и видео), документы и тексты на многих языках и т.д.).
  • DB2 Content Management (управление контентом) - программные продукты, обеспечивающие возможность работы с неструктурированной информацией и любыми формами контента.
  • DB2 Business Intelligence (<деловой интеллект>) - программные средства для анализа данных с целью поддержки принятия решений.
  • DB2 IMS Tools (утилиты DB2 ) - программные средства, позволяющие выполнять автоматически (без участия человека) ряд функций администрирования баз данных.
  • DB2 Information Integration (интеграция информации) - программные средства, обеспечивающие интеграцию информации, распределенной по разнородным средам.

Характерной особенностью IBM (отраженной и в названии компании) всегда была ориентированность на задачи из области бизнеса для крупных корпоративных клиентов. Отсюда и то, что решения IBM в области хранения данных предназначались, в первую очередь, для заказчиков, оперирующих с большими объемами данных и требующих от программных и аппаратных средств высокой надежности и безопасности.

Прикладные системы, которые используют средства DB2, - это, прежде всего, стандартные OLTP (On-Line Transaction Processing) системы. Кроме того, DB2 широко применяется в информационных системах различного назначения, в том числе при построении информационных хранилищ, при создании систем поддержки принятия решений (информационно-аналитических систем).

История развития продуктов DB2 начинается с 60-х годов прошлого столетия, когда компания IBM выпустила коммерческую базу с иерархической структурой данных Information Management System (IMS). В середине 70-х годов в исследовательских лабораториях IBM (Санта-Тереза, Калифорния) была разработана реляционная база данных System R, во многом определившая архитектуру современных реляционных баз данных. В 1981 году появился коммерческий продукт SQL/DS для операционной среды VM, а в 1983 - собственно DB2 для интерфейсов с операционной системой MVS/ESA. Первые версии DB2 были ориентированы на поддержку очень крупных централизованных систем, взаимодействие с транзакционными продуктами CICS, поддержку пакетной обработки больших объемов данных. В последующих версиях расширился круг поддерживаемых операционных платформ, возможности масштабируемого применения и поддержки архитектуры клиент-сервер.

В конце 80-х годов компания IBM начала работу над проектом Starburst, целью которого было создание расширяемой системы управления реляционными базами данных [6.6]. Под расширяемостью при этом понималась возможность поддерживать новые методы хранения данных, добавлять новые методы доступа к данным, предоставить пользователям возможность определять свои операции с данными и встраивать новые методы оптимизации запросов. Результатом проекта стало появление в середине девяностых годов семейства продуктов DB2 Common Server.

Основные тенденции развития DB2 - это наращивание производительности (определяется ростом объемов корпоративных баз данных) и укрепление интеграции с другими программными средствами, работающими на различных платформах. Так, в версии 3 DB2 для MVS [6.6], появившейся в 1992 году, была значительно увеличена производительность за счет распараллеливания операций ввода/вывода, поддержки работы с независимыми разделами дисковых устройств, использования возможностей аппаратного обеспечения и операционной системы при компрессии и сортировке данных.

В DB2 для MVS версии 4 важные добавления были сделаны для поддержки архитектуры клиент-сервер, использования DB2 в масштабируемой архитектуре Parallel Sysplex, распараллеленного исполнения запросов. Появились хранимые процедуры, как важное средство снижения сетевого трафика и перенесения бизнес-логики приложений на сервер баз данных. В отличие от СУБД других производителей, хранимые процедуры DB2 могут быть написаны на многих обычных языках программирования, а не только на специальном, приоритетном для данного производителя процедурном расширении SQL.

Возможности DB2 в области поддержки клиентов увеличились в этой версии до 25 тысяч на один сервер, а с учетом возможности параллельной работы в группе до 32 узлов DB2 Parallel Sysplex - до 800 тысяч клиентов.

Для архитектуры клиент-сервер наиболее важные улучшения были связаны с поддержкой клиентов по TCP/IP, хранением данных в ASCII-форматах, изменениями в поддержке хранимых процедур и стандартизации DB2 SQL, а также с появлением продукта DB2 WWW Connection для доступа к данным из Internet.

В условиях распространения архитектуры клиент-сервер оказалась необходимой поддержка удаленного доступа к базам данных на мэйнфреймах от персональных компьютеров и UNIX рабочих станций. Для решения этой задачи IBM предложила архитектуру DRDA (Distributed Relational Database Architecture). Реализация DRDA должна была позволить базам данных разных производителей взаимодействовать между собой, в частности, образовать единую распределенную базу данных.

В 2000 году вышла седьмая версия DB2. К этому времени за продуктами DB2, предназначенными для управления данными, уже закрепилось новое название - DB2 Universal Database (DB2 UDB). Седьмая версия являлась продолжением и развитием предшествующих продуктов управления данными [6.7]. К 2000 году оформилось расширенное понимание брэнда DB2 как объединения комплекса продуктов, ориентированных на управление информацией и включающих, помимо средств хранения данных, средства интеграции информации, интеллектуального анализа данных, управления знаниями. Ниже будут рассмотрены особенности продуктов, выполняющих эти функции.

Наконец, восьмая версия DB2 UDB V8 (2002 год) включила ряд дополнительных функций, например, таких как:

  • автоматическая настройка, самовосстановление, автоматическая оптимизация запросов и защита данных;
  • многомерная кластеризация, позволяющая средствами реляционной базы создавать аналоги многомерных баз, существенно повышая тем самым производительность аналитических вычислений;
  • поддержка доступа к разнообразным типам данных;
  • автоматическое обновление информации о производительности системы, предоставляемой администратору, и выработка рекомендаций по решению проблем, возникающих в базе данных или в приложениях;
  • упрощение процедур создания и развертывания приложений на платформах Java и Microsoft;
  • выполнение в режиме on-line операций реорганизации таблиц, ведения индексов и загрузки базы данных (ранее эти операции выполнялись в отключенном от сети состоянии).
< Лекция 10 || Лекция 11: 12345 || Лекция 12 >
Андрей Скурихин
Андрей Скурихин
Россия, Санкт-Петербург, Санкт-Петербургский государственный электротехнический университет (ЛЭТИ), 1997