Россия |
Информационное обеспечение САПР
11.2. Уровни представления данных
Существует три уровня представления данных: уровень пользователя (предметная область), логический и физический.
Каждый объект предметной области характеризуется своими атрибутами, каждый атрибут имеет имя и значение. Например, объект "осциллограф". Имена его атрибутов - частота повторения, чувствительность, полоса пропускания; значения атрибутов - соответствующие значения параметров. Или объект "транзистор", имена его атрибутов - наименования параметров, значения атрибутов - значения параметров и т. д.
Логический (концептуальный) уровень - это абстрактное представление (абстрактный уровень) данных, независимое от представления в ЭВМ.
Физический уровень - это практическая реализация базы данных на том или ином носителе в ЭВМ. Сюда входят и программные средства управления этими носителями.
Связь между этими тремя уровнями представления данных показана в табл. 11.1.
Вся совокупность информации, описывающей один объект предметной области на логическом уровне, называется записью. Запись полностью характеризует объект и все его атрибуты.
Совокупность записей об одной и той же категории объектов образует файл. Запись состоит из полей, каждое поле соответствует одному из атрибутов. Содержание поля описывает имя и значение соответствующего атрибута.
На физическом уровне каждой записи соответствует одна ячейка - область памяти на том или ином носителе, размер которой должен быть достаточен для хранения записи. Каждому полю, описывающему атрибут объекта, соответствует элемент на конкретном носителе; элемент может быть разделен на сегменты.
Совокупность ячеек образует список, соответствующий одному файлу на логическом уровне. Каждая ячейка имеет ключевое поле; если номера ячеек возрастают, то файл называют ранжированным. Бывают пустые ячейки; тогда список называют неплотным.
Совокупность файлов на логическом уровне называют библиотекой,соответствующей конкретной рассматриваемой предметной области. На физическом уровне библиотеке соответствует база данных.
На логическом уровне данные могут быть представлены тремя способами. В настоящее время существует три модели данных: реляционная, сетевая и иерархическая.
В основу реляционной модели положено понятие теоретико-множественного отношения (реляции), которое представляется в виде таблицы. Она является наиболее удобным инженерным представлением для пользователя (рис. 11.3, а). Каждый столбец ее соответствует атрибуту объекта, и ему присваивается соответствующее имя. В столбцах таблицы (отношения) вводятся значения атрибутов. Используя отношения связи и язык реляционной алгебры, можно осуществлять выбор любого подмножества информации: по строкам, столбцам или другим признакам. Применяя операции "разрезания" и "склеивания" отношений, можно получить разнообразные файлы в нужной форме (рис. 11.3,б).
При использовании реляционной модели атрибут объекта может сам выступать как объект другой предметной области, т. е. задействуется относительность (отсюда - отношение) понятий объекта и его атрибутов.
Иерархическая модель данных - это некоторая их совокупность, состоящая из отдельных деревьев, в которых все связи направлены от одного сегмента, называемого исходным, к нескольким порожденным, т. е. реализуются связи типа "один ко многим" (рис. 11.4, а).
Сегмент - это одно или несколько полей, являющихся основной единицей обмена между прикладной программой и языком описания данных. При реализации иерархической системы каждое дерево описывается в виде отдельного файла данных.
Сетевая модель данных является более общей структурой по сравнению с иерархической. Каждый отдельный сегмент (ячейка) может иметь произвольное число непосредственных исходных (старших) сегментов, а также и произвольное число порожденных (младших) (рис. 11.4,б). Это обеспечивает представление отношения "многие к многим". Сетевые структуры могут быть описаны с помощью раскрашенных файлов.
Модели данных необходимо сравнивать по следующим показателям: легкость применения для программиста и пользователя, эффективность реализации по объему памяти и времени поиска информации.
Наиболее легка в применении реляционная модель; сетевая требует от программиста и пользователя понимания типов записей, связей и их отношений. В то же время сетевая и иерархическая модели возникли исторически раньше и реализованы на языках низкого уровня (Ассемблер, Макрокод и др.). Примеры сетевых БД - КОДАСИЛ - ADABAS, Квант и др.; иерархической - IMS.
Реляционные базы данных реализованы на языках высокого уровня и в ряде стран приняты в качестве национального стандарта. К ним относятся ALPHA, QBE, RISS, SEQVEI, dBASE, FRAMEWORK.
11.3. Проектирование базы данных
Процесс разработки структуры БД на основании требований пользователя называют проектированием БД (ПБД). Результатами ПБД являются структура БД, состоящая из логических и физических компонент, и руководство для прикладных программистов.
Развитие системы БД во времени называют жизненным циклом. Последний делится на стадии анализа, проектирования и эксплуатации.
Первая стадия включает в себя этапы формулирования и анализа требований, концептуального проектирования, проектирования реализации, физического проектирования. Анализ требований является полностью неформализованным этапом. Его основная цель - обеспечить согласованность целей пользователей и представлений об информационных потоках.
Вторая стадия состоит из этапов реализации БД, анализа функционирования и поддержки, модификации и адаптации.
Концептуальное проектирование обеспечивает выбор структуры организации информации на основе объединения информационных требований пользователей.
Проектирование реализации (логическое проектирование) разделяют на две части: проектирование базы данных и проектирование программ. Результатом первой части является логическая структура БД. Результатом второй части считают функциональные описания программных модулей и наборы запросов к БД.
Физическое проектирование разделяют также на две части: выбор физической структуры БД и отладку программных модулей, полученных при проектировании программ. Результатом этапа является подготовка к эксплуатации БД.
На этапе реализации БД ставится задача разработки программ доступа к БД.
Этап анализа функционирования и поддержки обеспечивает статистическую обработку данных о функционировании системы. Восстановление БД и ее целостности после сбоев обеспечивает поддержка БД.
Этап модернизации и адаптации позволяет производить изменения, оптимизацию функционирования, модификацию программ.
Языки, используемые в БД, делят на языки описания данных (ЯОД) и языки манипулирования данными (ЯМД).
В общем случае ЯОД описывает различные типы записей, их имена и форматы, а также служит для определения:
- типов элементов данных, которые нужны в качестве ключей;
- отношений между записями или их частями и именования этих отношений;
- типа данных, которые используются в записях ;
- диапазона их значений;
- числа элементов, их порядка и т. п.;
- секретности частей данных и режимов доступа к ним. Различают три уровня абстракции для описания данных:
- концептуальный (с позиции администратора);
- реализации (с позиции прикладного программиста и пользователя);
- физический (с позиции системного программиста).
На концептуальном уровне описывают объекты, атрибуты и значения данных. На уровне реализации имеют дело с записями, элементами данных и связями между записями. На физическом уровне оперируют блоками, указателями, данными переполнения, группировкой данных.
Обычно ЯМД дают возможность манипулирования данными без знания несущественных для программиста подробностей. Они могут реализоваться как расширение языков программирования общего назначения путем введения в них специальных операторов или путем реализации специального языка.
При работе с БД используются несколько типов языков:
- манипулирования данными;
- программирования;
- описания физической организации данных.
Языки программирования, применяемые в БД, представляют собой распространенные языки типа ФОРТРАН, КОБОЛ и многие новые языки.
Языки описания логических схем пользователя реализуются средствами описания данных языка прикладного программирования, средствами СУБД, специальным языком.
Наиболее широко распространен первый способ описания. Он имеет в основе операторы объявления (например, DECLARE в языке PL/I, STRUCT в СИ, type в ADA).
Языки описания схем БД предназначены для администратора БД. С их помощью определяют глобальные описания данных.
Языки описания физической организации данных описывают физическую структуру размещения схемы на машинных носителях. С их помощью определяют методы доступа, предписывающие размещение данных на тех или иных носителях, и т. п.
Наибольшими преимуществами обладают специальные языки, так как они не зависят от используемых языков программирования или технических средств. Следовательно, при переносе БД на другое ТО или смене языка программирования большинство описаний БД останется без изменения.
Процесс проектирования БД начинают с построения концептуальной модели (КМ). Концептуальная модель состоит из описания объектов и их взаимосвязей без указания способов физического хранения. Построение КМ начинается с анализа данных об объектах и связях между ними, сбора информации о данных в существующих и возможных прикладных программах. Другими словами, КМ - это модель предметной области. Версия КМ, обеспечиваемая СУБД, называется логической моделью (ЛМ). Подмножества ЛМ, которые выделяются для пользователей, называются внешними моделями (подсхемами). Логическая модель отображается в физическую, которая отображает размещение данных и методы доступа. Физическую модель называют еще внутренней.
Внешние модели не связаны с используемыми ТС и методами доступа к БД. Они определяют первый уровень независимости данных. Второй уровень независимости данных связан с отсутствием изменений внешних моделей при изменении КМ.
Важным инструментом при разработке и проектировании БД является словарь данных (СД), предназначенный для хранения сведений об объектах, атрибутах, значениях данных, взаимосвязях между ними, их источниках, значениях, форматах представления. Словарь данных позволяет получить однообразную и формализованную информацию обо всех ресурсах данных.
Главное назначение СД состоит в документировании данных. Он должен обеспечивать централизованное введение и управление данными, взаимодействие между разработчиками любого проекта, например САПР. Существуют интегрированные и независимые СД. В первом случае СД - это часть пакета программ СУБД, а во втором - отдельный пакет программ в виде дополнения к СУБД.
В настоящее время СД рассматривают как связующее звено в системе ПО обработки данных, включающей в себя процессор, СУБД, языки запросов, монитор телеобработки.
В полном объеме СД обязан:
- поддерживать КМ, логическую, внутреннюю и внешнюю модели;
- быть интегрированным с СУБД, поддерживать тестовые и рабочие версии хранимых описаний;
- обеспечивать эффективный обмен информацией с СУБД и процесс изменения рабочей версии при изменении БД.
Словарь данных должен иметь свою БД. Основные составляющие БД словаря данных:
- атрибут;
- объект;
- групповой элемент данных;
- выводимый объект данных;
- синонимы, т. е. атрибуты, имеющие одинаковое назначение, но различные идентификаторы;
- омонимы, т. е. атрибуты с различным назначением, но с одинаковыми идентификаторами;
- описание КМ, ЛМ, внешних и внутренних моделей;
- описание, позволяющее пользователям формально и однозначно выбирать атрибуты для решения задач.
Контрольные вопросы
- Что такое система данных?
- Определите предметную область, объект, атрибут (элемент данных), значения данных и постройте таблицы связи между ними.
- Что такое идентификаторы объекта и ключевые атрибуты?
- Что такое запись данных? Приведите примеры.
- Что такое файл данных (набор данных)?
- Приведите известные определения базы данных (БД).
- В чем сходство и различие между БД и файлом?
- Приведите основные определения системы управления базами данных (СУБД).
- Опишите основные функции СУБД и требования к ним.
- В чем заключается информационная согласованность в САПР?
- Что такое функция администрирования БД и кто такой администратор БД (АБД)? Что такое независимость данных?
- Приведите определение логической, внешней, внутренней (физической) моделей.
- Опишите иерархическую модель данных (ИМД). Постройте пример.
- Опишите сетевую модель данных (СМД) и постройте пример.
- Опишите реляционную модель данных (РМД) и постройте пример.