Кубанский государственный университет
Опубликован: 24.12.2013 | Доступ: свободный | Студентов: 684 / 9 | Длительность: 24:28:00
Лекция 1:

Введение в базы данных

Лекция 1: 1234567 || Лекция 2 >
Аннотация: В лекции разберемся с основными понятиями, изучим условия, определяющие допустимые значения данных. Рассмотрим, как базы данных моделируют предметные области.

В первой части лекции разберёмся с основными понятиями: информация, данные, смыслы, база данных, схема базы, метаданные. Выясним, нужно ли учитывать семантику данных. Затем дадим предварительное описание баз данных, не связанное с реализациями на компьютерах. Это позволит выделить наиболее общие свойства баз данных. Рассмотрим важную разновидность баз, хранящих данные, организованные в виде наборов записей. Изучим устройство записей и наборов записей. Базы данных определим как структурированные собрания записей, обладающие свойством сохраняемости и способностью самоописания.

Во второй части лекции изучим условия, определяющие допустимые значения данных. Их называют ограничениями целостности. Определим модели данных и системы управления базами данных. Рассмотрим возникающие в бизнес-приложениях неопределённые значения. Сравним файловые системы и базы данных.

В третьей части рассмотрим, как базы данных моделируют предметные области. Этот подход очень важен для всех — от студентов до постановщиков задач. Есть вопросы, в которых невозможно разобраться до конца, не учитывая, что база данных моделирует некоторую предметную область. Хороший пример — аномалии, возникающие из-за несоответствия семантики, определённой в предметной области, и семантики данных, хранящихся в базе.

В четвёртой части рассмотрим особенности аппаратной реализации и проблему быстродействия баз данных.

В заключительных разделах дадим предварительное определение базы данных, выясним, что такое администрирование.

1.1 Первое представление о базах данных

Попытаемся раскрыть понятие "база данных", не привязываясь пока к реализациям на компьютерах. Такой подход позволит быстро войти в тему. А всё недосказанное здесь будет уточняться по мере изучения последующих разделов. И не думайте, пожалуйста, что предлагается что-то абстрактное и оторванное от жизни. Всё, к чему мы здесь придём, уже используется в работе с базами данных.

1.1.1 Информация, данные, семантика и смыслы

Итак, под "базой данных" временно будем понимать любое, не обязательно электронное, средство для хранения информации. В качестве первого примера подойдёт ваш блокнот для записей. Но он очень плохо структурирован. Мы такие базы не рассматриваем.

Необходимо различать данные и их семантику. Данные — это представление фактов о предметной области, моделируемой базой данных, или сведений об устройстве базы данных или информационной системы.

Семантика как-то определяет значение данных, смыслы, которые им придаются.

Смыслы данных — это тоже данные. Отличие, в первую очередь, в степени их активности, а во вторую — в местах хранения и связях с другими данными. Данные полностью пассивны. Их можно вводить, удалять и обновлять. Все операции над данными выполняют ровно то, что указано.

Смыслы — это активные данные, описывающие часть семантики. Могут находиться и в базе данных, и в приложениях, работающих с базой. Прикреплены они к другим данным или к процедурам. Смыслы способны вызвать действия, которые не заданы явно.

Например, требуется ввести в базу некоторую запись. А в структуре данных, в которой эта запись будет храниться, в числе других смыслов записано правило: "не допускать существования двух одинаковых записей". Тогда вместо того, чтобы сразу ввести запись, придётся сначала сравнить вводимую запись со всеми существующими и, если такая уже имеется, отказаться от ввода. Говорят, что команда записи это событие, запускающее процедуру проверки правила (оно же ограничение целостности). При попытке ввода дублирующей записи программа выдаст сообщение об ошибке и не допустит ввода. Забегая вперёд, заметим, что рассмотренный смысл в базах данных называют ограничением целостности "первичный ключ". Связываем рассмотренные понятия:

Информация = данные + семантика

Справедлива формула:

Семантика = система смыслов + ?

в которой знак ? означает, что существует семантика не представимая смыслами, хранимыми в базе данных.

База хранит данные и смыслы. Информационная система, использующая базу, решает все остальные задачи от общения с пользователями, до создания отчётов, выполнения анализа данных и т.д.

1.1.2 Данные и их хранение

Способ хранения данных должен, с одной стороны, обеспечить удобство восприятия человеком, а с другой стороны — их эффективную обработку на компьютерах и передачу по каналам связи. Но пока эти детали для нас не существенны. Любая база данных определяется следующими особенностями:

  • тем, что в ней хранится;
  • тем, как и где оно хранится;
  • тем, что и как спрашивают или могут спросить;
  • тем, кто, при каких условиях и когда может спрашивать.

Поясним эти свойства на примере. Пусть имеется некоторое собрание

книг со следующими особенностями хранения (пять вариантов):

  1. отдано на ответственное хранение без права чтения;
  2. книги на полках расположены бессистемно;
  3. книги на полках расположены по возрастанию инвентарных номеров и снабжены каталогом, в котором карточки расположены по темам;
  4. имеется поисковая система, позволяющая вести поиск данных в заглавиях и/или в текстах книг;
  5. имеется система организации и учета выдачи книг.

В первом варианте можно представлять себе большой мешок наполненный книгами. Раз хранение ответственное и нет права чтения, то на мешке большая сургучная печать. Вся информация для того, кто хранит библиотеку, сводится к простым вещам. Имеется ли библиотека, печать целая или нарушена, когда принята, при каких условиях может быть возвращена, в общем всё по известной формуле: сдал, принял, протокол. Содержание книг и сведения о них не доступны.

В варианте 2 библиотека доступна для хранителя, но из-за отсутствия порядка в расположении книг, поиск затруднён. Найти нужную книгу можно всегда, но для этого, может быть, придётся перебрать все книги.

В варианте 3 по каталогу можно найти инвентарный номер нужной книги и быстро её обнаружить на стеллажах.

Совсем современный вариант 4 позволяет выбирать книги и по названиям и по деталям содержимого.

И, наконец, в последнем варианте кроме самих книг предполагается некая система управления библиотекой, позволяющая что-то узнать о состоянии книги, определить, кто ею пользуется в настоящий момент, сколько экземпляров книги у нас имеется и т.д.

Вот такие разные получаются базы данных.

Мы пока не будем говорить о том, как база заполняется, как изменяется её содержимое. На общепринятом языке эти действия называются манипулированием данными.

Лекция 1: 1234567 || Лекция 2 >