Опубликован: 04.06.2009 | Уровень: специалист | Доступ: свободно | ВУЗ: Нижегородский государственный университет им. Н.И.Лобачевского
Лекция 1:

Введение в базы данных. Общая характеристика основных понятий

Лекция 1: 123 || Лекция 2 >
Аннотация: Лекция посвящена рассмотрению развития основных понятий обработки данных, связанного с постоянным расширением классов решаемых на ЭВМ задач. Показывается необходимость интеграции данных при решении несколькими пользователями задач, использующих общие данные. Вводится понятие базы данных.

Цель лекции: показать, что с изменением вида решаемых на ЭВМ задач в программировании возникают новые виды представления данных, в том числе такой вид, как базы данных.

1.1. Развитие основных понятий представления данных

Любой вычислительный процесс представляет собой отображение (по определенному алгоритму) некоторых входных данных в выходные.


Соотношение сложности представления обрабатываемых данных и алгоритма вычислений определяет два класса задач:

  • вычислительные задачи – достаточно простое представление данных и сложный, многооперационный процесс вычислений;
  • задачи обработки данных (невычислительные задачи) – простой алгоритм обработки данных и сложное представление обрабатываемых данных.

На начальной стадии обучения программированию основное внимание уделяется разработке алгоритма решения задачи. Однако часто оказывается, что возможность (или невозможность) решения конкретной задачи зависит не только от выбранного алгоритма, но и от того, какие понятия используются для представления обрабатываемых данных.

Рассмотрим простейший пример вычисления по формуле:

Y=X2+5X,

где X и Y – определенные числа, которые являются здесь элементарными единицами данных ( элементами данных ).

При программировании алгоритма решения этой задачи (программирование формулы) используется простейший вид данных – простая переменная ( X и Y представляются в программе простыми переменными). Заметим, что простая переменная в системах программирования характеризуется определенным типом ее значений, которые должны выбираться при программировании. Даже в этом простейшем случае необходимо правильно выбрать тип переменной, причем от этого выбора может зависеть возможность или невозможность решения конкретной прикладной задачи (например, для представления конкретных данных не хватит отведенных разрядов).

Рассмотрим другой пример:

S=a1+a2+...+aN.

Решение этой задачи в общем случае невозможно получить используя только простые переменные. Здесь обрабатывается не отдельное число, а последовательность чисел. В этом случае при программировании используется такой вид данных, как массив – совокупность элементов, с каждым из которых связан упорядоченный набор целых чисел, называемых индексами. Все элементы должны иметь одинаковый тип их значений, который и будет типом массива. В этом случае числа a1, a2,..., aN представляются в программе массивом A(1), A(2),..., A(N).

Приведенные примеры показывают, что изменение вида задач обуславливает необходимость использования других видов данных.

Ранние языки программирования (ФОРТРАН, АЛГОЛ-60) были предназначены для решения научно-технических вычислительных задач. В этих языках использовались только вышеуказанные виды данных (простые переменные и массивы) что было вполне достаточно.

Начиная с конца 60-х годов компьютеры начинают интенсивно использоваться для решения так называемых невычислительных задач, связанных с обработкой различного рода документов. Рассмотрим появление новых видов данных на примере упрощенных задач обработки данных.

Задача 1. Начисление заработной платы.

Рассматриваем задачу при двух упрощающих предположениях:

  • сотруднику начисляется заработная плата на основе его оклада;
  • никакие налоги и вычеты не учитываются.

Необходимые для решения этой задачи сведения о сотруднике представлены в следующей карточке НАЧИСЛЕНИЕ:

Фамилия, имя, отчество Оклад Количество отработанных дней в месяц Начисленная сумма
FIO O Ko S

Для каждого работника начисленная сумма за определенный месяц рассчитывается по следующей формуле:

S=KoO/Kr,

где Kr – количество рабочих дней в данном месяце.

Для каждого сотрудника соответствующие данные имеют конкретное значение, например:

Иванов Иван Иванович 1800 24 1800

Эти значения имеют смысл только во взаимосвязи друг с другом. Отдельно выбранное число 1800 теряет свой содержательный смысл, поэтому использовать такой вид данных, как простая переменная, здесь нельзя. В то же время набор соответствующих значений, характеризующих конкретного сотрудника, имеет разные типы (символьный и числовой), т.е. использовать для его представления такой вид данных, как массив, также нельзя. Таким образом, понятий "простая переменная" и "массив" недостаточно, чтобы представить соответствующую карточку.

Для описания аналогичных представлений данных в предметной области невычислительных задач вводится ряд новых понятий [ [ 1.1 ] ].

Элемент данных (поле) – наименьшая единица поименованных данных.

Для данного примера элементами данных являются FIO, O, Ko, S.

Для описания карточки сотрудника используется понятие " Логическая запись ".

Логическая запись – поименованная совокупность элементов данных (полей).

Экземпляр логической записи – текущее значение элементов записи.

Для представления всего набора карточек сотрудников используется понятие " Логический файл "

Логический файл - поименованная совокупность всех экземпляров записей заданного типа.

Пример логического файла НАЧИСЛЕНИЕ:


Таким образом, с помощью введенных понятий можно описывать соответствующие данные. Для отображения этих понятий в современных языках программирования, предназначенных как для вычислительных задач, так и для задач обработки данных, введены новые виды данных.

Лекция 1: 123 || Лекция 2 >
Александра Каева
Александра Каева
Карина Максутова
Карина Максутова