НОУ ИНТУИТ | Модели и смыслы данных в Cache и Oracle. Лекция 8: Язык SQL

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Кубанский государственный университет

Опубликован: 24.12.2013 | Доступ: свободный | Студентов: 684 / 9 | Длительность: 24:28:00

Тема: Базы данных

Специальности: Администратор баз данных

|

Вам нравится? Нравится 15 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

8.4 Язык манипулирования данными

Манипулирование данными выполняют инструкции:

INSERT — добавление строк в таблицу;
UPDATE — изменение строк в таблице;
DELETE —удаление строк в таблице.

8.4.1 Вставка

Новая строка вводится в таблицу инструкцией INSERT, упрощённый синтаксис которой выглядит так:

INSERT INTO имя_таблицы_или_представления [(столбец    [,столбец]  ... )] [VALUES    (значение [, значение] ...)]

Перечень столбцов после имени таблицы указывает столбцы, в которые вводят значения (по умолчанию ввод во все столбцы). После слова VALUES перечисляют вводимые значения. Для вставки неопределённого значения можно указать его явно: NULL. Можно просто не указывать значения, не забывая запятых.

Пример инструкции INSERT: Предполагается, что таблица создана инструкцией

CREATE TABLE qq (c1 NUMBER(3)  PRIMARY KEY,   c2 CHAR(5))

Если таблица с именем qq уже существует, следует начала удалить её инструкцией

DROP TABLE qq

а затем вновь создать. Вставим строку со значениями "7" в столбце c1 и "A" в столбце c2:

INSERT INTO qq VALUES(7, 'A')

Если вам так удобно, читайте инструкцию как фразу на русском языке: "ВВЕСТИ В qq ЗНАЧЕНИЯ (7, 'A')"

Почему мы написали ЗНАЧЕНИЯ, а не СТРОКУ? Да потому, что вводится именно набор значений столбцов в строке, а не обязательно вся строка. Не введённые значения столбцов вызывают вставку NULL, если это допустимо.

Вставляем ещё одну строку:

INSERT INTO qq VALUES(1, 'В')

Обратите внимание на то, что в одинарные кавычки берутся только строчные значения, но не числовые. Проверим, действительно ли введены эти строки. Для этого инструкцией SELECT * FROM qq выберем все строки из таблицы qq. Символ "*" означает выбор всех столбцов. Результат выполнения инструкций вы можете увидеть в листинге 8.1.

USER>>CREATE TABLE qq (c1 NUMBER(3) PRIMARY KEY,c2 CHAR(5))
0 Rows Affected
-------------------------------------------------------
USER>>INSERT INTO qq VALUES(7,'A')
1 Row Affected
-------------------------------------------------------
USER>>INSERT INTO qq VALUES(1,'B')
1 Row Affected
-------------------------------------------------------
USER>>SELECT * FROM qq
c1 c2
7 A
1 B
2 Rows(s) Affected
-------------------------------------------------------

Пример 8.1. Вставка

Замечание. Инструкцию SELECT мы рассмотрим позднее, а пока используем указанный простой вариант запроса.

Для ввода больших объёмов данных может быть полезен формат

INSERT INTO имя_таблицы_или_представления запрос

Пусть создана таблица vv со столбцами v1 типа NUMBER(5) и v2 типа CHAR(5) . В нее можно перенести все содержимое таблицы qq:

INSERT INTO vv SELECT * FROM qq

8.4.2 Обновление

Изменение существующих строк выполняет инструкция UPDATE:

UPDATE имя_таблицы_или_представления
SET   столбец=выражение  [,столбец=выражение] ...
[WHERE условие];

Пример инструкции UPDATE:

Заменим в строке (7, "A") значение 7 на 11. Строку выберем по условию с1=7:

UPDATE qq
SET c1=11 
WHERE c1=7 Проверим

результат запросом:

SELECT * FROM qq

8.4.3 Удаление

Удаляются строки из таблицы инструкцией DELETE:

DELETE [FROM] имя_таблицы_или_представления [WHERE условие]

Если фраза WHERE отсутствует, будут удалены все строки.

Пример инструкции DELETE:

Удаляем первую строку (11, "A"):

DELETE FROM qq WHERE c2='A'

Тот же результат можно было получить опустив слово FROM:

DELETE qq WHERE c2='A'

Результат выполнения запросов вы можете увидеть в листинге 8.2. Обратите внимание на то, что во всех инструкциях мы были уверены, что выбираем единственную строку. Ошибка в выборе условия может привести к непредусмотренным изменениям данных, может быть, большого объёма.

USER>>UPDATE qq SET c1=11 WHERE c1=7
1 Row Affected
-------------------------------------------------------
USER>>SELECT * FROM qq
c1 c2
11 A
1 B
2 Rows(s) Affected
-------------------------------------------------------
USER>>DELETE FROM QQ WHERE c2='A'
1 Row Affected
-------------------------------------------------------
USER>>SELECT * FROM qq
c1 c2
1 B
1 Rows(s) Affected
-------------------------------------------------------

Пример 8.2. Обновление и удаление

Заметьте, что для инструкции удаления таблицы используется слово DROP, а для удаления строк слово DELETE. Специально выбраны различные слова, чтобы не перепутать.

8.5 Запросы

Инструкцию "SELECT * FROM таблица" мы уже использовали без объяснения. Перейдём к систематическому изучению запросов.

8.5.1 Запросы в рамках исчисления на кортежах и соответствующие запросы в SQL

Останемся пока строго в рамках исчисления на кортежах. Инструкция SELECT (по-русски "ВЫБРАТЬ") должна состоять минимум из двух фраз SELECT и FROM (по-русски "ИЗ"), а именно:

SELECT DISTINCT
{*  |   { столбец|константа [псевдоним]},    ... } FROM    {таблица,    ... }

Фраза SELECT определяет список столбцов таблицы-результата. Если записаны псевдонимы, то используют их как имена.

Фраза FROM задает список таблиц, из которых производится выборка, а слово DISTINCT позволяет избежать дублирования строк, недопустимого в реляционной модели. Если список содержит более одной таблицы, то запрос строит декартово произведение. Поясним список фразы SELECT:

{*  |   {столбец|константа [псевдоним]},    ...   }

Он может состоять из единственного символа звездочка, означающего "выбрать все столбцы". Можно задать список столбцов, разделяя их запятой. Через пробел к каждому имени можно приписать псевдоним. Последнее соответствует операции переименования.

Во фразе FROM указывают имя таблицы или нескольких таблиц, из которых выбираются данные.

Самый сложный запрос, который можно записать в рамках исчисления на кортежах без использования вложенных подзапросов, имеет формат:

SELECT DISTINCT
{*   |   {столбец|константа  [псевдоним]},     ... } FROM таблица [, псевдоним_табл ] WHERE условие(я)

Псевдонимы таблиц позволяют, кроме прочего, соединять таблицы с собой, как бы образуя два или более экземпляров одной таблицы.

Добавленная фраза WHERE (по-русски "где") определяет условия, которым должны удовлетворять выбираемые кортежи. Для нескольких таблиц во фразе WHERE также записываются условия соединения таблиц.

Замечание. В рамках исчисления на кортежах запросы не содержат в списке SELECT функций от столбцов или констант.

Пример: Запрос в рамках исчисления на кортежах:

SELECT DISTINCT с1 FROM qq WHERE c2<>'A'

Из таблицы qq выбираются строки, в которых значения в столбце c2 отличны от 'A', и выдаётся столбец c1 (листинг 8.3).

USER>> << entering multiline statement mode >>
1>>SELECT DISTINCT c1
2>>FROM qq
3>>WHERE c2<>10
4>>go
c1
1
1 Rows(s) Affected
-------------------------------------------------------

Пример 8.3. Пример запроса в рамках исчисления на кортежах

В рамках исчисления допустимы запросы к результатам других запросов, понимаемым как переменная-отношение. В SQL им соответствует использование обычных (не коррелированных) подзапросов. О них поговорим позже.

8.5.2 Простейший запрос SQL

Расширим определение запроса, принятое в рамках исчисления на кор- тежах:

SELECT [DISTINCT]
{*|{столбец|константа|функция [псевдоним]}, ...} FROM     {таблица,    ... } WHERE условие(я) [GROUP BY список_столбцов]
[ORDER BY {столбец|выражение,    ...} [ASC|DESC]]

Символ "*", как вы помните, означает выбор всех столбцов. Подчеркнём, что этот символ может быть только единственным в списке SELECT. Слово DISTINCT теперь не обязательное, так как в SQL допустимы повторы строк.

Фраза ORDER BY ("упорядочить по") задает упорядочение строк и в запросе всегда стоит последней. По умолчанию упорядочение ведётся по возрастанию (ASCENDING — сокращённо ASC), можно задать упорядочение по убыванию (DESCENDING — сокращённо DESC). Если во фразе ORDER BY записано через запятую несколько столбцов, то вначале выполняется упорядочение по первому столбцу, полученные группы строк упорядочиваются по второму столбцу, и т. д. Как вы помните, в реляционной модели строки не упорядочены.

Функции во фразе SELECT могут быть одно- и многострочными. Последние ещё называют групповыми. Способ группирования определяется списком столбцов во фразе GROUP BY.

Напомним, что функции от значений в столбцах в реляционной теории не предусмотрены. Таким образом, использование функций и фраз GROUP BY и ORDER BY выводит нас за пределы реляционной модели.

Учебная схема базы данных

Очень удобно, когда определена всем известная схема базы данных и никому не нужно объяснять её детали. К сожалению, такие схемы распространяются исключительно в рамках одной СУБД или учебника. Мы уже нарушили эту обременительную традицию, загрузив (смотри раздел 8.1) учебную схему scott, известную издавна тем, кто работает в СУБД Oracle. В ней использованы три таблицы: dept (от слова department — отдел) описывает отделы некоторой просто структурированной организации, emp (от слова employee — работник) содержит сведения о работниках, а в salgrade (salary grade — категории оплаты) описана система оплаты.

Ниже расписана структура этих таблиц (таблицы 8.6 и 8.6, 8.7). В верхней строке приводится название столбца, а внизу даны пояснения. Перед именами столбцов первичных ключей помещен признак ключа в виде символа "*". В имя столбца он не входит.

Таблица 8.5. Таблица emp
* empno	ename job	hiredate	sal	comm	mgr deptno
табельный	фамилия дол-	дата прие-	оклад	комис-	табельный номер отдела
номер ра-	жность	ма на ра-		сион-	номер
ботника		боту		ные	руководи-

Таблица 8.6. Таблица dept
*deptno	dname	loc
номер отдела	название отдела	место нахождения

Таблица 8.7. Таблица salgrade
grade	local	hisal
категория оплаты	минимальный оклад	максимальный оклад

Содержимое учебной базы данных, созданной скриптом demobld.sql, показано в таблицах 8.8 и 8.9, 8.10.

Таблица 8.8. Содержимое таблицы dept
*deptno	dname	loc
10	ACCOUNTING	NEW-YORK
20	RESEARCH	DALLAS
30	SALES	CHICAGO
40	OPERATIONS	BOSTON

Таблица 8.9. Содержимое таблицы salgrade
grade	losal	hisal
1	700	1200
2	1201	1400
3	1401	2000
4	2001	3000
5	3001	9999

Таблица 8.10. Содержимое таблицы emp
* empno	ename	job	hiredate	sal	comm	mgr	deptno
7369	SMITH	CLERK	17-12-1980	800		7902	20
7499	ALLEN	SALESMAN	20-02-1981	1600	300	7698	30
7521	WARD	SALESMAN	22-02-1981	1250	500	7698	30
7566	JONES	MANAGER	02-04-1981	2975		7839	20
7654	MARTIN	SALESMAN	28-09-1981	1250	1400	7698	30
7698	BLAKE	MANAGER	01-05-1981	2850		7839	30
7782	CLARK	MANAGER	09-06-1981	2450		7839	10
7788	SCOTT	ANALYST	09-12-1982	3000		7566	20
7839	KING	PRESIDENT	17-11-1981	5000			10
7844	TURNER	SALESMAN	08-09-1981	1500	0	7698	30
7876	ADAMS	CLERK	12-01-1983	1100		7788	20
7900	JAMES	CLERK	03-12-1981	950		7698	30
7902	FORD	ANALYST	03-12-1981	3000		7566	20
7934	MILLER	CLERK	23-01-1982	1300		7782	10

Система оплаты заключается в том, что каждому работнику присваивается категория оплаты grade. В каждой такой категории определена раз и навсегда так называемая вилка, то есть минимальный оклад (losal) и максимальный (hisal). Допустимая для категории заработная плата выбирается из условия:

losal <= заработная_плата <= hisal для данной категории.

Изучим содержимое таблицы emp (таблица8.10). Заметим, что в отделе может не быть сотрудников, если отдел введен, но ещё не сформирован. Но в работающих отделах может быть один и более человек. Так из таблицы emp видно, что в отделе 10 работают Кларк, Кинг и Миллер, а в отделе 30 — Аллен и другие. Соединение таблиц emp и dept может быть реализовано через столбец deptno таблицы dept и столбец с тем же именем deptno в таблице emp. Считается, что все сотрудники, даже президент, относятся к какому-нибудь отделу. Правда, не очень умно подчинять президента начальнику отдела, который подчинён президенту? Ну, может быть, просто зарплата президента отнесена на расходы отдела 10? Потому его и включили в отдел 10.

Теперь проанализируем возможность соединения таблицы emp с собой. Естественно, что президент компании с многозначительной фамилией KING не имеет начальников. В поле mgr (руководитель) у него стоит неопределенное значение NULL. А вот менеджер Блейк (BLAKE) непосредственно подчинен президенту и табельный номер Кинга 7839 стоит в поле mgr во второй строке. В свою очередь, Аллен (ALLEN) подчиняется непосредственно Блейку чей табельный номер 7698 и стоит в столбце mgr второй строки. Значит, соединение таблицы emp с собой с помощью столбцов empno и mgr имеет смысл.

Заметим, что если в emp добавить столбцы, определяющие рост и вес сотрудников, то иерархию на этих столбцах построить можно, но смысла в описываемой предметной области такая связь не имеет, точнее, он есть, но больно уж извращённый.

Заметьте, что у всех таблиц схемы не выделены даже первичные ключи.

Выполнение однотабличного запроса

Сразу заметим, что здесь и далее в разделах с названиями вида "Выполнение. .." строится теоретическая модель процесса исполнения запроса, которая позволяет вам самим без программы правильно определить результат этого запроса. В вашей СУБД, скорее всего, реализуется другой алгоритм, но он обязан дать те же результаты.

Итак, однотабличный запрос выполняется путём поочерёдного применения фраз, образующих запрос. Запишем алгоритм, используя псевдокод:

По фразе FROM выбирается указанная таблица.
Если имеется фраза WHERE, то в выбранной таблице отбираются строки, удовлетворяющие заданному в ней условию.
По списку фразы SELECT создаются столбцы таблицы результата, вычисляются все значения во всех отобранных строках (в списке SELECT могут быть функции).
Если имеется слово DISTINCT, то из таблицы результатов удаляются все повторяющиеся строки.
Если имеется фраза ORDER BY, то результаты отсортировывают по значениям записанных в ней выражений.

Если бы можно было записывать запрос как последовательность фраз FROM, WHERE, SELECT, ORDER BY, что, в отличие от английского, допускается русским языком, то не пришлось бы вспоминать порядок действий.

Сравнение запросов SQL и запросов в языке исчисления на кортежах

Расширения языка запросов SQL по сравнению с языком исчисления на кортежах многочисленны и существенны. Как упоминалось выше, только небольшой слой, соответствующий реляционному исчислению на кортежах, содержится в языке запросов SQL. Большая часть языка находится вне рамок этого исчисления и была добавлена исходя из потребностей пользователей. Заметим, что это обычная судьба долго живущих и широко используемых языков программирования, независимо от их назначения.

Перечислим некоторые расширения, частично упомянутые ранее:

Многочисленные однострочные функции. Например, функция
```
SUBSTR(ИМЯ, начальная_позиция, длина)
```
которая вырезает часть строки, функция
```
DUMP (имя  | строка)
```
в СУБД Oracle, возвращающая внутреннее представление данных. Нестандартная функция
```
DECODE(значение, зн1, рез1,
зн2, рез2, ... результат_по_умолч)
```
анализирует "значение" и если оно равно "зн1", то возвращает "рез1", если равно "зн2" возвращает "рез2", и т.д., если "зш" не найдено, вернётся "результат_по_умолчанию". Обратите внимание, DECODE — это включение IF, то есть процедурного указания, во фразу SELECT, по природе своей декларативную. Употребляется также процедурная конструкция CASE, играющая сходную роль (листинг 8.4).
```
SELECT ename,job,sal,
CASE job WHEN  'CLERK'   THEN 1.10*sal
WHEN  'SALESMAN'   THEN 1.20*sal ELSE 1.05*sal
FROM emp
ename job sal Expression_4
SMITH CLERK 800 880
ALLEN SALESMAN 1600 1920
WARD SALESMAN 1250 1500
JONES MANAGER 2975 3123.75
MARTIN SALESMAN 1250 1500
BLAKE MANAGER 2850 2992.5
CLARK MANAGER 2450 2572.5
SCOTT ANALYST 3000 3150
KING PRESIDENT 5000 5250
TURNER SALESMAN 1500 1800
ADAMS CLERK 1100 1210
JAMES CLERK 950 1045
FORD ANALYST 3000 3150
MILLER CLERK 1300 1430
```
Пример 8.4. Пример использования процедуры CASE
Использование операторов IN и BETWEEN (по-русски "между") во фразе WHERE. Пример: Запрос в листинге 8.5 вернёт сведения о работниках с зарплатой 800, 1250 или 2000.
```
SELECT ename, sal FROM emp
WHERE sal IN  (800,   1250, 2000)
ename sal
SMITH 800 WARD 1250 MARTIN 1250
```
Пример 8.5. Пример использования оператора IN
Использование многострочных функций и управляющей их работой фразы группирования GROUP BY. Пример: Запрос в листинге 8.6 выдает суммарную заработную плату по отделам.
```
SELECT deptno,  SUM(sal) FROM emp GROUP BY deptno 
deptno Aggregate_2
ename     sal
10     8750
20     10875
30     9400
```
Пример 8.6. Пример использования многострочных функций
Использование строк с разделителями и списков в качестве значений, хранящихся в таблицах. С ними связаны регулярные выражения, то есть строки, предназначенные для поиска и обработки текста. В частности, регулярные выражения позволяют разбирать поля кодированных номеров счетов.
Реализация рекурсивных запросов, эквивалентных заданию переменного (выбираемого) числа соединений таблиц.
Использование коррелирующих подзапросов, которые срабатывают многократно, причем начинает работу основной запрос, затем подзапрос готовит строку-кандидата для основного запроса, который обрабатывает её и т. д.
Сращивание многомерной и реляционной моделей данных за счёт конструкции MODEL.

Из перечисленных расширений мы бегло рассмотрим рекурсивные и коррелирующие подзапросы, регулярные выражения и фразу MODEL.

Дальше >>

Авторизоваться

Модели и смыслы данных в Cache и Oracle

Язык SQL