Введение в SQL

Мартин Грубер

 1 Введение в Реляционные Базы Данных
 2 SQL: Краткий Обзор
 3 Использование SQL Для Извлечения Информации из Таблиц
 4 Использование Реляционных и Булевых Операторов при Создании более Сложных Предикатов
 5 Использование Специальных Операторов в Условиях
 6 Обобщение Данных с помощью Агрегатных Функций
 7 Форматирование Вывода Запроса
 8 Запрос Многих Таблиц Как Одной
 9 Объединение Таблицы с Собой
10 Помещение Одного Запроса Внутрь Другого
11 Соотнесенные Подзапросы
12 Использование Оператора EXISTS
13 Использование Операторов ANY, ALL, и SOME
14 Использование Предложения UNION
15 Введение, Удаление, и Изменение Значения Поля
16 Использование Подзапросов с Командами Модификации
17 Создание Таблиц
18 Ограничение Значений Ваших Данных
19 Поддержание Целостности Ваших Данных
20 Введение: Представления
21 Изменение Значений с Помощью Представлений
22 Определение Кто Что Может Делать
23 Глобальные Аспекты SQL
24 Как Данные SQL Содержатся в Упорядоченном Виде
25 Использование SQL с Другими Языками ( Вложенный SQL )

 A Ответы для Упражнений
 B Типы SQL Данных
 C Некоторые Общие Нестандартные Особенности SQL
 D Синтаксис и Команды Ссылки
 E Таблицы Используемые в Примерах

1. Введение в реляционную базу данных

 

Введение

       SQL (ОБЫЧНО ПРОИЗНОСИМАЯ КАК "SEEQUEL") символизирует собой Структурированный Язык Запросов.  Это - язык который дает  вам  возможность создавать и работать в реляционных базах данных,  которые являются наборами связанной информации сохраняемой в таблицах.
       Мир баз  данных  становится все более и более единым,  что привело к необходимости создания стандартного языка который мог бы использоваться  чтобы  функционировать в большом количестве различных видов компьютерных сред. Стандартный язык позволит пользователям знающим один набор команд,  использовать их чтобы создавать,  отыскивать, изменять, и передавать информацию независимо от того работают ли они на персональном компьютере, сетевой рабочей станции, или на универсальной ЭВМ.
       В нашем все более и более взаимосвязанном компьютерном мире, пользователь снабженный таким языком, имеет огромное преимущество в использовании и обобщении информации из ряда  источников  с  помощью  большого количества способов.
       Элегантность и независимость от специфики компьютерных технологий, а
также его поддержка лидерами промышленности в области технологии реляционных баз данных, сделало SQL, и вероятно в течение обозримого будущего оставит его,  основным стандартным языком. По этой причине, любой кто хочет работать с базами данных 90-х годов должен знать SQL.
       Стандарт SQL определяется ANSI (Американским Национальным Институтом Стандартов) и в данное время также принимается ISO (МЕЖДУНАРОДНОЙ  ОРГАНИЗАЦИЕЙ ПО СТАНДАРТИЗАЦИИ).  Однако, большинство коммерческих программ баз данных расширяют SQL без уведомления  ANSI,  добавляя  разные другие особенности в этот язык, которые, как они считают, будут весьма полезны.  Иногда они несколько нарушают стандарт языка,  хотя  хорошие идеи  имеют  тенденцию  развиваться  и  вскоре становиться стандартами "рынка" сами по себе в силу полезности своих качеств. В этой книге, мы будем,  в основном,  следовать стандарту ANSI,  но одновременно иногда будет показывать и некоторые наиболее общие отклонения от его стандарта.
       Вы должны проконсультироваться с документацией вашего  пакета  программ который вы будете использовать,  чтобы знать где в нем этот стандарт видоизменен.  ПРЕЖДЕ,  ЧЕМ ВЫ СМОЖЕТЕ ИСПОЛЬЗОВАТЬ SQL, ВЫ должны понять что такое реляционные базы данных.  В этой главе, мы это объясним,  и покажем насколько реляционные базы данных полезны. Мы не будем обсуждать SQL именно здесь,  и если вы уже знаете эти понятия довольно хорошо,  вы можете просто пропустить эту главу.  В  любом  случае,  вы должны рассмотреть три таблицы которые предоставляются и объясняются в конце главы;  они станут основой наших примеров в этой  книге.  Вторая копия этих таблиц находится Приложении E, и мы рекомендуем скопировать их для удобства ссылки к ним.

Что такое - реляционная базы данных?

 
  Реляционная база данных - это тело связанной информации, сохраняемой в двумерных таблицах. Напоминает адресную или телефонную книгу. В книге имеется большое количество входов,  каждый из которых соответствует определенной особенности. Для каждой такой особенности, может быть несколько независимых фрагментов данных,  например имя, телефонный номер,
и адрес.  Предположим, что вы должны сформатировать эту адресную книгу в виде таблицы со строками и столбцами.  Каждая  строка  (  называемая также записью ) будет соответствовать определенной особенности; каждый столбец будет содержать значение для каждого типа данных - имени,  телефонного номера,  и адреса представляемого в каждой строке.  Адресная книга могла бы выглядеть следующим образом:
 
    Имя             Телефон             Адрес
    Gerry Farish    ( 415)365-8775      127 Primrose Ave.,SF
    Celia Brock     ( 707)874-3553      246 #3rd St.,Sonoma
    Yves Grillet    ( 762)976-3665      778 Modernas,Barcelona
 
  То что  вы  получили  является основой реляционной базы данных как и было определено в начале этого обсуждения - а именно, двумерной (строка  и столбец ) таблицей информации.  Однако,  реляционные базы данных редко состоят из одной таблицы. Такая таблица меньше чем файловая система.  Создав несколько таблиц взаимосвязанной информации,  вы сможете выполнить более сложные и мощные операции с вашими  данными.  Мощность базы  данных зависит от связи которую вы можете создать между фрагментами информации, а не от самого фрагмента информации.

Связывание одной таблицы с другой

 
       Позвольте нам использовать пример нашей адресной книги чтобы  начать обсуждение  базы данных которая может реально использоваться в деловой ситуации. Предположим, что персонажи в нашей первой таблице ( адресной книги ) - это пациенты больницы.  В другой таблице, мы могли бы запомнить дополнительную информацию об этих пациентах.  Столбцы второй таблицы могли бы быть помечены как Пациент, Доктор, Страховка, и Баланс.
 
     Пациент         Доктор        Страховка           Баланс
     Farish          Drume         B.C./B.S.           $272.99
     Grillet         Halben        None                $44. 76
     Brock           Halben        Health,Inc.         $9077.47
 
 
       Много мощных  функций  можно  выполнить  извлекая информацию из этих таблиц согласно указанным параметрам,  особенно  когда  эти  параметры включают  в  себя  фрагменты  информации связанные в различных таблицах друг с другом. Например, возьмем - докторов. Предположим доктор Halben захотел получить номера телефонов всех своих пациентов.  Чтобы извлечь эту информацию, он мог бы связать таблицу с номерами телефонов пациентов ( по адресной книге ) с таблицей которая бы указывала,  какой из пациентов - его. Хотя, в этом простом примере, он мог бы держать это в голове  и  сразу  получать номера телефонов пациентов Grillet и Brock, эти таблицы могут быть слишком большими и слишком сложными.  Программы реляционной  базы  данных  разрабатывались для того чтобы обрабатывать большие и сложные совокупности данных такого типа,  что очевидно является  более  универсальным  методом в деловом мире.  Даже если бы база данных больницы содержала сотни или тысячи имен - как это  вероятно  и бывает  на  практике - одна команда SQL могла бы выдать доктору Halben информацию в которой он нуждался почти немедленно.

Порядок строк произволен

 
       Чтобы поддерживать максимальную гибкость, строки таблицы, по определению,  не должны находиться ни в каком определенном порядке.  С  этой точки зрения,  в этом структура базы данных отличается от нашей адресной книги.  Вход в адресную книгу обычно упорядочивается в  алфавитном порядке.  В  системах с реляционной базой данных,  имеется одна мощная возможность для пользователей - это способность упорядочивать информацию так чтобы они могли восстанавливать ее. 
       Рассмотрим вторую таблицу. Иногда Вам необходимо видеть эту информацию упорядоченной в алфавитном порядке по именам,  иногда в возрастающем или убывающем порядке, а иногда сгруппированной по отношению к какому-нибудь доктору.  Наложение порядка набора в строках будет сталкиваться со способностью заказчика изменять его,  поэтому строки  всегда рассматриваются  как  неупорядоченные.  По этой причине,  вы не можете просто сказать:" Мы хотим посмотреть пятую строку таблицы. " Пренебрегая порядком в котором данные вводились или любым другим критерием, мы определим,  не ту строку, хотя она и будет пятой. Строки таблицы которые рассматриваются, не будут в какой-либо определенной последовательности.

Идентификация строк ( Первичные ключи )

 
       По этим и другим причинам,  вы должны иметь столбец в вашей  таблице который бы уникально идентифицировал каждую строку. Обычно, этот столбец содержит номер - например,  номер пациента назначаемый каждому пациенту. Конечно,  вы могли бы использовать имя пациентов, но возможно что имеется несколько Mary Smiths; и в этом случае, вы не будете иметь другого способа чтобы отличить этих пациентов друг от друга. 
       Вот почему номера так необходимы. Такой уникальный столбец( или уникальная группа столбцов ),  используемый чтобы идентифицировать каждую строку и хранить все строки отдельно, называются - первичными ключами таблицы.
       Первичные ключи таблицы важный элемент в структуре базы данных.  Они - основа вашей системы записи в файл;  и когда вы хотите найти определенную строку в таблице, вы ссылаетесь к этому первичному ключу. Кроме
того,  первичные ключи гарантируют, что ваши данные имеют определенную целостность.  Если первичный ключ правильно используется и поддерживается, вы будете знать что нет пустых строк таблицы и что каждая строка отличается от любой другой строки.  Мы будем обсуждать ключи  и  далее когда поговорим относительно справочной целостности в Главе 19.

Столбцы именуются и нумеруются

 
       В отличие от строк, столбцы таблицы (также называемые полями) упорядочиваются и именуются. Таким образом, в нашей таблице адресной книги, возможно  указать на " адрес столбца " или на " столбец 3 ".  Конечно, это означает что каждый столбец данной таблицы должен иметь уникальное имя чтобы избежать неоднозначности.  Лучше всего если эти имена указывают на содержание поля.  В типовых таблицах этой книги,  мы будем использовать такие сокращения для имени столбца, как cname для имени заказчика,  и odate для даты порядка. Мы также дадим каждой таблице личный числовой номер столбца в качестве первичного ключа. Следующий раздел будет объяснять эти таблицы и их ключи более подробно.

Типовая база данных

 
       Таблицы 1.1,  1.2,  и 1.3 составляют реляционную базу данных которая является минимально достаточной чтобы легко ее отслеживать,  и  достаточно полной,  чтобы иллюстрировать главные понятия и практику использования SQL.        Эти таблицы напечатаны в этой главе а также в Приложении E.  Так как они будут использоваться для  иллюстрирования  различных  особенностей SQL  по всей этой книге,  мы рекомендуем чтобы вы скопировали их,  для удобства ссылки к ним.
       Вы могли уже обратить внимание что первый столбец каждой таблицы содержит номера чьи значения различны для каждой строки. Как вы наверное и предположили,  это - первичные ключи таблиц. Некоторые из этих номеров также показаны в столбцах других таблиц.  В этом нет ничего неверного.
       Они  показывают связь между строками которые используют значение принимаемое из первичного ключа, и строками где это значение используется в самом первичном ключе.
 
Таблица 1.1:     Продавцы
      -----------------------------------------------------------
        SNUM     SNAME            CITY           COMM
      -----------------------------------------------------------
        1001       Peel           London       .12
        1002       Serres         San Jose    .13
        1004       Motika         London       .11
        1007       Rifkin         Barcelona   .15
        1003       Axelrod        New York    .10
      -----------------------------------------------------------
 
Таблица 1.2:     Заказчики
 
        CNUM  CNAME          CITY        RATING        SNUM
        2001  |  Hoffman   | London      |   100             | 1001
        2002  |  Giovanni         | Rome        |   200             | 1003
        2003  |  Liu              | SanJose     |   200             | 1002
        2004  |  Grass            | Berlin      |   300             | 1002
        2006  |  Clemens          | London      |   100             | 1001
        2008  |  Cisneros         | SanJose     |   300             | 1007
        2007  |  Pereira          | Rome        |   100             | 1004
 
 
 
 
Таблица 1.3:   Порядки
 
        ONUM   AMT         ODATE         CNUM   SNUM
        3001  |    18.69  |  10/03/1990 | 2008 | 1007
        3003  |   767.19  |  10/03/1990 | 2001 | 1001
        3002  |  1900.10  |  10/03/1990 | 2007 | 1004
        3005  |  5160.45  |  10/03/1990 | 2003 | 1002
        3006  |  1098.16  |  10/03/1990 | 2008 | 1007
        3009  |  1713.23  |  10/04/1990 | 2002 | 1003
        3007  |    75.75  |  10/04/1990 | 2004 | 1002
        3008  |  4723.00  |  10/05/1990 | 2006 | 1001
        3010  |  1309.95  |  10/06/1990 | 2004 | 1002
        3011  |  9891.88  |  10/06/1990 | 2006 | 1001
 
 
       Например, поле snum в таблице Заказчиков указывает,  какому продавцу назначен данный заказчик. Номер поля snum связан с таблицей Продавцов, которая дает информацию об этих продавцах.  Очевидно, что продавец которому назначены заказчики должен уже существовать - то есть, значение snum из таблицы Заказчиков должно также быть  представлено  в  таблице Продавцов. Если это так, то говорят, что " система находится в состоянии справочной целостности ".
       Этот вывод будет более полно и формально объяснен в Главе 19.
 
 
       ПРИМЕЧАНИЕ: Эти  три  представленных  таблицы  в тексте имеют русские имена - Продавцов,  Заказчиков и Порядков,  и далее будут  упоминаться
именно под этими именами.  Имена любых других применяемых в книге таблиц будут написаны по-английски что бы отличать их  от  наших  базовых таблиц этой базы данных.  Кроме того в целях однозначности,  имена заказчиков, продавцов, Системных Каталогов а также полей в тексте, также будут даны на латыни.
       Таблицы приведены как пример к похожей ситуации  в  реальной  жизни, когда  вы будете использовать SQL чтобы следить за продавцами,  их заказчиками,  и порядками заказчиков. Давайте рассмотрим эти три таблицы и значения их полей.
 
Здесь показаны столбцы Таблицы 1.1
 
   ПОЛЕ              СОДЕРЖАНИЕ
  ---------    ----------------------------------------------
   snum     уникальный номер назначенный каждому продавцу
           ( " номер служащего " ).
   sname   имя продавца.
   city    расположение продавца( город ).
   comm    комиссионные продавцов в десятичной форме.
 
 
 
 
Таблица 1.2 содержит следующие столбцы:
 
   ПОЛЕ               СОДЕРЖАНИЕ
  --------     ---------------------------------------------------
   cnum     уникальный номер назначенный каждому заказчику.
   cname    имя заказчика.
   city     расположение заказчика( город ).
   rating   код указывающего уровень предпочтения данного заказчика
            перед другими. Более высокий номер указывают на большее
            предпочтение( рейтинг ).
   snum     номер продавца назначенного этому заказчику
            ( из таблицы Продавцов )
 
 И имеются столбцы в Таблице 1.3:
 
    ПОЛЕ              СОДЕРЖАНИЕ
    ---------    ---------------------------------------------------
    onum    уникальный номер данный каждому приобретению.
    amt     значение суммы приобретений.
    odate   дата приобретения.
    cnum    номер заказчика делающего приобретение
            ( из таблицы Заказчиков ).
    snum    номер продавца продающего приобретение
            ( из таблицы Продавцов).

РЕЗЮМЕ

 
       Теперь вы знаете что такое реляционная база данных, понятие, которое звучит сложнее чем есть на самом деле. Вы также изучили некоторые фундаментальные принципы относительно того, как сделаны таблицы – как работают строки и столбцы,  как первичные ключи  отличают  строки  друг друга, и как столбцы могут ссылаться к значениям в других столбцах.
       Вы поняли, что запись это синоним строки,  и  что  поле  это  синоним столбца.  Оба термина встречаются в обсуждении SQL, и мы будем использовать их в равной степени в этой книге.
       Вы теперь знакомы с таблицами примеров. Краткие и простые , они способны  показать  большинство особенностей языка,  как вы это увидите в некоторых случаях,  мы будем использовать другие таблицы или постулаты некоторых  различных  данных в одной из этих таблиц чтобы показать вам некоторые другие возможности.
       Теперь вы готовы к углублению в SQL  самостоятельно.  Следующая  глава даст вам быстрый просмотр языка,  и даст вам информацию, которая поможет Вам ссылаться к уже пройденным местам.

 

Работа с SQL

 
1. Какое поле таблицы Заказчиков является первичным ключом?
2. Что является столбцом 4 из таблицы Заказчиков 
3. Как по другому называется строка? Столбец?
4. Почему вы можете не запрашивать для просмотра первые пять строк
   таблицы?
 
( См. Приложение A для ответов. )

2.SQL: Обзор

 
 
       ЭТА ГЛАВА ПОЗАКОМИТ ВАС СО СТРУКТУРОЙ SQL языка а также с определенными общими выводами, такими как тип данных которые эти поля могут содержать и некоторые области неоднозначности, которые существуют в SQL.
       Она предназначена обеспечить связь с  более  конкретной  информацией  в последующих главах.  Вы не должны запоминать каждую подробность упомянутую в этой главе.  Краткий обзор представлен здесь  в  одной  удобно размещенной области, многие подробности которой вы можете иметь чтобы в последствии ссылаться к ним по мере овладения языком. Мы поместили все это  в начало книги чтобы ориентировать вас на мир SQL без упрощенного подхода к его проблемам и в тоже время дать Вам  привычные  в  будущем места для ссылки к ним когда у Вас появятся вопросы. Этот материал может стать более понятным когда мы перейдем к описанию  конкретных  команд SQL, начинающихся с Главы 3.
 

Как работает SQL?

 
       SQL это язык ориентированный специально на реляционные базы  данных. Он устраняет много работы которую вы должны были бы сделать если бы вы использовали универсальный язык  программирования,  например  C.  Чтобы сформировать реляционную базу данных на C,  вам необходимо было бы начать с самого начала. Вы должны были бы определить объект – называемый таблицей которая могла бы расти чтобы иметь любое число строк, а затем создавать постепенно процедуры для помещения значений в нее и извлечения  из них.  Если бы вы захотели найти некоторые определенные строки, вам необходимо было бы выполнить по шагам процедуру,  подобную следующей :
 
  1. Рассмотрите строку таблицы.
  2. Выполните  проверку - является ли эта строка одной из строк  
     которая вам нужна.
  3. Если это так,  сохраните ее где-нибудь пока вся таблица не  будет 
     проверена.
  4. Проверьте имеются ли другие строки в таблице.
  5. Если имеются,  возвратитесь на шаг 1.
  6. Если строк больше нет, вывести все значения сохраненные в шаге 3.
 
       (Конечно,  это не фактический набор C команд, а только логика шагов которые должны были бы быть включены в реальную программу.) SQL сэкономит вам все это. Команды в SQL могут работать со всеми группами таблиц как с единым объектом и могут обрабатывать любое количество информации извлеченной или полученной из их, в виде единого модуля.
 

Что делает ANSI?

 
       Как мы уже рассказывали во Введении,  стандарт SQL определяется с помощью кода ANSI (Американский Национальный Институт Стандартов ).  SQL не изобретался ANSI. Это по существу изобретение IBM. Но другие компании подхватили SQL сразу же,  по крайней мере одна  компания  Oracle отбила у IBM право на рыночную продажу SQL продуктов.
       После того как появился ряд конкурирующих программ SQL на рынке, ANSI определил стандарт к которому они должны быть приведены  (определение таких стандартов и является функцией ANSI ).
       Однако после этого, появились некоторые проблемы. Возникли они в  результате  стандартизации ANSI в виде некоторых ограничений.  Так как не всегда ANSI определяет то что является наиболее полезным, то программы  пытаются  соответствовать  стандарту ANSI не позволяя ему ограничивать их слишком сильно.  Это,  в свою очередь, ведет к случайным несогласованностям. Программы  Баз  Данных обычно дают ANSI SQL дополнительные особенности и  часто ослабляют многие  ограничения  из  большинства  из них.
       Следовательно, общие разновидности ANSI будут также рассмотрены. Хотя  мы  очевидно не сможем объять каждое исключение или разновидность, удачные идеи имеют тенденцию к внедрению и использованию  в  различных программах даже когда они не определены стандартом ANSI.
       ANSI - это вид минимального стандарта и вы можете делать больше  чем он позволяет,  хотя и должны выполнять его указания при выполнении задач которые он определяет.

Интерактивный и вложенный SQL

 
       Имеются два SQL: Интерактивный и Вложенный. Большей частью, обе формы работают одинаково, но используются различно. Интерактивный SQL используется для функционирования непосредственно в  базе  данных  чтобы производить вывод для использования его заказчиком.  В этой форме SQL, когда вы введете команду,  она сейчас же выполнится и вы сможете  увидеть вывод (если он вообще получится) - немедленно.
       Вложенный SQL состоит из команд SQL помещенных внутри программ,  которые  обычно написаны на некотором другом языке (типа КОБОЛА или Паскаля).
       Это делает эти программы более мощными и эффективным. Однако, допуская эти языки,  приходится иметь дело с структурой SQL и стилем управления  данных  который  требует  некоторых расширений к интерактивному SQL. Передача SQL команд во вложенный SQL является выдаваемой ("passed  off")  для переменных или параметров используемых программой в которую они были вложены.
       В этой книге,  мы будем представлять SQL в интерактивной форме.  Это даст нам возможность обсуждать команды и их эффекты не заботясь о  том как они связаны с помощью интерфейса с другими языками.  Интерактивный SQL - это форма наиболее полезная непрограммистам.  Все что вы узнаете относительно  интерактивного  SQL  в  основном применимо и к вложенной форме.  Изменения необходимые для использования вложенной формы  будут использованы в последней главе этой книги.
 

Субподразделение SQL

 
       И в интерактивной и во вложенной формах SQL,  имеются многочисленные части,  или субподразделения.  Так как вы вероятно столкнетесь с  этой терминологией при чтении SQL, мы дадим некоторые пояснения. 
       К сожалению,  эти термины не используются повсеместно во всех реализациях. Они подчеркиваются ANSI и полезны на концептуальном уровне, но большинство SQL программ практически не обрабатывают их отдельно,  так что они по существу становятся функциональными категориями команд SQL.
       DDL ( Язык Определения Данных ) - так называемый Язык Описания Схемы в ANSI,  состоит из команд которые создают объекты ( таблицы, индексы, просмотры, и так далее ) в базе данных. 
       DML (Язык Манипулирования Данными) - это набор команд которые  определяют  какие значения представлены в таблицах в любой момент времени. 
       DCD (Язык Управления Данными) состоит из средств  которые  определяют, разрешить ли пользователю выполнять определенные действия или нет.
       Они являются составными частями DDL в ANSI.  Не забывайте эти имена. Это  не  различные  языки,  а разделы команд SQL сгруппированных по их функциям.

Различные типы данных

 
       Не все типы значений которые могут занимать поля таблицы – логически одинаковые.  Наиболее очевидное различие - между числами и текстом. Вы не можете помещать числа в алфавитном порядке или вычитать одно имя из другого. Так как системы с реляционной базой данных базируются на связях между фрагментами информации, различные типы данных должны понятно отличаться друга от друга,  так чтобы соответствующие процессы и сравнения могли быть в них выполнены.
 
       В SQL,  это делается с помощью назначения каждому полю - типа данных который  указывает  на тип значения которое это поле может содержать. Все значения в данном поле должны иметь одинаковый тип.  В таблице Заказчиков,  например, cname и city - содержат строки текста для оценки, snum,  и cnum - это уже номера.  По этой причине,  вы не можете ввести значение  Highest(Наивысший) или значение None(Никакой) в поле rating, которое имеет числовой тип данных. Это ограничение удачно, так как оно налагает некоторую структурность на ваши данные. Вы часто будете сравнивать некоторые или все значения в данном поле, поэтому вы можете выполнять  действие  только на определенных строках а не на всех.  Вы не могли бы сделать этого если бы значения полей имели смешанный тип данных.
 
       К сожалению,  определение  этих  типов  данных является основной областью в которой большинство коммерческих программ баз данных и официальный стандарт SQL, не всегда совпадают. ANSI SQL стандарт распознает
только текст и тип номера,  в то время  как  большинство  коммерческих программ используют другие специальные типы.  Такие как,  DATA(ДАТА) и TIME(ВРЕМЯ) - фактически почти стандартные типы( хотя точный формат их меняется ). Некоторые пакеты также поддерживают такие типы, как например MONEY(ДЕНЬГИ) и BINARY (ДВОИЧНЫЕ). (MONEY - это специальная система  исчисления используемая компьютерами.  
Вся информация в компьютере передается двоичными числами и затем преобразовываются в другие системы, что бы мы могли легко использовать их и понимать.)
       ANSI определяет  несколько различных типов значений чисел,  различия между которыми - довольно тонки и иногда их путают.  Разрешенные  ANSI типы данных перечислены в Приложении B.
       Сложность числовых типов ANSI можно, по крайней мере частично, объяснить усилием сделать вложенный SQL, совместимым с рядом других языков.
       Два типа чисел ANSI ,  INTEGER(ЦЕЛОЕ ЧИСЛО)  и  DECIMAL  (ДЕСЯТИЧНОЕ ЧИСЛО) ( которые можно сокращать как INT и DEC,  соответственно ), будут адекватны для наших целей, также как и для целей большинства практических деловых прикладных программ. Естественно, что тип ЦЕЛОЕ можно представить как ДЕСЯТИЧНОЕ ЧИСЛО  которое  не  содержит  никаких  цифр справа от десятичной точки.
       Тип для  текста  -  CHAR ( или СИМВОЛ ),  который относится к строке текста.  Поле типа CHAR имеет определенную длину, которая определяется максимальным  числом  символов  которые могут быть введены в это поле. Больше всего реализаций также имеют нестандартный тип называемый VARCHAR(ПЕРЕМЕННОЕ ЧИСЛО СИМВОЛОВ), который является текстовой строкой которая может иметь любую длину до определенного  реализацией  максимума (обычно 254 символа ).  CHARACTER и VARCHAR значения включаются в одиночные кавычки как "текст".  Различие между CHAR и VARCHAR в том,  что CHAR должен резервировать достаточное количество памяти для максимальной длины строки,  а VARCHAR распределяет память так как это необходимо.
 
       Символьные типы  состоят  из всех печатных символов,  включая числа. Однако,  номер 1 не то же что символ "1".  Символ "1" - только  другой печатный фрагмент текста,  не определяемый системой как наличие числового значения 1.  Например 1 + 1 = 2,  но "1" + "1" не равняется  "2". Символьные значения сохраняются в компьютере как двоичные значения, но показываются пользователю как печатный текст.  Преобразование  следует за форматом определяемым системой которую вы используете.  Этот формат преобразования будет одним из двух стандартных типов (возможно с  расширениями)  используемых  в компьютерных системах:  в ASCII коде ( используемом во всех персональных и малых компьютерах )  и  EBCDIC  коде (Расширенном Двоично-Десятичном Коде Обмена Информации) (используемом в больших компьютерах).  Определенные операции, такие как упорядочивание в алфавитном порядке значений поля, будет изменяться вместе с форматом. Применение этих двух форматов будет обсуждаться в Главе 4.
 
       Мы должны следить за рынком, а не ANSI, в использовании типа называемого DATE(ДАТОЙ). ( В системе, которая не распознает тип ДАТА, вы конечно можете объявить дату как символьное или числовое  поле,  но  это сделает  большинство операций более трудоемкими.  ) Вы должны смотреть свою документацию по пакету программ которые вы  будете  использовать, чтобы выяснить точно, какие типы данных она поддерживает.
 

SQL несогласованности

 
       Вы можете понять из предшествующего обсуждения, что имеются самостоятельные несогласованности внутри продуктов мира SQL.  SQL появился из коммерческого мира баз данных как инструмент,  и был позже превращен в стандарт ANSI. К сожалению, ANSI не всегда определяет наибольшую пользу,  поэтому программы пытаются соответствовать стандарту ANSI не позволяя ему ограничивать их слишком  сильно.  ANSI  -  вид  минимального стандарта - вы можете делать больше чем он это позволяет, но вы должны быть способны получить те же самые результаты что и при выполнении той же самой задачи.
 

Что такое - Пользователь?

 
       SQL обычно  находится  в  компьютерных системах которые имеют больше чем одного пользователя,  и следовательно должны делать различие между ними ( ваше семейство PC может иметь любое число пользователей, но оно обычно не имеет способов чтобы отличать одного от другого ).  Обычно, в  такой  системе,  каждый  пользователь имеет некий вид кода проверки прав который идентифицирует его или ее (терминология изменяется  ).  В начале сеанса с компьютером,  пользователь входит в систему (регистрируется),  сообщая компьютеру кто этот пользователь, идентифицированный с  помощью  определенного ID(Идентификатора).  Любое количество людей использующих тот же самый ID доступа,  являются отдельными пользователями; и аналогично, один человек может представлять большое количество пользователей ( в разное время ),  используя различные доступные Идентификаторы.
 
 
       SQL следует этому примеру. Действия в большинстве сред SQL приведены к специальному доступному Идентификатору который  точно  соответствует определенному  пользователю.  Таблица  или  другой  объект принадлежит пользователю,  который имеет над ним полную власть. Пользователь может или  не  может иметь привилегии чтобы выполнять действие над объектом. 
Для наших целей, мы договоримся, что любой пользователь имеет привилегии необходимые чтобы выполнять любое действие, пока мы не возвратимся специально к обсуждению привилегий в Главе 22.
 
Специальное значение - USER(ПОЛЬЗОВАТЕЛЬ) может использоваться как аргумент в команде. Оно указывает на доступный Идентификатор пользователя, выдавшего команду.
 

Условия и терминология

 
       Ключевые слова - это слова которые имеют специальное значение в SQL. Они могут быть командами,  но не текстом и не именами объектов. Мы будем выделять ключевые слова печатая их ЗАГЛАВНЫМИ БУКВАМИ.  Вы  должны соблюдать осторожность чтобы не путать ключевые слова с терминами. 
       SQL имеет определенные специальные термины которые используются чтобы описывать его.  Среди них - такие слова как запрос,  предложение, и предикат,  которые являются важнейшими в описании и понимании языка но не означают что-нибудь самостоятельное для SQL. 
 
       Команды, или предложения, являются инструкциями которыми Вы обращаетесь  к SQL базе данных.  Команды состоят из одной или более отдельных логических частей  называемых  предложениями.  Предложения  начинаются ключевым  словом для которого они являются проименованными,  и состоят из ключевых слов и аргументов.  Например предложения с которыми вы можете сталкиваться - это " FROM Salespeope " и " WHERE city = "London". Аргументы завершают или изменяют значение предложения.  В примерах выше,  Salespeople - аргумент, а FROM - ключевое слово предложения FROM. Аналогично,  " city = "London" " - агрумент предложения WHERE. Объекты -  структуры  в базе данных которым даны имена и сохраняются в памяти. Они включают в себя базовые таблицы,  представления (два типа таблиц), и индексы.
       Чтобы показать Вам как формируются команды,  мы будем делать это  на
примерах.  Имеется, однако, более формальный метод описания команд использующих стандартизированные условные обозначения.  Мы будем использовать его в более поздних главах, для удобства чтобы понимать эти условные обозначения в случае если вы столкнетесь с ним в других SQL документах.  Квадратные скобки ( [ ] ) будут указывать части которые могут не использоваться, а многоточия ( ... ) указывать что все предшествующее им может повторяться любое число раз.  Слова обозначенные в угловых скобках (<>) - специальные термины которые объясняют что они собой представляют. Мы упростили стандартную терминологию SQL значительно, но без ухудшения его понимания.

РЕЗЮМЕ

 
       Мы быстро прошли основы в этой главе.  Но нашим намерением и было  - просто пролететь над основами SQL,  так чтобы вы могли понять идею относительно всего объема.  Когда мы возвратимся к  основе  в  следующей главе,  некоторые  вещи  станут  более  конкретными.  Теперь вы знаете кое-что относительно SQL - какова его структура,  как он используется, как  он представляет данные,  и как они определяются ( и некоторые несогласованности появляющиеся при этом ),  и некоторые условные обозначения  и термины используемые чтобы описывать их.  Все это - много информации для одной главы;  мы не ожидаем что бы вы запомнили  все  эти подробности,  но вы сможете вернуться позже к ним если понадобится. По Главе 3, мы будем идти, показывая конкретно, как формируются команды и что они делают.  Мы представим вам команду SQL используемую чтобы извлекать информацию из таблиц,  и которая является наиболее  широко  используемой командой в SQL. К концу этой главы, вы будете способны извлекать конкретную информацию из вашей базы данных с  высокой  степенью точности.

Работа с SQL

 
  1. Какое наибольшее основное различие между типами данных в SQL ?
  2. Распознает ANSI тип данных DATA ?
  3. Какой подраздел SQL используется чтобы помещать значения в
     таблицы ?
  4. Что такое - ключевое слово ?
 

( См. Приложение A для ответов. )


3. Использования SQL для извлечения информации из таблиц

 
       В ЭТОЙ  ГЛАВЕ МЫ ПОКАЖЕМ ВАМ КАК ИЗВЛЕКАТЬ информацию из таблиц.  Вы узнаете как опускать или переупорядочивать столбцы и как автоматически устранять избыточность данных из вашего вывода. В заключение, вы узнаете как устанавливать условие( проверку ) которую вы можете  использовать чтобы определить какие строки таблицы используются в выводе.  Эта последняя особенность,  будет далее описана в более поздних  главах  и является одной из наиболее изящных и мощных в SQL.

Создание запроса

       Как мы подчеркивали ранее, SQL символизирует собой  Структурированный Язык Запросов.  Запросы - вероятно наиболее часто используемый  аспект SQL.  Фактически,  для категории SQL пользователей, маловероятно чтобы кто-либо использовал этот язык для чего-то друго.  По этой причине, мы будем  начинать  наше обсуждение SQL с обсуждения запроса и как он выполняется на этом языке.

Что такое запрос ?

 
       Запрос - команда которую вы даете вашей программе базы данных, и которая сообщает ей чтобы она вывела определенную информацию из таблиц в память.  Эта информация обычно  посылается  непосредственно  на  экран компьютера или терминала которым вы пользуетесь,  хотя,  в большинстве случаев, ее можно также послать принтеру, сохранить в файле ( как объект в памяти компьютера ),  или представить как вводную информацию для другой команды или процесса.
 

Где применяются запросы ?

 
       Запросы обычно рассматриваются как часть языка DML.  Однако, так как
запрос не меняет информацию в таблицах, а просто показывает ее пользователю,  мы будем рассматривать запросы как самостоятельную  категорию среди  команд DML которые производят действие,  а не просто показывают содержание базы данных.
       Все запросы в SQL состоят из одиночной команды.  Структура этой  команды  обманчиво  проста,  потому что вы должны расширять ее так чтобы выполнить высоко сложные оценки и обработки данных.  Эта команда называется - SELECT(ВЫБОР).

Команда SELECT

 
       В самой простой форме, команда SELECT просто инструктирует базу данных чтобы извлечь информацию из таблицы. Например, вы могли бы вывести
таблицу Продавцов напечатав следующее:
 
        SELECT snum, sname, sity, comm
          FROM  Salespeople;
 
 
 
  Вывод для этого запроса показывается в Рисунке 3.1.
           ===============  SQL Execution Log ============
          |                                               |
          | SELECT snum, sname, sity, comm                |
          | FROM  Salespeople;                            |
          |                                               |
          | ==============================================|
          |   snum      sname         city         comm   |
          | ------    ----------   -----------   -------  |
          |   1001      Peel         London        0.12   |
          |   1002      Serres       San Jose      0.13   |
          |   1004      Motika       London        0.11   |
          |   1007      Rifkin       Barcelona     0.15   |
          |   1003      Axelrod      New York      0.10   |
           ===============================================
 
Рисунок 3.1: команда SELECT
 
       Другими словами,  эта команда просто выводит все данные из  таблицы. Большинство программ будут также давать заголовки столбца как выше,  а некоторые позволяют детальное форматирование вывода,  но это  уже  внестандартной спецификации.
       Имеется объяснение каждой части этой команды:
 
SELECT Ключевое слово  которое сообщает базе данных что эта                команда - запрос. Все запросы начинаются этим словом,                сопровождаемым пробелом.
 
 
snum, sname   Это - список столбцов из таблицы которые выбираются                запросом. Любые столбцы не перечисленные здесь не будут включены в вывод команды. Это, конечно, не значит что они будут удалены или их информация будет стерта из таблиц, потому что запрос не воздействует на                информацию в таблицах; он только показывает данные.
 
 
FROM          Ключевое слово, подобно SELECT, которое должно Salespeople   быть представлено в каждом запросе. Оно сопровождается пробелом и затем именем таблицы используемой в качестве источника информации. В данном случае - это таблица Продавцов(Salespeople).
 
;             Точка с запятой используется во всех интерактивных               командах SQL чтобы сообщать базе данных что команда заполнена и готова выполниться.  В некоторых системах наклонная черта влево (\) в строке,               является индикатором конца команды.
 
 
       Естественно, запрос такого характера не обязательно будет упорядочивать вывод любым указанным способом.  Та же самая команда выполненная с теми  же самыми данными но в разное время не сможет вывести тот же самый порядок. Обычно, строки обнаруживаются в том порядке в котором они найдены  в  таблице,  поскольку как мы установили в предыдущей главе - этот порядок произволен.  Это не обязательно будет тот порядок в котором  данные  вводились или сохранялись.  Вы можете упорядочивать вывод командами SQL непосредственно:  с  помощью  специального  предложения. Позже,  мы покажем как это делается.  А сейчас,  просто усвойте, что в отсутствии явного упорядочения,  нет никакого определенного порядка  в вашем выводе.
 
 
       Наше использование возврата (Клавиша ENTER) является произвольным. Мы должны точно установить как удобнее составить запрос,  в  несколько строк или в одну строку, следующим образом:
 
      SELECT snum, sname, city, comm FROM Salespeople;
 
       С тех  пор  как SQL использует точку с запятой чтобы указывать конец команды,  большинство программ SQL обрабатывают возврат  (через  нажим Возврат  или клавишу ENTER ) как пробел.  Это - хорошая идея чтобы использовать возвраты и выравнивание что мы делали это ранее, чтобы сделать ваши команды более легкими для чтения и более правильными.

 

Выбирайте всегда самый простой способ

       
       Если вы хотите видеть каждый столбец таблицы, имеется необязательное сокращение которое вы можете использовать.  Звездочка (*) может применяться для вывода полного списка столбцов следующим образом:
 
      SELECT *
      FROM Salespeople;
 
  Это приведет к тому же результату что и наша предыдущая команда.

Описание SELECT

 
       В общем случае,  команда SELECT начинается с ключевого слова SELECT, сопровождаемого  пробелом.  После  этого  должен следовать список имен столбцов которые вы хотите видеть, отделяемые запятыми. Если вы хотите видеть все столбцы таблицы,  вы можете заменить этот список звездочкой (*).  Ключевое слово FROM следующее далее,  сопровождается пробелом  и именем таблицы запрос к которой делается.  В заключение, точка с запятой ( ;  ) должна использоваться чтобы закончить запрос и указать  что команда готова к выполнению.

Просмотр только определенного столбца таблицы

 
       Команда SELECT  способна  извлечь  строго определенную информацию из таблицы. Сначала, мы можем предоставить возможность увидеть только определенные столбцы таблицы. Это выполняется легко, простым исключением столбцов которые вы не хотите видеть,  из части команды SELECT. Например, запрос
 
 
   SELECT sname, comm
      FROM Salespeople;
 
 
 
будет производить вывод показанный на Рисунке 3.2.
 
 
 
         ===============  SQL Execution Log ============
        |                                               |
        | SELECT snum, comm                             |
        | FROM  Salespeople;                            |
        |                                               |
        | ==============================================|
        |        sname             comm                 |
        |   -------------      ---------                |
        |        Peel              0.12                 |
        |        Serres            0.13                 |
        |        Motika            0.11                 |
        |        Rifkin            0.15                 |
        |        Axelrod           0.10                 |
         ===============================================
 
 
Рисунок 3.2: Выбор определенных столбцов
 
 
       Могут иметься  таблицы которые имеют большое количество столбцов содержащих данные, не все из которых являются относящимися к поставленной задаче.  Следовательно, вы можете найти способ подбора и выбора только полезных для Вас столбцов.

Переупорядочение столбца

       Даже если столбцы таблицы,  по определению, упорядочены, это не означает  что  вы  будете восстанавливать их в том же порядке.  Конечно, звездочка (*) покажет все столбцы в их естественном порядке,  но  если вы укажете столбцы отдельно, вы можете получить их в том порядке котором хотите.  Давайте рассмотрим таблицу Порядков, содержащую дату приобретения(odate),  номер продавца(snum),  номер порядка(onum), и суммы приобретения(amt):
 
   SELECT odate, snum, onum, amt
      FROM Orders;
 
  Вывод этого запроса показан на Рисунке 3.3.
 
     =============  SQL Execution Log  ===============
    |                                                 |
    |  SELECT odate, snum, onum, amt                  |
    |  FROM Orders;                                   |
    |                                                 |
    | ------------------------------------------------|
    |     odate        snum        onum          amt  |
    | -----------   -------      ------     --------- |
    | 10/03/1990       1007        3001         18.69 |
    | 10/03/1990       1001        3003        767.19 |
    | 10/03/1990       1004        3002       1900.10 |
    | 10/03/1990       1002        3005       5160.45 |
    | 10/03/1990       1007        3006       1098.16 |
    | 10/04/1990       1003        3009       1713.23 |
    | 10/04/1990       1002        3007         75.75 |
    | 10/05/1990       1001        3008       4723.00 |
    | 10/06/1990       1002        3010       1309.95 |
    | 10/06/1990       1001        3011       9891.88 |
      ===============================================
Рисунок 3.3: Реконструкция столбцов
 
       Как вы можете видеть,  структура информации в таблицах - это  просто основа для активной перестройки структуры в SQL.

Удаление избыточных данных

 
       DISTINCT (ОТЛИЧИЕ) - аргумент который обеспечивает Вас способом устранять двойные значения из вашего предложения SELECT.  Предположим что вы  хотите знать какие продавцы в настоящее время имеют свои порядки в таблице Порядков. Под порядком (здесь и далее) будет пониматься запись в таблицу Порядков, регистрирующую приобретения сделанные в определенный день определенным заказчиком у определенного продавца  на  определенную сумму).  Вам не нужно знать, сколько порядков имеет каждый; вам нужен только список номеров продавцов (snum).  Поэтому Вы можете ввести:
 
     SELECT snum
       FROM Orders;
 
для получения вывода показанного в Рисунке 3.4
 
               ===============  SQL Execution Log ============
              |                                               |
              | SELECT snum                                   |
              | FROM  Orders;                                 |
              |                                               |
              | ============================================= |
              |   snum                                        |
              | -------                                       |
              |   1007                                        |
              |   1001                                        |
              |   1004                                        |
              |   1002                                        |
              |   1007                                        |
              |   1003                                        |
              |   1002                                        |
              |   1001                                        |
              |   1002                                        |
              |   1001                                        |
                =============================================
Рисунок 3. 4: SELECT с дублированием номеров продавцов.
 
 
       Для получения списка без дубликатов,  для удобочитаемости, вы можете
ввести следующее:
 
       SELECT DISTINCT snum
          FROM Orders;
 
  Вывод для этого запроса показан в Рисунке 3.5.
 
 
       Другими словами,  DISTINCT следит за тем, какие значения были ранее,так что бы они не были продублированы в списке.  Это - полезный способ избежать избыточности данных, но важно что бы при этом вы понимали что вы делаете.  Если вы не хотите потерять некоторые данные, вы не должны безоглядно использовать DISTINCT, потому что это может скрыть какую-то проблему или какие-то важные данные.  Например,  вы могли бы предположить что имена всех ваших заказчиков различны.  Если  кто-то  помещает второго Clemens в таблицу Заказчиков, а вы используете SELECT DISTINCT cname, вы не будете даже знать о существовании двойника. Вы можете получить не того Clemens и даже не знать об этом. Так как вы не ожидаете избыточности, в этом случае вы не должны использовать DISTINCT.

Параметры DISTINCT

 
       DISTINCT может указываться только один раз в данном предложении  SELECT. Если предложение выбирает многочисленные поля,
 
               ===============  SQL Execution Log ============
              |                                               |
              | SELECT DISTINCT snum                          |
              | FROM  Orders;                                 |
              |                                               |
              | ============================================= |
              |   snum                                        |
              | -------                                       |
              |   1001                                        |
              |   1002                                        |
              |   1003                                        |
              |   1004                                        |
              |   1007                                        |
                =============================================
Рисунок 3.5: SELECT без дублирования
 
       DISTINCT опускает строки где все выбранные поля идентичны.  Строки в
которых некоторые значения одинаковы а некоторые различны - будут сохранены. DISTINCT, фактически, приводит к показу всей строки вывода, не указывая  полей ( за исключением когда он используется внутри агрегатных функций, как описано в Главе 6 ), так что нет никакого смысла чтобы его повторять.

DISTINCT вместо ALL

 
       Вместо DISTINCT, вы можете указать - ALL. Это будет иметь противоположный эффект, дублирование строк вывода сохранится. Так как это – тот же самый случай когда вы не указываете ни DISTINCT ни ALL, то ALL – по существу скорее пояснительный, а не действующий аргумент.

Квалифицированный выбор при использовании предложений

 
       Таблицы имеют тенденцию становиться очень большими,  поскольку с течением времени,  все большее и большее количество строк в нее добавляется.  Поскольку  обычно  из них только определенные строки интересуют вас в данное время,  SQL дает возможность вам  устанавливать  критерии чтобы определить какие строки будут выбраны для вывода.
 
       WHERE - предложение команды SELECT, которое позволяет вам устанавливать предикаты, условие которых может быть или верным или неверным для любой  строки  таблицы.  Команда извлекает только те строки из таблицы для которой такое утверждение верно.  Например,  предположим вы хотите видеть имена и комиссионные всех продавцов в Лондоне. Вы можете ввести такую команду:
 
      SELECT sname, city
        FROM Salespeople;
        WHERE city = "LONDON";
 
       Когда предложение WHERE представлено, программа базы данных просматривает всю таблицу по одной строке и исследует каждую строку чтобы определить верно ли утверждение.  Следовательно,  для записи Peel, программа рассмотрит текущее значение столбца city, определит что оно равно "London",  и включит эту строку в вывод. Запись для Serres не будет включена, и так далее. Вывод для вышеупомянутого запроса показан в Рисунке 3.6.
 
               ===============  SQL Execution Log ============
              |                                               |
              | SELECT sname, city                            |
              | FROM  Salespeople                             |
              | WHERE city = 'London'                         |
              | ============================================= |
              |   sname           city                        |
              |  -------       ----------                     |
              |   Peel            London                      |
              |   Motika          London                      |
                =============================================
 
Рисунок 3.6: SELECT c предложением WHERE
 
 
       Давайте попробуем пример с числовым полем в предложении WHERE.  Поле rating таблицы Заказчиков предназначено чтобы разделять заказчиков  на
группы основанные на некоторых критериях которые могут быть получены в итоге через этот номер. Возможно это - форма оценки кредита или оценки основанной на томе предыдущих приобретений.  Такие числовые коды могут быть полезны в реляционных базах данных как способ  подведения  итогов сложной информации.  Мы можем выбрать всех заказчиков с рейтингом 100,
следующим образом:
 
     SELECT *
        FROM Customers
        WHERE rating = 100;
 
       Одиночные кавычки не используются здесь потому,  что  оценка  -  это числовое поле. Результаты запроса показаны в Рисунке 3. 7.
 
       Предложение WHERE  совместимо  с предыдущим материалом в этой главе. Другими словами,  вы можете использовать  номера  столбцов,  устранять дубликаты,  или переупорядочивать столбцы в команде SELECT которая использует WHERE.  Однако,  вы можете изменять порядок столбцов для имен только в предложении SELECT, но не в предложении WHERE.
 
 
 
 
 
               ===============  SQL Execution Log ============
              |                                               |
              | SELECT *                                      |
              | FROM  Customers                               |
              | WHERE rating = 100;                           |
              | ============================================= |
              |   сnum     cname    city     rating    snum   |
              |  ------   --------  ------    ----   ------   |
              |   2001     Hoffman  London     100     1001   |
              |   2006     Clemens  London     100     1001   |
              |   2007     Pereira  Rome       100     1001   |
                =============================================
 
Рисунок 3.7:  SELECT с числовым полем в предикате

РЕЗЮМЕ

 
       Теперь вы знаете несколько способов заставить таблицу давать вам  ту информацию какую вы хотите,  а не просто выбрасывать наружу все ее содержание.  Вы можете переупорядочивать столбцы таблицы  или  устранять любую из них.  Вы можете решать, хотите вы видеть дублированные значения или нет.
       Наиболее важно  то,  что  вы можете устанавливать условие называемое предикатом которое определяет или не определяет указанную строку  таблицы из тысяч таких же строк, будет ли она выбрана для вывода.
       Предикаты могут становиться очень сложными, предоставляя вам высокую точность в решении, какие строки вам выбирать с помощью запроса. Именно эта способность решать точно,  что вы хотите видеть, делает запросы SQL такими мощными.  Следующие несколько глав будут посвящены, в большей мере,  особенностям которые расширяют мощность предикатов. В Главе 4, вам будут представлены операторы иные чем те которые используются в условиях предиката,  а также способы объединения многочисленных условий в единый предикат.
 
 

Работа с SQL

 
  1. Напишите команду SELECT которая бы вывела номер порядка, сумму, и
      дату для всех строк из таблицы Порядков.
  2. Напишите запрос который вывел бы все строки из таблицы Заказчиков
      для которых номер продавца = 1001.
  3. Напишите запрос который вывел бы таблицу со столбцами в следующем
      порядке: city, sname, snum, comm.
  4. Напишите команду SELECT которая вывела бы оценку(rating),  сопро-
      вождаемую именем каждого заказчика в San Jose.
  5. Напишите  запрос  который вывел бы значения snum всех продавцов в
      текущем порядке из таблицы Порядков без каких бы то ни было  пов-
      торений.
 
 ( См. Приложение A для ответов. )

4. Использование реляционный и булевых операторов для создания более изощренных предикатов

 
 
       В ГЛАВЕ 3,  ВЫ УЗНАЛИ ЧТО ПРЕДИКАТЫ МОГУТ оценивать равенство оператора как верного или неверного.  Они могут также оценивать другие виды связей кроме равенств.  Эта глава будет исследовать другие реляционные операторы используемые в SQL. Вы также узнаете как использовать операторы Буля,  чтобы изменять и объединять значения предиката.  С помощью операторов  Буля  (или проще говоря логических операторов),  одиночный предикат может содержать любое число условий. Это позволяет вам создавать очень сложные предикаты. Использование круглых скобок в структуре этих сложных предикатов будет также объясняться.

Реляционные операторы

 
       Реляционный оператор - математический символ  который  указывает  на определенный  тип сравнения между двумя значениями.  Вы уже видели как используются равенства,  такие как 2 + 3 = 5 или city =  "London".  Но также имеются другие реляционные операторы.  Предположим что вы хотите видеть всех Продавцов с их комиссионными выше определенного  значения. Вы  можете использовать тип сравнения "больше чем" - (>).  Реляционные операторы которыми распологает SQL :
 
           =    Равный к
           >    Больше чем
           <    Меньше чем
           >=   Больше чем или равно
           <=   Меньше чем или равно
           <>   Не равно
 
       Эти операторы имеют стандартные значения для числовых значений.  Для значения символа,  их определение зависит от  формата  преобразования, ASCII  или EBCDIC,  который вы используете.  SQL сравнивает символьные значения в терминах основных номеров как определено в формате преобразования.  Даже значение символа,  такого как "1", который представляет номер, не обязательно равняется номеру который он представляет. Вы можете  использовать  реляционные  операторы чтобы установить алфавитный порядок - например,  "a" < "n" где средство a первое в алфавитном  порядке  -  но все это ограничивается с помощью параметра преобразования формата.
 
 
       И в ASCII и в EBCDIC,  символы - по значению:  меньше чем все другие
символы которым они предшествуют в алфавитном порядке и имеют один вариант( верхний или нижний ).  В ASCII, все символы верхнего регистра - меньше чем все символы нижнего регистра,  поэтому "Z" < "a", а все номера - меньше чем все символы,  поэтому "1" < "Z". То же относится и к EBCDIC.  Чтобы сохранить обсуждение более простым,  мы допустим что вы будете использовать текстовый формат ASCII.  Проконсультируйтесь с вашей документацией системы если вы неуверены какой формат вы используете или как он работает.
       Значения сравниваемые здесь называются - скалярными значениями. Скалярные значения производятся скалярными выражениями; 1 + 2 - это скалярное  выражение  которое производит скалярное значение 3.  Скалярное значение может быть символом или числом,  хотя очевидно что только номера  используются  с арифметическими операторами,  такими как +(плюс) или *(звезда).
       Предикаты обычно  сравнивают  значения скалярных величин,  используя
или реляционные операторы или специальные операторы SQL чтобы  увидеть верно ли это сравнение. Некоторые операторы SQL описаны в Главе 5.   Предположим что вы хотите увидеть всех заказчиков с  оценкой(rating) выше  200.  Так  как  200  - это скалярное значение,  как и значение в столбце оценки,  для их сравнения вы можете  использовать  реляционный оператор.
 
    SELECT *
       FROM Customers
       WHERE rating > 200;
 
  Вывод для этого запроса показывается в Рисунке 4.1.
 
       Конечно, если бы мы захотели увидеть еще и заказчиков с оценкой рав-
ной 200, мы стали бы использовать предикат
 
             rating > = 200

Булевы операторы

 
       Основные Булевы операторы также распознаются в SQL. Выражения Буля - являются или верными или неверными,  подобно предикатам. Булевы операторы  связывают  одно  или более верных/неверных значений и производят единственное верное/или/неверное значение. Стандартными операторами Буля распознаваемыми в SQL являются:
 
              AND,  OR, и NOT.
 
               ===============  SQL Execution Log ============
              |                                               |
              | SELECT *                                      |
              | FROM  Customers                               |
              | WHERE rating > 200;                           |
              | ============================================= |
              |   snum     cname    city     rating    snum   |
              |  -----   --------  --------  -----   ------   |
              |   2004     Crass    Berlin     300     1002   |
              |   2008     Cirneros San Jose   300     1007   |
                =============================================
 
Рисунок 4.1:  Использование больше чем (>)
 
 
       Существуют другие,  более сложные, операторы Буля ( типа " исключенный или " ),  но они могут быть сформированы из этих трех простых операторов - AND, OR, NOT.
       Как вы можете понять,  Булева верня / неверная логика - основана  на цифровой компьютерной операции; и фактически, весь SQL( или любой другой язык ) может быть сведен до уровня Булевой логики.

 

Операторы Буля и как они работают:

 
* AND берет два Буля ( в форме A AND B) как аргументы и  оценивает  их
   по отношению к истине, верны ли они оба.
* OR  берет  два  Буля  ( в форме A OR B) как аргументы и оценивает на
   правильность, верен ли один из них.
* NOT берет одиночный Булев ( в форме NOT A) как аргументы и  заменяет
   его значение с неверного на верное или верное на неверное.
 
       Связывая предикаты с операторами Буля,  вы можете значительно увеличить их возможности.  Предположим вы хотите видеть всех  заказчиков  в San Jose которые имеют оценку(рейтинг) выше 200:
 
         SELECT  *
            FROM Customers
            WHERE city = " San Jose'
            AND rating > 200;
 
 
       Вывод для этого запроса показан на Рисунке 4.2.  Имеется только один заказчик который удовлетворяет этому условию.
       Если вы же используете OR вы получите всех заказчиков которые  находились в San Jose или(OR) которые имели оценку выше 200.
 
 
               ===============  SQL Execution Log ============
              |                                               |
              | SELECT *                                      |
              | FROM  Customers                               |
              | WHERE city = 'San Jose'                       |
              | AND rating > 200;                             |
              | ============================================= |
              |   сnum     cname    city     rating    snum   |
              |  ------   --------  --------  ----    -----   |
              |   2008     Cirneros San Jose   300     1007   |
                =============================================
 
Рисунок 4.2: SELECT использующий AND
 
           SELECT *
              FROM Customers
              WHERE city = " San Jose'
              OR rating > 200;
 
       Вывод для этого запроса показывается в Рисунке 4.3.
NOT может использоваться для инвертирования значений  Буля.  Имеется пример запроса с NOT:
 
 
                    SELECT *
                       FROM Customers
                       WHERE city = " San Jose'
                       OR NOT rating > 200;
 
 
  Вывод этого запроса  показывается в Рисунке 4.4.
 
 
               ===============  SQL Execution Log ============
              |                                               |
              | SELECT *                                      |
              | FROM  Customers                               |
              | WHERE city = 'San Jose'                       |
              | OR rating > 200;                              |
              | ============================================= |
              |   сnum     cname    city     rating    snum   |
              |  -----    -------  --------  -----   ------   |
              |   2003     Liu      San Jose   200     1002   |
              |   2004     Grass    Berlin     300     1002   |
              |   2008     Cirneros San Jose   300     1007   |
                =============================================
 
Рисунок 4.:3: SELECT использующий OR
 
               ===============  SQL Execution Log ============
              |                                               |
              | SELECT *                                      |
              | FROM  Customers                               |
              | WHERE city = 'San Jose'                       |
              | OR NOT rating > 200;                          |
              | ============================================= |
              |   cnum     cname    city     rating    snum   |
              |  ------   --------  ------   -----    -----   |
              |   2001     Hoffman  London     100     1001   |
              |   2002     Giovanni Rome       200     1003   |
              |   2003     Liu      San Jose   200     1002   |
              |   2006     Clemens  London     100     1001   |
              |   2008     Cirneros San Jose   300     1007   |
              |   2007     Pereira  Rome       100     1004   |
                =============================================
 
Рисунок 4.4: SELECT использующий NOT
 
       Все записи за исключением Grass были выбраны. Grass не был в San Jose,  и его оценка была больше чем 200, так что он потерпел неудачу при обеих проверках.  В каждой из других строк встретился один или  другой или оба критериев. Обратите внимание что оператор NOT должен предшествовать Булеву оператору,  чье значение должно измениться,  и не должен помещаться перед реляционным оператором.  Например неправильным вводом оценки предиката будет:
 
                 rating NOT > 200
 
  Он выдаст другую отметку. А как SQL оценит следующее?
 
                   SELECT *
                      FROM Customers
                      WHERE NOT city = " San Jose'
                      OR rating > 200;
 
 
       NOT применяется здесь только к выражению city = 'SanJose', или к выражению rating > 200 тоже ?  Как и написано,  правильный  ответ  будет прежним.  SQL может применять NOT с выражением Буля только сразу после него. 
 
Вы можете получить другой результат при команде:
 
                   SELECT *
                      FROM Customers
                      WHERE NOT( city = " San Jose'
                      OR rating > 200 );
 
 
       Здесь SQL понимает круглые скобки как означающие, что все внутри них
будет оцениваться первым и обрабатываться как единое выражение  с  помощью  всего что снаружи них ( это является стандартной интерпретацией в математике ). Другими словами, SQL берет каждую строку и определяет, соответствует ли истине равенство city = " San Jose' или равенство rating > 200.  Если любое условие верно,  выражение Буля внутри  круглых скобок верно. Однако, если выражение Буля внутри круглых скобок верно, предикат как единое целое неверен,  потому что NOT преобразует верно в неверно и наоборот.
       Вывод для этого запроса - показывается в Рисунке 4.5. 
       Имеется намеренно сложный пример. Посмотрим сможете ли вы проследить его логику (вывод показан в Рисунке 4.6 ):
 
        SELECT *
           FROM Orders
             WHERE NOT ((odate = 10/03/1990 AND snum >1002)
                OR amt > 2000.00);
 
               ===============  SQL Execution Log ============
              |                                               |
              | SELECT *                                      |
              | FROM  Customers                               |
              | WHERE NOT  (city = 'San Jose'                 |
              | OR rating > 200);                             |
              | ============================================= |
              |   cnum     cname    city     rating    snum   |
              |  -----   --------  -------   -----   ------   |
              |   2001     Hoffman  London     100     1001   |
              |   2002     Giovanni Rome       200     1003   |
              |   2006     Clemens  London     100     1001   |
              |   2007     Pereira  Rome       100     1004   |
                =============================================
Рисунок 4.5: SELECT использующий NOT и вводное предложение
 
               ===============  SQL Execution Log ==============
              |                                                 |
              | SELECT *                                        |
              | FROM  Orders                                    |
              | WHERE NOT ((odate = 10/03/1990 AND snum > 1002) |
              | OR amt > 2000.00);                              |
              | =============================================== |
              |   onum       amt      odate      cnum     snum  |
              |  ------   --------  ----------  -----    -----  |
              |   3003      767.19  10/03/1990   2001     1001  |
              |   3009     1713.23  10/04/1990   2002     1003  |
              |   3007       75.75  10/04/1990   2004     1002  |
              |   3010     1309.95  10/06/1990   2004     1002  |
               =================================================
Рисунок 4.6:  Полный (комплексный) запрос
 
       Несмотря на то что Булевы опреаторы индивидуально просты, они не так просты когда комбинируются в комплексное выражение.
 
       Способ оценки комплекса Булева состоит в том, чтобы оценивать Булевы
выражения наиболее глубоко вложенные в круглых скобках,  объединять их в единичное Булево значение,  и затем объединять его с верхними значениями.
       Имеется подробное объяснение того как пример выше был вычислен. Наиболее  глубоко  вложенные  выражения  Буля  в  предикате - это odate = 10/03/1990 и snum > 1002 являются объединеными с помощью AND, формируя одно  выражение Буля которое будет оценено как верное для всех строк в которых встретились оба эти условия.  Это составное  Булево  выражение (которое мы будем называть Булево номер 1,  или B1 для краткости) объдиняется с выражением (amt) > 2000.00  (B2)  с  помощью  OR,  формируя третье выражение (B3), которое является верным для данной строки, если или B1 или B2 - верны для этой строки. 
       B3 полностью  содержится в круглых скобках которым предшествует NOT, формируя последнее выражение Буля(B4),  которое является условием предиката.
       Таким образом B4,  предикат запроса, - будет верен всякий раз, когда B3 неправилен. B3 - неправилен всегда, когда B1 и B2 - оба неверны. B1 неправилен для строки если дата порядка строки не 10/03/1990, или если значение snum не большее чем 1002.  B2 неправилен для всех строк, значения суммы приобретений которых не превышает 2000.00. Любая строка со значением выше 2000.00 сделает B2 - верным;  в результате B3 будет верен, а B4 нет. Следовательно, все эти строки будут удалены из вывода.
       Из оставшихся, строки которые на 3 Октября имеют snum > 1002 ( такие как строки для onum 3001 на 3 Октября со snum = 1007 ), делают B1 верным,  с  помощью  верного B3 и неверного предиката запроса.  Они будут также удалены из вывода. Вывод показан для строк которые оставлены.

 

РЕЗЮМЕ

 
       В этой главе,  вы значительно расширили ваше знакомство с предикатами. Теперь вы можете находить значения которые связаны с данным значением любым способом - определяемым различными реляционными  операторами.
       Вы можете также использовать операторы Буля AND и OR чтобы много условий,  каждое из которых автономно в предикатах,  объединять в единый предикат.  Оператор Буля NOT, как вы уже видели, может изменять значение условия или группы условий на противоположное. 
       Булевы и Реляционные операторы могут эффективно  управляться  с  помощью круглых скобок,  которые определяют порядок,  в котором операции будут выполнены. Эти операции применимы к любому уровню сложности и вы поняли как сложные условия могут создаваться из этих простых частей.
       Теперь, когда мы показали как используются стандартные  математические операторы, мы можем перейти к операторам которые являются исключительными в SQL. Это мы сделаем в Главе 5.
 
 

Работа с SQL

 
1. Напишите запрос который может дать вам все  порядки  со  значениями
    суммы выше чем $1,000.
2. Напишите запрос который может выдать вам поля sname и city для всех
    продавцов в Лондоне с комиссионными выше .10 .
3. Напишите запрос к таблице Заказчиков чей вывод может включить  всех
    заказчиков с оценкой =< 100, если они не находятся в Риме.
4. Что может быть выведено в результате следующего запроса ?
 
              SELECT *
                 FROM Orders
                 WHERE (amt < 1000 OR
                     NOT (odate = 10/03/1990
                         AND cnum > 2003 ));
 
5. Что может быть выведено в результате следующего запроса ?
 
              SELECT *
                 FROM Orders
                 WHERE NOT ((odate = 10/03/1990 OR snum > 1006)
                    AND amt > = 1500 );
 
6. Как можно проще переписать такой запрос ?
 
              SELECT snum, sname, city, comm
                 FROM Salespeople
                 WHERE ( comm > + .12 OR
                    comm < .14 );
 
( См. Приложение A для ответов. )

5. Использование специальных операторов в условиях

 
       В ДОПОЛНЕНИИ К РЕЛЯЦИОННЫМ И БУЛЕВСКИМ операторам обсуждаемым в Главе 4,  SQL использует специальные операторы IN,  BETWEEN,  LIKE,  и IS NULL.  В этой главе,  вы узнаете как их использовать и как реляционные операторы позволяют создавать более сложные и мощные предикаты. Обсуждение  оператора  IS  NULL будет включать отсутствие данных и значение NULL, которое указывает на то: что данные отсутствуют. Вы также узнаете о разновидностях использования оператора NOT применяющегося с этими операторами.

Оператор IN

       Оператор IN определяет набор значений в которое данное значение  может  или не может быть включено.  В соответствии с нашей учебной базой данных на которой вы обучаетесь по настоящее временя,  если вы  хотите найти всех продавцов,  которые размещены в Barcelona или в London,  вы должны использовать следующий запрос ( вывод  показывается  в  Рисунке 5.1 ):
 
      SELECT *
         FROM Salespeople
         WHERE city = 'Barcelona'
            OR city = 'London';
 
  Имеется и более простой способ получить ту же информацию:
 
       SELECT *
          FROM Salespeople
          WHERE city IN ( 'Barcelona', 'London' );
 
       Вывод для этого запроса показывается в Рисунке 5.2.
 
       Как вы можете видеть,  IN определяет набор значений с  помощью  имен членов  набора  заключеных в круглые скобки и отделенных запятыми.  Он затем проверяет различные значения указанного поля пытаясь найти  совпадение со значениями из набора.  Если это случается,  то предикат верен. Когда наборсодержит значения номеров а не символов, одиночные кавычки опускаются. Давайте найдем всех заказчиков относящихся к продавцам имеющих значения snum = 1001,  1007,  и 1004. 
Вывод для следующего запроса показан на Рисунке 5.3:
     SELECT *
        FROM Customers
        WHERE cnum IN ( 1001, 1007, 1004 );
 
           ===============  SQL Execution Log ============
          | SELECT *                                      |
          | FROM  Salespeople                             |
          | WHERE city = 'Barcelona'                      |
          | OR city = 'London';                           |
          | ==============================================|
          |   snum      sname         city         comm   |
          | ------    ----------   -----------   -------  |
          |   1001      Peel         London        0.12   |
          |   1004      Motika       London        0.11   |
          |   1007      Rifkin       Barcelona     0.15   |
           ===============================================
 
Рисунок 5.1   Нахождение продавцов в Барселоне и Лондоне
 
           ===============  SQL Execution Log ============
          |                                               |
          | SELECT *                                      |
          | FROM  Salespeople                             |
          | WHERE city IN ('Barcelona', 'London';         |
          | ==============================================|
          |   snum      sname         city         comm   |
          | ------    ----------   -----------   -------  |
          |   1001      Peel         London        0.12   |
          |   1004      Motika       London        0.11   |
          |   1007      Rifkin       Barcelona     0.15   |
          |                                               |
           ===============================================
 
Рисунок 5.2     SELECT использует IN
 
           ===============  SQL Execution Log ============
          | SELECT *                                      |
          | FROM  Customers                               |
          | WHERE snum IN ( 1001, 1007, 1004 );           |
          | ============================================= |
          |   snum     cname    city     rating    snum   |
          |  ------   --------  ------    ----   ------   |
          |   2001     Hoffman  London     100     1001   |
          |   2006     Clemens  London     100     1001   |
          |   2008     Cisneros San Jose   300     1007   |
          |   2007     Pereira  Rome       100     1004   |
            =============================================
 
Рисунок 5.3: SELECT использует IN с номерами
 

Оператор BETWEEN

 
       Оператор BETWEEN  похож на оператор IN.  В отличии от определения по
номерам из набора,  как это делает IN,  BETWEEN  определяет  диапазон, значения  которого  должны уменьшаться что делает предикат верным.  Вы должны ввести ключевое слово BETWEEN с начальным  значением,  ключевое AND и конечное значение.  В отличие от IN,  BETWEEN чувствителен к порядку,  и первое значение в предложении должно быть первым по алфавитному или числовому порядку. ( Обратите Внимание что, в отличие от Английского языка,  SQL не говорит что "значение находится (между)BETWEEN значением и значением|, а просто "значение BETWEEN значение значение|. Это применимо и к оператору LIKE). Следующий пример будет извлекать из таблицы  Продавцов всех продавцов с комиссионными между .10 и .12 (вывод показывается в Рисунке 5.4):
 
          SELECT *
             FROM Salespeople
             WHERE comm BETWEEN .10 AND .12;
 
       Для включенного оператора BETWEEN,  значение совпадающее с любым  из двух значений границы ( в этом случае, .10 и .12 ) заставляет предикат быть верным.
 
           ===============  SQL Execution Log ============
          | SELECT *                                      |
          | FROM  Salespeople                             |
          | WHERE comm BETWEEN .10 AND .12;               |
          | ==============================================|
          |   snum      sname         city         comm   |
          | ------    ----------   -----------   -------  |
          |   1001      Peel         London        0.12   |
          |   1004      Motika       London        0.11   |
          |   1003      Axelrod      New York      0.10   |
           ===============================================
 
   Рисунок 5.4: SELECT использует BETWEEN
 
       SQL не делает непосредственной  поддержки  невключения  BETWEEN.  Вы должны  или  определить ваши граничные значения так,  чтобы включающая интерпретация была приемлема, или сделать что-нибудь типа этого:
 
      SELECT *
          FROM Salespeople
          WHERE ( comm BETWEEN .10, AND .12 )
            AND NOT comm IN ( .10, .12 );
 
       Вывод для этого запроса показывается в Рисунке 5.5.
       
       По общему признанию,  это немного неуклюже,  но зато показывает  как эти  новые  операторы  могут  комбинироваться с операторами Буля чтобы производить более сложные предикаты.  В основном,  вы используете IN и BETWEEN  также как вы использовали реляционные операторы чтобы сравнивать значения,  которые берутся либо из набора ( для IN ) либо из диапазона ( для BETWEEN ).
       Также, подобно реляционным операторам, BETWEEN может работать с символьными полями в терминах эквивалентов ASCII. Это означает что вы можете использовать BETWEEN чтобы выбирать ряд значений из упорядоченных по алфавиту значений.
 
           ===============  SQL Execution Log ============
          |                                               |
          | SELECT *                                      |
          | FROM  Salespeople                             |
          | WHERE ( comm BETWEEN .10 AND .12              |
          | AND NOT comm IN ( .10 .12;                    |
          | ==============================================|
          |   snum      sname         city         comm   |
          | ------    ----------   -----------   -------  |
          |   1004      Motika       London        0.11   |
          |                                               |
           ===============================================
 
Рисунок 5.5: Сделать BETWEEN - невключенным
 
       Этот запрос выбирает всех заказчиков чьи имена попали в определенный
алфавитный диапазон:
 
 
            SELECT *
               FROM Customers
               WHERE cname BETWEEN 'A' AND 'G';
 
 
       Вывод для этого запроса показывается в Рисунке 5.6.
       Обратите Внимание что Grass и Giovanni отсутствуют,  даже при  включенном BETWEEN. Это происходит из-за того что BETWEEN сравнивает строки неравной длины. Строка 'G' более короткая чем строка Giovanni, поэтому BETWEEN выводит 'G' с пробелами.  Пробелы предшествуют символам в алфавитном порядке ( в большинстве реализаций ),  поэтому Giovanni  не выбирается. То же самое происходит с Grass. Важно помнить это когда вы используете BETWEEN для извлечения значений из алфавитных  диапазонов. Обычно  вы  указываете  диапазон  с помощью символа начала диапазона и символа конца( вместо которого можно просто поставить z ).
 
 
           ===============  SQL Execution Log ============
          |                                               |
          | SELECT *                                      |
          | FROM  Customers                               |
          | WHERE cname BETWEEN 'A' AND 'G';              |
          | ============================================= |
          |   cnum     cname    city     rating    snum   |
          |  ------   --------  ------    ----   ------   |
          |   2006     Clemens  London     100     1001   |
          |   2008     Cisneros San Jose   300     1007   |
          |                                               |
            =============================================
 
Рисунок 5. 6: Использование BETWEEN в алфавитных порядках

Оператор LIKE

 
       LIKE применим  только  к полям типа CHAR или VARCHAR,  с которыми он используется чтобы находить подстроки. Т.е. он ищет поле символа чтобы видеть,  совпадает ли с условием часть его строки.  В качестве условия он использует групповые символы(wildkards) - специальные символы которые могут соответствовать чему-нибудь.
       Имеются два типа групповых символов используемых с LIKE:
 
* символ подчеркивания ( _ ) замещает любой одиночный  символ.  Например, 'b_t' будет соответствовать словам 'bat' или 'bit', но не будет соответствовать 'brat'.
 
* знак процента (%) замещает последовательность любого числа  символов   (включая символы нуля). Например '%p%t' будет соответствовать словам   'put', 'posit', или 'opt', но не 'spite'.
 
Давайте найдем всех заказчиков чьи имена начинаются с G ( вывод показывается в Рисунке 5.7 ):
 
 
 
       SELECT
          FROM Customers
          WHERE cname LIKE 'G%';
 
           ===============  SQL Execution Log ============
          |                                               |
          | SELECT *                                      |
          | FROM  Customers                               |
          | WHERE cname LIKE 'G';                         |
          | ============================================= |
          |   cnum     cname    city     rating    snum   |
          |  ------   --------  ------    ----   ------   |
          |   2002     Giovanni Rome       200     1003   |
          |   2004     Grass    Berlin     300     1002   |
          |                                               |
            =============================================
 
Рисунок 5. 7: SELECT использует LIKE с %
 
       LIKE может быть удобен если вы ищете имя или другое значение, и если вы не помните как они точно пишутся.  Предположим что вы не уверены как записано по буквам имя одного из ваших продавцов Peal или Peel. Вы можете просто использовать ту часть которую вы знаете и групповые символы чтобы находить все возможные пары ( вывод этого запроса показывается в Рисунке 5.8):
 
       SELECT *
          FROM Salespeople
          WHERE sname LIKE 'P _ _ l %';
 
       Групповые символы подчеркивания, каждый из которых представляет один символ, добавят только два символа к уже существующим 'P' и 'l' , поэтому имя наподобии Prettel не может быть показано.  Групповой символ ' % ' - в конце строки необходим в большинстве реализаций если длина поля sname больше чем число символов в имени Peel ( потому что некоторые другие значения sname - длиннее чем четыре символа ).  В таком случае, значение поля sname , фактически сохраняемое как имя Peel, сопровождается рядом пробелов. Следовательно, символ 'l' не будет рассматриваться концом строки.  Групповой символ ' %  ' - просто соответствует этим пробелам. Это необязательно, если поля sname имеет тип - VARCHAR.
 
           ===============  SQL Execution Log ============
          |                                               |
          | SELECT *                                      |
          | FROM  Salespeople                             |
          | WHERE sname LIKE ' P  1% ';                   |
          | ==============================================|
          |   snum      sname         city         comm   |
          | ------    ----------   -----------   -------  |
          |   1001      Peel         London        0.12   |
          |                                               |
           ===============================================
 
Рисунок 5.8: SELECT использует LIKE с подчеркиванием (_)
 
 
       А что же Вы будете делать если вам нужно искать  знак  процента  или знак  подчеркивания в строке?  В LIKE предикате,  вы можете определить любой одиночный символ как символ ESC.  Символ ESC используется  сразу перед процентом или подчеркиванием в предикате, и означает что процент или подчеркивание будет интерпретироваться как символ а не как групповой символ. Например, мы могли бы найти наш sname столбец где присутствует подчеркивание, следующим образом:
 
          SELECT *
             FROM Salespeople
             WHERE sname LIKE '%/_%'ESCAPE'/';
 
 
       С этими данными не будет никакого вывода,  потому что мы не включили
никакого подчеркивания в имя нашего продавца. Предложение ESCAPE определяет '/ ' как символ ESC.  Символ ESC используемый  в  LIKE  строке, сопровождается знаком процента, знаком подчеркивания, или знаком ESCAPE,  который будет искаться в столбце, а не обрабатываться как групповой  символ.  Символ  ESC должен быть одиночным символом и применяться только к одиночному символу сразу после него.
 
       В примере выше,  символ процента начала и символ процента  окончания
обрабатываются как групповые символы;  только подчеркивание предоставлено само себе.
       Как упомянуто выше,  символ ESC может также использоваться самостоятельно.  Другими словами, если вы будете искать столбец с вашим символом  ESC,  вы просто вводите его дважды.  Во-первых это будет означать что символ ESC  "берет  следующий  символ  буквально  как  символ",  и во-вторых что символ ESC самостоятелен.
       Имеется предыдущий пример который пересмотрен чтобы искать местонахождение строки '_/' в sname столбце:
 
     SELECT *
        FROM Salespeople
        WHERE sname LIKE ' % /_ / / %'ESCAPE'/';
 
       Снова не будет никакого вывода с такими данными. Строка сравнивается
с содержанием любой последовательности  символов  (%),  сопровождаемых символом подчеркивания ( /_ ), символом ESC ( // ), и любой последовательностью символов в конце строки ( % ).

Работа с нулевыми(NULL) значениями

 
       Часто, будут  иметься записи в таблице которые не имеют никаких зна
чений для каждого поля,  например потому что информация не  завершена, или потому что это поле просто не заполнялось. SQL учитывает такой вариант,  позволяя вам вводить значение NULL(ПУСТОЙ) в поле, вместо значения. Когда значение поля равно NULL, это означает, что программа базы данных специально промаркировала это поле как не  имеющее  никакого значения для этой строки (или записи). Это отличается от просто назначения полю, значения нуля или пробела, которые база данных будет обрабатывать также как и любое другое значение.  Точно также,  как NULL не является техническим значением,  оно не имеет и типа данных. Оно может помещаться в любой тип поля. Тем ни менее, NULL в SQL часто упоминается как нуль.
       Предположим, что  вы  получили  нового  заказчика который еще не был назначен продавцу.  Чем ждать продавца к которому его нужно назначить, вы можете ввести заказчика в базу данных теперь же,  так что он не потеряется при перестановке.
       Вы можете  ввести строку для заказчика со значением NULL в поле snum и заполнить это поле значением позже, когда продавец будет назначен.
 

NULL оператор

 
       Так как NULL указывает на отсутствие значения,  вы не  можете  знать каков  будет  результат любого сравнения с использованием NULL.  Когда NULL сравнивается с любым значением,  даже с другим таким же NULL, результат будет ни верным ни неверным,  он - неизвестен. Неизвестный Булев,  вообще ведет себя также как неверная строка,  которая  произведя неизвестное  значение  в  предикате не будет выбрана запросом – имейте ввиду что в то время как NOT(неверное) - равняется верно,  NOT  (неизвестное) - равняется неизвестно.
       Следовательно, выражение типа 'city = NULL' или 'city IN (NULL)' будет неизвестно, независимо от значения city.
       Часто вы должны делать различия между неверно и неизвестно  -  между строками  содержащими значения столбцов которые не соответствуют условию предиката и которые содержат NULL в столбцах. По этой причине, SQL предоставляет специальный оператор IS, который используется с ключевым словом NULL, для размещения значения NULL.
       Найдем все записи в нашей таблице Заказчиков с NULL значениями в city столбце:
            SELECT *
               FROM Customers
               WHERE city IS NULL;
 
       Здесь не будет никакого вывода,  потому что мы не имеем никаких значений NULL в наших типовых таблицах. Значения NULL - очень важны, и мы вернемся к ним позже.

Использование NOT со специальными операторами

 
       Специальные операторы которые мы изучали в этой главе  могут  немедленно предшествовать Булеву NOT.
       Он противоположен реляционным операторам,  которые должны иметь оператор  NOT  - вводимым выражением.  Например,  если мы хотим устранить NULL из нашего вывода,  мы будем использовать NOT  чтобы  изменить  на противоположное значение предиката:
 
          SELECT *
             FROM Customers
             WHERE city NOT NULL;
 
       При отсутствии  значений NULL( как в нашем случае ),  будет выведена вся таблица Заказчиков. Аналогично можно ввести следующее
 
           SELECT *
              FROM Customers
              WHERE NOT city IS NULL;
  - что также приемлемо.
 
  Мы можем также использовать NOT с IN:
         SELECT *
            FROM Salespeople
            WHERE city NOT IN ( 'London', 'San Jose' );
 
  А это - другой способ подобного же выражения
 
       SELECT *
          FROM Salespeople
          WHERE NOT city IN ( 'London', ' San Jose' );
 
  Вывод для этого запроса показывается в Рисунке 5.9.
  Таким же способом Вы можете использовать NOT BETWEEN и NOT LIKE.
 
           ===============  SQL Execution Log ============
          |                                               |
          | SELECT *                                      |
          | FROM  Salespeople                             |
          | WHERE sity NOT IN ('London', 'San Jose';      |
          | ==============================================|
          |   snum      sname         city         comm   |
          | ------    ----------   -----------   -------  |
          |   1003      Rifkin       Barcelona     0.15   |
          |   1007      Axelrod      New York      0.10   |
          |                                               |
           ===============================================
 
Рисунок 5. 9: Использование NOT с IN

РЕЗЮМЕ

 
       Теперь вы  можете  создавать  предикаты в терминах связей специально определенных SQL.  Вы можете искать значения в определенном  диапазоне (BETWEEN) или в числовом наборе (IN),  или вы можете искать символьные значения которые соответствуют тексту внутри параметров (LIKE).
       Вы также  изучили некоторые вещи относительно того как SQL поступает при отсутствии данных - что реальность мировой базы данных – используя NULL  вместо  конкретных  значений.  Вы можете извлекать или исключать значения NULL из вашего вывода используя  оператор  IS  NULL.  Теперь, когда  вы имеете в вашем распоряжении весь набор стандартных математических и специальных операторов,  вы можете переходить  к  специальным функциям SQL которые работают на всех группах значений, а не просто на одиночном значении, что важно.    Это уже тема Главы 6.

Работа с SQL

 
 
1. Напишите  два запроса которые могли бы вывести все порядки на 3 или
    4 Октября 1990
2. Напишите  запрос который выберет всех заказчиков обслуживаемых про-
    давцами Peel или Motika. ( Подсказка: из наших типовых таблиц, поле
    snum связывает вторую таблицу с первой )
3. Напишите запрос,  который может вывести всех заказчиков  чьи  имена
    начинаются с буквы попадающей в диапазон от A до G.
4. Напишите запрос который выберет всех пользователей чьи имена  начи-
    наются с буквы C.
5. Напишите запрос который выберет все порядки имеющие нулевые  значе-
    ния или NULL в поле amt(сумма).
 
( См. Приложение A для ответов. )

6. Обобщение данных с  помощью агрегатных функций

 
 
       В ЭТОЙ ГЛАВЕ, ВЫ ПЕРЕЙДЕТЕ ОТ ПРОСТОГО использования запросов к извлечению значений из базы данных и определению, как вы можете использовать эти значения чтобы получить из них информацию. Это делается с помощью  агрегатных  или  общих функций которые берут группы значений из поля и сводят их до одиночного значения.  Вы узнаете как  использовать эти функции, как определить группы значений к которым они будут применяться, и как определить какие группы выбираются для вывода. Вы будете также  видеть при каких условиях вы сможете объединить значения поля с этой полученной информацией в одиночном запросе.

Что такое агрегатные функции ?

 
       Запросы могут производить обобщенное групповое значение полей  точно также как и значение одного поля. Это делает с помощью агрегатых функций.  Агрегатные функции производят одиночное значение для всей группы таблицы. Имеется список этих функций:
 
* COUNT  производит  номера  строк  или не-NULL значения полей которые
   выбрал запрос.
* SUM производит арифметическую сумму всех выбранных значений данного
   поля.
* AVG производит усреднение всех выбранных значений данного поля.
* MAX производит наибольшее из всех выбранных значений данного поля.
* MIN производит наименьшее из всех выбранных значений данного
   поля.

Как использовать агрегатные функции ?

 
       Агрегатные функции используются подобно именам полей  в  предложении SELECT запроса, но с одним исключением, они берут имена поля как аргументы. Только числовые поля могут использоваться с SUM и AVG. С COUNT, MAX, и MIN, могут использоваться и числовые или символьные поля. Когда они используются с символьными полями,  MAX и MIN будут  транслировать их в эквивалент ASCII, который должен сообщать, что MIN будет означать первое, а MAX последнее значение в алфавитном порядке( выдача алфавитного упорядочения обсуждается более подробно в Главе 4 ).
  Чтобы найти SUM всех наших покупок  в  таблицы  Порядков,  мы  можем
ввести следующий запрос, с его выводом в Рисунке 6.1:
 
 
            SELECT SUM ((amt))
               FROM Orders;
 
           ===============  SQL Execution Log ============
          | SELECT SUM (amt)                              |
          | FROM  Orders;                                 |
          | ==============================================|
          | -------                                       |
          | 26658.4                                       |
           ===============================================
Рисунок 6.1: Выбор суммы
 
 
  Это конечно, отличается от выбора поля при котором возвращается оди-
ночное значение, независимо от того сколько строк находится в таблице.
Из-за этого, агрегатные функции и поля не могут выбираться одновремен-
но, пока предложение GROUP BY (описанное далее) не будет использовано.
Нахождение усредненой суммы - это похожая операция ( вывод  следующего
запроса показывается в Рисунке 6.2 ):
 
 
            SELECT AVG (amt)
               FROM Orders;
 
 
           ===============  SQL Execution Log ============
          |                                               |
          | SELECT AVG (amt)                              |
          | FROM  Orders;                                 |
          | ==============================================|
          |                                               |
          | -------                                       |
          | 2665.84                                       |
          |                                               |
           ===============================================
 
Рисунок 6.2: Выбор среднего
 

Специальные атрибуты COUNT

 
  Функция COUNT несколько отличается от всех. Она считает число значе-
ний  в  данном столбце,  или число строк в таблице.  Когда она считает
значения столбца,  она используется с DISTINCT чтобы производить  счет
чисел  различных значений в данном поле.  Мы могли бы использовать ее,
например,  чтобы сосчитать номера продавцов в настоящее время описаных
в таблице Порядков ( вывод показывается в Рисунке 6.3 ):
 
 
              SELECT COUNT ( DISTINCT snum )
                 FROM Orders;
 
 
 
 

Использование DISTINCT

 
 
 
 
  Обратите внимание в вышеупомянутом примере,  что DISTINCT, сопровож-
даемый именем поля с которым он применяется, помещен в круглые скобки,
но не сразу после SELECT, как раньше.
  Этого использования DISTINCT с COUNT применяемого  к  индивидуальным
столбцам,  требует  стандарт  ANSI,  но большое количество программ не
предъявляют к ним такого требования.
 
 
           ===============  SQL Execution Log ============
          |                                               |
          | SELECT COUNT (DISTINCT snum)                  |
          | FROM  Orders;                                 |
          | ==============================================|
          |                                               |
          | -------                                       |
          |       5                                       |
          |                                               |
          |                                               |
           ===============================================
 
 
Рисунок 6.3: Подсчет значений поля
 
 
  Вы можете выбирать многочисленые счета( COUNT ) из полей  с  помощью
DISTINCT в одиночном запросе который,  как мы видели в Главе 3, не вы-
полнялся когда вы выбирали строки с помощью DISTINCT.  DISTINCT  может
использоваться таким образом,  с любой функцией агрегата,  но наиболее
часто он используется с COUNT.  С MAX и MIN, это просто не будет иметь
никакого эффекта, а SUM и AVG, вы обычно применяете для включения пов-
торяемых значений,  так как они законно эффективнее  общих  и  средних
значений всех столбцов.
 
 

Использование COUNT со строками, а не значениями

 
 
 
  Чтобы подсчитать  общее  число строк в таблице,  используйте функцию
COUNT со звездочкой вместо имени поля, как например в следующем приме-
ре, вывод из которого показан на Рисунке 6.4:
 
      SELECT COUNT (*)
         FROM Customers
 
 
  COUNT со звездочкой включает и NULL и  дубликаты,  по  этой  причине
DISTINCT  не может быть использован.  DISTINCT может производить более
высокие номера чем COUNT особого поля, который удаляет все
 
 
           ===============  SQL Execution Log ============
          |                                               |
          | SELECT COUNT (*)                              |
          | FROM  Customers;                              |
          | ==============================================|
          |                                               |
          | -------                                       |
          |       7                                       |
          |                                               |
          |                                               |
           ===============================================
 
Рисунок 6. 4: Подсчет строк вместо значений строки, имеющие избыточные или NULL данные в этом поле.
  DISTINCT не применим c COUNT (*),  потому,  что он не имеет никакого
действия в хорошо разработаной и поддерживаемой базе данных.  В  такой
базе данных,  не должно быть ни таких строк,  которые бы являлись пол-
ностью пустыми,  ни дубликатов ( первые не содержат никаких данных,  а
последние полностью избыточны ). Если, с другой стороны, все таки име-
ются полностью пустые или избыточные строки,  вы вероятно не  захотите
чтобы COUNT скрыл от вас эту информацию.
 
 

Включение дубликатов в агрегатные функции

 
 
 
  Агрегатные функции  могут также ( в большинстве реализаций ) исполь-
зовать аргумент ALL,  который помещается перед  именем  поля,  подобно
DISTINCT, но означает противоположное: - включать дубликаты. ANSI тех-
нически не позволяет этого для COUNT,  но многие реализации  ослабляют
это ограничение.
  Различия между ALL и * когда они используются с COUNT -
 
 
*  ALL использует имя_поля как аргумент.
*  ALL не может подсчитать значения NULL.
 
 
  Пока *  является единственым аргументом который включает NULL значе-
ния, и он используется только с COUNT; функции отличные от COUNT игно-
рируют значения NULL в любом случае.  Следующая команда подсчитает(CO-
UNT) число не-NULL значений в поле rating в таблице Заказчиков ( вклю-
чая повторения ):
 
 
             SELECT COUNT ( ALL rating )
                FROM Customers;
 
 

Агрегаты, построенные на скалярном выражении

 
 
 
  До этого, вы использовали агрегатные функции с одиночными полями как
аргументами.  Вы  можете также использовать агрегатные функции с аргу-
ментами которые состоят из скалярных выражений включающих одно или бо-
лее полей. ( Если вы это делаете, DISTINCT не разрешается. ) Предполо-
жим, что таблица Порядков имеет еще один столбец который хранит преды-
дущий неуплаченый баланс (поле blnc) для каждого заказчика.  Вы должны
найти этот текущий баланс, добавлением суммы приобретений к предыдуще-
му  балансу.  Вы  можете найти наибольший неуплаченый баланс следующим
образом:
 
 
             SELECT MAX ( blnc + (amt) )
                FROM Orders;
 
 
  Для каждой  строки таблицы,  этот запрос будет складывать blnc и amt
для этого заказчика и выбирать самое большое значение которое он  най-
дет. Конечно, пока заказчики могут иметь многочисленые порядки, их не-
уплаченый баланс оценивается отдельно для каждого  порядка.  Возможно,
порядок  с  более  поздней датой будет иметь самый большой неуплаченый
баланс. Иначе, старый баланс должен быть выбран как в запросе выше.
  Фактически, имеются  большое количество ситуаций в SQL где вы можете
использовать скалярные выражения с полями или  вместо  полей,  как  вы
увидете это в Главе 7.
 
 

Предложение GROUP BY

 
 
 
  Предложение GROUP  BY позволяет вам определять подмножество значений
в особом поле в терминах другого поля,  и применять функцию агрегата к
подмножеству.  Это  дает  вам возможность объединять поля и агрегатные
функции в едином предложении SELECT.  Например, предположим что вы хо-
тите  найти наибольшую сумму приобретений полученную каждым продавцом.
Вы можете сделать раздельный запрос для каждого  из  них,  выбрав  MAX
(amt)  из  таблицы Порядков для каждого значения поля snum.  GROUP BY,
однако, позволит Вам поместить их все в одну команду:
 
 
                 SELECT snum, MAX (amt)
                    FROM Orders
                    GROUP BY snum;
 
 
  Вывод для этого запроса  показывается в Рисунке 6.5.
 
 
           ===============  SQL Execution Log ==============
          |                                                 |
          | SELECT snum, MAX (amt)                          |
          | FROM  Orders                                    |
          | GROUP BY snum;                                  |
          | =============================================== |
          |  snum                                           |
          |  ------   --------                              |
          |   1001      767.19                              |
          |   1002     1713.23                              |
          |   1003       75.75                              |
          |   1014     1309.95                              |
          |   1007     1098.16                              |
          |                                                 |
            ================================================
 
 
Рисунок 6.5: Нахождение максимальной суммы продажи у каждого продавца
 
 
  GROUP BY применяет агрегатные функции независимо от серий групп  ко-
торые  определяются  с  помощью значения поля в целом.  В этом случае,
каждая группа состоит из всех строк с  тем  же  самым  значением  поля
snum,  и MAX функция применяется отдельно для каждой такой группы. Это
значение поля, к которому применяется GROUP BY, имеет, по определению,
только одно значение на группу вывода, также как это делает агрегатная
функция.  Результатом является совместимость которая позволяет агрега-
там и полям объединяться таким образом.
  Вы можете также использовать GROUP BY с многочислеными  полями.  Со-
вершенствуя  вышеупомянутый  пример  далее,  предположим что вы хотите
увидеть наибольшую сумму приобретений получаемую каждым продавцом каж-
дый день.  Чтобы сделать это, вы должны сгруппировать таблицу Порядков
по датам продавцов, и применить функцию MAX к каждой такой группе, по-
добно этому:
 
 
          SELECT snum, odate, MAX ((amt))
              FROM Orders
              GROUP BY snum, odate;
 
 
  Вывод для этого запроса  показывается в Рисунке 6.6.
 
 
           ===============  SQL Execution Log ==============
          |                                                 |
          | SELECT snum, odate, MAX (amt)                   |
          | FROM  Orders                                    |
          | GROUP BY snum, odate;                           |
          | =============================================== |
          |   snum        odate                             |
          |  ------     ----------     --------             |
          |   1001      10/03/1990       767.19             |
          |   1001      10/05/1990      4723.00             |
          |   1001      10/06/1990      9891.88             |
          |   1002      10/03/1990      5160.45             |
          |   1002      10/04/1990        75.75             |
          |   1002      10/06/1990      1309.95             |
          |   1003      10/04/1990      1713.23             |
          |   1014      10/03/1990      1900.10             |
          |   1007      10/03/1990      1098.16             |
          |                                                 |
            ================================================
 
 
Рисунок 6.6: Нахождение наибольшей суммы приобретений на каждый день
 
 
  Конечно же,  пустые группы, в дни когда текущий продавец не имел по-
рядков, не будут показаны в выводе.
 
 

Предложение HAVING

 
 
  Предположим, что в предыдущем примере,  вы хотели бы увидеть  только
максимальную сумму приобретений значение которой выше $3000.00.  Вы не
сможете использовать агрегатную функцию в предложении WHERE ( если  вы
не используете подзапрос, описанный позже ), потому что предикаты оце-
ниваются в терминах одиночной строки, а агрегатные функции оцениваются
в терминах групп строк. Это означает что вы не сможете сделать что-ни-
будь подобно следующему:
 
 
              SELECT snum, odate, MAX (amt)