Введение
в SQL
1 Введение в Реляционные Базы
Данных
2 SQL: Краткий Обзор
3 Использование SQL Для
Извлечения Информации из Таблиц
4 Использование
Реляционных и Булевых Операторов при Создании более Сложных Предикатов
5 Использование
Специальных Операторов в Условиях
6 Обобщение Данных с
помощью Агрегатных Функций
7 Форматирование Вывода
Запроса
8 Запрос Многих Таблиц
Как Одной
9 Объединение Таблицы с
Собой
10 Помещение Одного Запроса Внутрь Другого
11 Соотнесенные Подзапросы
12 Использование Оператора EXISTS
13 Использование Операторов ANY, ALL, и SOME
14 Использование Предложения UNION
15 Введение, Удаление, и Изменение Значения Поля
16 Использование Подзапросов с Командами Модификации
17 Создание Таблиц
18 Ограничение Значений Ваших Данных
19 Поддержание Целостности Ваших Данных
20 Введение: Представления
21 Изменение Значений с Помощью Представлений
22 Определение Кто Что Может Делать
23 Глобальные Аспекты SQL
24 Как Данные SQL Содержатся в Упорядоченном Виде
25 Использование SQL с Другими Языками ( Вложенный SQL )
A Ответы для Упражнений
B Типы SQL Данных
C Некоторые Общие
Нестандартные Особенности SQL
D Синтаксис и Команды
Ссылки
E Таблицы Используемые в
Примерах
1. Введение в реляционную
базу данных
Введение
SQL (ОБЫЧНО ПРОИЗНОСИМАЯ КАК "SEEQUEL") символизирует собой Структурированный Язык Запросов. Это - язык который дает вам возможность создавать и работать в реляционных базах данных, которые являются наборами связанной информации сохраняемой в таблицах. Мир баз данных становится все более и более единым, что привело к необходимости создания стандартного языка который мог бы использоваться чтобы функционировать в большом количестве различных видов компьютерных сред. Стандартный язык позволит пользователям знающим один набор команд, использовать их чтобы создавать, отыскивать, изменять, и передавать информацию независимо от того работают ли они на персональном компьютере, сетевой рабочей станции, или на универсальной ЭВМ. В нашем все более и более взаимосвязанном компьютерном мире, пользователь снабженный таким языком, имеет огромное преимущество в использовании и обобщении информации из ряда источников с помощью большого количества способов. Элегантность и независимость от специфики компьютерных технологий, атакже его поддержка лидерами промышленности в области технологии реляционных баз данных, сделало SQL, и вероятно в течение обозримого будущего оставит его, основным стандартным языком. По этой причине, любой кто хочет работать с базами данных 90-х годов должен знать SQL. Стандарт SQL определяется ANSI (Американским Национальным Институтом Стандартов) и в данное время также принимается ISO (МЕЖДУНАРОДНОЙ ОРГАНИЗАЦИЕЙ ПО СТАНДАРТИЗАЦИИ). Однако, большинство коммерческих программ баз данных расширяют SQL без уведомления ANSI, добавляя разные другие особенности в этот язык, которые, как они считают, будут весьма полезны. Иногда они несколько нарушают стандарт языка, хотя хорошие идеи имеют тенденцию развиваться и вскоре становиться стандартами "рынка" сами по себе в силу полезности своих качеств. В этой книге, мы будем, в основном, следовать стандарту ANSI, но одновременно иногда будет показывать и некоторые наиболее общие отклонения от его стандарта. Вы должны проконсультироваться с документацией вашего пакета программ который вы будете использовать, чтобы знать где в нем этот стандарт видоизменен. ПРЕЖДЕ, ЧЕМ ВЫ СМОЖЕТЕ ИСПОЛЬЗОВАТЬ SQL, ВЫ должны понять что такое реляционные базы данных. В этой главе, мы это объясним, и покажем насколько реляционные базы данных полезны. Мы не будем обсуждать SQL именно здесь, и если вы уже знаете эти понятия довольно хорошо, вы можете просто пропустить эту главу. В любом случае, вы должны рассмотреть три таблицы которые предоставляются и объясняются в конце главы; они станут основой наших примеров в этой книге. Вторая копия этих таблиц находится Приложении E, и мы рекомендуем скопировать их для удобства ссылки к ним.
Что такое - реляционная
базы данных?
Реляционная база данных - это тело связанной информации, сохраняемой в двумерных таблицах. Напоминает адресную или телефонную книгу. В книге имеется большое количество входов, каждый из которых соответствует определенной особенности. Для каждой такой особенности, может быть несколько независимых фрагментов данных, например имя, телефонный номер,и адрес. Предположим, что вы должны сформатировать эту адресную книгу в виде таблицы со строками и столбцами. Каждая строка ( называемая также записью ) будет соответствовать определенной особенности; каждый столбец будет содержать значение для каждого типа данных - имени, телефонного номера, и адреса представляемого в каждой строке. Адресная книга могла бы выглядеть следующим образом: Имя Телефон Адрес
Gerry Farish ( 415)365-8775 127 Primrose Ave.,SF Celia Brock ( 707)874-3553 246 #3rd St.,Sonoma Yves Grillet ( 762)976-3665 778 Modernas,Barcelona То что вы получили является основой реляционной базы данных как и было определено в начале этого обсуждения - а именно, двумерной (строка и столбец ) таблицей информации. Однако, реляционные базы данных редко состоят из одной таблицы. Такая таблица меньше чем файловая система. Создав несколько таблиц взаимосвязанной информации, вы сможете выполнить более сложные и мощные операции с вашими данными. Мощность базы данных зависит от связи которую вы можете создать между фрагментами информации, а не от самого фрагмента информации.
Связывание одной таблицы с
другой
Позвольте нам использовать пример нашей адресной книги чтобы начать обсуждение базы данных которая может реально использоваться в деловой ситуации. Предположим, что персонажи в нашей первой таблице ( адресной книги ) - это пациенты больницы. В другой таблице, мы могли бы запомнить дополнительную информацию об этих пациентах. Столбцы второй таблицы могли бы быть помечены как Пациент, Доктор, Страховка, и Баланс. Пациент Доктор Страховка БалансFarish Drume B.C./B.S. $272.99
Grillet Halben None $44. 76Brock Halben Health,Inc. $9077.47
Много мощных функций можно выполнить извлекая информацию из этих таблиц согласно указанным параметрам, особенно когда эти параметры включают в себя фрагменты информации связанные в различных таблицах друг с другом. Например, возьмем - докторов. Предположим доктор Halben захотел получить номера телефонов всех своих пациентов. Чтобы извлечь эту информацию, он мог бы связать таблицу с номерами телефонов пациентов ( по адресной книге ) с таблицей которая бы указывала, какой из пациентов - его. Хотя, в этом простом примере, он мог бы держать это в голове и сразу получать номера телефонов пациентов Grillet и Brock, эти таблицы могут быть слишком большими и слишком сложными. Программы реляционной базы данных разрабатывались для того чтобы обрабатывать большие и сложные совокупности данных такого типа, что очевидно является более универсальным методом в деловом мире. Даже если бы база данных больницы содержала сотни или тысячи имен - как это вероятно и бывает на практике - одна команда SQL могла бы выдать доктору Halben информацию в которой он нуждался почти немедленно.
Порядок строк произволен
Чтобы поддерживать максимальную гибкость, строки таблицы, по определению, не должны находиться ни в каком определенном порядке. С этой точки зрения, в этом структура базы данных отличается от нашей адресной книги. Вход в адресную книгу обычно упорядочивается в алфавитном порядке. В системах с реляционной базой данных, имеется одна мощная возможность для пользователей - это способность упорядочивать информацию так чтобы они могли восстанавливать ее. Рассмотрим вторую таблицу. Иногда Вам необходимо видеть эту информацию упорядоченной в алфавитном порядке по именам, иногда в возрастающем или убывающем порядке, а иногда сгруппированной по отношению к какому-нибудь доктору. Наложение порядка набора в строках будет сталкиваться со способностью заказчика изменять его, поэтому строки всегда рассматриваются как неупорядоченные. По этой причине, вы не можете просто сказать:" Мы хотим посмотреть пятую строку таблицы. " Пренебрегая порядком в котором данные вводились или любым другим критерием, мы определим, не ту строку, хотя она и будет пятой. Строки таблицы которые рассматриваются, не будут в какой-либо определенной последовательности.
Идентификация строк (
Первичные ключи )
По этим и другим причинам, вы должны иметь столбец в вашей таблице который бы уникально идентифицировал каждую строку. Обычно, этот столбец содержит номер - например, номер пациента назначаемый каждому пациенту. Конечно, вы могли бы использовать имя пациентов, но возможно что имеется несколько Mary Smiths; и в этом случае, вы не будете иметь другого способа чтобы отличить этих пациентов друг от друга. Вот почему номера так необходимы. Такой уникальный столбец( или уникальная группа столбцов ), используемый чтобы идентифицировать каждую строку и хранить все строки отдельно, называются - первичными ключами таблицы. Первичные ключи таблицы важный элемент в структуре базы данных. Они - основа вашей системы записи в файл; и когда вы хотите найти определенную строку в таблице, вы ссылаетесь к этому первичному ключу. Крометого, первичные ключи гарантируют, что ваши данные имеют определенную целостность. Если первичный ключ правильно используется и поддерживается, вы будете знать что нет пустых строк таблицы и что каждая строка отличается от любой другой строки. Мы будем обсуждать ключи и далее когда поговорим относительно справочной целостности в Главе 19.Столбцы именуются и нумеруются
В отличие от строк, столбцы таблицы (также называемые полями) упорядочиваются и именуются. Таким образом, в нашей таблице адресной книги, возможно указать на " адрес столбца " или на " столбец 3 ". Конечно, это означает что каждый столбец данной таблицы должен иметь уникальное имя чтобы избежать неоднозначности. Лучше всего если эти имена указывают на содержание поля. В типовых таблицах этой книги, мы будем использовать такие сокращения для имени столбца, как cname для имени заказчика, и odate для даты порядка. Мы также дадим каждой таблице личный числовой номер столбца в качестве первичного ключа. Следующий раздел будет объяснять эти таблицы и их ключи более подробно.
Типовая база данных
Таблицы 1.1, 1.2, и 1.3 составляют реляционную базу данных которая является минимально достаточной чтобы легко ее отслеживать, и достаточно полной, чтобы иллюстрировать главные понятия и практику использования SQL. Эти таблицы напечатаны в этой главе а также в Приложении E. Так как они будут использоваться для иллюстрирования различных особенностей SQL по всей этой книге, мы рекомендуем чтобы вы скопировали их, для удобства ссылки к ним. Вы могли уже обратить внимание что первый столбец каждой таблицы содержит номера чьи значения различны для каждой строки. Как вы наверное и предположили, это - первичные ключи таблиц. Некоторые из этих номеров также показаны в столбцах других таблиц. В этом нет ничего неверного. Они показывают связь между строками которые используют значение принимаемое из первичного ключа, и строками где это значение используется в самом первичном ключе. Таблица 1.1: Продавцы
----------------------------------------------------------- SNUM SNAME CITY COMM ----------------------------------------------------------- 1001 Peel London .12 1002 Serres San Jose .13 1004 Motika London .11 1007 Rifkin Barcelona .15 1003 Axelrod New York .10 ----------------------------------------------------------- Таблица 1.2: Заказчики
CNUM CNAME CITY RATING SNUM 2001 | Hoffman | London | 100 | 1001 2002 | Giovanni | Rome | 200 | 1003 2003 | Liu | SanJose | 200 | 1002 2004 | Grass | Berlin | 300 | 1002 2006 | Clemens | London | 100 | 1001 2008 | Cisneros | SanJose | 300 | 1007 2007 | Pereira | Rome | 100 | 1004 Таблица 1.3: Порядки
ONUM AMT ODATE CNUM SNUM 3001 | 18.69 | 10/03/1990 | 2008 | 1007 3003 | 767.19 | 10/03/1990 | 2001 | 1001 3002 | 1900.10 | 10/03/1990 | 2007 | 1004 3005 | 5160.45 | 10/03/1990 | 2003 | 1002 3006 | 1098.16 | 10/03/1990 | 2008 | 1007 3009 | 1713.23 | 10/04/1990 | 2002 | 1003 3007 | 75.75 | 10/04/1990 | 2004 | 1002 3008 | 4723.00 | 10/05/1990 | 2006 | 1001 3010 | 1309.95 | 10/06/1990 | 2004 | 1002 3011 | 9891.88 | 10/06/1990 | 2006 | 1001 Например, поле snum в таблице Заказчиков указывает, какому продавцу назначен данный заказчик. Номер поля snum связан с таблицей Продавцов, которая дает информацию об этих продавцах. Очевидно, что продавец которому назначены заказчики должен уже существовать - то есть, значение snum из таблицы Заказчиков должно также быть представлено в таблице Продавцов. Если это так, то говорят, что " система находится в состоянии справочной целостности ".
Этот вывод будет более полно и формально объяснен в Главе 19. ПРИМЕЧАНИЕ: Эти три представленных таблицы в тексте имеют русские имена - Продавцов, Заказчиков и Порядков, и далее будут упоминатьсяименно под этими именами. Имена любых других применяемых в книге таблиц будут написаны по-английски что бы отличать их от наших базовых таблиц этой базы данных. Кроме того в целях однозначности, имена заказчиков, продавцов, Системных Каталогов а также полей в тексте, также будут даны на латыни. Таблицы приведены как пример к похожей ситуации в реальной жизни, когда вы будете использовать SQL чтобы следить за продавцами, их заказчиками, и порядками заказчиков. Давайте рассмотрим эти три таблицы и значения их полей. Здесь показаны столбцы Таблицы 1.1 ПОЛЕ СОДЕРЖАНИЕ --------- ---------------------------------------------- snum уникальный номер назначенный каждому продавцу ( " номер служащего " ). sname имя продавца. city расположение продавца( город ). comm комиссионные продавцов в десятичной форме. Таблица 1.2 содержит следующие столбцы: ПОЛЕ СОДЕРЖАНИЕ -------- --------------------------------------------------- cnum уникальный номер назначенный каждому заказчику. cname имя заказчика. city расположение заказчика( город ). rating код указывающего уровень предпочтения данного заказчика перед другими. Более высокий номер указывают на большее предпочтение( рейтинг ). snum номер продавца назначенного этому заказчику ( из таблицы Продавцов ) И имеются столбцы в Таблице 1.3: ПОЛЕ СОДЕРЖАНИЕ --------- --------------------------------------------------- onum уникальный номер данный каждому приобретению. amt значение суммы приобретений. odate дата приобретения. cnum номер заказчика делающего приобретение ( из таблицы Заказчиков ). snum номер продавца продающего приобретение ( из таблицы Продавцов).
РЕЗЮМЕ
Теперь вы знаете что такое реляционная база данных, понятие, которое звучит сложнее чем есть на самом деле. Вы также изучили некоторые фундаментальные принципы относительно того, как сделаны таблицы – как работают строки и столбцы, как первичные ключи отличают строки друг друга, и как столбцы могут ссылаться к значениям в других столбцах. Вы поняли, что запись это синоним строки, и что поле это синоним столбца. Оба термина встречаются в обсуждении SQL, и мы будем использовать их в равной степени в этой книге. Вы теперь знакомы с таблицами примеров. Краткие и простые , они способны показать большинство особенностей языка, как вы это увидите в некоторых случаях, мы будем использовать другие таблицы или постулаты некоторых различных данных в одной из этих таблиц чтобы показать вам некоторые другие возможности. Теперь вы готовы к углублению в SQL самостоятельно. Следующая глава даст вам быстрый просмотр языка, и даст вам информацию, которая поможет Вам ссылаться к уже пройденным местам.
Работа с SQL
1. Какое поле таблицы Заказчиков является первичным ключом?2. Что является столбцом 4 из таблицы Заказчиков 3. Как по другому называется строка? Столбец?4. Почему вы можете не запрашивать для просмотра первые пять строк таблицы? ( См. Приложение A для ответов. ) ЭТА ГЛАВА ПОЗАКОМИТ ВАС СО СТРУКТУРОЙ SQL языка а также с определенными общими выводами, такими как тип данных которые эти поля могут содержать и некоторые области неоднозначности, которые существуют в SQL. Она предназначена обеспечить связь с более конкретной информацией в последующих главах. Вы не должны запоминать каждую подробность упомянутую в этой главе. Краткий обзор представлен здесь в одной удобно размещенной области, многие подробности которой вы можете иметь чтобы в последствии ссылаться к ним по мере овладения языком. Мы поместили все это в начало книги чтобы ориентировать вас на мир SQL без упрощенного подхода к его проблемам и в тоже время дать Вам привычные в будущем места для ссылки к ним когда у Вас появятся вопросы. Этот материал может стать более понятным когда мы перейдем к описанию конкретных команд SQL, начинающихся с Главы 3.
Как работает SQL?
SQL это язык ориентированный специально на реляционные базы данных. Он устраняет много работы которую вы должны были бы сделать если бы вы использовали универсальный язык программирования, например C. Чтобы сформировать реляционную базу данных на C, вам необходимо было бы начать с самого начала. Вы должны были бы определить объект – называемый таблицей которая могла бы расти чтобы иметь любое число строк, а затем создавать постепенно процедуры для помещения значений в нее и извлечения из них. Если бы вы захотели найти некоторые определенные строки, вам необходимо было бы выполнить по шагам процедуру, подобную следующей : 1. Рассмотрите строку таблицы. 2. Выполните проверку - является ли эта строка одной из строк которая вам нужна. 3. Если это так, сохраните ее где-нибудь пока вся таблица не будет проверена. 4. Проверьте имеются ли другие строки в таблице. 5. Если имеются, возвратитесь на шаг 1. 6. Если строк больше нет, вывести все значения сохраненные в шаге 3. (Конечно, это не фактический набор C команд, а только логика шагов которые должны были бы быть включены в реальную программу.) SQL сэкономит вам все это. Команды в SQL могут работать со всеми группами таблиц как с единым объектом и могут обрабатывать любое количество информации извлеченной или полученной из их, в виде единого модуля. Что делает ANSI?
Как мы уже рассказывали во Введении, стандарт SQL определяется с помощью кода ANSI (Американский Национальный Институт Стандартов ). SQL не изобретался ANSI. Это по существу изобретение IBM. Но другие компании подхватили SQL сразу же, по крайней мере одна компания Oracle отбила у IBM право на рыночную продажу SQL продуктов. После того как появился ряд конкурирующих программ SQL на рынке, ANSI определил стандарт к которому они должны быть приведены (определение таких стандартов и является функцией ANSI ). Однако после этого, появились некоторые проблемы. Возникли они в результате стандартизации ANSI в виде некоторых ограничений. Так как не всегда ANSI определяет то что является наиболее полезным, то программы пытаются соответствовать стандарту ANSI не позволяя ему ограничивать их слишком сильно. Это, в свою очередь, ведет к случайным несогласованностям. Программы Баз Данных обычно дают ANSI SQL дополнительные особенности и часто ослабляют многие ограничения из большинства из них. Следовательно, общие разновидности ANSI будут также рассмотрены. Хотя мы очевидно не сможем объять каждое исключение или разновидность, удачные идеи имеют тенденцию к внедрению и использованию в различных программах даже когда они не определены стандартом ANSI. ANSI - это вид минимального стандарта и вы можете делать больше чем он позволяет, хотя и должны выполнять его указания при выполнении задач которые он определяет.
Интерактивный и вложенный
SQL
Имеются два SQL: Интерактивный и Вложенный. Большей частью, обе формы работают одинаково, но используются различно. Интерактивный SQL используется для функционирования непосредственно в базе данных чтобы производить вывод для использования его заказчиком. В этой форме SQL, когда вы введете команду, она сейчас же выполнится и вы сможете увидеть вывод (если он вообще получится) - немедленно. Вложенный SQL состоит из команд SQL помещенных внутри программ, которые обычно написаны на некотором другом языке (типа КОБОЛА или Паскаля).Это делает эти программы более мощными и эффективным. Однако, допуская эти языки, приходится иметь дело с структурой SQL и стилем управления данных который требует некоторых расширений к интерактивному SQL. Передача SQL команд во вложенный SQL является выдаваемой ("passed off") для переменных или параметров используемых программой в которую они были вложены.
В этой книге, мы будем представлять SQL в интерактивной форме. Это даст нам возможность обсуждать команды и их эффекты не заботясь о том как они связаны с помощью интерфейса с другими языками. Интерактивный SQL - это форма наиболее полезная непрограммистам. Все что вы узнаете относительно интерактивного SQL в основном применимо и к вложенной форме. Изменения необходимые для использования вложенной формы будут использованы в последней главе этой книги. Субподразделение SQL
И в интерактивной и во вложенной формах SQL, имеются многочисленные части, или субподразделения. Так как вы вероятно столкнетесь с этой терминологией при чтении SQL, мы дадим некоторые пояснения. К сожалению, эти термины не используются повсеместно во всех реализациях. Они подчеркиваются ANSI и полезны на концептуальном уровне, но большинство SQL программ практически не обрабатывают их отдельно, так что они по существу становятся функциональными категориями команд SQL. DDL ( Язык Определения Данных ) - так называемый Язык Описания Схемы в ANSI, состоит из команд которые создают объекты ( таблицы, индексы, просмотры, и так далее ) в базе данных. DML (Язык Манипулирования Данными) - это набор команд которые определяют какие значения представлены в таблицах в любой момент времени. DCD (Язык Управления Данными) состоит из средств которые определяют, разрешить ли пользователю выполнять определенные действия или нет. Они являются составными частями DDL в ANSI. Не забывайте эти имена. Это не различные языки, а разделы команд SQL сгруппированных по их функциям.
Различные типы данных
Не все типы значений которые могут занимать поля таблицы – логически одинаковые. Наиболее очевидное различие - между числами и текстом. Вы не можете помещать числа в алфавитном порядке или вычитать одно имя из другого. Так как системы с реляционной базой данных базируются на связях между фрагментами информации, различные типы данных должны понятно отличаться друга от друга, так чтобы соответствующие процессы и сравнения могли быть в них выполнены. В SQL, это делается с помощью назначения каждому полю - типа данных который указывает на тип значения которое это поле может содержать. Все значения в данном поле должны иметь одинаковый тип. В таблице Заказчиков, например, cname и city - содержат строки текста для оценки, snum, и cnum - это уже номера. По этой причине, вы не можете ввести значение Highest(Наивысший) или значение None(Никакой) в поле rating, которое имеет числовой тип данных. Это ограничение удачно, так как оно налагает некоторую структурность на ваши данные. Вы часто будете сравнивать некоторые или все значения в данном поле, поэтому вы можете выполнять действие только на определенных строках а не на всех. Вы не могли бы сделать этого если бы значения полей имели смешанный тип данных. К сожалению, определение этих типов данных является основной областью в которой большинство коммерческих программ баз данных и официальный стандарт SQL, не всегда совпадают. ANSI SQL стандарт распознаеттолько текст и тип номера, в то время как большинство коммерческих программ используют другие специальные типы. Такие как, DATA(ДАТА) и TIME(ВРЕМЯ) - фактически почти стандартные типы( хотя точный формат их меняется ). Некоторые пакеты также поддерживают такие типы, как например MONEY(ДЕНЬГИ) и BINARY (ДВОИЧНЫЕ). (MONEY - это специальная система исчисления используемая компьютерами. Вся информация в компьютере передается двоичными числами и затем преобразовываются в другие системы, что бы мы могли легко использовать их и понимать.) ANSI определяет несколько различных типов значений чисел, различия между которыми - довольно тонки и иногда их путают. Разрешенные ANSI типы данных перечислены в Приложении B. Сложность числовых типов ANSI можно, по крайней мере частично, объяснить усилием сделать вложенный SQL, совместимым с рядом других языков. Два типа чисел ANSI , INTEGER(ЦЕЛОЕ ЧИСЛО) и DECIMAL (ДЕСЯТИЧНОЕ ЧИСЛО) ( которые можно сокращать как INT и DEC, соответственно ), будут адекватны для наших целей, также как и для целей большинства практических деловых прикладных программ. Естественно, что тип ЦЕЛОЕ можно представить как ДЕСЯТИЧНОЕ ЧИСЛО которое не содержит никаких цифр справа от десятичной точки. Тип для текста - CHAR ( или СИМВОЛ ), который относится к строке текста. Поле типа CHAR имеет определенную длину, которая определяется максимальным числом символов которые могут быть введены в это поле. Больше всего реализаций также имеют нестандартный тип называемый VARCHAR(ПЕРЕМЕННОЕ ЧИСЛО СИМВОЛОВ), который является текстовой строкой которая может иметь любую длину до определенного реализацией максимума (обычно 254 символа ). CHARACTER и VARCHAR значения включаются в одиночные кавычки как "текст". Различие между CHAR и VARCHAR в том, что CHAR должен резервировать достаточное количество памяти для максимальной длины строки, а VARCHAR распределяет память так как это необходимо. Символьные типы состоят из всех печатных символов, включая числа. Однако, номер 1 не то же что символ "1". Символ "1" - только другой печатный фрагмент текста, не определяемый системой как наличие числового значения 1. Например 1 + 1 = 2, но "1" + "1" не равняется "2". Символьные значения сохраняются в компьютере как двоичные значения, но показываются пользователю как печатный текст. Преобразование следует за форматом определяемым системой которую вы используете. Этот формат преобразования будет одним из двух стандартных типов (возможно с расширениями) используемых в компьютерных системах: в ASCII коде ( используемом во всех персональных и малых компьютерах ) и EBCDIC коде (Расширенном Двоично-Десятичном Коде Обмена Информации) (используемом в больших компьютерах). Определенные операции, такие как упорядочивание в алфавитном порядке значений поля, будет изменяться вместе с форматом. Применение этих двух форматов будет обсуждаться в Главе 4. Мы должны следить за рынком, а не ANSI, в использовании типа называемого DATE(ДАТОЙ). ( В системе, которая не распознает тип ДАТА, вы конечно можете объявить дату как символьное или числовое поле, но это сделает большинство операций более трудоемкими. ) Вы должны смотреть свою документацию по пакету программ которые вы будете использовать, чтобы выяснить точно, какие типы данных она поддерживает. SQL несогласованности
Вы можете понять из предшествующего обсуждения, что имеются самостоятельные несогласованности внутри продуктов мира SQL. SQL появился из коммерческого мира баз данных как инструмент, и был позже превращен в стандарт ANSI. К сожалению, ANSI не всегда определяет наибольшую пользу, поэтому программы пытаются соответствовать стандарту ANSI не позволяя ему ограничивать их слишком сильно. ANSI - вид минимального стандарта - вы можете делать больше чем он это позволяет, но вы должны быть способны получить те же самые результаты что и при выполнении той же самой задачи.
Что такое - Пользователь?
SQL обычно находится в компьютерных системах которые имеют больше чем одного пользователя, и следовательно должны делать различие между ними ( ваше семейство PC может иметь любое число пользователей, но оно обычно не имеет способов чтобы отличать одного от другого ). Обычно, в такой системе, каждый пользователь имеет некий вид кода проверки прав который идентифицирует его или ее (терминология изменяется ). В начале сеанса с компьютером, пользователь входит в систему (регистрируется), сообщая компьютеру кто этот пользователь, идентифицированный с помощью определенного ID(Идентификатора). Любое количество людей использующих тот же самый ID доступа, являются отдельными пользователями; и аналогично, один человек может представлять большое количество пользователей ( в разное время ), используя различные доступные Идентификаторы. SQL следует этому примеру. Действия в большинстве сред SQL приведены к специальному доступному Идентификатору который точно соответствует определенному пользователю. Таблица или другой объект принадлежит пользователю, который имеет над ним полную власть. Пользователь может или не может иметь привилегии чтобы выполнять действие над объектом. Для наших целей, мы договоримся, что любой пользователь имеет привилегии необходимые чтобы выполнять любое действие, пока мы не возвратимся специально к обсуждению привилегий в Главе 22. Специальное значение - USER(ПОЛЬЗОВАТЕЛЬ) может использоваться как аргумент в команде. Оно указывает на доступный Идентификатор пользователя, выдавшего команду.
Условия и терминология
Ключевые слова - это слова которые имеют специальное значение в SQL. Они могут быть командами, но не текстом и не именами объектов. Мы будем выделять ключевые слова печатая их ЗАГЛАВНЫМИ БУКВАМИ. Вы должны соблюдать осторожность чтобы не путать ключевые слова с терминами. SQL имеет определенные специальные термины которые используются чтобы описывать его. Среди них - такие слова как запрос, предложение, и предикат, которые являются важнейшими в описании и понимании языка но не означают что-нибудь самостоятельное для SQL. Команды, или предложения, являются инструкциями которыми Вы обращаетесь к SQL базе данных. Команды состоят из одной или более отдельных логических частей называемых предложениями. Предложения начинаются ключевым словом для которого они являются проименованными, и состоят из ключевых слов и аргументов. Например предложения с которыми вы можете сталкиваться - это " FROM Salespeope " и " WHERE city = "London". Аргументы завершают или изменяют значение предложения. В примерах выше, Salespeople - аргумент, а FROM - ключевое слово предложения FROM. Аналогично, " city = "London" " - агрумент предложения WHERE. Объекты - структуры в базе данных которым даны имена и сохраняются в памяти. Они включают в себя базовые таблицы, представления (два типа таблиц), и индексы.
Чтобы показать Вам как формируются команды, мы будем делать это напримерах. Имеется, однако, более формальный метод описания команд использующих стандартизированные условные обозначения. Мы будем использовать его в более поздних главах, для удобства чтобы понимать эти условные обозначения в случае если вы столкнетесь с ним в других SQL документах. Квадратные скобки ( [ ] ) будут указывать части которые могут не использоваться, а многоточия ( ... ) указывать что все предшествующее им может повторяться любое число раз. Слова обозначенные в угловых скобках (<>) - специальные термины которые объясняют что они собой представляют. Мы упростили стандартную терминологию SQL значительно, но без ухудшения его понимания.
РЕЗЮМЕ
Мы быстро прошли основы в этой главе. Но нашим намерением и было - просто пролететь над основами SQL, так чтобы вы могли понять идею относительно всего объема. Когда мы возвратимся к основе в следующей главе, некоторые вещи станут более конкретными. Теперь вы знаете кое-что относительно SQL - какова его структура, как он используется, как он представляет данные, и как они определяются ( и некоторые несогласованности появляющиеся при этом ), и некоторые условные обозначения и термины используемые чтобы описывать их. Все это - много информации для одной главы; мы не ожидаем что бы вы запомнили все эти подробности, но вы сможете вернуться позже к ним если понадобится. По Главе 3, мы будем идти, показывая конкретно, как формируются команды и что они делают. Мы представим вам команду SQL используемую чтобы извлекать информацию из таблиц, и которая является наиболее широко используемой командой в SQL. К концу этой главы, вы будете способны извлекать конкретную информацию из вашей базы данных с высокой степенью точности.
Работа с SQL
1. Какое наибольшее основное различие между типами данных в SQL ? 2. Распознает ANSI тип данных DATA ? 3. Какой подраздел SQL используется чтобы помещать значения в таблицы ? 4. Что такое - ключевое слово ?
( См. Приложение A для ответов. )
3. Использования SQL для
извлечения информации из таблиц
В ЭТОЙ ГЛАВЕ МЫ ПОКАЖЕМ ВАМ КАК ИЗВЛЕКАТЬ информацию из таблиц. Вы узнаете как опускать или переупорядочивать столбцы и как автоматически устранять избыточность данных из вашего вывода. В заключение, вы узнаете как устанавливать условие( проверку ) которую вы можете использовать чтобы определить какие строки таблицы используются в выводе. Эта последняя особенность, будет далее описана в более поздних главах и является одной из наиболее изящных и мощных в SQL.
Создание запроса
Как мы подчеркивали ранее, SQL символизирует собой Структурированный Язык Запросов. Запросы - вероятно наиболее часто используемый аспект SQL. Фактически, для категории SQL пользователей, маловероятно чтобы кто-либо использовал этот язык для чего-то друго. По этой причине, мы будем начинать наше обсуждение SQL с обсуждения запроса и как он выполняется на этом языке.
Что такое запрос ?
Запрос - команда которую вы даете вашей программе базы данных, и которая сообщает ей чтобы она вывела определенную информацию из таблиц в память. Эта информация обычно посылается непосредственно на экран компьютера или терминала которым вы пользуетесь, хотя, в большинстве случаев, ее можно также послать принтеру, сохранить в файле ( как объект в памяти компьютера ), или представить как вводную информацию для другой команды или процесса.
Где применяются запросы ?
Запросы обычно рассматриваются как часть языка DML. Однако, так какзапрос не меняет информацию в таблицах, а просто показывает ее пользователю, мы будем рассматривать запросы как самостоятельную категорию среди команд DML которые производят действие, а не просто показывают содержание базы данных. Все запросы в SQL состоят из одиночной команды. Структура этой команды обманчиво проста, потому что вы должны расширять ее так чтобы выполнить высоко сложные оценки и обработки данных. Эта команда называется - SELECT(ВЫБОР).
Команда SELECT
В самой простой форме, команда SELECT просто инструктирует базу данных чтобы извлечь информацию из таблицы. Например, вы могли бы вывеститаблицу Продавцов напечатав следующее: SELECT snum, sname, sity, comm
FROM Salespeople;
Вывод для этого запроса показывается в Рисунке 3.1.=============== SQL Execution Log ============
| | | SELECT snum, sname, sity, comm | | FROM Salespeople; | | | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1001 Peel London 0.12 | | 1002 Serres San Jose 0.13 | | 1004 Motika London 0.11 | | 1007 Rifkin Barcelona 0.15 | | 1003 Axelrod New York 0.10 |===============================================
Рисунок 3.1: команда SELECT Другими словами, эта команда просто выводит все данные из таблицы. Большинство программ будут также давать заголовки столбца как выше, а некоторые позволяют детальное форматирование вывода, но это уже внестандартной спецификации. Имеется объяснение каждой части этой команды: SELECT Ключевое слово которое сообщает базе данных что эта команда - запрос. Все запросы начинаются этим словом, сопровождаемым пробелом. snum, sname Это - список столбцов из таблицы которые выбираются запросом. Любые столбцы не перечисленные здесь не будут включены в вывод команды. Это, конечно, не значит что они будут удалены или их информация будет стерта из таблиц, потому что запрос не воздействует на информацию в таблицах; он только показывает данные. FROM Ключевое слово, подобно SELECT, которое должно Salespeople быть представлено в каждом запросе. Оно сопровождается пробелом и затем именем таблицы используемой в качестве источника информации. В данном случае - это таблица Продавцов(Salespeople). ; Точка с запятой используется во всех интерактивных командах SQL чтобы сообщать базе данных что команда заполнена и готова выполниться. В некоторых системах наклонная черта влево (\) в строке, является индикатором конца команды. Естественно, запрос такого характера не обязательно будет упорядочивать вывод любым указанным способом. Та же самая команда выполненная с теми же самыми данными но в разное время не сможет вывести тот же самый порядок. Обычно, строки обнаруживаются в том порядке в котором они найдены в таблице, поскольку как мы установили в предыдущей главе - этот порядок произволен. Это не обязательно будет тот порядок в котором данные вводились или сохранялись. Вы можете упорядочивать вывод командами SQL непосредственно: с помощью специального предложения. Позже, мы покажем как это делается. А сейчас, просто усвойте, что в отсутствии явного упорядочения, нет никакого определенного порядка в вашем выводе. Наше использование возврата (Клавиша ENTER) является произвольным. Мы должны точно установить как удобнее составить запрос, в несколько строк или в одну строку, следующим образом: SELECT snum, sname, city, comm FROM Salespeople;
С тех пор как SQL использует точку с запятой чтобы указывать конец команды, большинство программ SQL обрабатывают возврат (через нажим Возврат или клавишу ENTER ) как пробел. Это - хорошая идея чтобы использовать возвраты и выравнивание что мы делали это ранее, чтобы сделать ваши команды более легкими для чтения и более правильными.
Выбирайте всегда самый
простой способ
Если вы хотите видеть каждый столбец таблицы, имеется необязательное сокращение которое вы можете использовать. Звездочка (*) может применяться для вывода полного списка столбцов следующим образом: SELECT *
FROM Salespeople; Это приведет к тому же результату что и наша предыдущая команда.
Описание SELECT
В общем случае, команда SELECT начинается с ключевого слова SELECT, сопровождаемого пробелом. После этого должен следовать список имен столбцов которые вы хотите видеть, отделяемые запятыми. Если вы хотите видеть все столбцы таблицы, вы можете заменить этот список звездочкой (*). Ключевое слово FROM следующее далее, сопровождается пробелом и именем таблицы запрос к которой делается. В заключение, точка с запятой ( ; ) должна использоваться чтобы закончить запрос и указать что команда готова к выполнению.
Просмотр только
определенного столбца таблицы
Команда SELECT способна извлечь строго определенную информацию из таблицы. Сначала, мы можем предоставить возможность увидеть только определенные столбцы таблицы. Это выполняется легко, простым исключением столбцов которые вы не хотите видеть, из части команды SELECT. Например, запрос
SELECT sname, comm FROM Salespeople; будет производить вывод показанный на Рисунке 3.2. =============== SQL Execution Log ============
| | | SELECT snum, comm | | FROM Salespeople; | | | | ==============================================| | sname comm | | ------------- --------- | | Peel 0.12 | | Serres 0.13 | | Motika 0.11 || Rifkin 0.15 |
| Axelrod 0.10 | =============================================== Рисунок 3.2: Выбор определенных столбцов Могут иметься таблицы которые имеют большое количество столбцов содержащих данные, не все из которых являются относящимися к поставленной задаче. Следовательно, вы можете найти способ подбора и выбора только полезных для Вас столбцов.
Переупорядочение столбца
Даже если столбцы таблицы, по определению, упорядочены, это не означает что вы будете восстанавливать их в том же порядке. Конечно, звездочка (*) покажет все столбцы в их естественном порядке, но если вы укажете столбцы отдельно, вы можете получить их в том порядке котором хотите. Давайте рассмотрим таблицу Порядков, содержащую дату приобретения(odate), номер продавца(snum), номер порядка(onum), и суммы приобретения(amt):
SELECT odate, snum, onum, amt
FROM Orders;
Вывод этого запроса показан на Рисунке 3.3. ============= SQL Execution Log ===============
| | | SELECT odate, snum, onum, amt | | FROM Orders; | | | | ------------------------------------------------| | odate snum onum amt || ----------- ------- ------ --------- |
| 10/03/1990 1007 3001 18.69 | | 10/03/1990 1001 3003 767.19 | | 10/03/1990 1004 3002 1900.10 | | 10/03/1990 1002 3005 5160.45 | | 10/03/1990 1007 3006 1098.16 | | 10/04/1990 1003 3009 1713.23 | | 10/04/1990 1002 3007 75.75 | | 10/05/1990 1001 3008 4723.00 | | 10/06/1990 1002 3010 1309.95 | | 10/06/1990 1001 3011 9891.88 | ===============================================Рисунок 3.3: Реконструкция столбцов Как вы можете видеть, структура информации в таблицах - это просто основа для активной перестройки структуры в SQL.
Удаление избыточных данных
DISTINCT (ОТЛИЧИЕ) - аргумент который обеспечивает Вас способом устранять двойные значения из вашего предложения SELECT. Предположим что вы хотите знать какие продавцы в настоящее время имеют свои порядки в таблице Порядков. Под порядком (здесь и далее) будет пониматься запись в таблицу Порядков, регистрирующую приобретения сделанные в определенный день определенным заказчиком у определенного продавца на определенную сумму). Вам не нужно знать, сколько порядков имеет каждый; вам нужен только список номеров продавцов (snum). Поэтому Вы можете ввести: SELECT snum
FROM Orders; для получения вывода показанного в Рисунке 3.4 =============== SQL Execution Log ============
| | | SELECT snum | | FROM Orders; | | | | ============================================= | | snum | | ------- | | 1007 | | 1001 | | 1004 | | 1002 | | 1007 | | 1003 | | 1002 | | 1001 | | 1002 | | 1001 | =============================================Рисунок 3. 4: SELECT с дублированием номеров продавцов.
Для получения списка без дубликатов, для удобочитаемости, вы можете
ввести следующее:
SELECT DISTINCT snum FROM Orders; Вывод для этого запроса показан в Рисунке 3.5.
Другими словами, DISTINCT следит за тем, какие значения были ранее,так что бы они не были продублированы в списке. Это - полезный способ избежать избыточности данных, но важно что бы при этом вы понимали что вы делаете. Если вы не хотите потерять некоторые данные, вы не должны безоглядно использовать DISTINCT, потому что это может скрыть какую-то проблему или какие-то важные данные. Например, вы могли бы предположить что имена всех ваших заказчиков различны. Если кто-то помещает второго Clemens в таблицу Заказчиков, а вы используете SELECT DISTINCT cname, вы не будете даже знать о существовании двойника. Вы можете получить не того Clemens и даже не знать об этом. Так как вы не ожидаете избыточности, в этом случае вы не должны использовать DISTINCT.
Параметры DISTINCT
DISTINCT может указываться только один раз в данном предложении SELECT. Если предложение выбирает многочисленные поля, =============== SQL Execution Log ============
| | | SELECT DISTINCT snum | | FROM Orders; | | | | ============================================= | | snum | | ------- | | 1001 | | 1002 | | 1003 | | 1004 | | 1007 | =============================================Рисунок 3.5: SELECT без дублирования
DISTINCT опускает строки где все выбранные поля идентичны. Строки в
которых некоторые значения одинаковы а некоторые различны - будут сохранены. DISTINCT, фактически, приводит к показу всей строки вывода, не указывая полей ( за исключением когда он используется внутри агрегатных функций, как описано в Главе 6 ), так что нет никакого смысла чтобы его повторять.
DISTINCT
вместо ALL
Вместо DISTINCT, вы можете указать - ALL. Это будет иметь противоположный эффект, дублирование строк вывода сохранится. Так как это – тот же самый случай когда вы не указываете ни DISTINCT ни ALL, то ALL – по существу скорее пояснительный, а не действующий аргумент.
Квалифицированный выбор
при использовании предложений
Таблицы имеют тенденцию становиться очень большими, поскольку с течением времени, все большее и большее количество строк в нее добавляется. Поскольку обычно из них только определенные строки интересуют вас в данное время, SQL дает возможность вам устанавливать критерии чтобы определить какие строки будут выбраны для вывода. WHERE - предложение команды SELECT, которое позволяет вам устанавливать предикаты, условие которых может быть или верным или неверным для любой строки таблицы. Команда извлекает только те строки из таблицы для которой такое утверждение верно. Например, предположим вы хотите видеть имена и комиссионные всех продавцов в Лондоне. Вы можете ввести такую команду: SELECT sname, city
FROM Salespeople; WHERE city = "LONDON"; Когда предложение WHERE представлено, программа базы данных просматривает всю таблицу по одной строке и исследует каждую строку чтобы определить верно ли утверждение. Следовательно, для записи Peel, программа рассмотрит текущее значение столбца city, определит что оно равно "London", и включит эту строку в вывод. Запись для Serres не будет включена, и так далее. Вывод для вышеупомянутого запроса показан в Рисунке 3.6.
=============== SQL Execution Log ============
| | | SELECT sname, city | | FROM Salespeople | | WHERE city = 'London' | | ============================================= | | sname city | | ------- ---------- | | Peel London | | Motika London | ============================================= Рисунок 3.6: SELECT c предложением WHERE
Давайте попробуем пример с числовым полем в предложении WHERE. Поле rating таблицы Заказчиков предназначено чтобы разделять заказчиков на
группы основанные на некоторых критериях которые могут быть получены в итоге через этот номер. Возможно это - форма оценки кредита или оценки основанной на томе предыдущих приобретений. Такие числовые коды могут быть полезны в реляционных базах данных как способ подведения итогов сложной информации. Мы можем выбрать всех заказчиков с рейтингом 100,следующим образом: SELECT *FROM Customers
WHERE rating = 100; Одиночные кавычки не используются здесь потому, что оценка - это числовое поле. Результаты запроса показаны в Рисунке 3. 7.
Предложение WHERE совместимо с предыдущим материалом в этой главе. Другими словами, вы можете использовать номера столбцов, устранять дубликаты, или переупорядочивать столбцы в команде SELECT которая использует WHERE. Однако, вы можете изменять порядок столбцов для имен только в предложении SELECT, но не в предложении WHERE. =============== SQL Execution Log ============
| | | SELECT * | | FROM Customers | | WHERE rating = 100; | | ============================================= || сnum cname city rating snum |
| ------ -------- ------ ---- ------ | | 2001 Hoffman London 100 1001 | | 2006 Clemens London 100 1001 || 2007 Pereira Rome 100 1001 |
============================================= Рисунок 3.7: SELECT с числовым полем в предикате
РЕЗЮМЕ
Теперь вы знаете несколько способов заставить таблицу давать вам ту информацию какую вы хотите, а не просто выбрасывать наружу все ее содержание. Вы можете переупорядочивать столбцы таблицы или устранять любую из них. Вы можете решать, хотите вы видеть дублированные значения или нет. Наиболее важно то, что вы можете устанавливать условие называемое предикатом которое определяет или не определяет указанную строку таблицы из тысяч таких же строк, будет ли она выбрана для вывода. Предикаты могут становиться очень сложными, предоставляя вам высокую точность в решении, какие строки вам выбирать с помощью запроса. Именно эта способность решать точно, что вы хотите видеть, делает запросы SQL такими мощными. Следующие несколько глав будут посвящены, в большей мере, особенностям которые расширяют мощность предикатов. В Главе 4, вам будут представлены операторы иные чем те которые используются в условиях предиката, а также способы объединения многочисленных условий в единый предикат.
Работа с SQL
1. Напишите команду SELECT которая бы вывела номер порядка, сумму, и дату для всех строк из таблицы Порядков. 2. Напишите запрос который вывел бы все строки из таблицы Заказчиков для которых номер продавца = 1001. 3. Напишите запрос который вывел бы таблицу со столбцами в следующемпорядке: city, sname, snum, comm.
4. Напишите команду SELECT которая вывела бы оценку(rating), сопро-
вождаемую именем каждого заказчика в San Jose. 5. Напишите запрос который вывел бы значения snum всех продавцов в текущем порядке из таблицы Порядков без каких бы то ни было пов- торений. ( См. Приложение A для ответов. )4. Использование
реляционный и булевых операторов для создания более изощренных предикатов
В ГЛАВЕ 3, ВЫ УЗНАЛИ ЧТО ПРЕДИКАТЫ МОГУТ оценивать равенство оператора как верного или неверного. Они могут также оценивать другие виды связей кроме равенств. Эта глава будет исследовать другие реляционные операторы используемые в SQL. Вы также узнаете как использовать операторы Буля, чтобы изменять и объединять значения предиката. С помощью операторов Буля (или проще говоря логических операторов), одиночный предикат может содержать любое число условий. Это позволяет вам создавать очень сложные предикаты. Использование круглых скобок в структуре этих сложных предикатов будет также объясняться.
Реляционные операторы
Реляционный оператор - математический символ который указывает на определенный тип сравнения между двумя значениями. Вы уже видели как используются равенства, такие как 2 + 3 = 5 или city = "London". Но также имеются другие реляционные операторы. Предположим что вы хотите видеть всех Продавцов с их комиссионными выше определенного значения. Вы можете использовать тип сравнения "больше чем" - (>). Реляционные операторы которыми распологает SQL : = Равный к > Больше чем < Меньше чем >= Больше чем или равно <= Меньше чем или равно <> Не равно Эти операторы имеют стандартные значения для числовых значений. Для значения символа, их определение зависит от формата преобразования, ASCII или EBCDIC, который вы используете. SQL сравнивает символьные значения в терминах основных номеров как определено в формате преобразования. Даже значение символа, такого как "1", который представляет номер, не обязательно равняется номеру который он представляет. Вы можете использовать реляционные операторы чтобы установить алфавитный порядок - например, "a" < "n" где средство a первое в алфавитном порядке - но все это ограничивается с помощью параметра преобразования формата. И в ASCII и в EBCDIC, символы - по значению: меньше чем все другиесимволы которым они предшествуют в алфавитном порядке и имеют один вариант( верхний или нижний ). В ASCII, все символы верхнего регистра - меньше чем все символы нижнего регистра, поэтому "Z" < "a", а все номера - меньше чем все символы, поэтому "1" < "Z". То же относится и к EBCDIC. Чтобы сохранить обсуждение более простым, мы допустим что вы будете использовать текстовый формат ASCII. Проконсультируйтесь с вашей документацией системы если вы неуверены какой формат вы используете или как он работает. Значения сравниваемые здесь называются - скалярными значениями. Скалярные значения производятся скалярными выражениями; 1 + 2 - это скалярное выражение которое производит скалярное значение 3. Скалярное значение может быть символом или числом, хотя очевидно что только номера используются с арифметическими операторами, такими как +(плюс) или *(звезда). Предикаты обычно сравнивают значения скалярных величин, используяили реляционные операторы или специальные операторы SQL чтобы увидеть верно ли это сравнение. Некоторые операторы SQL описаны в Главе 5. Предположим что вы хотите увидеть всех заказчиков с оценкой(rating) выше 200. Так как 200 - это скалярное значение, как и значение в столбце оценки, для их сравнения вы можете использовать реляционный оператор. SELECT *
FROM Customers WHERE rating > 200; Вывод для этого запроса показывается в Рисунке 4.1.
Конечно, если бы мы захотели увидеть еще и заказчиков с оценкой рав-ной 200, мы стали бы использовать предикат rating > = 200
Булевы операторы
Основные Булевы операторы также распознаются в SQL. Выражения Буля - являются или верными или неверными, подобно предикатам. Булевы операторы связывают одно или более верных/неверных значений и производят единственное верное/или/неверное значение. Стандартными операторами Буля распознаваемыми в SQL являются: AND, OR, и NOT.
=============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE rating > 200; | | ============================================= | | snum cname city rating snum | | ----- -------- -------- ----- ------ | | 2004 Crass Berlin 300 1002 | | 2008 Cirneros San Jose 300 1007 |=============================================
Рисунок 4.1: Использование больше чем (>) Существуют другие, более сложные, операторы Буля ( типа " исключенный или " ), но они могут быть сформированы из этих трех простых операторов - AND, OR, NOT.
Как вы можете понять, Булева верня / неверная логика - основана на цифровой компьютерной операции; и фактически, весь SQL( или любой другой язык ) может быть сведен до уровня Булевой логики.
Операторы Буля и как они
работают:
* AND берет два Буля ( в форме A AND B) как аргументы и оценивает их по отношению к истине, верны ли они оба.* OR берет два Буля ( в форме A OR B) как аргументы и оценивает на правильность, верен ли один из них.* NOT берет одиночный Булев ( в форме NOT A) как аргументы и заменяет его значение с неверного на верное или верное на неверное. Связывая предикаты с операторами Буля, вы можете значительно увеличить их возможности. Предположим вы хотите видеть всех заказчиков в San Jose которые имеют оценку(рейтинг) выше 200: SELECT *
FROM Customers WHERE city = " San Jose'AND rating > 200;
Вывод для этого запроса показан на Рисунке 4.2. Имеется только один заказчик который удовлетворяет этому условию. Если вы же используете OR вы получите всех заказчиков которые находились в San Jose или(OR) которые имели оценку выше 200. =============== SQL Execution Log ============
| | | SELECT * | | FROM Customers | | WHERE city = 'San Jose' | | AND rating > 200; | | ============================================= || сnum cname city rating snum |
| ------ -------- -------- ---- ----- | | 2008 Cirneros San Jose 300 1007 |=============================================
Рисунок 4.2: SELECT использующий AND SELECT *
FROM Customers WHERE city = " San Jose'OR rating > 200;
Вывод для этого запроса показывается в Рисунке 4.3.NOT может использоваться для инвертирования значений Буля. Имеется пример запроса с NOT: SELECT *
FROM Customers WHERE city = " San Jose' OR NOT rating > 200; Вывод этого запроса показывается в Рисунке 4.4.
=============== SQL Execution Log ============
| | | SELECT * | | FROM Customers | | WHERE city = 'San Jose' | | OR rating > 200; | | ============================================= || сnum cname city rating snum |
| ----- ------- -------- ----- ------ | | 2003 Liu San Jose 200 1002 | | 2004 Grass Berlin 300 1002 | | 2008 Cirneros San Jose 300 1007 |=============================================
Рисунок 4.:3: SELECT использующий OR =============== SQL Execution Log ============
| | | SELECT * | | FROM Customers | | WHERE city = 'San Jose' | | OR NOT rating > 200; | | ============================================= | | cnum cname city rating snum | | ------ -------- ------ ----- ----- | | 2001 Hoffman London 100 1001 | | 2002 Giovanni Rome 200 1003 | | 2003 Liu San Jose 200 1002 | | 2006 Clemens London 100 1001 | | 2008 Cirneros San Jose 300 1007 | | 2007 Pereira Rome 100 1004 | ============================================= Рисунок 4.4: SELECT использующий NOT
Все записи за исключением Grass были выбраны. Grass не был в San Jose, и его оценка была больше чем 200, так что он потерпел неудачу при обеих проверках. В каждой из других строк встретился один или другой или оба критериев. Обратите внимание что оператор NOT должен предшествовать Булеву оператору, чье значение должно измениться, и не должен помещаться перед реляционным оператором. Например неправильным вводом оценки предиката будет:
rating NOT > 200 Он выдаст другую отметку. А как SQL оценит следующее? SELECT *
FROM Customers WHERE NOT city = " San Jose'OR rating > 200;
NOT применяется здесь только к выражению city = 'SanJose', или к выражению rating > 200 тоже ? Как и написано, правильный ответ будет прежним. SQL может применять NOT с выражением Буля только сразу после него. Вы можете получить другой результат при команде: SELECT *
FROM Customers WHERE NOT( city = " San Jose'OR rating > 200 );
Здесь SQL понимает круглые скобки как означающие, что все внутри нихбудет оцениваться первым и обрабатываться как единое выражение с помощью всего что снаружи них ( это является стандартной интерпретацией в математике ). Другими словами, SQL берет каждую строку и определяет, соответствует ли истине равенство city = " San Jose' или равенство rating > 200. Если любое условие верно, выражение Буля внутри круглых скобок верно. Однако, если выражение Буля внутри круглых скобок верно, предикат как единое целое неверен, потому что NOT преобразует верно в неверно и наоборот. Вывод для этого запроса - показывается в Рисунке 4.5. Имеется намеренно сложный пример. Посмотрим сможете ли вы проследить его логику (вывод показан в Рисунке 4.6 ): SELECT *
FROM Orders WHERE NOT ((odate = 10/03/1990 AND snum >1002) OR amt > 2000.00); =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE NOT (city = 'San Jose' | | OR rating > 200); | | ============================================= | | cnum cname city rating snum | | ----- -------- ------- ----- ------ | | 2001 Hoffman London 100 1001 | | 2002 Giovanni Rome 200 1003 | | 2006 Clemens London 100 1001 | | 2007 Pereira Rome 100 1004 |=============================================
Рисунок 4.5: SELECT использующий NOT и вводное предложение =============== SQL Execution Log ==============
| | | SELECT * | | FROM Orders | | WHERE NOT ((odate = 10/03/1990 AND snum > 1002) | | OR amt > 2000.00); | | =============================================== | | onum amt odate cnum snum || ------ -------- ---------- ----- ----- |
| 3003 767.19 10/03/1990 2001 1001 | | 3009 1713.23 10/04/1990 2002 1003 | | 3007 75.75 10/04/1990 2004 1002 | | 3010 1309.95 10/06/1990 2004 1002 | =================================================Рисунок 4.6: Полный (комплексный) запрос Несмотря на то что Булевы опреаторы индивидуально просты, они не так просты когда комбинируются в комплексное выражение. Способ оценки комплекса Булева состоит в том, чтобы оценивать Булевывыражения наиболее глубоко вложенные в круглых скобках, объединять их в единичное Булево значение, и затем объединять его с верхними значениями. Имеется подробное объяснение того как пример выше был вычислен. Наиболее глубоко вложенные выражения Буля в предикате - это odate = 10/03/1990 и snum > 1002 являются объединеными с помощью AND, формируя одно выражение Буля которое будет оценено как верное для всех строк в которых встретились оба эти условия. Это составное Булево выражение (которое мы будем называть Булево номер 1, или B1 для краткости) объдиняется с выражением (amt) > 2000.00 (B2) с помощью OR, формируя третье выражение (B3), которое является верным для данной строки, если или B1 или B2 - верны для этой строки. B3 полностью содержится в круглых скобках которым предшествует NOT, формируя последнее выражение Буля(B4), которое является условием предиката. Таким образом B4, предикат запроса, - будет верен всякий раз, когда B3 неправилен. B3 - неправилен всегда, когда B1 и B2 - оба неверны. B1 неправилен для строки если дата порядка строки не 10/03/1990, или если значение snum не большее чем 1002. B2 неправилен для всех строк, значения суммы приобретений которых не превышает 2000.00. Любая строка со значением выше 2000.00 сделает B2 - верным; в результате B3 будет верен, а B4 нет. Следовательно, все эти строки будут удалены из вывода. Из оставшихся, строки которые на 3 Октября имеют snum > 1002 ( такие как строки для onum 3001 на 3 Октября со snum = 1007 ), делают B1 верным, с помощью верного B3 и неверного предиката запроса. Они будут также удалены из вывода. Вывод показан для строк которые оставлены.
РЕЗЮМЕ
В этой главе, вы значительно расширили ваше знакомство с предикатами. Теперь вы можете находить значения которые связаны с данным значением любым способом - определяемым различными реляционными операторами. Вы можете также использовать операторы Буля AND и OR чтобы много условий, каждое из которых автономно в предикатах, объединять в единый предикат. Оператор Буля NOT, как вы уже видели, может изменять значение условия или группы условий на противоположное. Булевы и Реляционные операторы могут эффективно управляться с помощью круглых скобок, которые определяют порядок, в котором операции будут выполнены. Эти операции применимы к любому уровню сложности и вы поняли как сложные условия могут создаваться из этих простых частей. Теперь, когда мы показали как используются стандартные математические операторы, мы можем перейти к операторам которые являются исключительными в SQL. Это мы сделаем в Главе 5.
Работа с SQL
1. Напишите запрос который может дать вам все порядки со значениями суммы выше чем $1,000.2. Напишите запрос который может выдать вам поля sname и city для всех продавцов в Лондоне с комиссионными выше .10 .3. Напишите запрос к таблице Заказчиков чей вывод может включить всех заказчиков с оценкой =< 100, если они не находятся в Риме.4. Что может быть выведено в результате следующего запроса ? SELECT *
FROM Orders WHERE (amt < 1000 OR NOT (odate = 10/03/1990 AND cnum > 2003 )); 5. Что может быть выведено в результате следующего запроса ? SELECT *
FROM Orders WHERE NOT ((odate = 10/03/1990 OR snum > 1006)AND amt > = 1500 );
6. Как можно проще переписать такой запрос ? SELECT snum, sname, city, comm
FROM Salespeople WHERE ( comm > + .12 ORcomm < .14 );
( См. Приложение A для ответов. )5. Использование
специальных операторов в условиях
В ДОПОЛНЕНИИ К РЕЛЯЦИОННЫМ И БУЛЕВСКИМ операторам обсуждаемым в Главе 4, SQL использует специальные операторы IN, BETWEEN, LIKE, и IS NULL. В этой главе, вы узнаете как их использовать и как реляционные операторы позволяют создавать более сложные и мощные предикаты. Обсуждение оператора IS NULL будет включать отсутствие данных и значение NULL, которое указывает на то: что данные отсутствуют. Вы также узнаете о разновидностях использования оператора NOT применяющегося с этими операторами.
Оператор IN
Оператор IN определяет набор значений в которое данное значение может или не может быть включено. В соответствии с нашей учебной базой данных на которой вы обучаетесь по настоящее временя, если вы хотите найти всех продавцов, которые размещены в Barcelona или в London, вы должны использовать следующий запрос ( вывод показывается в Рисунке 5.1 ): SELECT *
FROM Salespeople WHERE city = 'Barcelona' OR city = 'London'; Имеется и более простой способ получить ту же информацию:
SELECT *
FROM Salespeople WHERE city IN ( 'Barcelona', 'London' ); Вывод для этого запроса показывается в Рисунке 5.2.
Как вы можете видеть, IN определяет набор значений с помощью имен членов набора заключеных в круглые скобки и отделенных запятыми. Он затем проверяет различные значения указанного поля пытаясь найти совпадение со значениями из набора. Если это случается, то предикат верен. Когда наборсодержит значения номеров а не символов, одиночные кавычки опускаются. Давайте найдем всех заказчиков относящихся к продавцам имеющих значения snum = 1001, 1007, и 1004. Вывод для следующего запроса показан на Рисунке 5.3:SELECT *
FROM Customers WHERE cnum IN ( 1001, 1007, 1004 ); =============== SQL Execution Log ============ | SELECT * | | FROM Salespeople | | WHERE city = 'Barcelona' | | OR city = 'London'; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1001 Peel London 0.12 | | 1004 Motika London 0.11 || 1007 Rifkin Barcelona 0.15 |
=============================================== Рисунок 5.1 Нахождение продавцов в Барселоне и Лондоне =============== SQL Execution Log ============
| | | SELECT * | | FROM Salespeople | | WHERE city IN ('Barcelona', 'London'; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1001 Peel London 0.12 | | 1004 Motika London 0.11 | | 1007 Rifkin Barcelona 0.15 | | | =============================================== Рисунок 5.2 SELECT использует IN
=============== SQL Execution Log ============ | SELECT * | | FROM Customers | | WHERE snum IN ( 1001, 1007, 1004 ); | | ============================================= | | snum cname city rating snum | | ------ -------- ------ ---- ------ | | 2001 Hoffman London 100 1001 | | 2006 Clemens London 100 1001 | | 2008 Cisneros San Jose 300 1007 | | 2007 Pereira Rome 100 1004 | ============================================= Рисунок 5.3: SELECT использует IN с номерами
Оператор BETWEEN
Оператор BETWEEN похож на оператор IN. В отличии от определения пономерам из набора, как это делает IN, BETWEEN определяет диапазон, значения которого должны уменьшаться что делает предикат верным. Вы должны ввести ключевое слово BETWEEN с начальным значением, ключевое AND и конечное значение. В отличие от IN, BETWEEN чувствителен к порядку, и первое значение в предложении должно быть первым по алфавитному или числовому порядку. ( Обратите Внимание что, в отличие от Английского языка, SQL не говорит что "значение находится (между)BETWEEN значением и значением|, а просто "значение BETWEEN значение значение|. Это применимо и к оператору LIKE). Следующий пример будет извлекать из таблицы Продавцов всех продавцов с комиссионными между .10 и .12 (вывод показывается в Рисунке 5.4): SELECT *
FROM Salespeople WHERE comm BETWEEN .10 AND .12; Для включенного оператора BETWEEN, значение совпадающее с любым из двух значений границы ( в этом случае, .10 и .12 ) заставляет предикат быть верным.
=============== SQL Execution Log ============
| SELECT * | | FROM Salespeople | | WHERE comm BETWEEN .10 AND .12; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1001 Peel London 0.12 | | 1004 Motika London 0.11 | | 1003 Axelrod New York 0.10 |===============================================
Рисунок 5.4: SELECT использует BETWEEN SQL не делает непосредственной поддержки невключения BETWEEN. Вы должны или определить ваши граничные значения так, чтобы включающая интерпретация была приемлема, или сделать что-нибудь типа этого: SELECT *
FROM Salespeople WHERE ( comm BETWEEN .10, AND .12 ) AND NOT comm IN ( .10, .12 ); Вывод для этого запроса показывается в Рисунке 5.5.
По общему признанию, это немного неуклюже, но зато показывает как эти новые операторы могут комбинироваться с операторами Буля чтобы производить более сложные предикаты. В основном, вы используете IN и BETWEEN также как вы использовали реляционные операторы чтобы сравнивать значения, которые берутся либо из набора ( для IN ) либо из диапазона ( для BETWEEN ). Также, подобно реляционным операторам, BETWEEN может работать с символьными полями в терминах эквивалентов ASCII. Это означает что вы можете использовать BETWEEN чтобы выбирать ряд значений из упорядоченных по алфавиту значений. =============== SQL Execution Log ============
| | | SELECT * | | FROM Salespeople | | WHERE ( comm BETWEEN .10 AND .12 | | AND NOT comm IN ( .10 .12; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1004 Motika London 0.11 | | | =============================================== Рисунок 5.5: Сделать BETWEEN - невключенным
Этот запрос выбирает всех заказчиков чьи имена попали в определенный
алфавитный диапазон: SELECT *FROM Customers
WHERE cname BETWEEN 'A' AND 'G'; Вывод для этого запроса показывается в Рисунке 5.6.
Обратите Внимание что Grass и Giovanni отсутствуют, даже при включенном BETWEEN. Это происходит из-за того что BETWEEN сравнивает строки неравной длины. Строка 'G' более короткая чем строка Giovanni, поэтому BETWEEN выводит 'G' с пробелами. Пробелы предшествуют символам в алфавитном порядке ( в большинстве реализаций ), поэтому Giovanni не выбирается. То же самое происходит с Grass. Важно помнить это когда вы используете BETWEEN для извлечения значений из алфавитных диапазонов. Обычно вы указываете диапазон с помощью символа начала диапазона и символа конца( вместо которого можно просто поставить z ). =============== SQL Execution Log ============
| | | SELECT * | | FROM Customers | | WHERE cname BETWEEN 'A' AND 'G'; | | ============================================= | | cnum cname city rating snum | | ------ -------- ------ ---- ------ | | 2006 Clemens London 100 1001 | | 2008 Cisneros San Jose 300 1007 || |
============================================= Рисунок 5. 6: Использование BETWEEN в алфавитных порядках
Оператор LIKE
LIKE применим только к полям типа CHAR или VARCHAR, с которыми он используется чтобы находить подстроки. Т.е. он ищет поле символа чтобы видеть, совпадает ли с условием часть его строки. В качестве условия он использует групповые символы(wildkards) - специальные символы которые могут соответствовать чему-нибудь. Имеются два типа групповых символов используемых с LIKE: * символ подчеркивания ( _ ) замещает любой одиночный символ. Например, 'b_t' будет соответствовать словам 'bat' или 'bit', но не будет соответствовать 'brat'. * знак процента (%) замещает последовательность любого числа символов (включая символы нуля). Например '%p%t' будет соответствовать словам 'put', 'posit', или 'opt', но не 'spite'. Давайте найдем всех заказчиков чьи имена начинаются с G ( вывод показывается в Рисунке 5.7 ): SELECT
FROM Customers WHERE cname LIKE 'G%'; =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE cname LIKE 'G'; | | ============================================= | | cnum cname city rating snum | | ------ -------- ------ ---- ------ | | 2002 Giovanni Rome 200 1003 | | 2004 Grass Berlin 300 1002 || |
============================================= Рисунок 5. 7: SELECT использует LIKE с % LIKE может быть удобен если вы ищете имя или другое значение, и если вы не помните как они точно пишутся. Предположим что вы не уверены как записано по буквам имя одного из ваших продавцов Peal или Peel. Вы можете просто использовать ту часть которую вы знаете и групповые символы чтобы находить все возможные пары ( вывод этого запроса показывается в Рисунке 5.8): SELECT *
FROM Salespeople WHERE sname LIKE 'P _ _ l %'; Групповые символы подчеркивания, каждый из которых представляет один символ, добавят только два символа к уже существующим 'P' и 'l' , поэтому имя наподобии Prettel не может быть показано. Групповой символ ' % ' - в конце строки необходим в большинстве реализаций если длина поля sname больше чем число символов в имени Peel ( потому что некоторые другие значения sname - длиннее чем четыре символа ). В таком случае, значение поля sname , фактически сохраняемое как имя Peel, сопровождается рядом пробелов. Следовательно, символ 'l' не будет рассматриваться концом строки. Групповой символ ' % ' - просто соответствует этим пробелам. Это необязательно, если поля sname имеет тип - VARCHAR.
=============== SQL Execution Log ============
| | | SELECT * | | FROM Salespeople | | WHERE sname LIKE ' P 1% '; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1001 Peel London 0.12 | | | =============================================== Рисунок 5.8: SELECT использует LIKE с подчеркиванием (_)
А что же Вы будете делать если вам нужно искать знак процента или знак подчеркивания в строке? В LIKE предикате, вы можете определить любой одиночный символ как символ ESC. Символ ESC используется сразу перед процентом или подчеркиванием в предикате, и означает что процент или подчеркивание будет интерпретироваться как символ а не как групповой символ. Например, мы могли бы найти наш sname столбец где присутствует подчеркивание, следующим образом:
SELECT *
FROM Salespeople WHERE sname LIKE '%/_%'ESCAPE'/'; С этими данными не будет никакого вывода, потому что мы не включили
никакого подчеркивания в имя нашего продавца. Предложение ESCAPE определяет '/ ' как символ ESC. Символ ESC используемый в LIKE строке, сопровождается знаком процента, знаком подчеркивания, или знаком ESCAPE, который будет искаться в столбце, а не обрабатываться как групповой символ. Символ ESC должен быть одиночным символом и применяться только к одиночному символу сразу после него. В примере выше, символ процента начала и символ процента окончанияобрабатываются как групповые символы; только подчеркивание предоставлено само себе. Как упомянуто выше, символ ESC может также использоваться самостоятельно. Другими словами, если вы будете искать столбец с вашим символом ESC, вы просто вводите его дважды. Во-первых это будет означать что символ ESC "берет следующий символ буквально как символ", и во-вторых что символ ESC самостоятелен. Имеется предыдущий пример который пересмотрен чтобы искать местонахождение строки '_/' в sname столбце: SELECT *
FROM Salespeople WHERE sname LIKE ' % /_ / / %'ESCAPE'/'; Снова не будет никакого вывода с такими данными. Строка сравнивается
с содержанием любой последовательности символов (%), сопровождаемых символом подчеркивания ( /_ ), символом ESC ( // ), и любой последовательностью символов в конце строки ( % ).
Работа с нулевыми(NULL)
значениями
Часто, будут иметься записи в таблице которые не имеют никаких значений для каждого поля, например потому что информация не завершена, или потому что это поле просто не заполнялось. SQL учитывает такой вариант, позволяя вам вводить значение NULL(ПУСТОЙ) в поле, вместо значения. Когда значение поля равно NULL, это означает, что программа базы данных специально промаркировала это поле как не имеющее никакого значения для этой строки (или записи). Это отличается от просто назначения полю, значения нуля или пробела, которые база данных будет обрабатывать также как и любое другое значение. Точно также, как NULL не является техническим значением, оно не имеет и типа данных. Оно может помещаться в любой тип поля. Тем ни менее, NULL в SQL часто упоминается как нуль. Предположим, что вы получили нового заказчика который еще не был назначен продавцу. Чем ждать продавца к которому его нужно назначить, вы можете ввести заказчика в базу данных теперь же, так что он не потеряется при перестановке. Вы можете ввести строку для заказчика со значением NULL в поле snum и заполнить это поле значением позже, когда продавец будет назначен.
NULL оператор
Так как NULL указывает на отсутствие значения, вы не можете знать каков будет результат любого сравнения с использованием NULL. Когда NULL сравнивается с любым значением, даже с другим таким же NULL, результат будет ни верным ни неверным, он - неизвестен. Неизвестный Булев, вообще ведет себя также как неверная строка, которая произведя неизвестное значение в предикате не будет выбрана запросом – имейте ввиду что в то время как NOT(неверное) - равняется верно, NOT (неизвестное) - равняется неизвестно. Следовательно, выражение типа 'city = NULL' или 'city IN (NULL)' будет неизвестно, независимо от значения city. Часто вы должны делать различия между неверно и неизвестно - между строками содержащими значения столбцов которые не соответствуют условию предиката и которые содержат NULL в столбцах. По этой причине, SQL предоставляет специальный оператор IS, который используется с ключевым словом NULL, для размещения значения NULL.Найдем все записи в нашей таблице Заказчиков с NULL значениями в city столбце:
SELECT *
FROM Customers WHERE city IS NULL; Здесь не будет никакого вывода, потому что мы не имеем никаких значений NULL в наших типовых таблицах. Значения NULL - очень важны, и мы вернемся к ним позже.
Использование NOT со
специальными операторами
Специальные операторы которые мы изучали в этой главе могут немедленно предшествовать Булеву NOT. Он противоположен реляционным операторам, которые должны иметь оператор NOT - вводимым выражением. Например, если мы хотим устранить NULL из нашего вывода, мы будем использовать NOT чтобы изменить на противоположное значение предиката: SELECT *
FROM Customers WHERE city NOT NULL; При отсутствии значений NULL( как в нашем случае ), будет выведена вся таблица Заказчиков. Аналогично можно ввести следующее
SELECT *
FROM Customers WHERE NOT city IS NULL;- что также приемлемо.
Мы можем также использовать NOT с IN:SELECT *
FROM Salespeople WHERE city NOT IN ( 'London', 'San Jose' ); А это - другой способ подобного же выражения
SELECT *
FROM Salespeople WHERE NOT city IN ( 'London', ' San Jose' ); Вывод для этого запроса показывается в Рисунке 5.9.
Таким же способом Вы можете использовать NOT BETWEEN и NOT LIKE. =============== SQL Execution Log ============
| | | SELECT * | | FROM Salespeople | | WHERE sity NOT IN ('London', 'San Jose'; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1003 Rifkin Barcelona 0.15 | | 1007 Axelrod New York 0.10 || |
=============================================== Рисунок 5. 9: Использование NOT с IN
РЕЗЮМЕ
Теперь вы можете создавать предикаты в терминах связей специально определенных SQL. Вы можете искать значения в определенном диапазоне (BETWEEN) или в числовом наборе (IN), или вы можете искать символьные значения которые соответствуют тексту внутри параметров (LIKE). Вы также изучили некоторые вещи относительно того как SQL поступает при отсутствии данных - что реальность мировой базы данных – используя NULL вместо конкретных значений. Вы можете извлекать или исключать значения NULL из вашего вывода используя оператор IS NULL. Теперь, когда вы имеете в вашем распоряжении весь набор стандартных математических и специальных операторов, вы можете переходить к специальным функциям SQL которые работают на всех группах значений, а не просто на одиночном значении, что важно. Это уже тема Главы 6.
Работа с SQL
1. Напишите два запроса которые могли бы вывести все порядки на 3 или 4 Октября 19902. Напишите запрос который выберет всех заказчиков обслуживаемых про- давцами Peel или Motika. ( Подсказка: из наших типовых таблиц, поле snum связывает вторую таблицу с первой )3. Напишите запрос, который может вывести всех заказчиков чьи имена начинаются с буквы попадающей в диапазон от A до G.4. Напишите запрос который выберет всех пользователей чьи имена начи- наются с буквы C.5. Напишите запрос который выберет все порядки имеющие нулевые значе- ния или NULL в поле amt(сумма). ( См. Приложение A для ответов. )6. Обобщение данных с помощью агрегатных функций
В ЭТОЙ ГЛАВЕ, ВЫ ПЕРЕЙДЕТЕ ОТ ПРОСТОГО использования запросов к извлечению значений из базы данных и определению, как вы можете использовать эти значения чтобы получить из них информацию. Это делается с помощью агрегатных или общих функций которые берут группы значений из поля и сводят их до одиночного значения. Вы узнаете как использовать эти функции, как определить группы значений к которым они будут применяться, и как определить какие группы выбираются для вывода. Вы будете также видеть при каких условиях вы сможете объединить значения поля с этой полученной информацией в одиночном запросе.
Что такое агрегатные
функции ?
Запросы могут производить обобщенное групповое значение полей точно также как и значение одного поля. Это делает с помощью агрегатых функций. Агрегатные функции производят одиночное значение для всей группы таблицы. Имеется список этих функций: * COUNT производит номера строк или не-NULL значения полей которые выбрал запрос.* SUM производит арифметическую сумму всех выбранных значений данного поля.* AVG производит усреднение всех выбранных значений данного поля.* MAX производит наибольшее из всех выбранных значений данного поля.* MIN производит наименьшее из всех выбранных значений данного поля.
Как использовать
агрегатные функции ?
Агрегатные функции используются подобно именам полей в предложении SELECT запроса, но с одним исключением, они берут имена поля как аргументы. Только числовые поля могут использоваться с SUM и AVG. С COUNT, MAX, и MIN, могут использоваться и числовые или символьные поля. Когда они используются с символьными полями, MAX и MIN будут транслировать их в эквивалент ASCII, который должен сообщать, что MIN будет означать первое, а MAX последнее значение в алфавитном порядке( выдача алфавитного упорядочения обсуждается более подробно в Главе 4 ). Чтобы найти SUM всех наших покупок в таблицы Порядков, мы можемввести следующий запрос, с его выводом в Рисунке 6.1: SELECT SUM ((amt))
FROM Orders; =============== SQL Execution Log ============ | SELECT SUM (amt) | | FROM Orders; | | ==============================================| | ------- | | 26658.4 | ===============================================Рисунок 6.1: Выбор суммы
Это конечно, отличается от выбора поля при котором возвращается оди-
ночное значение, независимо от того сколько строк находится в таблице.Из-за этого, агрегатные функции и поля не могут выбираться одновремен-но, пока предложение GROUP BY (описанное далее) не будет использовано.Нахождение усредненой суммы - это похожая операция ( вывод следующегозапроса показывается в Рисунке 6.2 ): SELECT AVG (amt)
FROM Orders; =============== SQL Execution Log ============ | | | SELECT AVG (amt) | | FROM Orders; | | ==============================================| | | | ------- | | 2665.84 | | | =============================================== Рисунок 6.2: Выбор среднего
Специальные атрибуты COUNT
Функция COUNT несколько отличается от всех. Она считает число значе-ний в данном столбце, или число строк в таблице. Когда она считаетзначения столбца, она используется с DISTINCT чтобы производить счетчисел различных значений в данном поле. Мы могли бы использовать ее,например, чтобы сосчитать номера продавцов в настоящее время описаныхв таблице Порядков ( вывод показывается в Рисунке 6.3 ): SELECT COUNT ( DISTINCT snum )
FROM Orders;
Использование
DISTINCT
Обратите внимание в вышеупомянутом примере, что DISTINCT, сопровож-
даемый именем поля с которым он применяется, помещен в круглые скобки,но не сразу после SELECT, как раньше. Этого использования DISTINCT с COUNT применяемого к индивидуальнымстолбцам, требует стандарт ANSI, но большое количество программ непредъявляют к ним такого требования. =============== SQL Execution Log ============
| | | SELECT COUNT (DISTINCT snum) | | FROM Orders; | | ==============================================| | | | ------- | | 5 | | | | | =============================================== Рисунок 6.3: Подсчет значений поля
Вы можете выбирать многочисленые счета( COUNT ) из полей с помощью
DISTINCT в одиночном запросе который, как мы видели в Главе 3, не вы-полнялся когда вы выбирали строки с помощью DISTINCT. DISTINCT можетиспользоваться таким образом, с любой функцией агрегата, но наиболеечасто он используется с COUNT. С MAX и MIN, это просто не будет иметьникакого эффекта, а SUM и AVG, вы обычно применяете для включения пов-торяемых значений, так как они законно эффективнее общих и среднихзначений всех столбцов.
Использование COUNT со
строками, а не значениями
Чтобы подсчитать общее число строк в таблице, используйте функциюCOUNT со звездочкой вместо имени поля, как например в следующем приме-ре, вывод из которого показан на Рисунке 6.4: SELECT COUNT (*)
FROM Customers COUNT со звездочкой включает и NULL и дубликаты, по этой причине
DISTINCT не может быть использован. DISTINCT может производить болеевысокие номера чем COUNT особого поля, который удаляет все =============== SQL Execution Log ============
| | | SELECT COUNT (*) | | FROM Customers; || ==============================================|
| | | ------- | | 7 | | | | | =============================================== Рисунок 6. 4: Подсчет строк вместо значений строки, имеющие избыточные или NULL данные в этом поле. DISTINCT не применим c COUNT (*), потому, что он не имеет никакогодействия в хорошо разработаной и поддерживаемой базе данных. В такойбазе данных, не должно быть ни таких строк, которые бы являлись пол-ностью пустыми, ни дубликатов ( первые не содержат никаких данных, апоследние полностью избыточны ). Если, с другой стороны, все таки име-ются полностью пустые или избыточные строки, вы вероятно не захотитечтобы COUNT скрыл от вас эту информацию.
Включение дубликатов в
агрегатные функции
Агрегатные функции могут также ( в большинстве реализаций ) исполь-зовать аргумент ALL, который помещается перед именем поля, подобноDISTINCT, но означает противоположное: - включать дубликаты. ANSI тех-нически не позволяет этого для COUNT, но многие реализации ослабляютэто ограничение. Различия между ALL и * когда они используются с COUNT - * ALL использует имя_поля как аргумент.* ALL не может подсчитать значения NULL. Пока * является единственым аргументом который включает NULL значе-ния, и он используется только с COUNT; функции отличные от COUNT игно-рируют значения NULL в любом случае. Следующая команда подсчитает(CO-UNT) число не-NULL значений в поле rating в таблице Заказчиков ( вклю-чая повторения ):
SELECT COUNT ( ALL rating )FROM Customers;
Агрегаты, построенные на
скалярном выражении
До этого, вы использовали агрегатные функции с одиночными полями какаргументами. Вы можете также использовать агрегатные функции с аргу-ментами которые состоят из скалярных выражений включающих одно или бо-лее полей. ( Если вы это делаете, DISTINCT не разрешается. ) Предполо-жим, что таблица Порядков имеет еще один столбец который хранит преды-дущий неуплаченый баланс (поле blnc) для каждого заказчика. Вы должнынайти этот текущий баланс, добавлением суммы приобретений к предыдуще-му балансу. Вы можете найти наибольший неуплаченый баланс следующимобразом:
SELECT MAX ( blnc + (amt) )FROM Orders;
Для каждой строки таблицы, этот запрос будет складывать blnc и amtдля этого заказчика и выбирать самое большое значение которое он най-дет. Конечно, пока заказчики могут иметь многочисленые порядки, их не-уплаченый баланс оценивается отдельно для каждого порядка. Возможно,порядок с более поздней датой будет иметь самый большой неуплаченыйбаланс. Иначе, старый баланс должен быть выбран как в запросе выше. Фактически, имеются большое количество ситуаций в SQL где вы можетеиспользовать скалярные выражения с полями или вместо полей, как выувидете это в Главе 7.
Предложение GROUP BY
Предложение GROUP BY позволяет вам определять подмножество значенийв особом поле в терминах другого поля, и применять функцию агрегата кподмножеству. Это дает вам возможность объединять поля и агрегатныефункции в едином предложении SELECT. Например, предположим что вы хо-тите найти наибольшую сумму приобретений полученную каждым продавцом.Вы можете сделать раздельный запрос для каждого из них, выбрав MAX(amt) из таблицы Порядков для каждого значения поля snum. GROUP BY,однако, позволит Вам поместить их все в одну команду: SELECT snum, MAX (amt)
FROM Orders GROUP BY snum; Вывод для этого запроса показывается в Рисунке 6.5.
=============== SQL Execution Log ==============
| | | SELECT snum, MAX (amt) | | FROM Orders | | GROUP BY snum; || =============================================== |
| snum | | ------ -------- | | 1001 767.19 | | 1002 1713.23 | | 1003 75.75 | | 1014 1309.95 | | 1007 1098.16 | | | ================================================ Рисунок 6.5: Нахождение максимальной суммы продажи у каждого продавца GROUP BY применяет агрегатные функции независимо от серий групп ко-торые определяются с помощью значения поля в целом. В этом случае,каждая группа состоит из всех строк с тем же самым значением поляsnum, и MAX функция применяется отдельно для каждой такой группы. Этозначение поля, к которому применяется GROUP BY, имеет, по определению,только одно значение на группу вывода, также как это делает агрегатнаяфункция. Результатом является совместимость которая позволяет агрега-там и полям объединяться таким образом. Вы можете также использовать GROUP BY с многочислеными полями. Со-вершенствуя вышеупомянутый пример далее, предположим что вы хотитеувидеть наибольшую сумму приобретений получаемую каждым продавцом каж-дый день. Чтобы сделать это, вы должны сгруппировать таблицу Порядковпо датам продавцов, и применить функцию MAX к каждой такой группе, по-добно этому:
SELECT snum, odate, MAX ((amt)) FROM Orders GROUP BY snum, odate; Вывод для этого запроса показывается в Рисунке 6.6.
=============== SQL Execution Log ==============
| | | SELECT snum, odate, MAX (amt) | | FROM Orders | | GROUP BY snum, odate; | | =============================================== | | snum odate | | ------ ---------- -------- | | 1001 10/03/1990 767.19 | | 1001 10/05/1990 4723.00 | | 1001 10/06/1990 9891.88 | | 1002 10/03/1990 5160.45 | | 1002 10/04/1990 75.75 | | 1002 10/06/1990 1309.95 | | 1003 10/04/1990 1713.23 | | 1014 10/03/1990 1900.10 | | 1007 10/03/1990 1098.16 | | | ================================================ Рисунок 6.6: Нахождение наибольшей суммы приобретений на каждый день
Конечно же, пустые группы, в дни когда текущий продавец не имел по-
рядков, не будут показаны в выводе.
Предложение HAVING
Предположим, что в предыдущем примере, вы хотели бы увидеть толькомаксимальную сумму приобретений значение которой выше $3000.00. Вы несможете использовать агрегатную функцию в предложении WHERE ( если выне используете подзапрос, описанный позже ), потому что предикаты оце-ниваются в терминах одиночной строки, а агрегатные функции оцениваютсяв терминах групп строк. Это означает что вы не сможете сделать что-ни-будь подобно следующему: SELECT snum, odate, MAX (amt)
FROM Oreders WHERE MAX ((amt)) > 3000.00 GROUP BY snum, odate; Это будет отклонением от строгой интерпретации ANSI. Чтобы увидеть
максимальную стоимость приобретений свыше $3000.00, вы можете исполь-зовать предложение HAVING. Предложение HAVING определяет критерии используемые чтобы удалятьопределенные группы из вывода, точно также как предложение WHERE дела-ет это для индивидуальных строк. Правильной командой будет следующяя: SELECT snum, odate, MAX ((amt))
FROM Orders GROUP BY snum, odate HAVING MAX ((amt)) > 3000.00; Вывод для этого запроса показывается в Рисунке 6. 7.
=============== SQL Execution Log ============== | | | SELECT snum, odate, MAX (amt) | | FROM Orders | | GROUP BY snum, odate | | HAVING MAX (amt) > 3000.00; | | =============================================== | | snum odate | | ------ ---------- -------- | | 1001 10/05/1990 4723.00 | | 1001 10/06/1990 9891.88 | | 1002 10/03/1990 5160.45 | | | ================================================ Рисунок 6. 7: Удаление групп агрегатных значений
Аргументы в предложении HAVING следуют тем же самым правилам что и впредложении SELECT, состоящей из команд использующих GROUP BY. Онидолжны иметь одно значение на группу вывода. Следующая команда будетзапрещена: SELECT snum, MAX (amt)
FROM Orders GROUP BY snumHAVING odate = 10/03/1988;
Поле оdate не может быть вызвано предложением HAVING, потому что ономожет иметь ( и действительно имеет ) больше чем одно значение нагруппу вывода. Чтобы избегать такой ситуации, предложение HAVING долж-но ссылаться только на агрегаты и поля выбранные GROUP BY. Имеетсяправильный способ сделать вышеупомянутый запрос( вывод показывается вРисунке 6.8 ):
SELECT snum, MAX (amt) FROM Orders WHEREodate = 10/03/1990 GROUP BY snum; =============== SQL Execution Log ============== | | | SELECT snum, odate, MAX (amt) | | FROM Orders | | GROUP BY snum, odate; || =============================================== |
| snum | | ------ -------- | | 1001 767.19 | | 1002 5160.45 | | 1014 1900.10 | | 1007 1098.16 | | | ================================================ Рисунок 6.8: Максимальное значение суммы приобретений у каждого продавца на 3 Октября Поскольку поля odate нет, не может быть и выбраных полей, значениеэтих данных меньше чем в некоторых других примерах. Вывод должен веро-ятно включать что-нибудь такое что говорит - " это - самые большие по-рядки на 3 Октября." В Главе 7, мы покажем как вставлять текст в вашвывод. Как и говорилось ранее, HAVING может использовать только аргументыкоторые имеют одно значение на группу вывода. Практически, ссылки наагрегатные функции - наиболее общие, но и поля выбранные с помощьюGROUP BY также допустимы. Например, мы хотим увидеть наибольшие поряд-ки для Serres и Rifkin: SELECT snum, MAX (amt)
FROM Orders GROUP BY snum HAVING snum B (1002,1007); Вывод для этого запроса показывается в Рисунке 6.9.
=============== SQL Execution Log ==============
| | | SELECT snum, MAX (amt) | | FROM Orders | | GROUP BY snum | | HAVING snum IN ( 1002, 1007 ); | | =============================================== | | snum | | ------ -------- | | 1002 5160.45 | | 1007 1098.16 | | | ================================================ Рисунок 6. 9: Использование HAVING с GROUP BY полями
Не делайте вложенных
агрегатов
В строгой интерпретации ANSI SQL, вы не можете использовать агрегатагрегата. Предположим что вы хотите выяснять, в какой день имелась на-ибольшая сумма приобретений. Если вы попробуете сделать это, то ваша SELECT odate, MAX ( SUM (amt) )
FROM Orders GROUP BY odate; команда будет вероятно отклонена. ( Некоторые реализации не предписы-вают этого ограничения, которое является выгодным, потому что вложен-ные агрегаты могут быть очень полезны, даже если они и несколько проб-лематичны.) В вышеупомянутой команде, например, SUM должен применятьсяк каждой группе поля odate, а MAX ко всем группам, производящим оди-ночное значение для всех групп. Однако предложение GROUP BY подразуме-вает что должна иметься одна строка вывода для каждой группы поля oda-te.
РЕЗЮМЕ
Теперь вы используете запросы несколько по-другому. Способность по-лучать, а не просто размещать значения, очень мощна. Это означает чтовы не обязательно должны следить за определенной информацией если выможете сформулировать запрос так чтобы ее получить. Запрос будет да-вать вам по-минутные результаты, в то время как таблица общего илисреднего значений будет хороша только некоторое время после ее модифи-кации. Это не должно наводить на мысль, что агрегатные функции могутполностью вытеснить потребность в отслеживании информации такой напри-мер как эта. Вы можете применять эти агрегаты для групп значений определенныхпредложением GROUP BY. Эти группы имеют значение поля в целом, и могутпостоянно находиться внутри других групп которые имеют значение поля вцелом. В то же время, предикаты еще используются чтобы определять ка-кие строки агрегатной функции применяются. Объединенные вместе, эти особенности делают возможным, производитьагрегаты основанные на сильно определенных подмножествах значений вполе. Затем вы можете определять другое условие для исключения опреде-ленных результатов групп с предложением HAVING. Теперь , когда вы стали знатоком большого количества того как запроспроизводит значения, мы покажем вам, в Главе 7, некоторые вещи которыевы можете делать со значениями которые он производит.
Работа с SQL
1. Напишите запрос который сосчитал бы все суммы приобретений на 3 Ок- тября.2. Напишите запрос который сосчитал бы число различных не-NULL значе- ний поля city в таблице Заказчиков.3. Напишите запрос который выбрал бы нименьшую сумму для каждого за- казчика.4. Напишите запрос который бы выбирал заказчиков в алфавитном порядке, чьи имена начинаются с буквы G.5. Напишите запрос который выбрал бы высшую оценку в каждом городе.6. Напишите запрос который сосчитал бы число заказчиков регистрирующих каждый день свои порядки. (Если продавец имел более одного порядка в данный день, он должен учитываться только один раз.) ( См. Приложение A для ответов. )7. Формирование выводов
запросов
ЭТА ГЛАВА РАСШИРИТ ВАШИ ВОЗМОЖНОСТИ в работе с выводом который про-изводит запрос. Вы узнаете как вставлять текст и константы между выб-ранных полей, как использовать выбранные поля в математических выраже-ниях, чьи результаты затем становятся выводом, и как сделать чтобы ва-ши значения выводились в определенном порядке. Эта последняя особен-ность включена, чтобы упорядочивать ваш вывод по любым столбцам, любымполученным значениям этого столбца, или по обеим.
Строки и выражения
Большинство основанных на SQL баз данных предоставляют специальныесредства позволяющие Вам совершенствовать вывод ваших запросов. Конеч-но, они претерпевают значительные изменения от программы к программе,и их обсуждение здесь не входит в наши задачи, однако, имеются пятьособенностей созданых в стандарте SQL которые позволяют вам делатьбольше чем просто вывод значений полей и агрегатных данных.
Скалярное выражение с
помощью выбранных полей
Предположим что вы хотите выполнять простые числовые вычисления дан-ных чтобы затем помещать их в форму больше соответствующую вашим пот-ребностям. SQL позволяет вам помещать скалярные выражения и константысреди выбраных полей. Эти выражения могут дополнять или замещать поляв предложениях SELECT, и могут включать в себя одно или более выбран-ных полей. Например, вы можете пожелать, представить комиссионные ва-шего продавца в процентном отношении а не как десятичные числа. Просто
достаточно:
SELECT snum, sname, city, comm * 100FROM Salespeople;
Вывод из этого запроса показывается в Рисунке 7.1.
Столбцы вывода
Последний столбец предшествующего примера непомечен( т.е. без наиме-нования), потому что это - столбец вывода. Столбцы вывода - это столб-цы данных созданные запросом способом, иным чем просто извлечение ихиз таблицы. Вы создаете их всякий раз, когда вы используете агрегатные =============== SQL Execution Log ============
| | | SELECT snum, sname, city, comm * 100 | | FROM Salespeople; | | ==============================================| | snum sname city | | ------ --------- ----------- --------- | | 1001 Peel London 12.000000 | | 1002 Serres San Jose 13.000000 | | 1004 Motika London 11.000000 | | 1007 Rifkin Barcelona 15.000000 | | 1003 Axelrod New York 10.000000 || |
=============================================== Рисунок 7.1: Помещение выражения в вашем запросе функции, константы, или выражения в предложении SELECT запроса. Таккак имя столбца - один из атрибутов таблицы, столбцы которые приходятне из таблиц не имеют никаких имен. Другими словами непомеченные,столбцы вывода могут обрабатываться также как и столбцы извлеченные изтаблиц, почти во всех ситуациях.
Помещение текста в вашем
выводе запроса
Символ 'A', когда ничего не значит сам по себе, - является констан-той, такой например как число 1. Вы можете вставлять константы в пред-ложение SELECT запроса, включая и текст. Однако символьные константы,в отличие от числовых констант, не могут использоваться в выражениях.Вы можете иметь выражение 1 + 2 в вашем предложении SELECT, но вы неможете использовать выражение типа 'A' + 'B'; это приемлемо только ес-ли мы имеем в виду что 'A' и 'B' это просто буквы, а не переменные ине символы. Тем ни менее, возможность вставлять текст в вывод ваших запросовочень удобная штука. Вы можете усовершенствовать предыдущий пример представив комиссион-ные как проценты со знаком процента (%). Это даст вам возможность по-мещать в вывод такие единицы как символы и комментарии, как например вследующем примере ( вывод показывается в Рисунке 7.2 ) SELECT snum, sname, city, ' % ', comm * 100
FROM Salespeople; =============== SQL Execution Log ============ | | | SELECT snum, sname, city, '%' comm * 100 | | FROM Salespeople; | | ==============================================| | snum sname city | | ------ -------- ----------- ---- --------- | | 1001 Peel London % 12.000000 | | 1002 Serres San Jose % 13.000000 | | 1004 Motika London % 11.000000 | | 1007 Rifkin Barcelona % 15.000000 | | 1003 Axelrod New York % 10.000000 || |
=============================================== Рисунок 7.2: Вставка символов в ваш вывод Обратите внимание что пробел перед процентом вставляется как частьстроки. Эта же самая особенность может использоваться чтобы маркиро-вать вывод вместе с вставляемыми комментариями. Вы должны помнить, чтоэтот же самый комментарий будет напечатан в каждой строке вывода, а непросто один раз для всей таблицы. Предположим что вы генерируете выводдля отчета который бы указывал число порядков получаемых в течениекаждого дня. Вы можете промаркировать ваш вывод ( см. Рисунок 7.3 )сформировав запрос следующим образом: SELECT ' For ', odate, ', there are ',
COUNT ( DISTINCT onum ), 'orders.' FROM Orders GROUP BY odate; Грамматической некорректности вывода, на 5 Октября, невозможно избе-
жать не создав запроса, еще более сложного чем этот. ( Вы будете долж-ны использовать два запроса с UNION, который =============== SQL Execution Log ==============
| | | SELECT 'For', odate, ', ' there are ' , | | COUNT (DISTINCT onum), ' orders ' | | FROM Orders | | GROUP BY odate; | | =============================================== | | odate | | ------ ---------- --------- ------ ------- | | For 10/03/1990 , there are 5 orders. | | For 10/04/1990 , there are 2 orders. | | For 10/05/1990 , there are 1 orders. || For 10/06/1990 , there are 2 orders. |
================================================Рисунок 7.3: Комбинация текста, значений поля, и агрегатов мы будем описывать в Главе 14. ) Как вы можете видеть, одиночный неиз-менный комментарий для каждой строки таблицы может быть очень полезен,но имеет ограничения. Иногда изящнее и полезнее, произвести один ком-ментарий для всего вывода в целом, или производить свой собственныйкомментарии для каждой строки. Различные программы использующие SQL часто обеспечивают специальныесредства типа генератора отчетов( например Report Writer), которыеразработаны чтобы форматировать и совершенствовать вывод. ВложенныйSQL может также эксплуатировать возможности того языка в который онвложен. SQL сам по себе интересен прежде всего при операциях с данны-ми. Вывод, по существу, это информация, и программа использующая SQLможет часто использовать эту информацию и помещать ее в более привле-кательную форму. Это, однако, вне сферы самой SQL.
Упорядочение вывода полей
Как мы подчеркивали, таблицы - это неупорядоченные наборы данных, иданные которе выходят из их, не обязательно появляются в какой-то оп-ределенной последовательности. SQL использует команду ORDER BY чтобыпозволять вам упорядочивать ваш вывод. Эта команда упорядочивает выводзапроса согласно значениям в том или ином количестве выбранных столб-цов. Многочисленые столбцы упорядочиваются один внутри другого, такжекак с GROUP BY, и вы можете определять возрастание ( ASC ) или убыва-ние ( DESC ) для каждого столбца. По умолчанию установлено - возроста-ние. Давайте рассмотрим нашу таблицу порядка приводимую в порядок спомощью номера заказчика ( обратите внимание на значения в cnum столб-це):
SELECT * FROM Orders ORDER BY cnum DESC; Вывод показывается в Рисунке 7.4. =============== SQL Execution Log ==============
| SELECT * | | FROM Orders | | ORDER BY cnum DESC; | | =============================================== | | onum amt odate cnum snum | | ------ -------- ---------- ----- ----- | | 3001 18.69 10/03/1990 2008 1007 | | 3006 1098.16 10/03/1990 2008 1007 | | 3002 1900.10 10/03/1990 2007 1004 | | 3008 4723.00 10/05/1990 2006 1001 | | 3011 9891.88 10/06/1990 2006 1001 | | 3007 75.75 10/04/1990 2004 1002 | | 3010 1309.95 10/06/1990 2004 1002 | | 3005 5160.45 10/03/1990 2003 1002 | | 3009 1713.23 10/04/1990 2002 1003 | | 3003 767.19 10/03/1990 2001 1001 | Рисунок 7. 4: Упорядочение вывода с помощью убывания поля
Упорядочение с помощью
многочисленных столбцов
Мы можем также упорядочивать таблицу с помощью другого столбца, нап-ример с помощью поля amt, внутри упорядочения поля cnum. ( вывод пока-зан в Рисунке 7.5 ): SELECT *
FROM Orders ORDER BY cnum DESC, amt DESC; =============== SQL Execution Log ============== | | | SELECT * | | FROM Orders | | ORDER BY cnum DESC, amt DESC; | | =============================================== | | onum amt odate cnum snum | | ------ -------- ---------- ----- ----- | | 3006 1098.16 10/03/1990 2008 1007 | | 3001 18.69 10/03/1990 2008 1007 | | 3002 1900.10 10/03/1990 2007 1004 | | 3011 9891.88 10/06/1990 2006 1001 | | 3008 4723.00 10/05/1990 2006 1001 | | 3010 1309.95 10/06/1990 2004 1002 | | 3007 75.75 10/04/1990 2004 1002 | | 3005 5160.45 10/03/1990 2003 1002 | | 3009 1713.23 10/04/1990 2002 1003 | | 3003 767.19 10/03/1990 2001 1001 | | | ================================================ Рисунок 7.5: Упорядочение вывода с помощью многочисленых полей
Вы можете использовать ORDER BY таким же способом сразу с любым чис-
лом столбцов. Обратите внимание что, во всех случаях, столбцы которыеупорядочиваются должны быть указаны в выборе SELECT. Это - требованиеANSI которые в большинстве, но не всегда, предписано системе. Следую-щая команда, например, будет запрещена: SELECT cname, city
FROM Customers GROUP BY cnum; Так как поле cnum не было выбранным полем, GROUP BY не cможет найти
его чтобы использовать для упорядочения вывода. Даже если ваша системапозволяет это, смысл упорядочения не будет понятен из вывода, так чтовключение (в предложение SELECT) всех столбцов, используемых в предло-жении ORDER BY, в принципе желательно.
Упорядочение агрегатных
групп
ORDER BY может кроме того, использоваться с GROUP BY для упорядоче-ния групп. Если это так, то ORDER BY всегда приходит последним. Вот -пример из последней главы с добавлением предложения ORDER BY. Передсгруппированием вывода, порядок групп был произвольным; и мы, теперь,заставим группы размещаться в последовательности: SELECT snum, odate, MAX (amt)
FROM Orders GROUP BY snum, odate GROUP BY snum; Вывод показывается в Рисунке 7.6. =============== SQL Execution Log ==============
| | | SELECT snum, odate, MAX (amt) | | FROM Orders | | GROUP BY snum, odate | | ORDER BY snum ; | | =============================================== | | snum odate amt | | ----- ---------- -------- | | 1001 10/06/1990 767.19 | | 1001 10/05/1990 4723.00 | | 1001 10/05/1990 9891.88 | | 1002 10/06/1990 5160.45 | | 1002 10/04/1990 75.75 | | 1002 10/03/1990 1309.95 | | 1003 10/04/1990 1713.23 | | 1004 10/03/1990 1900.10 | | 1007 10/03/1990 1098.16 | | | ================================================ Рисунок 7. 6: Упорядочение с помощью группы
Так как мы не указывали на возрастание или убывание порядка, возрас-
тание используется по умолчанию.
Упорядочение вывода по
номеру столбца
Вместо имен столбца, вы можете использовать их порядковые номера дляуказания поля используемого в упорядочении вывода. Эти номера могутссылаться не на порядок столбцов в таблице, а на их порядок в выводе.Другими словами, поле упомянутое в предложении SELECT первым, для OR-DER BY - это поле 1, независимо от того каким по порядку оно стоит втаблице. Например, вы можете использовать следующую команду чтобы уви-деть определенные поля таблицы Продавцов, упорядоченными в порядкеубывания к наименьшему значению комиссионных ( вывод показывается Ри-сунке 7.7 ):
SELECT sname, comm FROM Salespeople GROUP BY 2 DESC; =============== SQL Execution Log ============ | | | (SELECT sname, comm | | FROM Salespeople | | ORDER BY 2 DESC; | | ============================================= | | sname comm | | -------- -------- | | Peel 0.17 | | Serres 0.13 | | Rifkin 0.15 | | | =============================================== Pисунок 7. 7: Упорядочение использующее номера
Одна из основных целей этой возможности ORDER BY - дать вам возмож-ность использовать GROUP BY со столбцами вывода также как и со столб-цами таблицы. Столбцы производимые агрегатной функцией, константы, иливыражения в предложении SELECT запроса, абсолютнопригодны для исполь-зования с GROUP BY, если они ссылаются к ним с помощью номера. Напри-мер, давайте сосчитаем порядки каждого из наших продавцов, и выведемрезультаты в убывающем порядке, как показано в Рисунке 7.8: SELECT snum, COUNT ( DISTINCT onum )
FROM Orders GROUP BY snum ORDER BY 2 DESC; =============== SQL Execution Log ============== | | | SELECT snum, odate, MAX (amt) | | FROM Orders | | GROUP BY snum | | ORDER BY 2 DESC; | | =============================================== | | snum | | ----- ---------- | | 1001 3 | | 1002 3 | | 1007 2 | | 1003 1 | | 1004 1 | | | ================================================ Рисунок 7.8: Упорядочение с помощью столбца вывода
В этом случае, вы должны использовать номер столбца, так как столбец
вывода не имеет имени; и вы не должны использовать саму агрегатнуюфункцию. Строго говоря по правилам ANSI SQL, следующее не будет рабо-тать, хотя некоторые системы и пренебрегают этим требованием: SELECT snum, COUNT ( DISTINCT onum )
FROM Orders GROUP BY snumGROUP BY COUNTОМ ( DISTINCT onum ) DESC;
Это будет отклонено большинством систем!
Упорядочение с помощью
оператора NULL
Если имеются пустые значения (NULL) в поле которое вы используетедля упорядочивания вашего вывода, они могутут или следовать или пред-шествовать каждому другому значению в поле. Это - возможность которуюANSI оставил для индивидуальных программ. Данная программа используетту или иную форму.
РЕЗЮМЕ
В этой главе, вы изучили как заставить ваши запросы делать больше,чем просто выводить значения полей или объединять функциональные дан-ные таблиц. Вы можете использовать поля в выражениях: например, вы мо-жете умножить числовое поле на 10 или даже умножить его на другое чис-ловое поле. Кроме того, вы можете помещать константы, включая и симво-лы, в ваш вывод, что позволяет вам помещать текст непосредственно взапрос и получать его в выводе вместе с данными таблицы. Это дает вам возможность помечать или объяснять ваш вывод различнымиспособами. Вы также изучили как упорядочивать ваш вывод. Даже если таблица самапо себе остается неупорядоченной, предложение ORDER BY дает вам воз-можность управлять порядком вывода строк данного запроса. Вывод запро-са может быть в порядке возрастания или убывания, и столбцы могут бытьвложенными один внутрь другого. Понятие выводимых столбцов объяснялось в этой главе. Вы теперь знае-те что выводимые столбцы можно использовать чтобы упорядочивать выводзапроса, но эти столбцы - без имени, и следовательно должны опреде-ляться их порядковым номером в предложении ORDER BY. Теперь, когда вы увидели что можно делать с выводом запроса основан-ного на одиночной таблице, настало время чтобы перейти к возможностямулучшенного запроса и узнать как сделать запрос любого числа таблиц водной команде, определив связи между ними как вы это обычно делали.Это будет темой Главы 8.
Работа с SQL
1. Предположим что каждый продавец имеет 12% комиссионных. Напишите запрос к таблице Порядков который мог бы вывести номер порядка, но- мер продавца, и сумму комиссионных продавца для этого порядка.2. Напишите запрос к таблице Заказчиков который мог бы найти высшую оценку в каждом городе. Вывод должен быть в такой форме:For the city (city), the highest rating is: (rating).
3. Напишите запрос который выводил бы список заказчиков в нисходящем порядке. Вывод поля оценки( rating ) должден сопровождаться именем закзчика и его номером.4. Напишите запрос который бы выводил общие порядки на каждый день и помещал результаты в нисходящем порядке. ( См. Приложение A для ответов. )8. Запрашивание
многочисленных таблиц также как одной
ДО ЭТОГО, КАЖДЫЙ ЗАПРОС КОТОРЫЙ МЫ ИССЛЕДОВАЛИ основывался на оди-ночной таблице. В этой главе, вы узнаете как сделать запрос любогочисла таблиц с помощью одной команды. Это - чрезвычайно мощное средс-тво потому что оно не только объединяет вывод из многочисленых таблиц,но и определяет связи между ними. Вы обучитесь различным формам кото-рые могут использовать эти связи, а также устанавливать и использоватьих чтобы удовлетворять возможным специальным требованиям.
Объединение таблиц
Одна из наиболее важных особенностей запросов SQL - это их способ-ность определять связи между многочислеными таблицами и выводить ин-формацию из них в терминах этих связей, всю внутри одной команды. Этотвид операции называется - объединением, которое является одним из ви-дов операций в реляционных базах данных. Как установлено в Главе 1,главное в реляционном подходе это связи которые можно создавать междупозициями данных в таблицах. Используя обьединения, мы непосредственносвязываем информацию с любым номером таблицы, и таким образом способнысоздавать связи между сравнимыми фрагментами данных. При обьединении,таблицы представленые списком в предложении FROM запроса, отделяютсязапятыми. Предикат запроса может ссылаться к любому столбцу любой свя-занной таблицы и, следовательно, может использоваться для связи междуими. Обычно, предикат сравнивает значения в столбцах различных таблицчтобы определить, удовлетворяет ли WHERE установленному условию.
Имена таблиц и столбцов
Полное имя столбца таблицы фактически состоит из имени таблицы, соп-ровождаемого точкой и затем именем столбца. Имеются несколько примеровимен :Salespeople.snum
Salespeople.cityOrders.odate
До этого, вы могли опускать имена таблиц потому что вы запрашивалитолько одну таблицу одновременно, а SQL достаточно интелектуален чтобыприсвоить соответствующий префикс, имени таблицы. Даже когда вы делае-те запрос многочисленых таблиц, вы еще можете опускать имена таблиц,если все ее столбцы имеют различные имена. Но это не всегда так быва-ет. Например, мы имеем две типовые таблицы со столбцами называемымиcity. Если мы должны связать эти столбцы( кратковременно ), мы будем долж-ны указать их с именами Salespeople.city или Customers.city, чтобы SQLмог их различать.
Создание объединения
Предположим что вы хотите поставить в соответствии вашему продавцуваших заказчиков в городе в котором они живут, поэтому вы увидите всекомбинации продавцов и заказчиков для этого города. Вы будете должныбрать каждого продавца и искать в таблице Заказчиков всех заказчиковтого же самого города. Вы могли бы сделать это, введя следующую коман-ду ( вывод показывается в Рисунке 8.1 ): SELECT Customers.cname, Salespeople.sname,
Salespeople.city FROM Salespeople, Customers WHERE Salespeople.city = Customers.city; =============== SQL Execution Log ============ | SELECT Customers.cname, Salespeople.sname, | | Salespeople.city | | FROM Salespeople, Customers | | WHERE Salespeople.city = Customers.city | | ============================================= | | cname cname city | | ------- -------- ---- | | Hoffman Peel London | | Hoffman Peel London | | Liu Serres San Jose | | Cisneros Serres San Jose | | Hoffman Motika London | | Clemens Motika London |=============================================
Рисунок 8.1: Объединение двух таблиц Так как это поле city имеется и в таблице Продавцов и таблице Заказ-чиков, имена таблиц должны использоваться как префиксы. Хотя это необ-ходимо только когда два или более полей имеют одно и то же имя, в лю-бом случае это хорошая идея включать имя таблицы в обьединение длялучшего понимания и непротиворечивости. Несмотря на это, мы будем, внаших примерах далее, использовать имена таблицы только когда необхо-димо, так что будет ясно, когда они необходимы а когда нет. Что SQL в основном делает в обьединении - так это исследует каждуюкомбинацию строк двух или более возможных таблиц, и проверяет эти ком-бинации по их предикатам. В предыдущем примере, требовалась строкапродавца Peel из таблицы Продавцов и объединение ее с каждой строкойтаблицы Пользователей, по одной в каждый момент времени. Если комбина-ция производит значение которое делает предикат верным, и если полеcity из строк таблиц Заказчика равно London, то Peel - это то запраши-ваемое значение которое комбинация выберет для вывода. То же самое бу-дет затем выполнено для каждого продавца в таблице Продавцов ( у неко-торых из которых небыло никаких заказчиков в этих городах).
Объединение таблиц через
справочную целостность
Эта особенность часто используется просто для эксплуатации связейвстроенных в базу данных. В предыдущем примере, мы установили связьмежду двумя таблицами в обьединении. Это прекрасно. Но эти таблицы,уже были соединены через snum поле. Эта связь называется состояниемсправочной целостности, как мы уже говорили в Главе 1. Используя обь-единение можно извлекать данные в терминах этой связи. Например, чтобыпоказать имена всех заказчиков соответствующих продавцам которые ихобслуживают, мы будем использовать такой запрос: SELECT Customers.cname, Salespeople.sname
FROM Customers, Salespeople WHERE Salespeople.snum = Customers.snum; Вывод этого запроса показывается в Рисунке 8.2.
Это - пример обьединения, в котором столбцы используются для опреде-ления предиката запроса, и в этом случае, snum столбцы из обеих таб-лиц, удалены из вывода. И это прекрасно. Вывод показывает какие заказ-чики каким продавцом обслуживаются; значения поля snum которые уста-навливают связь - отсутствуют. Однако если вы введете их в вывод, товы должны или удостовериться что вывод понятен сам по себе или обеспе-чить коментарий к данным при выводе. =============== SQL Execution Log ============
| SELECT Customers.cname, Salespeople.sname, | | FROM Salespeople, Customers | | WHERE Salespeople.snum = Customers.snum | | ============================================= | | cname sname | | ------- -------- | | Hoffman Peel | | Giovanni Axelrod | | Liu Serres | | Grass Serres | | Clemens Peel | | Cisneros Rifkin | | Pereira Motika |=============================================
Рисунок 8.2: Объединение продавцов с их заказчикам
Объединения таблиц по
равенству значений в столбцах
и другие виды объединений
Обьединения которые используют предикаты основанные на равенствахназываются - объединениями по равенству. Все наши примеры в этой главедо настоящего времени, относились именно к этой категории, потому чтовсе условия в предложениях WHERE базировались на математических выра-жениях использующих знак равно ( = ). Строки 'city = 'London' и 'Sa-
lespeople.snum = Orders.snum ' - примеры таких типов равенств найден-ных в предикатах. Объединения по равенству - это вероятно наиболее об-щий вид объединения, но имеются и другие. Вы можете, фактически, ис-пользовать любой из реляционных операторов в обьединении. Здесь пока-зан пример другого вида объединения (вывод показывается в Рисунке8.3): SELECT sname, cname FROM Salespeople, Customers WHERE sname < cname AND rating < 200; =============== SQL Execution Log ============ | SELECT sname, cname | | FROM Salespeople, Customers | | WHERE sname < cname | | AND rating < 200; | | ============================================= | | sname cname | | -------- ------- | | Peel Pereira | | Motika Pereira | | Axelrod Hoffman | | Axelrod Clemens || Axelrod Pereira |
| | ============================================= Рисунок 8.3: Обьединение основанное на неравенстве Эта команда не часто бывает полезна. Она воспроизводит все комбина-ции имени продавца и имени заказчика так, что первый предшествует пос-леднему в алфавитном порядке, а последний имеет оценку меньше чем 200.Обычно, вы не создаете сложных связей подобно этой, и, по этой причи-не, вы вероятно будете строить наиболее общие объединения по равенс-тву, но вы должны хорошо знать и другие возможности.
Объединение более двух
таблиц
Вы можете также создавать запросы объединяющие более двух таблиц.Предположим что мы хотим найти все порядки заказчиков не находящихся втех городах где находятся их продавцы.Для этого необходимо связать всетри наши типовые таблицы ( вывод показывается в Рисунке 8.4 ): SELECT onum, cname, Orders.cnum, Orders.snum
FROM Salespeople, Customers,Orders WHERE Customers.city < > Salespeople.city AND Orders.cnum = Customers.cnum AND Orders.snum = Salespeople.snum; =============== SQL Execution Log ============== | | | SELECT onum, cname, Orders.cnum, Orders.snum | | FROM Salespeople, Customers, Orders | | WHERE Customers.city < > Salespeople.city | | AND Orders.cnum = Customers.cnum | | AND Orders.snum = Salespeople.snum; | | =============================================== | | onum cname cnum snum | | ------ ------- ----- ----- | | 3001 Cisneros 2008 1007 | | 3002 Pereira 2007 1004 | | 3006 Cisneros 2008 1007 | | 3009 Giovanni 2002 1003 | | 3007 Grass 2004 1002 | | 3010 Grass 2004 1002 |===============================================
Рисунок 8. 4: Объединение трех таблиц Хотя эта команда выглядит скорее как комплексная, вы можете следо-вать за логикой, просто проверяя - что заказчики не размещены в техгородах где размещены их продавцы ( совпадение двух snum полей ), ичто перечисленные порядки - выполнены с помощью этих заказчиков( сов-падение порядков с полями cnum и snum в таблице Порядков ).
РЕЗЮМЕ
Теперь вы больше не ограничиваетесь просмотром одной таблицы в каж-дый момент времени. Кроме того, вы можете делать сложные сравнениямежду любыми полями любого числа таблиц и использовать полученные ре-зультаты чтобы решать какую информацию вы бы хотели видеть. Фактичес-ки, эта методика настолько полезна для построения связей, что она час-то используется для создания их внутри одиночной таблицы. Это будетправильным: вы сможете объединить таблицу с собой, а это очень удобнаявещь. Это будет темой Главы 9.
Работа с SQL
1. Напишите запрос который бы вывел список номеров порядков сопровож- дающихся именем заказчика который создавал эти порядки.2. Напишите запрос который бы выдавал имена продавца и заказчика для каждого порядка после номера порядков.3. Напишите запрос который бы выводил всех заказчиков обслуживаемых продавцом с комиссионными выше 12% . Выведите имя заказчика, имя продавца, и ставку комиссионных продавца.4. Напишите запрос который вычислил бы сумму комиссионных продавца для каждого порядка заказчика с оценкой выше 100. ( См. Приложение A для ответов. )9. Объединение таблицы с
собой
В ГЛАВЕ 8, МЫ ПОКАЗАЛИ ВАМ КАК ОБЪЕДИНЯТЬ ДВЕ или более таблиц -вместе. Достаточно интересно то, что та же самая методика может использо-ваться чтобы объединять вместе две копии одиночной таблицы. В этойглаве, мы будем исследовать этот процесс. Как вы видете, объединениетаблицы с самой собой, далеко не простая вещь, и может быть очень по-лезным способом определять определенные виды связей между пунктамиданных в конкретной таблице.
Как делать объединение
таблицы с собой
Для объединения таблицы с собой, вы можете сделать каждую строкутаблицы, одновременно, и комбинацией ее с собой и комбинацией с каждойдругой строкой таблицы. Вы затем оцениваете каждую комбинацию в терми-нах предиката, также как в обьединениях мультитаблиц. Это позволит вамлегко создавать определенные виды связей между различными позициямивнутри одиночной таблицы - с помощью обнаружения пар строк со значени-ем поля, например. Вы можете изобразить обьединение таблицы с собой, как обьединениедвух копий одной и той же таблицы. Таблица на самом деле не копирует-ся, но SQL выполняет команду так, как если бы это было сделано. Други-ми словами, это обьединение - такое же, как и любое другое обьединениемежду двумя таблицами, за исключением того, что в данном случае обетаблицы идентичны.
Псевдонимы
Синтаксис команды для объединения таблицы с собой, тот же что и дляобъединения многочисленых таблиц, в одном экземпляре. Когда вы объеди-няете таблицу с собой, все повторяемые имена столбца, заполняются пре-фиксами имени таблицы. Чтобы ссылаться к этим столбцам внутри запроса,вы должны иметь два различных имени для этой таблицы. Вы можете сделать это с помощью определения временных имен называе-мых переменными диапазона, переменными корреляции или просто - псевдо-нимами. Вы определяете их в предложении FROM запроса. Это очень прос-то: вы набираете имя таблицы, оставляете пробел, и затем набираетепсевдоним для нее. Имеется пример который находит все пары заказчиковимеющих один и тот же самый рейтинг (вывод показывается в Рисунке9.1): SELECT first.cname, second.cname, first.rating FROM Customers first, Customers second WHERE first.rating = second.rating; =============== SQL Execution Log ============== | | | Giovanni Giovanni 200 | | Giovanni Liu 200 | | Liu Giovanni 200 | | Liu Liu 200 | | Grass Grass 300 | | Grass Cisneros 300 | | Clemens Hoffman 100 | | Clemens Clemens 100 | | Clemens Pereira 100 | | Cisneros Grass 300 | | Cisneros Cisneros 300 | | Pereira Hoffman 100 | | Pereira Clemens 100 | | Pereira Pereira 100 || |
=============================================== Рисунок 9.1: Объединение таблицы с собой ( обратите внимание что на Рисунке 9.1, как и в некоторых дальнейшихпримерах, полный запрос не может уместиться в окне вывода, и следова-тельно будет усекаться. ) В вышеупомянутой команде, SQL ведет себя так, как если бы он соеди-нял две таблицы называемые 'первая' и 'вторая'. Обе они - фактически,таблицы Заказчика, но псевдонимы разрешают им быть обработаными неза-висимо. Псевдонимы первый и второй были установлены в предложении FROMзапроса, сразу после имени копии таблицы. Обратите внимание что псев-донимы могут использоваться в предложении SELECT, даже если они не оп-ределены в предложении FROM. Это - очень хорошо. SQL будет сначала допускать любые такие псевдо-нимы на веру, но будет отклонять команду если они не определены далеев предложении FROM запроса. Псевдоним существует - только пока команда выполняется ! Когда зап-рос заканчивается, псевдонимы используемые в нем больше не имеют ника-кого значения. Теперь, когда имеются две копии таблицы Заказчиков, чтобы работать сними, SQL может обрабатывать эту операцию точно также как и любое дру-гое обьединение - берет каждую строку из одного псевдонима и сравнива-ет ее с каждой строкой из другого псевдонима.
Устранение избыточности
Обратите внимание что наш вывод имеет два значение для каждой комби-нации, причем второй раз в обратном порядке. Это потому, что каждоезначение показано первый раз в каждом псевдониме, и второй раз( сим-метрично) в предикате. Следовательно, значение A в псевдониме сначалавыбирается в комбинации со значением B во втором псевдониме, а затемзначение A во втором псевдониме выбирается в комбинации со значением Bв первом псевдониме. В нашем примере, Hoffman выбрался вместе с Cle-mens, а затем Clemens выбрался вместе с Hoffman. Тот же самый случай сCisneros и Grass, Liu и Giovanni, и так далее. Кроме того каждая стро-ка была сравнена сама с собой, чтобы вывести строки такие как - Liu иLiu. Простой способ избежать этого состoит в том, чтобы налагать поря-док на два значения, так чтобы один мог быть меньше чем другой илипредшествовал ему в алфавитном порядке. Это делает предикат ассимет-ричным, поэтому те же самые значения в обратном порядке не будут выб-раны снова, например: SELECT tirst.cname, second.cname, first.rating
FROM Customers first, Customers second WHERE first.rating = second.rating AND first.cname < second.cname; Вывод этого запроса показывается в Рисунке 9.2.
Hoffman предшествует Periera в алфавитном порядке, поэтому комбина-ция удовлетворяет обеим условиям предиката и появляется в выводе. Ког-да та же самая комбинация появляется в обратном порядке - когда Perie-ra в псевдониме первой таблицы сравнтвается с Hoffman во второй табли-це псевдонима - второе условие не встречается. Аналогично Hoffman невыбирается при наличии того же рейтинга что и он сам потому что егоимя не предшествует ему самому в алфавитном порядке. Если бы вы захо- =============== SQL Execution Log ==============
| | | SELECT first.cname, second.cname, first.rating | | FROM Customers first, Customers second | | WHERE first.rating = second.rating | | AND first.cname < second.cname | | =============================================== | | cname cname rating | | ------- --------- ------- | | Hoffman Pereira 100 | | Giovanni Liu 200 | | Clemens Hoffman 100 | | Pereira Pereira 100 || Gisneros Grass 300 |
================================================= Рисунок 9.2: Устранение избыточности вывода в обьединении с собой. тели включить сравнение строк с ними же в запросах подобно этому, вымогли бы просто использовать < = вместо <.
Проверка ошибок
Таким образом мы можем использовать эту особенность SQL для проверкиопределенных видов ошибок. При просмотре таблицы Порядков, вы можетевидеть что поля cnum и snum должны иметь постоянную связь. Так каккаждый заказчик должен быть назначен к одному и только одному продав-цу, каждый раз когда определенный номер заказчика появляется в таблицеПорядков, он должен совпадать с таким же номером продавца. Следующаякоманда будет определять любые несогласованности в этой области: SELECT first.onum, tirst.cnum, first.snum,
second.onum, second.cnum,second.snum FROM Orders first, Orders second WHERE first.cnum = second.cnum AND first.snum < > second.snum; Хотя это выглядит сложно, логика этой команды достаточно проста. Она
будет брать первую строку таблицы Порядков, запоминать ее под первымпсевдонимом, и проверять ее в комбинации с каждой строкой таблицы По-рядков под вторым псевдонимом, одну за другой. Если комбинация строкудовлетворяет предикату, она выбирается для вывода. В этом случае пре-дикат будет рассматривать эту строку, найдет строку где поле cnum=2008а поле snum=1007, и затем рассмотрит каждую следующую строку с тем жесамым значением поля cnum. Если он находит что какая -то из их имеетзначение отличное от значения поля snum, предикат будет верен, и выве-дет выбранные поля из текущей комбинации строк. Если же значение snumс данным значением cnum в наш таблице совпадает, эта команда не произ-ведет никакого вывода.
Больше псевдонимов
Хотя обьединение таблицы с собой - это первая ситуация когда понятночто псевдонимы необходимы, вы не ограничены в их использовании что бытолько отличать копию одлной таблицы от ее оригинала. Вы можете ис-пользовать псевдонимы в любое время когда вы хотите создать альтерна-тивные имена для ваших таблиц в команде. Например, если ваши таблицыимеют очень длинные и сложные имена, вы могли бы определить простыеодносимвольные псевдонимы, типа a и b, и использовать их вместо иментаблицы в предложении SELECT и предикате. Они будут также использо-ваться с соотнесенными подзапросами(обсуждаемыми в Главе 11).
Еще больше комплексных
объединений
Вы можете использовать любое число псевдонимов для одной таблицы взапросе, хотя использование более двух в данном предложении SELECT *будет излишеством. Предположим что вы еще не назначили ваших заказчи-ков к вашему продавцу. Компании должна назначить каждому продавцу пер-воначально трех заказчиков, по одному для каждого рейтингового значе-ния. Вы лично можете решить какого заказчика какому продавцу назна-чить, но следующий запрос вы используете чтобы увидеть все возможныекомбинации заказчиков которых вы можете назначать. ( Вывод показывает-ся в Рисунке 9.3 ): SELECT a.cnum, b.cnum, c.cnum
FROM Customers a, Customers b, Customers c WHERE a.rating = 100 AND b.rating = 200 AND c.rating = 300; =============== SQL Execution Log ============== | | | AND c.rating = 300; | | =============================================== | | cnum cnum cnum | | ----- ------ ------ | | 2001 2002 2004 | | 2001 2002 2008 | | 2001 2003 2004 | | 2001 2003 2008 | | 2006 2002 2004 | | 2006 2002 2008 | | 2006 2003 2004 | | 2006 2003 2008 | | 2007 2002 2004 | | 2007 2002 2008 | | 2007 2003 2004 | | 2007 2003 2008 | ================================================= Рисунок 9.3 Комбинация пользователей с различными значениями
рейтинга
Как вы можете видеть, этот запрос находит все комбинации заказчиковс тремя значениями оценки, поэтому первый столбец состоит из заказчи-ков с оценкой 100, второй с 200, и последний с оценкой 300. Они повто-ряются во всех возможных комбинациях. Это - сортировка группировки ко-торая не может быть выполнена с GROUP BY или ORDER BY, поскольку онисравнивают значения только в одном столбце вывода. Вы должны также понимать, что не всегда обязательно использоватькаждый псевдоним или таблицу которые упомянуты в предложении FROM зап-роса, в предложении SELECT. Иногда, предложение или таблица становятсязапрашиваемыми исключительно потому что они могут вызываться в преди-кате запроса. Например, следующий запрос находит всех заказчиков раз-мещенных в городах где продавец Serres ( snum 1002 ) имеет заказиков (вывод показывается в Рисунке 9.4 ): SELECT b.cnum, b.cname
FROM Customers a, Customers b WHERE a.snum = 1002 AND b.city = a.city; =============== SQL Execution Log ============ | | | SELECT b.cnum, b.cname | | FROM Customers a, Customers b | | WHERE a.snum = 1002 | | AND b.city = a.city; | | ==============================================| | cnum cname | | ------ --------- | | 2003 Liu || 2008 Cisneros |
| 2004 Grass | ============================================= Рисунок 9.4 Нахождение заказчиков в городах относящихся к Serres. Псевдоним a будет делать предикат неверным за исключением случаякогда его значение столбца snum = 1002. Таким образом псевдоним опус-кает все, кроме заказчиков продавца Serres. Псевдоним b будет вернымдля всех строк с тем же самым значением города что и текущее значениегорода для a; в ходе запроса, строка псевдонима b будет верна один разкогда значение города представлено в a. Нахождение этих строк псевдо-нима b - единственая цель псевдонима a, поэтоиму мы не выбираем всестолбцы подряд. Как вы можете видеть, собственные заказчики Serres вы-бираются при нахождении их в том же самом городе что и он сам, поэтомувыбор их из псевдонима a необязателен. Короче говоря, псевдоним назхо-дит строки заказчиков Serres, Liu и Grass. Псевдоним b находит всехзаказчиков размещенных в любом из их городов ( San Jose и Berlin соот-ветственно ) включая, конечно, самих - Liu и Grass. Вы можете также создать обьединение которое включает и различныетаблицы и псевдонимы одиночной таблицы. Следующий запрос объединяеттаблицу Пользователей с собой: чтобы найти все пары заказчиков обслу-живаемых одним продавцом. В то же самое время, этот запрос объединяетзаказчика с таблицей Продавцов с именем этого продавца ( вывод показанна Рисунке 9.5 ):
SELECT sname, Salespeople.snum, first.cname second.cname FROM Customers first, Customers second, Salespeople WHERE first.snum = second.snum AND Salespeople.snum = first.snum AND first.cnum < second.cnum; =============== SQL Execution Log ================== | | | SELECT cname, Salespeople.snum, first.cname | | second.cname | | FROM Customers first, Customers second, Salespeople | | WHERE first.snum = second.snum | | AND Salespeople.snum = first.snum | | AND first.cnum < second.cnum; | | ====================================================| | cname snum cname cname | | ------ ------ -------- -------- | | Serres 1002 Liu Grass | | Peel 1001 Hoffman Clemens |=====================================================
Рисунок 9.5: Объединение таблицы с собой и с другой таблицей
РЕЗЮМЕ
Теперь Вы понимаете возможности объединения и можете использовать ихдля ограничения связей с таблицей, между различными таблицами, или вобоих случаях. Вы могли видеть некоторые возможности объединения прииспользовании его способностей. Вы теперь познакомились с терминамипорядковые переменные, корреляционные переменные и предложения (этатерминология будет меняться от изделия к изделию, так что мы предлага-ем Вам познакомится со всеми тремя терминами ). Кроме того Вы поняли,немного, как в действительности работают запросы. Следующим шагом после комбинации многочисленых таблиц или многочис-леных копий одной таблицы в запросе, будет комбинация многочисленныхзапросов, где один запрос будет производить вывод который будет затемуправлять работой другого запроса. Это другое мощное средство SQL, окотором мы расскажем в Главе 10 и более тщательно в последующих гла-вах.
Работа с SQL
1. Напишите запрос который бы вывел все пары продавцов живущих в одном и том же городе. Исключите комбинации продавцов с ними же, а также дубликаты строк выводимых в обратным порядке.2. Напишите запрос который вывел бы все пары порядков по данным заказ- чикам, именам этих заказчиков, и исключал дубликаты из вывода, как в предыдущем вопросе.3. Напишите запрос который вывел бы имена(cname) и города(city) всех заказчиков с такой же оценкой(rating) как у Hoffmanа. Напишите зап- рос использующий поле cnum Hoffmanа а не его оценку, так чтобы оно могло быть использовано если его оценка вдруг изменится. ( См. Приложение A для ответов. )10. Вставка одного запроса
внутрь другого
В КОНЕЦ ГЛАВЫ 9, МЫ ГОВОРИЛИ ЧТО ЗАПРОСЫ могут управлять другимизапросами. В этой главе, вы узнаете как это делается ( большей частью), помещая запрос внутрь предиката другого запроса, и используя выводвнутреннего запроса в верном или неверном условии предиката. Вы сможе-те выяснить какие виды операторов могут использовать подзапросы и пос-мотреть как подзапросы работают со средствами SQL , такими как DIS-TINCT, с составными функциями и выводимыми выражения. Вы узнаете какиспользовать подзапросы с предложением HAVING и получите некоторыенаставления как правильно использовать подзапросы.
Как работает подзапрос?
С помощью SQL вы можете вкладывать запросы внутрь друга друга. Обыч-но, внутренний запрос генерирует значение которое проверяется в преди-кате внешнего запроса, определяющего верно оно или нет. Например,предположим что мы знаем имя продавца: Motika, но не знаем значениеего поля snum, и хотим извлечь все порядки из таблицы Порядков. Имеет-ся один способ чтобы сделать это( вывод показывается в Рисунке 10.1 ): SELECT *
FROM Orders WHERE snum = ( SELECT snum FROM Salespeople WHERE sname = 'Motika'); Чтобы оценить внешний( основной ) запрос, SQL сначала должен оценить
внутренний запрос ( или подзапрос ) внутри предложения WHERE. Он дела-ет это так как и должен делать запрос имеющий единственную цель -отыскать через таблицу Продавцов все строки, где поле sname равно зна-чению Motika, и затем извлечь значения поля snum этих строк. Единственной найденной строкой естественно будет snum = 1004. ОднакоSQL, не просто выдает это значение, а помещает его в предикат основно-го запроса вместо самого подзапроса, так чтобы предиката прочитал что WHERE snum = 1004
=============== SQL Execution Log ============== | | | SELECT * | | FROM Orders | | WHERE snum = | | (SELECT snum | | FROM Salespeople | | WHERE sname = 'Motika'); | |=================================================| | onum amt odate cnum snum || ----- ------- ---------- ----- ----- |
| 3002 1900.10 10/03/1990 2007 1004 | | | ================================================= Рисунок 10.1: Использование подзапроса Основной запрос затем выполняется как обычно с вышеупомянутыми ре-зультатами. Конечно же, подзапрос должен выбрать один и только одинстолбец, а тип данных этого столбца должен совпадать с тем значением скоторым он будет сравниваться в предикате. Часто, как показано выше,выбранное поле и его значение будут иметь одинаковые имена( в этомслучае, snum ), но это необязательно. Конечно, если бы мы уже знали номер продавца Motika, мы могли быпросто напечатать WHERE snum = 1004 и выполнять далее с подзапросом в целом, но это было бы не так универ-сально. Это будет продолжать работать даже если номер Motika изменил-ся, а, с помощью простого изменения имени в подзапросе, вы можете ис-пользовать его для чего угодно.
Значения, которые могут
выдавать подзапросы
Скорее всего было бы удобнее, чтобы наш подзапрос в предыдущем при-мере возвращал одно и только одно значение.Имея выбранным поле snum " WHERE city = "London" вместо "WHERE sname
= 'Motika", можно получить несколько различных значений. Это можетсделать уравнение в предикате основного запроса невозможным для оценкиверности или неверности, и команда выдаст ошибку. При использовании подзапросов в предикатах основанных на реляционныхоператорах ( уравнениях или неравенствах, как объяснено в Главе 4 ),вы должны убедиться что использовали подзапрос который будет выдаватьодну и только одну строку вывода. Если вы используете подзапрос кото-рый не выводит никаких значений вообще, команда не потерпит неудачи;но основной запрос не выведет никаких значений. Подзапросы которые непроизводят никакого вывода (или нулевой вывод) вынуждают рассматриватьпредикат ни как верный ни как неверный, а как неизвестный. Однако, не-известный предикат имеет тот же самый эффект что и неверный: никакиестроки не выбираются основным запросом ( смотри Главу 5 для подробнойинформации о неизвестном предикате ). Это плохая стратегия, чтобы делать что-нибудь подобное следующему: SELECT *
FROM Orders WHERE snum = ( SELECT snum FROM Salespeople WHERE city = Barcelona ); Поскольку мы имеем только одного продавца в Barcelona - Rifkin, то
подзапрос будет выбирать одиночное значение snum и следовательно будетпринят. Но это - только в данном случае. Большинство SQL баз данныхимеют многочисленых пользователей, и если другой пользователь добавитнового продавца из Barcelona в таблицу, подзапрос выберет два значе-ния, и ваша команда потерпит неудачу.
DISTINCT с подзапросами
Вы можете, в некоторых случаях, использовать DISTINCT чтобы вынудитьподзапрос генерировать одиночное значение. Предположим что мы хотимнайти все порядки кредитований для тех продавцов которые обслуживаютHoffmanа ( cnum = 2001 ). Имеется один способ чтобы сделать это ( вывод показывается в Рисунке10.2 ): SELECT * FROM Orders WHERE snum = ( SELECT DISTINCT snum FROM Orders WHERE cnum = 2001 ); =============== SQL Execution Log ============== | SELECT * | | FROM Orders | | WHERE snum = | | (SELECT DISTINCT snum | | FROM Orders | | Where cnum = 2001); | | =============================================== | | onum amt odate cnum snum || ----- --------- --------- ------ ------- |
| 3003 767.19 10/03/1990 2001 1001 | | 3008 4723.00 10/05/1990 2006 1001 | | 3011 9891.88 10/06/1990 2006 1001 | ================================================ Рисунок 10.2: Использование DISTINCT чтобы вынудить получение одного значения из подзапроса Подзапрос установил что значение поля snum совпало с Hoffman - 1001,и затем основной запрос выделил все порядки с этим значением snum изтаблицы Порядков( не разбирая, относятся они к Hoffman или нет). Таккак каждый заказчик назначен к одному и только этому продавцу, мы зна-ем что каждая строка в таблице Порядков с данным значением cnum должнаиметь такое же значение snum. Однако так как там может быть любое чис-ло таких строк, подзапрос мог бы вывести много ( хотя и идентичных )значений snum для данного поля cnum. Аргумент DISTINCT предотвращаетэто. Если наш подзапрос возвратит более одного значения, это будетуказывать на ошибку в наших данных - хорошая вещь для знающих об этом.Альтернативный подход должен быть чтобы ссылаться к таблице Заказчикова не к таблице Порядков в подзапросе. Так как поле cnum - это первич-ный ключ таблицы Заказчика, запрос выбирающий его должен произвеститолько одно значение. Это рационально только если вы как пользовательимеете доступ к таблице Порядков но не к таблице Заказчиков. В этомслучае, вы можете использовать решение которое мы показали выше. ( SQLимеет механизмы которые определяют - кто имеет привилегии чтобы делатьчто-то в определенной таблице. Это будет объясняться в Главе 22.) По-жалуйста учтите, что методика используемая в предшествующем примереприменима только когда вы знаете, что два различных поля в таблицедолжны всегда совпадать, как в нашем случае. Эта ситуация не являетсятипичной в реляционных базах данных, она являеться исключением из пра-вил.
Предикаты с подзапросами
являются необратимыми
Вы должны обратить внимание что предикаты включающие подзапросы, ис-пользуют выражение < скалярная форма > < оператор > < подзапрос >, а не < подзапрос > < оператор > < скалярное выражение > или, < подзапрос > < оператор > < подзапрос >. Другими словами, вы не должны записывать предыдущий пример так: SELECT *
FROM Orders WHERE ( SELECT DISTINCT snum FROM Orders WHERE cnum = 2001 )= snum;
В строгой ANSI реализации, это приведет к неудаче, хотя некоторыепрограммы и позволяют делать такие вещи. ANSI также предохраняет васот появления обеих значений при сравнении, которые нужно вывести с по-мощью подзапроса.
Использование агрегатных
функций в подзапросах
Один тип функций, который автоматически может производить одиночноезначение для любого числа строк, конечно же, - агрегатная функция. Любой запрос использующий одиночную функцию агрегата без предложенияGROUP BY будет выбирать одиночное значение для использования в основ-ном предикате. Например, вы хотите увидеть все порядки имеющие суммуприобретений выше средней на 4-е Октября ( вывод показан на Рисуноке10.3 ): SELECT * FROM Orders WHERE amt > ( SELECT AVG (amt) FROM Orders WHERE odate = 10/04/1990 ); =============== SQL Execution Log ============== | | | SELECT * | | FROM Orders | | WHERE amt > | | (SELECT AVG (amt) | | FROM Orders | | WHERE odate = 01/04/1990 ); | | =============================================== | | onum amt odate cnum snum || ----- -------- ---------- ----- ----- |
| 3002 1900.10 10/03/1990 2007 1004 | | 3005 2345.45 10/03/1990 2003 1002 | | 3006 1098.19 10/03/1990 2008 1007 | | 3009 1713.23 10/04/1990 2002 1003 | | 3008 4723.00 10/05/1990 2006 1001 | | 3010 1309.95 10/06/1990 2004 1002 | | 3011 9891.88 10/06/1990 2006 1001 | ================================================ Рисунок 10.3: Выбор всех сумм со значением выше средней на 10/04/1990 Средняя сумма приобретений на 4 Октября - 1788.98 ( 1713.23 + 75.75)делится пополам, что в целом равняется = 894.49. Все строки со значе-нием в поле amt выше этого - являются выбраными. Имейте ввиду что сгруппированные агрегатные функции, которые являют-ся агрегатными функциями определенными в терминах предложения GROUPBY, могут производить многочисленые значения. Они, следовательно, непозволительны в подзапросах такого характера. Даже если GROUP BY и HA-VING используются таким способом, что только одна группа выводится спомощью подзапроса, команда будет отклонена в принципе. Вы должны ис-пользовать одиночную агрегатную функцию с предложением WHERE что уст-ранит нежелательные группы. Например, следующий запрос который долженнайти среднее значение комиссионных продавца в Лондоне - SELECT AVG (comm)
FROM Salespeople GROUP BY city HAVlNG city = "London"; не может использоваться в подзапросе! Во всяком случае это не лучший спо-соб формировать запрос. Другим способом может быть - SELECT AVG (comm)
FROM Salespeople WHERE city = "London";
Использование подзапросов,
которые выдают много строк
с помощью оператора IN
Вы можете использовать подзапросы которые производят любое числострок если вы используете специальный оператор IN ( операторы BETWEEN,LIKE, и IS NULL не могут использоваться с подзапросами ). Как вы пом-ните, IN определяет набор значений, одно из которых должно совпадать сдругим термином уравнения предиката в порядке, чтобы предикат был вер-ным. Когда вы используете IN с подзапросом, SQL просто формирует этотнабор из вывода подзапроса. Мы можем, следовательно, использовать INчтобы выполнить такой же подзапрос который не будет работать с реляци-онным оператором, и найти все атрибуты таблицы Порядков для продавца вЛондоне ( вывод показывается в Рисунке 10.4 ): SELECT *
FROM Orders WHERE snum IN ( SELECT snum FROM Salespeople WHERE city = "LONDON" ); =============== SQL Execution Log ============== | | | SELECT * | | FROM Orders | | WHERE snum IN | | (SELECT snum | | FROM Salespeople | | WHERE city = 'London'); | | =============================================== | | onum amt odate cnum snum || ----- -------- ---------- ----- ------ |
| 3003 767.19 10/03/1990 2001 1001 | | 3002 1900.10 10/03/1990 2007 1004 | | 3006 1098.19 10/03/1990 2008 1007 | | 3008 4723.00 10/05/1990 2006 1001 | | 3011 9891.88 10/06/1990 2006 1001 | ================================================ Рисунок 10. 4: Использование подзапроса с IN В ситуации подобно этой, подзапрос - более прост для пользователячтобы понимать его и более прост для компьютера чтобы его выполнить,чем если бы Вы использовали обьединение: SELECT onum, amt, odate, cnum, Orders.snum
FROM Orders, Salespeople WHERE Orders.snum = Salespeople.snum AND Salespeople.city = "London"; Хотя это и произведет тот же самый вывод что и в примере с подзапро-
сом, SQL должен будет просмотреть каждую возможную комбинацию строк издвух таблиц и проверить их снова по составному предикату. Проще и эф-фективнее извлекать из таблицы Продавцов значения поля snum где city ="London", и затем искать эти значения в таблице Порядков, как это де-лается в варианте с подзапросом. Внутренний запрос дает нам snums=1001и snum=1004. Внешний запрос, затем, дает нам строки из таблицы Поряд-ков где эти поля snum найдены. Строго говоря, быстрее или нет работает вариант подзапроса, практи-чески зависит от реализации - в какой программе вы это используете.Эта часть вашей программы называемой - оптимизатор, пытается найти на-иболее эффективный способ выполнения ваших запросов. Хороший оптимизатор во всяком случае преобразует вариант обьединенияв подзапрос, но нет достаточно простого способа для вас чтобы выяснитьвыполнено это или нет. Лучше сохранить ваши запросы в памяти чем пола-гаться полностью на оптимизатор. Конечно вы можете также использовать оператор IN, даже когда вы уве-рены что подзапрос произведет одиночное значение. В любой ситуации гдевы можете использовать реляционный оператор сравнения (=), вы можетеиспользовать IN. В отличие от реляционных операторов, IN не может зас-тавить команду потерпеть неудачу если больше чем одно значение выбраноподзапросом. Это может быть или преимуществом или недостатком. Вы неувидите непосредственно вывода из подзапросов; если вы полагаете чтоподзапрос собирается произвести только одно значение, а он производитразличные. Вы не сможете объяснить различия в выводе основного запро-са. Например, рассмотрим команду, которая похожа на предыдущую: SELECT onum, amt, odate
FROM Orders WHERE snum = ( SELECT snum FROM OrdersWHERE cnum = 2001 );
Вы можете устранить потребность в DISTINCT используя IN вместо (=),подобно этому:
SELECT onum, amt, odate FROM Orders WHERE snum IN ( SELECT snum FROM OrdersWHERE cnum = 2001 );
Что случится если есть ошибка и один из порядков был акредитован кразличным продавцам? Версия использующая IN будет давать вам все по-рядки для обоих продавцов. Нет никакого очевидного способа наблюденияза ошибкой, и поэтому сгенерированные отчеты или решения сделанные наоснове этого запроса не будут содержать ошибки. Вариант использующий (= ) , просто потерпит неудачу. Это, по крайней мере, позволило вам узнать что имеется такая пробле-ма. Вы должны затем выполнять поиск неисправности, выполнив этот под-запрос отдельно и наблюдая значения которые он производит. В принципе, если вы знаете что подзапрос должен( по логике) вывеститолько одно значение, вы должны использовать = . IN является подходя-щим, если запрос может ограниченно производить одно или более значе-ний, независимо от того ожидаете вы их или нет. Предположим, мы хотимзнать комиссионные всех продавцов обслуживающих заказчиков в Лондоне: SELECT comm
FROM Salespeople WHERE snum IN ( SELECT snum FROM Customers WHERE city = "London" ); Выводимыми для этого запроса, показанного в Рисунке 10.5, являются
значения комиссионных продавца Peel ( snum = 1001 ), который имеетобоих заказчиков в Лондоне. Это - только для данного случая. Нет ника-кой причины чтобы некоторые заказчики в Лондоне не могли быть назначе-ными к кому-то еще. Следовательно, IN - это наиболее логичная формачтобы использовать ее в запросе. =============== SQL Execution Log ==============
| SELECT comm | | FROM Salespeople | | WHERE snum IN | | (SELECT snum | | FROM Customers | | WHERE city = 'London'); || =============================================== |
| comm | | ------- | | 0.12 | ================================================Рисунок 10.5 Использование IN с подзапросом для вывода одного значения Между прочим, префикс таблицы для поля city необязателен в предыду-щем примере, несмотря на возможную неоднозначность между полями cityтаблицы Заказчика и таблицы Продавцов. SQL всегда ищет первое поле в таблице обозначенной в предложенииFROM текущего подзапроса. Если поле с данным именем там не найдено,проверяются внешние запросы. В вышеупомянутом примере, "city" в пред-ложении WHERE означает что имеется ссылка к Customer.city( поле cityтаблицы Заказчиков). Так как таблица Заказчиков указана в предложенииFROM текущего запроса, SQL предполагает что это - правильно. Это пред-положение может быть отменено полным именем таблицы или префиксомпсевдонима, о которых мы поговорим позже когда будем говорить об соот-несенных подзапросах. Если возможен беспорядок, конечно же, лучше все-го использовать префиксы.
Подзапросы выбирают
одиночные столбцы
Смысл всех подзапросов обсужденных в этой главе тот, что все они вы-бирают одиночный столбец. Это обязательно, поскольку выбранный выводсравнивается с одиночным значением. Подтверждением этому то, что SE-LECT * не может использоваться в подзапросе. Имеется исключение изэтого, когда подзапросы используются с оператором EXISTS, который мыбудем представлять в Главе 12.
Использование выражений в
подзапросах
Вы можете использовать выражение основанное на столбце, а не простосам столбец, в предложении SELECT подзапроса. Это может быть выполненоили с помощью реляционных операторов или с IN. Например, следующийзапрос использует реляционный оператор = ( вывод показывается в Рисун-ке 10.6 ):
SELECT * FROM Customers WHERE cnum = ( SELECT snum + 1000 FROM Salespeople WHERE sname = Serres ); Он находит всех заказчиков чье значение поля cnum равное 1000, выше
поля snum Serres. Мы предполагаем что столбец sname не имеет никаких
двойных значений ( это может быть предписано или UNIQUE INDEX, обсуж-даемым в Главе 17, или ограничением UNIQUE, обсуждаемым в Главе 18 );иначе
=============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE cnum = | | (SELECT snum + 1000 | | WHERE Salespeople | | WHERE sname = 'Serres' | | ============================================= | | cnum cname city rating snum || ----- -------- ---- ------ ----- |
| 2002 Giovanni Rome 200 1003 | ============================================= Рисунок 10.6: Использование подзапроса с выражением подзапрос может произвести многочисленые значения. Когда поля snum исnum не имеют такого простого функционального значения как напримерпервичный ключ , что не всегда хорошо, запрос типа вышеупомянутого не-вероятно полезен.
Подзапросы в предложении
HAVING
Вы можете также использовать подзапросы внутри предложения HAVING.Эти подзапросы могут использовать свои собственные агрегатные функцииесли они не производят многочисленых значений или использовать GROUPBY или HAVING. Следующий запрос является этому примером ( вывод пока-
зывается в Рисунке 10.7 ): SELECT rating, COUNT ( DISTINCT cnum )
FROM Customers GROUP BY rating HAVING rating > ( SELECT AVG (rating) FROM Customers WHERE city = " San Jose'; =============== SQL Execution Log ============ | | | SELECT rating,count (DISTINCT cnum) | | FROM Customers | | GROUP BY rating | | HAVING rating > | | (SELECT AVG (rating)snum + 1000 | | FROM Custimers | | WHERE city = 'San Jose' | |============================================ |
| rating | | -------- -------- | | 200 2 | ================================================ Рисунок 10.7: Нахождение заказчиков с оценкой выше среднего в San Jose Эта команда подсчитывает заказчиков с оценками выше среднего в SanJose. Так как имеются другие оценки отличные от 300, они должны бытьвыведены с числом номеров заказчиков которые имели эту оценку.
РЕЗЮМЕ
Теперь вы используете запросы в иерархической манере. Вы видели, чтоиспользование результата одного запроса для управления другим, расши-ряет возможности позволяющие выполнить большее количество функций. Вытеперь понимаете как использовать подзапросы с реляционными оператора-ми также как и со специальным оператором IN, или в предложении WHEREили в предложении HAVING внешнего запроса. В следующих главах, мы будем разрабатывать подзапросы. Сначала вГлаве 11, мы обсудим другой вид подзапроса, который выполняется от-дельно для каждой строки таблицы вызываемой во внешнем запросе. Затем,в Главе 12 и 13, мы представим вас нескольким специальным операторамкоторые функционируют на всех подзапросах, как это делает IN, за иск-лючением когда эти операторы могут использоваться только в подзапро-сах.