数据库完整性
数据库的完整性(integrity)是指数据的正确性(correctness)和相容性(compat-ability)。数据的正确性是指数据是符合现实世界语义、反映当前实际状况的;数据的相容性是指数据库同一对象在不同关系表中的数据是符合逻辑的。
例如,学生的学号必须唯一,性别只能是男或女,本科学生年龄的取值范围为14—50的整数,学生所选的课程必须是学校开设的课程,学生所在的院系必须是学校已成立的院系等。
数据的完整性和安全性是两个既有联系又不尽相同的概念。数据的完整性是为了防止数据库中存在不符合语义的数据,也就是防止数据库中存在不正确的数据。数据的安全性是保护数据库防止恶意破坏和非法存取。因此,完整性检查和控制的防范对象是不合语义的、不正确的数据,防止它们进入数据库。安全性控制的防范对象是非法用户和非法操作,防止他们对数据库数据的非法存取。
为维护数据库的完整性,数据库管理系统必须能够实现如下功能。
关系数据库-关系的完整性中己经讲解了关系数据库三类完整性约束的基本概念,下面将介绍SQL语言中实现这些完整性控制功能的方法。
1. 提供定义完整性约束条件的机制
完整性约束条件也称为完整性规则,是数据库中的数据必须满足的语义约束条件。它表达了给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效和相容。SQL标准使用了一系列概念来描述完整性,包括关系模型的实体完整性、参照完整性和用户定义完整性。这些完整性一般由SQL的数据定义语言语句来实现,它们作为数据库模式的一部分存入数据字典中。
2. 提供完整性检查的方法
数据库管理系统中检查数据是否满足完整性约束条件的机制称为完整性检查。一般在INSERT
、UPDATE
、DELETE
语句执行后开始检查,也可以在事务提交时检查。检查这些操作执行后数据库中的数据是否违背了完整性约束条件。
3. 进行违约处理
数据库管理系统若发现用户的操作违背了完整性约束条件将采取一定的动作,如拒绝(NO ACTION)执行该操作或级联(CASCADE)执行其他操作,进行违约处理以保证数据 的完整性。
早期的数据库管理系统不支持完整性检查,因为完整性检查费时费资源。现在商用的关系数据库管理系统产品都支持完整性控制,即完整性定义和检查控制由关系数据库管理系统实现,不必由应用程序来完成,从而减轻了应用程序员的负担。更重要的是,关系数据库管理系统使得完整性控制成为其核心支持的功能,从而能够为所有用户和应用提供一致的数据库完整性。因为由应用程序来实现完整性控制是有漏洞的,有的应用程序定义的完整性约束条件可能被其他应用程序破坏,数据库数据的正确性仍然无法保障。
实体完整性
定义实体完整性
关系模型的实体完整性在CREATE TABLE
中用PRIMARY KEY
定义。对单属性构成的码有两种说明方法,一种是定义为列级约束条件,另一种是定义为表级约束条件。对多个属性构成的码只有一种说明方法,即定义为表级约束条件。
例1:将Student
表中的Sno
属性定义为码。
|
|
或者
|
|
例2:将SC
表中的Sno
、Cno
属性组定义为码。
|
|
实体完整性检查和违约处理
用PRIMARY KEY
短语定义了关系的主码后,每当用户程序对基本表插入一条记录或对主码列进行更新操作时,关系数据库管理系统将按照关系数据库-实体完整性中讲解的实体完整性规则自动进行检查。包括:
(1)检查主码值是否唯一,如果不唯一则拒绝插入或修改。
(2)检查主码的各个属性是否为空,只要有一个为空就拒绝插入或修改。从而保证了实体完整性。
检查记录中主码值是否唯一的一种方法是进行全表扫描,依次判断表中每一条记录的主码值与将插入记录的主码值(或者修改的新主码值)是否相同,如图1所示。
图1 用全表扫描方法检查主码唯一性
全表扫描是十分耗时的。为了避免对基本表进行全表扫描,关系数据库管理系统一般都 在主码上自动建立一个索引,如图2的B+树索引,通过索引查找基本表中是否已经存在新的主码值将大大提高效率。例如,如果新插入记录的主码值是25,通过主码索引,从B+树的根结点开始查找,只要读取三个结点就可以知道该主码值已经存在,所以不能插入这条记录。这三个结点是根结点(51)、中间结点(12 30)和叶结点(15 20 25)。如果新插入记录的主码值是86,也只要查找三个结点就可以知道该主码值不存在,所以可以插入该记录。
图2 使用索引检查主码唯一
参照完整性
定义参照完整性
关系模型的参照完整性在CREATE TABLE
中用FOREIGN KEY
短语定义哪些列为外码,用REFERENCES
短语指明这些外码参照哪些表的主码。
例如,关系SC
中一个元组表示一个学生选修的某门课程的成绩,(Sno, Cno)
是主码。Sno
、Cno
分别参照引用Student
表的主码和Course
表的主码。
例3:定义SC中的参照完整性。
|
|
参照完整性检查和违约处理
参照完整性将两个表中的相应元组联系起来了。因此,对被参照表和参照表进行增、删、改操作时有可能破坏参照完整性,必须进行检查以保证这两个表的相容性。
例如,对表SC
和Student
有4种可能破坏参照完整性的情况,如表1所示。
被参照表(例如Student) | 参照表(例如SC) | 违约处理 |
---|---|---|
插入元组 | 拒绝 | |
修改外码值 | 拒绝 | |
删除元组 | 拒绝/级联删除/设置为空值 | |
修改主码值 | 拒绝/级联修改/设置为空值 |
表1 可能破坏参照完整性的情况及违约处理
(1)SC
表中增加一个元组,该元组的Sno
属性值在表Student
中找不到一个元组,其Sno
属性值与之相等。
(2)修改SC
表中的一个元组,修改后该元组的Sno
属性值在表Student
中找不到一个 元组,其Sno
属性值与之相等。
(3)从Student
表中删除一个元组,造成SC
表中某些元组的Sno
属性值在表Student
中找不到一个元组,其Sno
属性值与之相等。
(4)修改Student
表中一个元组的Sno
属性,造成SC
表中某些元组的Sno
属性值在表Student
中找不到一个元组,其Sno
属性值与之相等。
当上述的不一致发生时,系统可以采用以下策略加以处理。
(1)拒绝(NO ACTION
)执行。不允许该操作执行。该策略一般设置为默认策略。
(2)级联(CASCADE
)操作。当删除或修改被参照表(Student
)的一个元组导致与参照表(SC
)的不一致时,删除或修改参照表中的所有导致不一致的元组。例如,删除Student
表中Sno
值为'201215121'
的元组,则从要SC
表中级联删除
SC.Sno='201215121'
的所有元组。
(3)设置为空值。当删除或修改被参照表的一个元组时造成了不一致,则将参照表中的所有造成不一致的元组的对应属性设置为空值。例如,有下面两个关系:
其中学生关系的“专业号”是外码,因为专业号是专业关系的主码。
假设专业表中某个元组被删除,专业号为12,按照设置为空值的策略,就要把学生表 中专业号=12
的所有元组的专业号设置为空值。这对应了这样的语义:某个专业删除了,该专业的所有学生专业未定,等待重新分配专业。
这里讲解一下外码能否接受空值的问题。
例如,学生表中“专业号”是外码,按照应用的实际情况可以取空值,表示这个学生的专业尚未确定。但在学生一选课数据库中,关系Student
为被参照关系,其主码为Sno
;SC
为参照关系,Sno
为外码,它能否取空值呢?答案是否定的。因为Sno
为SC
的主属性,按照实体完整性Sno
不能为空值。若SC
的Sno
为空值,则表明尚不存在的某个学生,或者某个不知学号的学生,选修了某门课程,其成绩记录在Grade
列中。这与学校的应用环境是不相符的,因此SC
的Sno
列不能取空值。同样,SC
的Cno
是外码,也是SC
的主属性,也不能取空值。
因此对于参照完整性,除了应该定义外码,还应定义外码列是否允许空值。
一般地,当对参照表和被参照表的操作违反了参照完整性时,系统选用默认策略,即拒绝执行。如果想让系统采用其他策略则必须在创建参照表时显式地加以说明。
例4:显式说明参照完整性的违约处理示例。
|
|
可以对DELETE
和UPDATE
采用不同的策略。例如,例4中当删除被参照表Course
表中的元组,造成与参照表(SC
表)不一致时,拒绝删除被参照表的元组;对更新操作则采取级联更新的策略。
从上面的讨论可以看到,关系数据库管理系统在实现参照完整性时,除了要提供定义主码、外码的机制外,还需要提供不同的策略供用户选择。具体选择哪种策略,要根据应用环境的要求确定。
用户定义的完整性
用户定义的完整性就是针对某一具体应用的数据必须满足的语义要求。目前的关系数据库管理系统都提供了定义和检验这类完整性的机制,使用了和实体完整性、参照完整性相同的技术和方法来处理它们,而不必由应用程序承担这一功能。
属性上的约束条件
属性上约束条件的定义
在CREATE TABLE
中定义属性的同时,可以根据应用要求定义属性上的约束条件,即属性值限制,包括:
◦列值非空(NOT NULL
)。
◦列值唯一(UNIQUE
)。
◦检查列值是否满足一个条件表达式(CHECK
短语)。
(1)不允许取空值
例5:在定义SC
表时,说明Sno
、Cno
、Grade
属性不允许取空值。
|
|
(2)列值唯一
例6:建立部门表DEPT
,要求部门名称Dname
列取值唯一,部门编号Deptno
列为主码。
|
|
(3)用CHECK
短语指定列值应该满足的条件
例7:Student
表的Ssex
只允许取“男”或“女”
|
|
例8:SC
表的Grade
的值应该在0和100之间。
|
|
属性上约束条件的检查和违约处理
当往表中插入元组或修改属性的值时,关系数据库管理系统将检查属性上的约束条件是否被满足,如果不满足则操作被拒绝执行。
元组上的约束条件
元组上约束条件的定义
与属性上约束条件的定义类似,在CREATE TABLE
语句中可以用CHECK
短语定义元组上的约束条件,即元组级的限制。同属性值限制相比,元组级的限制可以设置不同属性之间的取值的相互约束条件。
例9:当学生的性别是男时,其名字不能以Ms.
打头。
|
|
性别是女性的元组都能通过该项CHECK
检查,因为Ssex='女'
成立;当性别是男性时,要通过检查则名字一定不能以Ms.
打头,因为Ssex='男'
时,条件要想为真值,Sname NOT LIKE 'Ms.%'
必须为真值。
元组上约束条件的检查和违约处理
当往表中插入元组或修改属性的值时,关系数据库管理系统将检查元组上的约束条件是否被满足,如果不满足则操作被拒绝执行。
完整性约束命名子句
以上讲解的完整性约束条件都在CREATE TABLE
语句中定义,SQL还在CREATE TABLE
语句中提供了完整性约束命名子句CONSTRAINT
,用来对完整性约束条件命名,从而可以灵活地增加、删除一个完整性约束条件。
完整性约束命名子句
|
|
<完整性约束条件>
包括NOT NULL
、UNIQUE
、PRIMARY KEY
、FOREIGN KEY
、CHECK
短语等。
例10:建立学生登记表Student
,要求学号在90000〜99999之间,姓名不能取空值,年龄小于30,性别只能是“男”或“女”。
|
|
在Student表上建立了5个约束条件,包括主码约束(命名为StudentKey
)以及C1
、C2
、C3
、C4
这4个列级约束。
例11:建立教师表TEACHER
,要求每个教师的应发工资不低于3000元。应发工资是工资列Sal
与扣除项Deduct
之和。
|
|
修改表中的完整性限制
可以使用ALTER TABLE
语句修改表中的完整性限制。
例12:去掉例10Student
表中对性别的限制。
|
|
例13:修改表Student
中的约束条件,要求学号改为在900000~999999之间,年龄由小于30改为小于40。
可以先删除原来的约束条件,再增加新的约束条件。
|
|
域中的完整性限制
在数据库系统概论和关系数据库中已经讲到,域是数据库中一个重要概念。一般地,域是一组具有相同数据类型的值的集合。SQL支持域的概念,并可以用CREATE DOMAIN
语句建立一个域以及该域应该满足的完整性约束条件,然后就可以用域来定义属性。这样定义的优点是,数据库中不同的属性可以来自同一个域,当域上的完整性约束条件改变时只要修改域的定义即可,而不必一一修改域上的各个属性。
例14:建立一个性别域,并声明性别域的取值范围。
|
|
这样例10中对Ssex
的说明可以改写为:
|
|
例15:建立一个性别域GenderDomain
,并对其中的限制命名。
|
|
例16:删除域GenderDomain
的限制条件GD
。
|
|
例17:在域GenderDomain
上增加性别的限制条件GDD
。
|
|
这样,通过例16和例17,就把性别的取值范围由('男','女')
改为(1,0)
。
断言
在SQL中可以使用数据定义语言中的CREATE ASSERTION
语句,通过声明性断言(declarative assertions)来指定更具一般性的约束。可以定义涉及多个表或聚集操作的比较复杂的完整性约束。断言创建以后,任何对断言中所涉及关系的操作都会触发关系数据库管理系统对断言的检查,任何使断言不为真值的操作都会被拒绝执行。
创建断言的语句格式
|
|
每个断言都被赋予一个名字,<CHECK子句>
中的约束条件与WHERE
子句的条件表达式类似。
例18:限制数据库课程最多60名学生选修。
|
|
每当学生选修课程时,将在SC
表中插入一条元组(Sno, Cno, NULL)
,ASSE_SC_DB_NUM
断言被触发检查。如果选修数据库课程的人数已经超过60人,CHECK
子句返回值为“假”,对SC表的插入操作被拒绝。
例19:限制每一门课程最多60名学生选修。
|
|
例20:限制每个学期每一门课程最多60名学生选修。
首先修改SC
表的模式,增加一个“学期(TERM
)”的属性。
|
|
然后定义断言:
|
|
删除断言的语句格式
|
|
如果断言很复杂,则系统在检测和维护断言上的开销较高,这是在使用断言时应该注意的。
触发器
触发器(trigger)是用户定义在关系表上的一类由事件驱动的特殊过程。一旦定义,触发器将被保存在数据库服务器中。任何用户对表的增、删、改操作均由服务器自动激活相应的触发器,在关系数据库管理系统核心层进行集中的完整性控制。触发器类似于约束,但是比约束更加灵活,可以实施更为复杂的检查和操作,具有更精细和更强大的数据控制能力。
触发器在SQL 99之后才写入SQL标准,但是很多关系数据库管理系统很早就支持触发器,因此不同的关系数据库管理系统实现的触发器语法各不相同、互不兼容。请读者在上机实验时注意阅读所用系统的使用说明。
定义触发器
触发器又叫做事件-条件-动作(event-condition-action)规则。当特定的系统事件(如对一个表的增、删、改操作,事务的结束等)发生时,对规则的条件进行检查,如果条件成立则执行规则中的动作,否则不执行该动作。规则中的动作体可以很复杂,可以涉及其他表和其他数据库对象,通常是一段SQL存储过程。
SQL使用CREATE TRIGGER
命令建立触发器,其一般格式为
|
|
下面对定义触发器的各部分语法进行详细说明。
(1) 只有表的拥有者,即创建表的用户才可以在表上创建触发器,并且一个表上只能 创建一定数量的触发器。触发器的具体数量由具体的关系数据库管理系统在设计时确定。
(2)触发器名。触发器名可以包含模式名,也可以不包含模式名。同一模式下,触发器名必须是唯一的,并且触发器名和表名必须在同一模式下。
(3)表名。触发器只能定义在基本表上,不能定义在视图上。当基本表的数据发生变化时,将激活定义在该表上相应触发事件的触发器,因此该表也称为触发器的目标表。
(4)触发事件。触发事件可以是INSERT
、DELETE
或UPDATE
,也可以是这几个事件的组合,如INSERT OR DELETE
等,还可以是UPDATE OF <触发列,···>
,即进一步指明修改哪些列时激活触发器。AFTER
/BEFORE
是触发的时机。AFTER
表示在触发事件的操作执行之后 激活触发器;BEFORE
表示在触发事件的操作执行之前激活触发器。
(5)触发器类型。触发器按照所触发动作的间隔尺寸可以分为行级触发器(FOR EACH ROW
)和语句级触发器(FOR EACH STATEMENT
)。
例如,假设在例11的TEACHER
表上创建了一个AFTER UPDATE
触发器,触发事件是UPDATE
语句:
|
|
假设表TEACHER
有1000行,如果定义的触发器为语句级触发器,那么执行完UPDATE
语句后触发动作体执行一次;如果是行级触发器,触发动作体将执行1000次。
(6)触发条件。触发器被激活时,只有当触发条件为真时触发动作体才执行,否则触发动作体不执行。如果省略WHEN
触发条件,则触发动作体在触发器激活后立即执行。
(7)触发动作体。触发动作体既可以是一个匿名PL/SQL过程块,也可以是对已创建存储过程的调用。如果是行级触发器,用户可以在过程体中使用NEW
和OLD
引用UPDATE
/INSERT
事件之 后的新值和UPDATE
/DELETE
事件之前的旧值;如果是语句级触发器,则不能在触发动作 体中使用NEW
或OLD
进行引用。
如果触发动作体执行失败,激活触发器的事件(即对数据库的增、删、改操作)就会终止执行,触发器的目标表或触发器可能影响的其他对象不发生任何变化。
例21:当对表SC
的Grade
属性进行修改时,若分数增加了10%,则将此次操作记录到另一个表SC_U(Sno,Cno,Oldgrade,Newgrade)
中,其中Oldgrade
是修改前的分数,Newgrade
是修改后的分数。
|
|
在本例中REFERENCING
指出引用的变量,如果触发事件是UPDATE
操作并且有FOR EACH ROW
子句,则可以引用的变量有OLD ROW
和NEW ROW
,分别表示修改之前的元组和修改之后的元组。若没有FOR EACH ROW
子句,则可以引用的变量有OLD TABLE
和NEW TABLE
,OLD TABLE
表示表中原来的内容,NEW TABLE
表示表中变化后的部分。
例22:每次对表Student
的插入操作所增加的学生个数记录到表Student-InsertLog
中。
|
|
在本例中出现的FOR EACH STATEMENT
,表示触发事件INSERT
语句执行完成后才执行一次触发器中的动作,这种触发器叫做语句级触发器。而例21中的触发器是行级触发器。默认的触发器是语句级触发器。DELTA
是一个关系名,其模式与Student
相同,包含的元组是INSERT
语句增加的元组。
例23:定义一个BEFORE
行级触发器,为教师表Teacher
定义完整性规则“教授的工资不得低于4000元,如果低于4000元,自动改为4000元”。
|
|
因为定义的是BEFORE
触发器,在插入和更新教师记录前就可以按照触发器的规则 调整教授的工资,不必等插入后再检查再调整。
激活触发器
触发器的执行是由触发事件激活,并由数据库服务器自动执行的。一个数据表上可能定义了多个触发器,如多个BEFORE
触发器、多个AFTER
触发器等,同一个表上的多个触发器激活时遵循如下的执行顺序:
(1)执行该表上的BEFORE
触发器。
(2)激活触发器的SQL语句。
(3)执行该表上的AFTER
触发器。
对于同一个表上的多个BEFORE
(AFTER
)触发器,遵循“谁先创建谁先执行”的原则,即按照触发器创建的时间先后顺序执行。有些关系数据库管理系统是按照触发器名称的字母排序顺序执行触发器。
删除触发器
删除触发器的SQL语法如下:
|
|
触发器必须是一个已经创建的触发器,并且只能由具有相应权限的用户删除。
触发器是一种功能强大的工具,但在使用时要慎重,因为在每次访问一个表时都可能触发一个触发器,这样会影响系统的性能。
小结
数据库的完整性是为了保证数据库中存储的数据是正确的。所谓正确是指符合现实世界语义的。本章讲解了关系数据库管理系统完整性实现的机制,包括完整性约束定义机制、完整性检查机制和违背完整性约束条件时关系数据库管理系统应采取的动作等。
在关系系统中,最重要的完整性约束是实体完整性和参照完整性,其他完整性约束条件则可以归入用户定义的完整性。
数据库完整性的定义一般由SQL的数据定义语言来实现。它们作为数据库模式的一部分存入数据字典中,在数据库数据修改时关系数据库管理系统的完整性检查机制将按照数据字典中定义的这些约束进行检查。
完整性机制的实施会影响系统性能。因此,许多数据库管理系统对完整性机制的支持比对安全性的支持要晚得多,也弱得多。随着硬件性能的提高以及数据库技术的发展,目前的关系数据库管理系统都提供了定义和检查实体完整性、参照完整性和用户定义的完整性的功能。
对于违反完整性的操作一般的处理是采用默认方式,如拒绝执行。对于违反参照完整性的操作,本书讲解了不同的处理策略.用户要根据应用语义来定义合适的处理策略,以保证数据库的正确性。
实现数据库完整性的一个重要方法是触发器。触发器和前面介绍的各种完整性约束不同之处是,完整性控制是当被限制的对象发生变化时系统就去检查该对象变化后能否满足完整性约束条件,如果不能满足就进行违约处理,违约处理通常比较简单。而触发器功能就要强得多,因为触发器规则中的动作体可以很复杂,通常是一段SQL存储过程。触发器不仅可以用于数据库完整性检查,也可以用来实现数据库系统的其他功能,包括数据库安全性,以及更加广泛的应用系统的一些业务流程和控制流程、基于规则的数据和业务控制功能等。不过也要特别注意,一个触发器的动作可能激活另一个触发器,最坏的情况是导致一个触发链,从而造成难以预见的错误。
你并非爱的目的,而是让我去爱的动力。我将这份爱送走,送给路上的花儿,送给酒杯里的一抹日光,送给教堂塔楼的红色洋葱顶。是你让我爱恋这个世界。
― 赫尔曼·黑塞, 《克林索尔的最后夏天》