1.数据库技术基础

2.基本概念
- 数据库系统DBS:是一个采用了数据库技术,有组织地、动态地存储大量有关数据,方便多用户访问的计算机系统。其由下面四个部分组成:
- 数据库(统一管理、长期存储在计算机内的,有组织的相关数据的集合)
- 硬件(构成计算机系统包括存储数据所需的外部设备)
- 软件(操作系统、数据库管理系统及应用程序)
- 人员(系统分析和数据库设计人员、应用程序员、最终用户、数据库管理员DBA)
- 数据库管理系统DBMS的功能(软件):
- 实现对共享数据有效的组织、管理和存取。
- 包括数据定义、数据库操作、数据库运行管理、数据的存储管理、数据库的建立和维护等。
3.三级模式-两级映像
- 内模式:管理如何存储物理的数据,对应具体物理存储文件。
- 模式:又称为概念模式,就是我们通常使用的基本表,根据应用、需求将物理数据划分成一张张表。
- 外模式:对应数据库中的视图这个级别,将表进行一定的处理后再提供给用户使用。
- 外模式-模式映像:是表和视图之间的映射,存在于概念级和外部级之间,若表中数据发生了修改,只需要修改此映射,而无需修改应用程序。
- 模式-内模式映像:是表和数据的物理存储之间的映射,存在于概念级和内部级之间,若修改了数据存储方式,只需要修改此映射,而不需要去修改应用程序。

4.数据库设计
- 需求分析:即分析数据存储的要求,产出物有数据流图、数据字典、需求说明书。
- 概念结构设计:就是设计E-R图,也即实体-属性图,与物理实现无关,说明有哪些实体,实体有哪些属性。
- 逻辑结构设计:将E-R图,转换成关系模式,也即转换成实际的表和表中的列属性,这里要考虑很多规范化的东西。
- 物理设计:根据生成的表等概念,生成物理数据库。


5.E-R模型
- 数据模型三要素:数据结构(所研究的对象类型的集合)、数据操作(对数据库中各种对象的实例允许执行的操作的集合)、数据的约束条件(一组完整性规则的集合)。
- E-R模型:即实体-联系模型,使用椭圆表示属性(一般没有)、长方形表示实体、菱形表示联系,联系两端要标注联系类型。
- 联系类型:一对一1:1、一对多1:N、多对多M:N。
- 属性分类:简单属性和复合属性(属性是否可以分割),单值属性和多值属性(属性有多个取值)、NULL属性(无意义)、派生属性(可由其他属性生成)。

6.关系模型
- 关系模型也即数据库中常用的表,包括实体的属性,标识出实体的主键和外键,如下:

7.模型转换
- E-R图转换为关系模型:每个实体都对应一个关系模式;联系分为三种:
- 1:1联系中,联系可以放到任意的两端实体中,作为一个属性(要保证1:1的两端关联);
- 1:N的联系中,联系可以单独作为一个关系模式,也可以在N端中加入1端实体的主键;
- M:N的联系中,联系必须作为一个单独的关系模式,其主键是M和N端的联合主键。

答案:B
8.关系代数运算
- 并:结果是两张表所有记录数合并,相同记录只显示一次。
- 交:结果是两张表中相同的记录。
- 差:S1-S2,结果是S1表中有而S2表中没有的那些记录。

- 笛卡尔积:S1*S2,产生的结果集包括S1和S2的所有属性列,并且S1中每条记录依次和S2中所有记录组合成一条记录,最终属性列为S1+S2属性列,记录数为S1*S2记录数。
- 投影:实际是按条件选择某关系模式中的某列,列也可以用数字表示(Π)。
- 选择:实际是按条件选择某关系模式中的某条记录

- 自然连接的结果显示全部的属性列,但是相同属性列只显示一次,显示两个关系模式中属性相同且值相同的记录。
- 设有关系R、S如下左图所示,自然连接结果如下右图所示(记住符号):


答案:BD
9.函数依赖
- 给定一个X,能唯一确定一个Y,就称X确定Y,或者说Y依赖于X,利于Y=X*X函数。
函数依赖又可扩展以下两种规则:
- 部分函数依赖:A可确定C,(A,B)也可确定C,(A,B)中的一部分(即A)可以确定C,称为部分函数依赖。
- 传递函数依赖:当A和B不等价时,A可确定B,B可确定C,则A可确定C,是传递函数依赖;若A和B等价,则不存在传递,直接就可确定C。

10.键与约束
- 超键:能唯一标识此表的属性的组合。
- 候选键:超键中去掉冗余的属性,剩余的属性就是候选键。
- 主键:任选一个候选键,即可作为主键。
- 外键:其他表中的主键。
- 主属性:候选键内的属性为主属性,其他属性为非主属性。
- 实体完整性约束:即主键约束,主键值不能为空,也不能重复。
- 参照完整性约束:即外键约束,外键必须是其他表中已经存在的主键的值,或者为空。
- 用户自定义完整性约束:自定义表达式约束,如设定年龄属性的值必须在0到150之间。
11.范式
- 第一范式1NF:所有属性都不可以再分割为两个或多个分量。
- 第二范式2NF:当且仅当R是1NF,且每个非主属性完全依赖主键(不存在部分依赖)时,R就是2NF,比较典型的例子就是候选键是单属性,单属性是不可能存在部分函数依赖的。
- 第三范式3NF:当且仅当R是2NE,且R中没有非主属性传递依赖于候选键时,R就是3NF(此时,也不会存在部分依赖)。一般解决方法是拆分传递依赖的非主属性为一个新的关系模式,本质就是主键要直接决定所有非主属性,不能通过非主属性间接决定。
- BC范式BCNF:R属于BCNF当且仅当其F中每个依赖的决定因素必定包含R的某个候选码,实例如下:


思路:先画图,找出入路为0的属性,候选键必定包含入路为0的属性,从而根据推导关系可以推导出其余全部属性。候选键中的属性都算主属性。

12.模式分解
- 范式之间的转换一般都是通过拆分属性,即模式分解,将具有部分函数依赖和传递依赖的属性分离出来,来达到一步步优化,一般分为以下两种:
- 保持函数依赖分解
- 对于关系模式R,有依赖集F,若对R进行分解,分解出来的多个关系模式,保持原来的依赖集不变,则为保持函数依赖的分解。另外,注意要消除冗余依赖(如传递依赖)。



上题 ,分解后D->A的函数依赖没有保持
版权声明:本文为qq_28384315原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。