文章目录
第一讲:初识数据库系统
引言
- 数据库系统的发展经历了三代演变
层次/网状数据库系统、关系数据库系统、新一代数据库系统 - 造就了四位图灵奖得主
C.W.Bachman、E.F.Codd、James Gray、M.R.Stonebraker - 发展了一门计算机基础学科
数据建模和DBMS核心技术为主,内容丰富领域宽广 - 带动了一个巨大软件产业
DBMS及其相关工具产品、应用套件、解决方案
数据库技术和系统已经成为信息系统的核心技术和重要基础设施。
第一章:绪论
1.1 数据库系统概述
1.1.1 数据库的四个基本概念
- 数据(Data):描述事物的符号记录。
数据的种类:数字、文字、图形、视频、档案记录等
计算机中常常用记录来描述数据,比如学生档案中的学生记录:
(李明,男,199505,江苏南京市,计算机系,2013)
数据是有结构的:记录是计算机存储数据的一种格式或方法。 - 数据库(Database,DB):长期存储在计算机内、有组织的、可共享的大量数据的集合。
为什么要建立数据库?
收集并抽取出一个应用所需要的大量数据,将其保存,以供进一步加工处理,抽取有用信息,转换为有价值的知识。
数据库的基本特征:
- 数据按一定的数据模型组织、描述和储存
- 可谓各种用户共享、冗余度较小、易扩展
- 数据独立性较高
- 数据库管理系统(DataBase Management System,DBMS)
位于用户应用与操作系统之间的一层数据管理软件
是基础软件,是一个大型复杂的软件系统
(1)数据库管理系统的用途
科学地组织和存储数据、高效地获取和维护数据
(2)数据库管理系统的主要功能
数据定义功能
数据组织、存储和管理
数据操纵功能(提供数据操纵语言DML)
数据库的事务管理和运行管理(保证多用户对数据的并发使用)
数据库的建立和维护功能
其他功能 - 数据库系统(DataBase System,DBS):在计算机系统中引入数据库后的系统构成,在不引起混淆的情况下常常把数据库系统简称为数据库。
数据库系统构成:数据库、数据库管理系统(及其应用开发工具)、应用程序、数据库管理员(DataBase Administrator,DBA)
所以说,数据库系统包括数据库和数据库管理系统。
1.1.2 数据管理技术的产生和发展
- 什么是数据管理?
对数据进行分类、组织、编码、存储、检索和维护 - 数据管理技术的发展过程
人工管理阶段(科学计算)
文件系统阶段(科学计算、管理)
数据库系统阶段(大规模数据管理)
1.1.3 数据库系统的特点
- 数据结构化
- 数据的共享性高,冗余度低且易扩充
- 数据独立性高
- 数据由数据库管理系统统一管理和控制
- 数据库的定义:
- 数据库是长期存储在计算机内有组织的共享的大量的数据集合。
- 可以供各种用户共享,具有最小冗余度和较高的数据独立性。
- 数据库管理系统在数据库建立、运用和维护时对数据库进行统一控制,以保证数据的完整性、安全性,并在多用户同时使用数据库时进行并发控制,在发生故障后对数据库进行恢复。
1.2 数据模型
数据模型是对现实世界数据特征的抽象。
1.2.1 两大类数据模型
数据模型分为两类(两个不同的层次)
(1) 概念模型,也称信息模型
它是按用户的观点来对数据和信息建模,用于数据库设计。
(2) 逻辑模型和物理模型
逻辑模型:逻辑模型主要包括网状模型、层次模型、关系模型、面向对象数据模型、对
象关系数据模型、半结构化数据模型等。
按计算机系统的观点对数据建模,用于DBMS实现
物理模型:是对数据最底层的抽象
描述数据在系统内的表示方式和存取方法。
1.2.2 概念模型
信息世界中的基本概念:
(1)实体(Entity)
图中的学生
(2)属性(Attribute)
学号、姓名等
(3)码(Key)
属性的集合
(4)实体型(Entity Type)
实体名及其属性名集合
(5)实体集(Entity Set)
实体的集合
(6)联系(Relationship)
现实世界中事物内部以及事物之间的联系在信息世界中反映为实体(型)内部的联系和实体(型)之间的联系。
实体内部的联系: 是指组成实体的各属性之间的联系。
实体之间的联系: 通常是指不同实体集之间的联系。
实体之间的联系有一对一(1:1)、一对多(1:n)【n叉树】和多对多(m:n)【学生选课】等多种类型
概念模型的一种表示方法:
实体-联系方法
1.2.3 数据模型的组成要素
数据模型是严格定义的一组概念的集合
精确地描述了系统的静态特性、动态特性和完整性约束条件
(Integrity Constraints)。
数据模型由三部分组成
- 数据结构–描述系统的静态特性
描述数据库的组成对象–对象的类型、内容、性质
- 数据操作–描述系统的动态特性
对数据库中各种对象的实例允许执行的操作(如查询、插入、删除、修改)的集合。 - 完整性约束
一组完整性规则的集合。
数据模型对完整性约束条件的定义,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件,如公司规定60岁退休。
1.2.4 常用的数据模型
层次模型(Hierarchical Model)
网状模型(Network Model)
关系模型(Relational Model))
面向对象数据模型(Object Oriented Data Model)
对象关系数据模型(Object Relational Data Model)
半结构化数据模型(Semi-struture Data Model)—如XML
非结构化数据模型、图模型
1.2.5 层次模型

特点:
- 结点的双亲是唯一的
- 只能直接处理一对多的实体联系
- 任何记录值只有按其路径查看
- 没有一个子女记录值能够脱离双亲记录值而独立存在
1.2.6 网状模型

特点
- 允许多个结点没有双亲结点
- 允许一个结点有多个双亲结点
- 允许两个结点之间有多种联系
- 要为每个联系命名并指出与该联系有关的双亲记录和子女记录
1.2.7 关系模型
最基本的规范条件:关系的每一个分量必须是一个不可分的数据项,不允许表中还有表。
1.3 数据库系统的结构
从数据库应用开发人员角度看:数据库系统采用三级模式结构,是数据库系统内部的系统结构。
1.3.1 数据库系统模式的概念
模式(Schema):是对数据库逻辑结构和特征的描述,是型的描述,不涉及具体值,模式是相对稳定的。
实例(Instance):数据库某一时刻的状态——模式的一个具体值,同一个模式可以有很多实例,实例随数据库中的数据的更新而变动。(每一年学生选课数据库都不一样,所以说实例随数据库中的数据的更新而变动。)
1.3.2 数据库系统的三级模式结构

模式(也称逻辑模式):
数据库中全体数据的逻辑结构和特征的描述,所有用户的公共数据视图,一般,某个应用的数据库有一个模式。
- 模式是数据库系统模式结构的中心
与数据的物理存储细节和硬件环境无关
与具体的应用程序、开发工具及高级程序设计语言无关
外模式(也称子模式或用户模式)
数据库用户使用的局部数据的逻辑结构和特征的描述,数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。
- 外模式与模式的关系
外模式通常是模式的子集、一个模式可以有多个外模式,反映了不同的用户的应用需求、看待数据的方式、对数据保密的要求。
对模式中某一数据,在不同的外模式中 结构、类型、长度、保密级别等都可以不同。 - 外模式与应用的关系
一个外模式可以为 多个应用系统所使用,一个应用程序只能使用一个外模式。 - 外模式的用途
每个用户只能看见和访问所对应的外模式中的数据,简化用户视图。
保证数据库安全性的一个有力措施。
内模式(也称存储模式)
- 是数据物理结构和存储方式的描述。
- 是数据在数据库内部的表示方式。
- 一个数据库只有一个内模式。
1.3.3 数据库的二级影响功能与数据独立性
数据库管理系统内部提供二级映像
- 外模式/模式映像
- 模式/内模式映像
外模式/模式映像:保证数据的逻辑独立性,定义外模式与模式之间的对应关系
- 当模式改变时,数据库管理员对外模式/模式映像作相应改变,使外模式保持不变
- 应用程序是依据数据的外模式编写的,应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。
模式/内模式映象:保证数据的物理独立性。
定义了数据全局逻辑结构与存储结构之间的对应关系。如,说明某个逻辑记录对应何种存储结构。
保证数据的物理独立性
- 当数据库的存储结构改变了(例如选用了另一种存储结构),数据库管理员修改模式/内模式映象,使模式保持不变。
- 模式不变,则应用程序不变。保证了数据与程序的物理独立性,简称数据的物理独立性。
1.4 数据库系统的组成
- 硬件平台及数据库
数据库系统对硬件资源的要求:
- 足够大的内存。
- 足够的大的磁盘或磁盘阵列等外部设备。
- 较高的通道能力,提高数据传送率。
- 软件
- 数据库管理系统
- 支持数据库管理系统运行的操作系统
- 与数据库接口的高级语言及其编译系统
- 以数据库管理系统为核心的应用开发工具
- 为特定应用环境开发的数据库应用系统
- 人员
