1、数据库绪论

数据库绪论

概述

基本术语

数据(Data)

  • 数据是数据库中存储的基本对象。

  • 数据的定义:描述事物的符号记录称为数据。

  • 数据的种类:文字、数字、图形、图像、声音、视频等。

  • 数据的特点:数据与其语义是不可分的。

  • 数据的形式并不能完全表达其内容,需要经过解释。所以数据和关于数据的解释是不可分的。

  • 数据的解释是指对数据的说明,数据的含义称为数据的语义,数据与其语义是不可分的。

  • 如:

    在计算机中,为了存储和处理事物,就要抽出对这些事物感兴趣的特征组成一个记录来描述。
    如:学生档案中的学生记录
    (李明,男,1984,哈尔滨,计算机系,2006)
    数据的形式不能完全表达其内容
    数据的解释
    语义:学生姓名、性别、出生年月、籍贯、所在系别、入学时间
    解释:李明是个大学生,1984年出生,哈尔滨人,2006年考入计算机系

数据库(Database)

  • 人们收集并抽取出一个应用所需要的大量数据之后,应将其保存起来以供进一步加工处理,进一步抽取有用信息。

  • 数据库的定义

    数据库(DB)就是长期储存在计算机内、有组织的、可共享、大量的数据集合。

  • 数据库中的数据具有永久存储、有组织、可共享的特点。

  • 数据库的特征

    数据按一定的数据模型组织、描述和储存
    可为各种用户共享
    冗余度较小
    数据独立性较高
    易扩展

数据库管理系统(DBMS)

  • 什么是DBMS

    数据库管理系统(Database Management System,简称DBMS)是位于用户与操作系统之间的一层数据管理软件。

  • DBMS的用途

    科学地组织和存储数据、
    高效地获取和维护数据。

image-20220611094412963
  • DBMS的主要功能

    数据定义功能
    提供数据定义语言(DDL),定义数据库中的数据对象(数据库表、索引、视图等)
    数据的组织、存储和管理功能
    分类组织、存储和管理各种数据,确定组织数据的文件结构和存取方式,实现数据之间的联系,提供多种存取方法提高存取效率。
    数据操纵功能
    提供数据操纵语言(DML),操纵数据实现对数据库的基本操作(查询、插入、删除和修改)

    数据库的事务管理和运行管理功能
    数据库在建立、运行和维护时由DBMS统一管理和控制,以保证事务的正确运行,保证数据的安全性、完整性、多用户对数据的并发使用,发生故障后的系统恢复。
    数据库的建立和维护功能
    数据库数据初始数据的输入、转换,数据库转储、恢复功能,数据库的重组织,性能监视、分析功能等。
    其他功能
    DBMS与网络中其它软件系统的通信,两个DBMS系统的数据转换, 异构数据库之间的互访和互操作

数据库系统(DBS)

  • 什么是数据库系统

    由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员(和用户)组成的存储、管理、处理和维护数据的系统。

    在不引起混淆的情况下常常把数据库系统简称为数据库。

  • 数据库系统的构成

    由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员(和用户)构成。

  • 数据库系统构成图示

image-20220611095010570
  • 数据库系统在计算机系统中的位置图示
image-20220611095111958

数据管理技术的产生与发展

  • 数据处理与数据管理

    数据处理:指对各种数据进行收集、存储、加 工和传播的一系列活动的总和。
    数据管理对数据进行分类、组织、编码、存储、检索和维护,是数据处理的中心问题。

  • 数据管理技术的发展过程

    人工管理阶段(40年代中–50年代中)
    文件系 统阶段(50年代末–60年代中)
    数据库系统阶段(60年代末–现在)

  • 数据管理技术的发展动力

    应用需求的推动
    计算机硬件的发展
    计算机软件的发展

人工管理阶段

  • 时期

    40年代中–50年代中

  • 产生的背景

    应用需求 科学计算
    硬件水平 无直接存取存储设备
    软件水平 没有操作系统
    处理方式 批处理

  • 特点

    数据不保存
    应用程序管理数据
    数据不共享、冗余度极大
    数据不独立,完全依赖于程序

image-20220611095721026

文件系统阶段

  • 时期

    50年代末–60年代中

  • 产生的背景

    应用需求 科学计算、管理
    硬件水平 磁盘、磁鼓
    软件水平 有文件系统
    处理方式 联机实时处理、批处理

  • 优点:

    数据长期保存在磁盘上
    把数据组织成内部有结构的记录
    文件系统管理数据,-------“按文件名访问、按记录进行存取

  • 缺点:

    数据面向某一应用程序
    数据共享性差、冗余度大
    记录内有结构,整体无结构
    数据的独立性差,数据的逻辑结构改变必须修改应用程序
    应用程序自己控制与管理数据

image-20220611100023712

文件系统中数据的结构

  • 记录内有结构。
  • 数据的结构是靠程序定义和解释的。
  • 数据只能是定长的。
  • 可以间接实现数据变长要求,但访问相应数据的应用程序复杂了。
  • 文件间是独立的,因此数据整体无结构。
  • 可以间接实现数据整体的有结构,但必须在应用程序中描述数据间的联系。
  • 数据的最小存取单位是记录。

数据库系统阶段

  • 时期

    60年代末以来

  • 产生的背景

    应用背景 大规模管理
    硬件背景 大容量磁盘
    软件背景 有数据库管理系统
    处理方式 联机实时处理,分布处理,批处理

  • 为解决多用户、多应用共享数据的需求,使数据为尽可能多的应用服务,数据库技术便应运而生,出现了统一管理数据的专用软件系统——数据库管理系统。

数据管理三个阶段的比较

image-20220611100349032

数据库系统的主要特点

  • 与人工管理和文件系统相比,数据库系统的特点主要表现在以下几个方面:

    一、数据结构化
    二、数据的共享性高,冗余度低,易扩充
    三、数据独立性高
    四、数据由DBMS统一管理和控制

数据结构化

  • 数据结构化是数据库与文件系统的根本区别。

    在文件系统中,相互独立的文件的记录内部是有结构的。
    传统文件的最简单形式是等长同格式的记录的集合。这样会浪费大量的存储空间。

例如下面的存储方式(文件系统):

image-20220611100628863
  • 采用变长记录或主记录与详细记录相结合的形式建立文件可以节省存储空间,灵活性相对提高。

例如下面的存储方式:

image-20220611100724476

但这种结构上的灵活性只是针对一个应用而言。且记录之间没有联系。数据的最小存取单位是记录。

  • 在数据库系统中,数据不再仅仅针对某一个应用,而是面向全组织,具有整体的结构化。不仅数据内部结构化,整体是结构化的,数据之间具有联系。
  • 数据的结构用数据模型描述,无需程序定义和解释。
  • 存取数据的方式灵活,可以存取数据库中的某一个数据项,一组数据项、一个记录或一组记录。
image-20220611101020711

数据的共享性高,冗余度低,易扩充

  • 数据库系统从整体角度看待和描述数据,数据不再面向某个应用而是面向整个系统,因此数据可以被多个用户、多个应用共享使用。
  • 数据共享可以大大减少数据冗余,节约存储空间。
  • 数据共享还能够避免数据之间不相容性与不一致性。
  • 数据面向整个系统,是有结构的数据,不仅可以被多个应用共享使用,而且容易增加新的应用。
  • 数据库系统弹性大,易于扩充、可以适应各种用户的要求。

数据独立性高

  • 数据库中将数据结构定义和存储方式与应用程序进行分离,因此数据结构和存储方式发生变化时不需要修改应用程序。

  • 数据的独立性包括数据的物理独立性和数据的逻辑独立性。

    物理独立性是指用户的应用程序与数据库中数据的物理存储是相互独立的。当数据的物理存储改变时,应用程序不用改变。
    逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的。数据的逻辑结构改变时,用户程序也可以不变。

  • 应用程序与数据的对应关系(数据库系统)

image-20220611101411166

数据由DBMS统一管理和控制

  • DBMS利用许多技术来实现数据的高效存储和检索,实现高效数据访问,这对存于外部存储设备上的数据相当重要。

  • 数据库的共享是并发的共享,即多个用户可以同时存取数据库中的数据甚至可以同时存取数据库中同一个数据。为此,DBMS必须提供以下几方面的数据控制功能:

    数据的安全性保护
    数据的完整性检查
    并发控制
    数据库恢复

  • 数据的安全性(Security)保护

    使每个用户只能按指定方式使用和处理指定数据,保护数据以防止不合法的使用造成的数据的泄密和破坏。

  • 数据的完整性(Integrity)检查

    数据的完整性是指数据的正确性、有效性与相容性。完整性检查用于将数据控制在有效的范围内,或保证数据之间满足一定的关系

  • 并发(Concurrency)控制

    对多用户的并发操作加以控制和协调,防止相互干扰而得到错误的结果。

  • 数据库恢复(Recovery)

    将数据库从错误状态恢复到某一已知的正确状态。

数据模型

数据模型的分类

  • 数据模型指对现实世界中客观事物及其联系的数据描述,是能表示实体类型与实体间联系的模型,具有描述数据与数据联系两方面的功能。数据模型是对现实世界数据特征的模拟和抽象,是数据库系统的核心和基础

  • 数据模型应该满足三个方面的要求:

    比较真实地模拟现实世界;
    容易为人所理解;
    便于计算机处理.

image-20220611102015962
  • 根据模型应用的不同目的分为:

    概念模型(信息模型)
    逻辑模型和物理模型(数据模型)

  • 概念模型(信息模型)

    按用户观点对数据进行建模,强调语义表达功能
    独立于计算机系统和DBMS
    主要用于数据库的设计

  • 逻辑模型

    逻辑模型:层次、网状、关系模型,是按计算机系统的观点对数据建模,主要用于DBMS的实现。有严格的形式化定义(层次、网状和关系模型),以便于在计算机系统中实现。

  • 物理模型

    对数据最底层的抽象,是面向计算机系统的。物理模型描述数据在存储介质上的组织结构,不但与具体的DBMS有关,而且还与操作系统和硬件有关。它的具体实现是DBMS的任务,用户一般不必考虑物理级的细节。

  • 从现实世界到概念模型的转换由数据库设计人员完成的。

  • 从概念模型到逻辑模型的转换可以由数据库设计人员完成,也可以用数据库设计工具协助设计人员完成。

  • 从逻辑模型到物理模型的转换是由DBMS自动完成的。

概念数据模型(信息模型)

  • 概念模型的用途

    概念模型用于信息世界的建模
    是现实世界到机器世界的一个中间层次
    是数据库设计的有力工具
    数据库设计人员和用户之间进行交流的语言

  • 对概念模型的基本要求

    较强的语义表达能力
    能够方便、直接地表达应用中的各种语义知识
    简单、清晰、易于用户理解

信息世界的基本概念

  • 实体(Entity)

    客观存在并可相互区别的事物称为实体。可以是具体的人、事、物或抽象的概念。

  • 属性(Attribute)

    实体所具有的某一特性称为属性。一个实体可以由若干个属性来刻画

  • 码(Key)

    唯一标识实体的属性集称为码。

  • 实体型(Entity Type)

    用实体名及其属性名集合来抽象和刻画同类实体。

  • 实体集(Entity Set)

    同型实体的集合称为实体集

  • 联系(Relationship)

    现实世界中事物内部以及事物之间的联系在信息世界
    中反映。包括实体内部的联系和实体之间的联系。
    实体内部的联系通常是指组成实体的各属性之间的联系
    实体之间的联系通常是指不同实体集之间的联系

  • 联系(Relationship)

    一对一联系(1:1)

    定义:
    如果对于实体集A中的每一个实体,实体集B中至多有一个(也可以没有)实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系,记为1:1。
    实例
    一个班级中有一个班长
    每个班长只能管理一个班级

    一对多联系(1:n)
    定义:
    如果对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则称实体集A与实体集B有一对多联系,记为1:n。
    实例
    一个班级中有若干名学生,
    每个学生只在一个班级中学习

    多对多联系(m:n)
    定义:
    如果对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中也有m个实体(m≥0)与之联系,则称实体集A与实体B具有多对多联系,记为m:n
    实例
    课程与学生之间的联系:
    一门课程同时有若干个学生选修
    一个学生可以同时选修多门课程

E-R模型

信息模型中比较著名的是实体联系模型(Entity Relationship Model),简称ER模型。ER模型是P.P. Chen于1976年提出的,通过ER图表示实体及其联系。
ER图有四个基本成分:
(1)矩形框——表示实体型;
(2)菱形框——表示联系型;
(3)椭圆形框——表示实体型或联系型的属性;
(4)直线——用来连接上述三种图框。

建立ER图过程:
(1)确定实体型
(2)确定联系型
(3)对实体型和联系型用连线组合
(4)确定实体型和联系型的属性和类型,确定并标记主键。

  • 两个不同实体型之间的联系

    分别画出学校与教师联系、学生与课程联系的ER图。

image-20220616075747040
  • 多个不同实体型之间的联系

    假设厂家供应零件,仓库负责采购并管理零件的入库、出库,多个工程项目所需的零件在仓库领取。画出仓库管理的ER图。

image-20220616075849348
  • 多个不同实体型之间的多元联系

    假设厂家供应零件,仓库负责采购并管理零件的入库、出库,多个工程项目所需的零件在仓库领取,且某个工程项目指定购买某个厂家的零件。画出仓库管理的ER图。

image-20220616080214812
  • 两个不同实体型之间的多种联系

    假设一个工程队承担若干项目,每个项目由一个职工负责,其他职工可以自由参加项目。请画出工程队的ER图。

image-20220616081015165
  • 同一实体型内各实体间的联系

    假设实体型是“女性公民”,联系型是母女。请画出ER图。

    假设实例型是“零件”,联系型的“组成”。请划出其ER图。

image-20220616081153376

E-R模型的画法

image-20220616081335344image-20220616081300306

E-R模型实例

  • 用E-R图表示某个工厂物资管理的概念模型

    实体

    仓库: 仓库号、面积、电话号码
    零件 :零件号、名称、规格、单价、描述
    供应商:供应商号、姓名、地址、电话号码、帐号
    项目:项目号、预算、开工日期
    职工:职工号、姓名、年龄、职称

    实体之间的联系如下:
    (1)一个仓库可以存放多种零件,一种零件可以存放在多个仓库中。仓库和零件具有多对多的联系。用库存量来表示某种零件在某个仓库中的数量。
    (2)一个仓库有多个职工当仓库保管员,一个职工只能在一个仓库工作,仓库和职工之间是一对多的联系。
    (3)职工之间具有领导-被领导关系,即仓库主任领导若干保管员。职工实体型中具有一对多的联系
    (4)供应商、项目和零件三者之间具有多对多的联系

image-20220616082137915

结构数据模型

  • 结构数据模型也称为逻辑数据模型,在不引起歧义的情况下,简称数据模型
  • 结构数据模型直接面向数据库的逻辑结构,是对现实世界的第二层抽象,所以也称逻辑数据模型。是严格定义的一组概念,描述了系统的静态特性、动态特性和完整性约束条件,以保证数据的正确、有效和相容。
  • 它反映的是系统分析设计人员对数据存储的观点,是对概念数据模型进一步的分解和细化。逻辑数据模型是根据业务规则确定的,关于业务对象、业务对象的数据项及业务对象之间关系的基本蓝图。
  • 结构数据模型主要有网状数据模型(Network Data Model)、 层次数据模型 (Hierarchical Data Model)等等。
  • 现有的数据库系统都是基于某种结构数据模型的。

数据模型的组成要素:

  • 数据结构(静态特性)

    规定了数据模型的静态特性,刻画数据模型性质最重要的方面。

  • 数据操作(动态特性)

    主要包括数据查询和数据更新,规定了数据模型的动态特性。

  • 数据的完整性约束

    是一组完整性规则的集合,用以限定相容的数据库状态的集合和可容许的改变,以保证数据库中数据的正确性、有效性和相容性。

数据结构、数据操作和数据的约束条件(完整性约束)称为数据模型的三要素。

数据结构

  • 数据结构描述数据库的组成对象以及对象之间的联系。描述的主要内容有两类:

  • 与对象的类型、内容、性质有关的

    关系模型中的域、属性、关系等;
    网状模型中的数据项、记录等。

  • 与对象之间联系有关的

    网状模型中的系型。

  • 数据结构是刻画一个数据模型性质最重要的方面,在数据库系统中,按照其数据结构的类型来命名数据模型。

  • 数据结构是对系统静态特性的描述。

数据操作

  • 数据操作:对数据库中各种对象(型)的实例(值)允许执行的操作集合及有关的操作规则。
  • 数据操作的类型:检索、更新(包括插入、删除、修改)。
  • 数据模型对操作的定义:操作的确切含义、操作符号、操作规则(如优先级)、实现操作的语言。
  • 数据操作是对系统动态特性的描述。

完整性约束

  • 完整性约束条件是一组完整性规则。
  • 完整性规则是给定的数据模型中数据及其联系所具有的制约和储存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。
  • 数据模型应反映和规定本数据模型必须遵守的基本的通用的完整性约束条件。
  • 数据模型还应提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。

主要的结构数据模型

  • 当前流行的数据模型有四种,即层次模型(Hierarchical Model)、网状模型(Network Model)、关系模型(Relational Model)和面向对象模型(Object Oriented Model)。它们的区别在于记录之间联系的表示方式不同。

  • 其中,关系模型是目前应用最为广泛的模型,市面上绝大多数数据库管理系统都是关系型。

层次模型

  • 层次数据库系统:采用层次模型作为数据的组织方式的数据库系统。

  • 层次模型是数据库系统中最早使用的模型,它的数据结构类似一颗倒置的树,每个结点表示一个记录类型,记录之间的联系是一对多的联系,联系通过指针来体现。

  • 层次模型:用树形结构来表示各类实体及实体间的联系的数据模型。

  • 层次模型要满足下面两个条件:

    1.有且只有一个结点没有双亲结点,这个结点称为根结点。
    2.根以外的其它结点有且只有一个双亲结点。

  • 表示方法:

    实体型:用记录类型描述。
    每个结点表示一个记录类型。
    属性:用字段描述。
    每个记录类型可包含若干个字段。
    联系:用结点之间的连线(有向边)表示记录(类)型之间的一对多的联系

image-20220616085805367image-20220616085835969
  • 特点

    结点的双亲是惟一的
    父子结点之间是一对多的联系
    没有一个子女记录值能够脱离双亲记录值而独立存在

  • 数据操纵:

    查询、插入、删除、 更新

    插入:无相应的双亲结点值就不能插入子女结点值;
    删除:如果删除双亲结点值,则相应的子女结点值也被同时删除;
    更新:更新操作时,应更新所有相应记录,以保证数据的一致性。

  • 优点

    层次模型结构简单、层次分明,便于在计算机中实现。
    从根结点到树中任意一个结点均存在一条惟一的层次路径,为有效进行数据操纵提供条件。
    层次结构规定除根结点外所有结点都有且只有一个父结点,故实体集之间的联系易于实现,且实体集间联系固定,对数据有较高的处理效率。
    提供了良好的完整性支持。

  • 缺点:

    层次数据模型缺乏直接表达现实世界中非层次关系实体集间的复杂联系的能力,如多对多联系(M:N)的联系难于实现。
    对插入或删除操作有较多的限制。
    查询子结点必须通过父结点。

网状模型

  • 网状数据库:采用网状模型作为数据的组织方式的数据库系统。

  • 数据库中,把满足以下两个条件的基本层次联系集合称为网状模型:

    允许一个以上的结点无双亲
    一个结点也可以有多于一个的双亲。

  • 网状模型可以看作是层次模型的一种扩展,是一种比层次模型更具普遍性的结构,去掉了层次模型的两个限制。

  • 网状模型采用有向图结构表示实体及其之间的联系。

  • 表示方法:

    实体型:用记录类型描述
    每个结点表示一个记录类型。
    属性:用字段描述。
    每个记录类型可包含若干个字段。
    联系:用结点之间的连线表示记录(类)型之间的一对多的父子联系。

  • 网状模型允许两个结点之间有多种联系(复合联系),层次模型中子女结点与双亲结点的联系是唯一的,而在网状模型中这种联系可以不唯一。

image-20220616090501727
  • 数据操纵:

    查询 插入 删除 更新

    允许插入尚未确定双亲结点值的子女结点值,允许只删除双亲结点值。
    支持记录码的概念,码即惟一标识记录的数据项的集合
    保证一个联系中双亲结点与子女结点之间是一对多联系
    可以支持双亲记录子女记录之间某些约束条件。例如:有些子女记录要求有双亲记录才能插入、双亲记录删除时也连同删除。

  • 优点

    能够更为直接地描述现实世界,如一个结点可以有多个双亲
    具有良好的性能,存取效率较高

  • 缺点

    结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握
    DDL、DML语言复杂,用户不容易使用

关系模型

  • 关系模型数据结构简单,容易理解,是目前应用最多、也最为重要的一种数据模型。
  • 1970年由美国IBM公司San Jose研究室的研究员E.F.Codd提出,于1981年获得ACM图领奖。
  • 关系模型本课程的重点

关系数据模型的数据结构

  • 关系模型是有若干关系模式组成的集合。关系模型建立在严格的数学概念基础上,采用二维表结构来表示实体和实体之间的联系。

  • 关系数据库用二维表表示实体及其属性,实体间的联系也用二维表来进行表示。二维表对应存储文件,其存取路径对用户透明。

  • 在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。

  • 关系模型由一组关系组成。每个关系的数据结构是一张规范化的二维表。一个关系由关系名、关系模式、关系实例组成,分别对应二维表的表名、表头和数据

关系模型的基本概念

  • 关系(Relation)

    一个关系对应通常说的一张表。

  • 元组(Tuple)

    表中的一行即为一个元组。

  • 属性(Attribute)

    表中的一列即为一个属性,给每一个属性起一个名称即属性名。

  • 主码(Key)

    表中的某个属性组,它可以唯一确定一个元组。

  • 域(Domain)

    属性的取值范围。

  • 分量

    元组中的一个属性值。

  • 关系模式

    对关系的描述
    关系名(属性1,属性2,…,属性n)
    学生(学号,姓名,年龄,性别,系,年级)

image-20220616091428397
  • 关系必须是规范化的,满足一定的规范条件

    最基本的规范条件:关系的每一个分量必须是一个不可分的数据项。

关系模型的数据操纵

  • 关系数据模型的操纵主要包括查询、插入、删除和更新数据。
  • 数据操作是集合操作,操作对象和操作结果都是关系,即若干元组的集合
  • 存取路径对用户隐蔽,用户只要指出“干什么”,不必详细说明“怎么干”

关系的完整性约束条件包括:
实体完整性
参照完整性
用户定义的完整性

关系数据模型的特点:

  • 概念清晰,结构简单,实体、实体联系和查询结果都采用关系表示,用户比较容易理解。
  • 关系模型的存取路径对用户是透明的,程序员不用关心具体的存取过程,减轻了程序员的工作负担,具有较好的数据独立性和安全保密性。
  • 一般只处理格式化的数据,对于多媒体数据如图像、图形、声音等,处理效果不好。
  • 数据结构比较简单,不能描述许多复杂的数据结构。

数据库系统的体系结构

  • 数据库系统的结构分为内部的模式结构和外部的体系结构。

    (1)数据库系统内部的模式结构
    从数据库管理系统角度看:数据库系统通常采用三级模式结构
    (2)数据库系统外部的体系结构
    从数据库最终用户角度看:数据库系统的结构分为:单用户结构、主从式结构、分布式结构、客户/ 服务器结构

数据库系统模式的概念

  • “型” 和“值” 的概念

    型(Type)
    对某一类数据的结构和属性的说明
    值(Value)
    是型的一个具体赋值
    例如:学生记录
    记录型:
    (学号,姓名,性别,系别,年龄,籍贯)
    该记录型的一个记录值:
    (900201,李明,男,计算机,22,江苏)

  • 模式(Schema)

    数据库逻辑结构和特征的描述
    是型的描述
    反映的是数据的结构及其联系
    模式是相对稳定的

  • 模式的一个实例(Instance)

    模式的一个具体值
    反映数据库某一时刻的状态
    同一个模式可以有很多实例
    实例随数据库中的数据的更新而变动

image-20220616092427874

数据库系统的三级模式结构

image-20220616092502006

模式

  • 模式(也称逻辑模式)

    数据库中全体数据的逻辑结构和特征的描述
    所有用户的公共数据视图,综合了所有用户的需求

  • 一个数据库只有一个模式

  • 模式的地位:是数据库系统模式结构的中间层

    与数据的物理存储细节和硬件环境无关
    与具体的应用程序、开发工具及高级程序设计语言无关

  • 模式的定义

    数据的逻辑结构(数据项的名字、类型、取值范围等)
    数据之间的联系
    数据有关的安全性、完整性要求

外模式(也称子模式或用户模式)

  • 数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述

  • 数据库用户的数据视图,是与某一应用有关的数据的逻辑表示

  • 一个数据库可以有多个外模式

  • 外模式的地位:介于模式与应用之间

    模式与外模式的关系:一对多
    外模式通常是模式的子集
    一个数据库可以有多个外模式。反映了不同的用户的应用需求、看待数据的方式、对数据保密的要求
    对模式中同一数据,在外模式中的结构、类型、长度、保密级别等都可以不同
    外模式与应用的关系:一对多
    同一外模式也可以为某一用户的多个应用系统所使用,
    但一个应用程序只能使用一个外模式。

  • 外模式的用途

    保证数据库安全性的一个有力措施。
    每个用户只能看见和访问所对应的外模式中的数据

内模式(Internal Schema)

  • 内模式(也称存储模式)

    是数据物理结构和存储方式的描述
    是数据在数据库内部的表示方式

    记录的存储方式(顺序存储,堆存储,聚簇存储)
    索引的组织方式(按照B+树结构存储,按hash方法存储)
    数据是否压缩存储
    数据是否加密
    数据存储记录结构的规定

  • 一个数据库只有一个内模式

数据库的二级映像功能与数据独立性

image-20220616093205833

外模式/模式映像

  • 定义了外模式与模式之间的对应关系

    属性名称可能不同
    外模式中的属性可能由模式中的多个属性运算而得

  • 每一个外模式都对应一个外模式/模式映像

  • 映像定义通常包含在各自外模式的描述中

  • 外模式/模式映像的用途

    保证数据的逻辑独立性
    当模式改变时,数据库管理员修改有关的外模式/模式映像,使外模式保持不变。
    应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。

模式/内模式映像

  • 模式/内模式映像定义了数据全局逻辑结构与存储结构之间的对应关系。例如,说明逻辑记录和字段在内部是如何表示的。

  • 数据库中模式/内模式映像是唯一的。

  • 该映像定义通常包含在模式描述中。

  • 模式/内模式映像的用途

    保证数据的物理独立性
    当数据库的存储结构改变了(例如选用了另一种存储结构),数据库管理员修改模式/内模式映像,使模式保持不变。
    应用程序不受影响。保证了数据与程序的物理独立性,简称数据的物理独立性。

image-20220616093656846

数据库系统的组成

  • 数据库系统组成

    数据库
    数据库管理系统(及其开发工具)
    应用系统
    数据库管理员
    用户

  • 一、硬件平台及数据库

    要有足够大的内存,存放操作系统、DBMS的核心模块、数据缓冲区和应用程序。
    有足够大的磁盘等直接存取设备存放数据库,有足够的磁盘作数据备份。
    要求系统有较高的通道能力,以提高数据传送率。

  • 二、软件

    DBMS。 DBMS是为数据库的建立、使用和维护配置的软件。
    支持DBMS运行的操作系统。
    具有与数据库接口的高级语言及其编译系统,便于开发用于程序。
    以DBMS为核心的应用开发工具。
    为特定应用环境开发的数据库应用系统。

  • 三、人员

    数据库管理员
    系统分析员
    数据库设计人员
    应用程序员
    (最终用户)

    • 1.数据库管理员(DBA,Database Administrator):负责全面管理和控制数据库系统。

      决定数据库中的信息内容和结构;
      决定数据库的存储结构和存取策略;
      定义数据的安全性要求和完整性约束条件;
      监控数据库的使用和运行;
      数据库的改进和重组重构。

    • 2.系统分析员和数据库设计人员

      系统分析员要负责应用系统的需求分析与规范说明,需要从总体上了解、设计整个系统。因此系统分析员必须与用户及数据库管理员相结合,确定系统的软硬件配置,并参与数据库各级模式的概要设计。
      数据库设计人员负责数据库中数据的确定及数据库中各级模式的设计。

    • 3.应用程序员

      以外模式为基础编制具体的应用程序,操作数据库,数据库的映像功能保证了他们不必考虑具体的存储细节。

    • 4.最终用户

      具体操作应用系统,通过应用系统的用户界面使用数据库来完成其业务活动。数据库的模式结构对最终用户是透明的。
      可分为3类:

      (1)偶然用户:企业或组织机构中的高中级管理人员。
      (2)简单用户:主要工作是查询和更新数据库,数据库系统操作员等。
      (3)复杂用户:具有较高科学技术背景的人员。可以直接使用语言访问数据库,编写应用程序。


版权声明:本文为hello_now原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。