关系数据库的简单概念和范式理解

相关概念

讲解

首先说明 键字=码字,所以 主键=主码=主关键字,候选键=候选码=候选关键字

image-20231017090955695

  1. 码=超键:能够唯一标识一条记录的属性或属性集。

    • 标识性:一个数据表的所有记录都具有不同的超键
    • 非空性:不能为空
    • 有些时候也把码称作“键”
  2. 候选键=候选码:能够唯一标识一条记录的最小属性集

    • 标识性:一个数据表的所有记录都具有不同的候选键
    • 最小性:任一候选键的任何真子集都不能唯一标识一个记录(比如在成绩表中(学号,课程号)是一个候选键,单独的学号,课程号都不能决定一条记录)
    • 非空性:不能为空
    • 候选键是没有多余属性的超键
    • 举例:学生ID是候选码,那么含有候选码的都是码。
    • 少部分地方也有叫超级码的,但是见得不多
  3. 主键=主码某个能够唯一标识一条记录的最小属性集(是从候选码里人为挑选的一条)

    • 唯一性:一个数据表只能有一个主键
    • 标识性:一个数据表的所有记录都具有不同的主键取值
    • 非空性:不能为空
    • 人为的选取某个候选码为主码
  4. 主属性:包含在任一候选码中的属性称主属性。简单来说,主属性是候选码所有属性的并集

  5. 非主属性:不包含在候选码中的属性称为非主属性。 非主属性是相对于主属性来定义的

  6. 外键(foreign key):子数据表中出现的父数据表的主键,称为子数据表的外键

  7. 全码:当所有的属性共同构成一个候选码时,这时该候选码为全码

  8. 代理键:当不适合用任何一个候选键作为主键时(如数据太长等),添加一个没有实际意义的键作为主键,这个键就是代理键。(如常用的序号1、2、3)

  9. 自然键:自然生活中唯一能够标识一条记录的键(如身份证)

举例

学生成绩信息表中有(学号、姓名、性别、年龄、系别、专业等)

超键/码:

由于学号能确定一个学生,因此学生表中含有学号的任意组合都为此表的超键。如:(学号)、(学号,姓名)、(学号,性别)等

若我们假设学生的姓名唯一,没有重名的现象。

学号唯一,所以是一个超键
姓名唯一,所以是一个超键
(姓名,性别)唯一,所以是一个超键
(姓名,年龄)唯一,所以是一个超键
(姓名,性别,年龄)唯一,所以是一个超键

候选键:

学号唯一,而且没有多余属性,所以是一个候选键

姓名唯一,而且没有多余属性,所以是一个候选键

(姓名,性别)唯一,但是单独姓名一个属性就能确定这个人是谁,所以性别这个属性就是多余属性,所以(姓名,性别)不是候选键
(姓名,年龄),(姓名,性别,年龄)同上,也不是候选键

主键:

主键就是候选键里面的一个,是人为规定的,例如学生表中,我们通常会让“学号”做主键,学号能唯一标识这一个元组。

外键:

外键就很简单了,假如我们还有一个教师表,每个教师都有自己的编号,假设老师编号在教师表中是主键,在学生表中它就是外键

练习

image-20231017105656057

image-20231017105716977

函数依赖

在一个表里面,属性X可以映射到属性Y,也就是说知道了X就能确定Y,称X为决定因素。

有一个关系模式S(Sno,Sname,Sage)

如果知道了一个学生的学号Sno,那我就能确定他的姓名Sname和年龄Sage。

image-20231017110705119

如果强制规定学生姓名不能重复。那么,知道了一个学生的姓名也是可以确定其他属性的,这也是满足函数依赖关系的。

完全函数依赖

有一个关系模式S(Sno,Sname,Cno,Grade)

如果我想知道某位学生的某一门课的成绩Grade,那我必须得同时知道他的学号Sno和课程号Cno。
但如果我只知道一部分信息,比如他的Sno或者Cno可以吗?答案是不行的!此时称Y[Grade]完全依赖于X[Sno,Cno]。

image-20231017110951519

部分函数依赖

如果我想知道某位学生的姓名Sname,那我知道他的学号Sno就可以了。也就是说Y[Sname]只函数依赖于X[Sno,Cno]中的子集x[Sno],此时称Y部分函数依赖于X。

image-20231017111116265

传递函数依赖

有一个关系模式S(Sno,Sdept,Mname)
如果我知道了一个学生的学号Sno,那我就能知道他所在的系Sdept。(因为理论上一个学生只属于一个系)
如果我知道了某一个系Sdept,那么我就能知道这个系的系主任的姓名Mname。(一个系只有一个正的系主任)
也就是说,我知道了一个学生的学号Sno,其实我就知道了他所在系的系主任的姓名Mname。但这个过程中,他们是不存在直接函数依赖的,我需要通过系名称Sdept作为一个桥梁去把二者联系起来的。
image-20231017111247348

范式

关系数据库中的模式设计要满足一定的规范,引入了范式这一概念。
不管做哪种范式的设计,最终要的思想是“one fact in one place”,也就是“一事一地”。

举例

现有一关于学生的关系模式Student(学生编号 , 学生姓名, 班级编号, 院系, 课程编号 , 成绩)

image-20231017111442520

(学生编号、课程编号)作为主键,可以唯一标识每条元组

1NF

定义:关系中每一分量不可再分。即不能以集合、序列等作为属性。(也就是不能表中套表,要保证数据的原子性。)

学生编号 课程编号
S01 {C1,C2,C3}
S02 {C1,C4}

它就不满足1NF,因为{C1,C2,C3}和{C1,C4}是集合。

修改为符合1NF:

学生编号 课程编号
S01 C1
S01 C2
S01 C3
S02 C1

2NF

定义:在1NF基础上,消除非主属性对键的部分依赖,则称它符合2NF。

对于学生姓名、学生所属的班级编号院系,这三个属性可以直接通过学生编号来确定,在这里课程编号#显得很多余。也就是,学生姓名、班级编号、院系对(学生编号、课程编号部分函数依赖。把Student表进行拆分,可以消除部分依赖。

其中,学生表Student如下:

S01 杨明 D01 思齐
S02 李婉 D01 思齐
S01 杨明 D01 思齐
S03 刘海 D02 述圣
S04 安然 D02 述圣
S05 乐天 D03 省身

学生-课程表如下:

学生编号 课程编号 成绩
S01 C01 90
S02 C01 87
S01 C02 92
S03 C01 95
S04 C02 78
S05 C01 82

3NF

定义:在2NF基础上,消除非主属性对键的传递依赖,则称它符合3NF。

根据上面对传递依赖的分析,对于Student表,学生编号可以唯一确定他所在的院系,但是注意到这中间存在传递过程,即学生编号唯一确定该学生所对应的班级编号,班级编号对应唯一的院系。我们称,院系对学生编号传递函数依赖。

把Student表继续进行拆分,可以消除传递依赖。

其中,学生表Student如下:

学生编号 学生姓名 班级编号
S01 杨明 D01
S02 李婉 D01
S01 杨明 D01
S03 刘海 D02
S04 安然 D02
S05 乐天 D03

班级-院系表如下:

班级编号 院系
D01 思齐
D02 述圣
D03 省身

BCNF

每个非主属性必须直接(或完全)依赖于候选键的所有属性,而不是候选键的一部分。

参考

数据库函数依赖——完全函数依赖、部分函数依赖、传递函数依赖【通俗易懂,博主会讲人话】_完全函数依赖和部分函数依赖怎么理解-CSDN博客

范式通俗理解:1NF、2NF、3NF和BNCF_数据库范式-CSDN博客

一文搞懂候选码、主码、全码、外码、主属性、主键、主关键字、非主属性清晰总结_什么是候选码举例-CSDN博客