关系数据库的简单概念和范式理解

发表于 2023-10-17 更新于 2025-01-14 分类于数据库阅读次数： Waline：本文字数： 2.2k 阅读时长 ≈ 7 分钟

介绍了关系数据库的一些基础概念，如什么是键，候选码等，还简单介绍了下函数依赖和常见范式。

函数依赖

在一个表里面，属性X可以映射到属性Y，也就是说知道了X就能确定Y，称X为决定因素。

有一个关系模式S(Sno,Sname,Sage)

如果知道了一个学生的学号Sno，那我就能确定他的姓名Sname和年龄Sage。

如果强制规定学生姓名不能重复。那么，知道了一个学生的姓名也是可以确定其他属性的，这也是满足函数依赖关系的。

完全函数依赖

有一个关系模式S(Sno,Sname,Cno,Grade)

如果我想知道某位学生的某一门课的成绩Grade，那我必须得同时知道他的学号Sno和课程号Cno。
但如果我只知道一部分信息，比如他的Sno或者Cno可以吗？答案是不行的！此时称Y[Grade]完全依赖于X[Sno,Cno]。

部分函数依赖

如果我想知道某位学生的姓名Sname，那我知道他的学号Sno就可以了。也就是说Y[Sname]只函数依赖于X[Sno,Cno]中的子集x[Sno]，此时称Y部分函数依赖于X。

传递函数依赖

有一个关系模式S(Sno,Sdept,Mname)
如果我知道了一个学生的学号Sno，那我就能知道他所在的系Sdept。(因为理论上一个学生只属于一个系)
如果我知道了某一个系Sdept，那么我就能知道这个系的系主任的姓名Mname。(一个系只有一个正的系主任)
也就是说，我知道了一个学生的学号Sno，其实我就知道了他所在系的系主任的姓名Mname。但这个过程中，他们是不存在直接函数依赖的，我需要通过系名称Sdept作为一个桥梁去把二者联系起来的。

范式

关系数据库中的模式设计要满足一定的规范，引入了范式这一概念。
不管做哪种范式的设计，最终要的思想是“one fact in one place”，也就是“一事一地”。

举例

现有一关于学生的关系模式Student(学生编号 , 学生姓名, 班级编号, 院系, 课程编号 , 成绩)

（学生编号、课程编号）作为主键，可以唯一标识每条元组

1NF

定义：关系中每一分量不可再分。即不能以集合、序列等作为属性。（也就是不能表中套表，要保证数据的原子性。）

学生编号	课程编号
S01	{C1，C2，C3}
S02	{C1，C4}

它就不满足1NF，因为{C1，C2，C3}和{C1，C4}是集合。

修改为符合1NF：

学生编号	课程编号
S01	C1
S01	C2
S01	C3
S02	C1

2NF

定义：在1NF基础上，消除非主属性对键的部分依赖，则称它符合2NF。

对于学生姓名、学生所属的班级编号、院系，这三个属性可以直接通过学生编号来确定，在这里课程编号#显得很多余。也就是，学生姓名、班级编号、院系对（学生编号、课程编号）部分函数依赖。把Student表进行拆分，可以消除部分依赖。

其中，学生表Student如下：

S01	杨明	D01	思齐
S02	李婉	D01	思齐
S01	杨明	D01	思齐
S03	刘海	D02	述圣
S04	安然	D02	述圣
S05	乐天	D03	省身

学生-课程表如下：

学生编号	课程编号	成绩
S01	C01	90
S02	C01	87
S01	C02	92
S03	C01	95
S04	C02	78
S05	C01	82

3NF

定义：在2NF基础上，消除非主属性对键的传递依赖，则称它符合3NF。

根据上面对传递依赖的分析，对于Student表，学生编号可以唯一确定他所在的院系，但是注意到这中间存在传递过程，即学生编号唯一确定该学生所对应的班级编号，班级编号对应唯一的院系。我们称，院系对学生编号传递函数依赖。

把Student表继续进行拆分，可以消除传递依赖。

其中，学生表Student如下：

学生编号	学生姓名	班级编号
S01	杨明	D01
S02	李婉	D01
S01	杨明	D01
S03	刘海	D02
S04	安然	D02
S05	乐天	D03

班级-院系表如下：

班级编号	院系
D01	思齐
D02	述圣
D03	省身

BCNF

每个非主属性必须直接（或完全）依赖于候选键的所有属性，而不是候选键的一部分。

参考

数据库函数依赖——完全函数依赖、部分函数依赖、传递函数依赖【通俗易懂，博主会讲人话】_完全函数依赖和部分函数依赖怎么理解-CSDN博客

范式通俗理解：1NF、2NF、3NF和BNCF_数据库范式-CSDN博客

一文搞懂候选码、主码、全码、外码、主属性、主键、主关键字、非主属性清晰总结_什么是候选码举例-CSDN博客