【数据库复习】第二章关系数据库
目錄
- 一、關系數據結構及形式化定義
- 1.1關系
- 1.2關系模式
- 1.3關系數據庫
- 1.4關系模型的存儲結構
- 二、關系操作
- 三、關系的完整性
- 四、關系代數
- 4.1傳統的集合運算
- 4.2專門的關系運算
- 4.2.1選擇(selection)
- 4.2.2投影(projection)
- 4.2.3連接(union)
- 4.2.4除運算(division)
一、關系數據結構及形式化定義
1.1關系
現實世界的實體以及實體間的各種聯系均用關系來表示。
域是一組具有相同數據類型的值的集合。例:整數、實數、介于某個取值范圍的整數、指定長度的字符串集合、{‘男’,‘女’}
笛卡爾積: 給定一組域D1,D2,…,Dn,允許其中某些域是相同的。
D1,D2,…,Dn的笛卡爾積為:
D1×D2×…×Dn = {(d1,d2,…,dn)|di?Di,i=1,2,…,n}
所有域的所有取值的一個組合;不能重復
元組(Tuple): 笛卡爾積中每一個元素(d1,d2,…,dn)叫作一個n元組(n-tuple)或簡稱元組。(張清玫,計算機專業,李勇)、 (張清玫,計算機專業,劉晨) 等 都是元組 。
分量(Component): 笛卡爾積元素(d1,d2,…,dn)中的每一個值di 叫作一個分量,張清玫、計算機專業、李勇、劉晨等都是分量 。
基數(Cardinal number): 若Di(i=1,2,…,n)為有限集,其基數為mi(i=1,2,…,n),則D1×D2×…×Dn的基數M為:M=M=M=∏i?1n\prod_{i-1}^{n}∏i?1n? mim_imi?
笛卡爾積的表示方法: 笛卡爾積可表示為一張二維表;表中的每行對應一個元組,表中的每列對應一個域
關系: D1×D2×…×Dn的子集叫作在域D1,D2,…,Dn上的關系,表示為R(D1,D2,…,Dn)R:關系名 ,n:關系的目或度(Degree)
元組: 關系中的每個元素是關系中的元組,通常用t表示。
關系的表示: 關系也是一個二維表,表的每行對應一個元組,表的每列對應一個域
屬性: 關系中不同列可以對應相同的域;為了加以區分,必須對每列起一個名字,稱為屬性(Attribute);n目關系必有n個屬性
候選碼(Candidate key): 若關系中的某一屬性組的值能唯一地標識一個元組,則稱該屬性組為候選碼。簡單的情況:候選碼只包含一個屬性
全碼(All-key): 最極端的情況:關系模式的所有屬性組是這個關系模式的候選碼,稱為全碼(All-key)
主碼: 若一個關系有多個候選碼,則選定其中一個為主碼(Primary key)
主屬性: 候選碼的諸屬性稱為主屬性(Prime attribute)。不包含在任何侯選碼中的屬性稱為非主屬性(Non-Prime attribute)或非碼屬性(Non-key attribute)
三類關系:
- 基本關系(基本表或基表) :實際存在的表,是實際存儲數據的邏輯表示
- 查詢表 :查詢結果對應的表
- 視圖表: 由基本表或其他視圖表導出的表,是虛表,不對應實際存儲的數據
基本關系的性質:
- 列是同質的(Homogeneous)
- 不同的列可出自同一個域 ,其中的每一列稱為一個屬性 ,不同的屬性要給予不同的屬性
- 列的順序無所謂,列的次序可以任意交換
- 任意兩個元組的候選碼不能相同
- 行的順序無所謂,行的次序可以任意交換
- 分量必須取原子值,這是規范條件中最基本的一條
1.2關系模式
關系模式(Relation Schema)是型,關系是值。
關系模式是對關系的描述。
關系模式可以形式化地表示為:R(U,D,DOM,F)
R : 關系名
U : 組成該關系的屬性名集合
D : U中屬性所來自的域
DOM :屬性向域的映象集合
F :屬性間數據的依賴關系的集合
關系模式通??梢院営洖镽 (U) 或 R (A1,A2,…,An)
R: 關系名
A1,A2,…,An : 屬性名
注:域名及屬性向域的映象常常直接說明為屬性的類型、長度
關系模式
- 對關系的描述
- 靜態的、穩定的
關系
- 關系模式在某一時刻的狀態或內容
- 動態的、隨時間不斷變化的
關系模式和關系往往籠統稱為關系,通過上下文加以區別。
1.3關系數據庫
關系數據庫:在一個給定的應用領域中,所有關系的集合構成一個關系數據庫
關系數據庫的型: 關系數據庫模式,是對關系數據庫的描述
關系數據庫的值: 關系模式在某一時刻對應的關系的集合,通常稱為關系數據庫
1.4關系模型的存儲結構
關系數據庫的物理組織:
- 有的關系數據庫管理系統中一個表對應一個操作系統文件,將物理數據組織交給操作系統完成
- 有的關系數據庫管理系統從操作系統那里申請若干個大的文件,自己劃分文件空間,組織表、索引等存儲結構,并進行存儲管理
二、關系操作
常用的關系操作:
- 查詢操作:選擇、投影、連接、除、并、差、交、笛卡爾積
- 選擇、投影、并、差、笛卡爾基是5種基本操作
- 數據更新:插入、刪除、修改
關系操作的特點:
集合操作方式:操作的對象和結果都是集合,一次一集合的方式
具有關系代數和關系演算雙重特點的語言:SQL(Structured Query Language)
三、關系的完整性
實體完整性和參照完整性: 關系模型必須滿足的完整性約束條件稱為關系的兩個不變性,應該由關系系統自動支持
用戶定義的完整性: 應用領域需要遵循的約束條件,體現了具體領域中的語義約束
實體完整性規則的說明:
- 實體完整性規則是針對基本關系而言的。一個基本表通常對應現實世界的一個實體集。
- 現實世界中的實體是可區分的,即它們具有某種唯一性標識。
- 關系模型中以主碼作為唯一性標識。
- 主碼中的屬性即主屬性不能取空值。主屬性取空值,就說明存在某個不可標識的實體,即存在不可區分的實體,這與第(2)點相矛盾,因此這個規則稱為實體完整性
參照完整性:
在關系模型中實體及實體間的聯系都是用關系來描述的,自然存在著關系與關系間的引用。
設F是基本關系R的一個或一組屬性,但不是關系R的碼。如果F與基本關系S的主碼Ks相對應,則稱F是R的外碼。
基本關系R稱為參照關系(Referencing Relation)
基本關系S稱為被參照關系(Referenced Relation) 或目標關系(Target Relation)
關系R和S不一定是不同的關系。
目標關系S的主碼Ks 和參照關系的外碼F必須定義在同一個(或一組)域上。
外碼并不一定要與相應的主碼同名,當外碼與相應的主碼屬于不同關系時,往往取相同的名 字,以便于識別。
參照完整性規則: 若屬性(或屬性組)F是基本關系R的外碼它與基本關系S的主碼Ks相對應(基本關系R和S不一定是不同的關系),則對于R中每個元組在F上的值必須為:
- 或者取空值(F的每個屬性值均為空值)
- 或者等于S中某個元組的主碼值
用戶定義的完整性:
- 針對某一具體關系數據庫的約束條件,反映某一具體應用所涉及的數據必須滿足的語義要求
- 關系模型應提供定義和檢驗這類完整性的機制,以便用統一的系統的方法處理它們,而不需由應用程序承擔這一功能
四、關系代數
關系代數是一種抽象的查詢語言,它用對關系的運算來表達查詢。
關系代數:
- 運算對象是關系
- 運算結果亦為關系
- 關系代數的運算符有兩類:集合運算符和專門的關系運算符
傳統的集合運算是從關系的“水平”方向即行的角度進行。
專門的關系運算不僅涉及行而且涉及列。
4.1傳統的集合運算
R和S:
具有相同的目n(即兩個關系都有n個屬性)
相應的屬性取自同一個域
R∪S:
仍為n目關系,由屬于R或屬于S的元組組成 :R∪S = { t|t ? R∨t ?S }
R - S :
仍為n目關系,由屬于R而不屬于S的所有元組組成:R -S = { t|t?R∧t?S }
R∩S:
仍為n目關系,由既屬于R又屬于S的元組組成: R∩S = { t|t ? R∧t ?S } ;R∩S = R –(R-S)
R×S :
R: n目關系,k1個元組
S: m目關系,k2個元組
列:(n+m)列元組的集合
元組的前n列是關系R的一個元組
后m列是關系S的一個元組
行:k1×k2個元組
4.2專門的關系運算
引入的記號 :
- R,t∈\in∈R,t[Ai]: 設關系模式為R(A1,A2,…,An),它的一個關系設為R,t∈\in∈R表示t是R的一個元組,t[Ai]則表示元組t中相應于屬性Ai的一個分量
- A,t[A], A ̄\overline{A}A: 若A={Ai1,Ai2,…,Aik},其中Ai1,Ai2,…,Aik是A1,A2,…,An中的一部分,則A稱為屬性列或屬性組。t[A]=(t[Ai1],t[Ai2],…,t[Aik])表示元組t在屬性列A上諸分量的集合。 A ̄\overline{A}A則表示{A1,A2,…,An}中去掉{Ai1,Ai2,…,Aik}后剩余的屬性組。
- trts?\overgroup{t_rt_s}tr?ts??: R為n目關系,S為m目關系。tr∈\in∈R,ts∈\in∈S,trts?\overgroup{t_rt_s}tr?ts??稱為元組的連接。trts?\overgroup{t_rt_s}tr?ts??是一個n + m列的元組,前n個分量為R中的一個n元組,后m個分量為S中的一個m元組。
- 象集Zx: 給定一個關系R(X,Z),X和Z為屬性組。當t[X]=x時,x在R中的象集(Images Set)為:Zx={t[Z]|t∈\in∈R,t[X]=x},它表示R中屬性組X上值為x的諸元組在Z上分量的集合
**學生-課程數據庫:**學生關系Student、課程關系Course和選修關系SC
4.2.1選擇(selection)
選擇又稱為限制(Restriction)
選擇運算符的含義:在關系R中選擇滿足給定條件的諸元組, σF? = {t|t∈\in∈R∧F(t)= ‘真’}
F:選擇條件,是一個邏輯表達式,取值為“真”或“假”,基本形式為:X1θY1,θ表示比較運算符,它可以是>,≥,<,≤,=或<>
選擇運算是從關系R中選取使邏輯表達式F為真的元組,是從行的角度進行的運算
4.2.2投影(projection)
從R中選擇出若干屬性列組成新的關系
πA? = { t[A] | t ?R }
A:R中的屬性列
投影操作主要是從列的角度進行運算
投影之后不僅取消了原關系中的某些列,而且還可能取消某些元組(避免重復行)
4.2.3連接(union)
連接也稱為θ連接
連接運算的含義:從兩個關系的笛卡爾積中選取屬性間滿足一定條件的元組
A和B:分別為R和S上度數相等且可比的屬性組
θ:比較運算符
連接運算從R和S的廣義笛卡爾積R×S中選取R關系在A屬性組上的值與S關系在B屬性組上的值滿足比較關系θ的元組
等值連接(equijoin) :θ為“=”的連接運算稱為等值連接
自然連接(Natural join) :自然連接是一種特殊的等值連接
兩個關系中進行比較的分量必須是相同的屬性組;在結果中把重復的屬性列去掉
自然連接的含義:R和S具有相同的屬性組B,自然連接還需要取消重復列,所以是同時從行和列的角度進行運算。
**懸浮元組(Dangling tuple):**兩個關系R和S在做自然連接時,關系R中某些元組有可能在S中不存在公共屬性上值相等的元組,從而造成R中這些元組在操作時被舍棄了,這些被舍棄的元組稱為懸浮元組。
**外連接(Outer Join):**如果把懸浮元組也保存在結果關系中,而在其他屬性上填空值(Null),就叫做外連接。左外連接(LEFT OUTER JOIN或LEFT JOIN):只保留左邊關系R中的懸浮元組。右外連接(RIGHT OUTER JOIN或RIGHT JOIN):只保留右邊關系S中的懸浮元組
4.2.4除運算(division)
給定關系R (X,Y) 和S (Y,Z),其中X,Y,Z為屬性組。
R中的Y與S中的Y可以有不同的屬性名,但必須出自相同的域集。
R與S的除運算得到一個新的關系P(X),是R中滿足下列條件的元組在 X 屬性列上的投影:
元組在X上分量值x的象集Yx包含S在Y上投影的集合,記作:R÷S={tr[X]|tr∈\in∈R∧πY(S)?\subseteq?Yx},Yx:x在R中的象集,x = tr[X]
除操作是同時從行和列角度進行運算。
總結
以上是生活随笔為你收集整理的【数据库复习】第二章关系数据库的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【数据库复习】第一章绪论
- 下一篇: SAGE(SAGEMATH)密码学基本使