SQL查询入门(中篇)
引言
??? 在前篇文章中(SQL查詢入門(上篇),我對數據庫查詢的基本概念以及單表查詢做了詳細的解釋,本篇文章中,主要說明SQL中的各種連接以及使用范圍,以及更進一步的解釋關系代數法和關系演算法對在同一條查詢的不同思路。
?
多表連接簡介
???? 在關系數據庫中,一個查詢往往會涉及多個表,因為很少有數據庫只有一個表,而如果大多查詢只涉及到一個表的,那么那個表也往往低于第三范式,存在大量冗余和異常。
???? 因此,連接(Join)就是一種把多個表連接成一個表的重要手段.
???? 比如簡單兩個表連接學生表(Student)和班級(Class)表,如圖:
??????
?
???? 進行連接后如圖:
?
?????
?
笛卡爾積
????? 笛卡爾積在SQL中的實現方式既是交叉連接(Cross Join)。所有連接方式都會先生成臨時笛卡爾積表,笛卡爾積是關系代數里的一個概念,表示兩個表中的每一行數據任意組合,上圖中兩個表連接即為笛卡爾積(交叉連接)
????? 在實際應用中,笛卡爾積本身大多沒有什么實際用處,只有在兩個表連接時加上限制條件,才會有實際意義,下面看內連接
內連接
????? 如果分步驟理解的話,內連接可以看做先對兩個表進行了交叉連接后,再通過加上限制條件(SQL中通過關鍵字on)剔除不符合條件的行的子集,得到的結果就是內連接了.上面的圖中,如果我加上限制條件
????? 對于開篇中的兩個表,假使查詢語句如下:
SELECT *FROM [Class] cinner join [Student] son c.ClassID=s.StudentClassID??? 可以將上面查詢語句進行分部理解,首先先將Class表和Student表進行交叉連接,生成如下表:
?
????
?
???? 然后通過on后面的限制條件,只選擇那些StudentClassID和ClassID相等的列(上圖中劃了綠色的部分),最終,得到選擇后的表的子集
?????
??
?????當然,內連接on后面的限制條件不僅僅是等號,還可以使用比較運算符,包括了>(大于)、>=(大于或等于)、<=(小于或等于)、<(小于)、!>(不大于)、!<(不小于)和<>(不等于)。當然,限制條件所涉及的兩個列的數據類型必須匹配.
???? 對于上面的查詢語句,如果將on后面限制條件由等于改為大于:
SELECT *FROM [Class] cinner join [Student] son c.ClassID>s.StudentClassID?
???? 則結果從第一步的笛卡爾積中篩選出那些ClassID大于StudentClassID的子集:
?
?
??? 雖然上面連接后的表并沒有什么實際意義,但這里僅僅作為DEMO使用:-)
?
?????? 關系演算
?????? 上面笛卡爾積的概念是關系代數中的概念,而我在前一篇文章中提到還有關系演算的查詢方法.上面的關系代數是分布理解的,上面的語句推導過程是這樣的:“對表Student和Class進行內連接,匹配所有ClassID和StudentClassID相等行,選擇所有的列”
????? 而關系演算法,更多關注的是我想要什么,比如說上面同樣查詢,用關系演算法思考的方式是“給我找到所有學生的信息,包括他們的班級信息,班級ID,學生ID,學生姓名”
???? 用關系演算法的SQL查詢語句如下:
SELECT *FROM [Class] c,[Student] swhere c.ClassID=s.StudentClassID
?????當然,查詢后返回的結果是不會變的:
?????
?
外連接
???? 假設還是上面兩個表,學生和班級.我在學生中添加一個名為Eric的學生,但出于某種原因忘了填寫它的班級ID:
??????
???? 當我想執行這樣一條查詢:給我取得所有學生的姓名和他們所屬的班級:
SELECT s.StudentName,c.ClassName FROM [fordemo].[dbo].[Student] sinner join [fordemo].[dbo].[Class] con s.StudentClassID=c.ClassID
?
?? 結果如下圖:
?
?
?
?? 可以看到,這個查詢“丟失”了Eric..
?? 這時就需要用到外連接,外連接可以使連接表的一方,或者雙方不必遵守on后面的連接限制條件.這里把上面的查詢語句中的inner join改為left outer join:
SELECT s.StudentName,c.ClassName FROM [fordemo].[dbo].[Student] sleft outer join [fordemo].[dbo].[Class] con s.StudentClassID=c.ClassID?
? 結果如下:
???
??? Eric又重新出現.
????? 右外連接
????? 右外連接和左外連接的概念是相同的,只是順序不同,對于上面查詢語句,也可以改成:
SELECT s.StudentName,c.ClassName FROM [fordemo].[dbo].[Class] cright outer join [fordemo].[dbo].[Student] son s.StudentClassID=c.ClassID?
????? 效果和上面使用了左外連接的效果是一樣的.
?
??????? 全外連接
?????? 全外連接是將左邊和右邊表每行都至少輸出一次,用關鍵字”full outer join”進行連接,可以看作是左外連接和右外連接的結合.
?
自連接
?????? 談到自連接,讓我們首先從一個表和一個問題開始:
?
????? 上面員工表(Employee),因為經理也是員工的一種,所以將兩種人放入一個表中,MangerID字段表示的是當前員工的直系經理的員工id.
????? 現在,我的問題是,如何查找CareySon的經理的姓名?
???????可以看出,雖然數據存儲在單張表中,但除了嵌套查詢(這個會在后續文章中講到),只有自連接可以做到.正確自連接語句如下:
SELECT m.EmployeeNameFROM [fordemo].[dbo].[Employee] einner join [fordemo].[dbo].[Employee] mon e.ManagerID=m.id and e.EmployeeName='Careyson'??
???? 在詳細解釋自連接的概念之前,請再看一個更能說明自連接應用之處的例子:
??????
????? 這個表是一個出席會議記錄的表,每一行表示出席會議的記錄(這里,由于表簡單,我就不用EmployeeID和MeetingID來表示了,用名稱對于理解表更容易些)
?
?????? 好了,現在我的問題是:找出既參加“談論項目進度”會議,又參加”討論職業發展”會議的員工
??????乍一看上去很讓人迷惑是吧,也許你看到這一句腦中第一印象會是:
SELECT EmployeeNameFROM [fordemo].[dbo].[MeettingRecord] mwhere MeetingName='¨???????????¨¨' and meetingName='¨???????¨°|ì?¤?é?1'
??? (我用的代碼高亮插件不支持中文,所以上面where子句后面第一個字符串是’談論項目進度’,第二個是’討論職業發展’)
???? 恩,恭喜你,答錯了…如果這樣寫將會什么數據也得不到.正確的寫法是使用自連接!
???? 自連接的是一種特殊的連接,是對物理上相同但邏輯上不相同的表進行連接的方式。我看到百度百科上說自連接是一種特殊的內連接,但這是錯誤的,因為兩個相同表之間不光可以內連接,還可以外連接,交叉連接…在進行自連接時,必須為其中至少一個表指定別名以對這兩個表進行區分!
???? 回到上面的例子,使用自連接,則正確的寫法為:
SELECT m.EmployeeNameFROM [fordemo].[dbo].[MeettingRecord] m,[fordemo].[dbo].[MeettingRecord] m2where m.MeetingName='¨???????????¨¨' and m2.MeetingName='¨???????¨°|ì?¤?é?1'and m.EmployeeName=m2.EmployeeName
?? (關于亂碼問題,請參考上面)
???
多表連接
?
???? 多個表連接實際上可以看成是對N個表進行n-1次雙表連接.這樣理解會讓問題簡單很多!
??????
??? 比如上面三個表,前兩個表是我們已經在文章開始認識的,假設現在又添加了一個教師表,對這三個表進行笛卡爾積如下:
SELECT *FROM [fordemo].[dbo].[Class]cross join [fordemo].[dbo].[Teacher]cross join [fordemo].[dbo].[Student]?? 結果可以如圖表示:
???
?
總結
????? 文中對SQL中各種連接查詢方式都做了簡單的介紹,并利用一些Demo實際探討各種連接的用處,掌握好各種連接的原理是寫好SQL查詢所必不可少的!
總結
以上是生活随笔為你收集整理的SQL查询入门(中篇)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: SQL查询入门(上篇)
- 下一篇: SQL查询入门(下篇)