数据库知识基本概念
數據庫知識基本概念
最近在學習數據庫原理與應用,自己理解著整理出了一些基礎的概念,有不同意見可以留言討論:
- 數據和信息
- 數據庫系統的組成
- 數據管理技術的發展階段
- 數據庫系統的發展過程和發展趨勢
- 數據模型
- 關系模型
- 實體一聯系模型
- 其他數據模型
- 數據庫內部體系結構
- MySQL簡介
- powerdesigner的簡介
思維導圖
數據庫的基本概念
1.信息
信息來源于數據,是一種被加工為特定形式的數據,它相對于使用者是有意義、有價值的。例如一個銷售主管除非得到由這些數據加工處理后的概要匯總,否則計算機打印出包括大約252518個客戶的1000頁數據對他也并沒有多少價值。(見表1-1)
| 女 | 20871 | 33894 | 2577 | 818339 | 15092 | 14396 | 128430 |
| 男 | 22947 | 30049 | 24115 | 19243 | 16731 | 11003 | 124088 |
| 總計 | 43818 | 63943 | 49893 | 37642 | 31826 | 253992 | 52518 |
表1-1 客戶性別與年齡交叉表
2.數據
數據是現實生活中一種抽象的表示符號,包括數據內容和數據形式,一個數據表示一個事實,數據是能夠被記錄并具有固定的意義,從中我們可以提取出對我們有價值的信息。
例如,我們來考慮這樣的事實,作為M/s Elbee公司的經理,我們感興趣的可能是雇員Thomas Mathew,我們希望記住他的雇員號是106519,他的基本工資是每月2 000 000Rs.(4000美元),他所在的城市是Jamshedpur,他所在的國家是印度,他的出生Et期是1957年9月6日,他的結婚紀念日是5月29日,他的電話號碼是0091.657-2431322,等等。我們知道這些事實是為了每月處理Mathew的工資單,在生日和結婚紀念日發賀卡給他,打印他的工資條,萬一遇到緊急情況通知他的家人,等等。顯然,收集所有有關Mathew的事實(或數據),并將它們保存在一起確實是很有道理的。表1-2顯示了有關Thomas Mathew的工資單和其他相關情況的所有信息。(見表1-2)
| 106519 | Mathew | Thomas | 4000 | Jamshedpur | India | 06-09-1957 | 29.05 | 0091-657-2431322 |
表1-2 Thomas Mathew的工資單事實
3.數據與信息的關系
數據與信息是密不可分的,數據是信息的具體表示形式,而信息是數據所包含的意義,信息可用不同的數據形式來表現,信息不隨數據的表現形式而改變。例如:2017年10月10日與2017-10-10。
數據庫系統的組成
1.數據庫
數據庫(DataBase,DB)指數據的集合,數據的存儲獨立于使用它的程序,結構化的存放數據可以完全地或部分地消除了數據的冗余。例如,一個部門可能同時有職工文件(職工號、姓名、地址、部門、工資等)和業務檔案文件(職工號、姓名、部門、完成項目、評價等),在這兩個文件中存在有一定的重復數據(如職工號、姓名、部門)。在構造數據庫時,就可以只存儲一套數據,消除職工號、姓名、部門這3項數據的冗余。數據庫中的數據能為用戶共享。
2.數據庫管理系統
數據庫管理系統簡稱DBMS,由相互關聯的數據集合以及一組用于訪問這些數據的程序組成,是一種負責數據庫的定義、建立、操作、管理和維護的系統管理軟件。主要目標是為人們提供方便高效的環境來存儲和檢索數據。
3.數據庫管理員
數據庫管理員(DataBase Administrator,DBA)是負責設計、建立、管理和維護數據庫的人員。
4.用戶
用戶是數據庫系統的服務對象,是使用數據庫系統者,一般可分為兩類:終端用戶和應用程序員。
5.數據庫應用系統
數據庫應用系統簡寫DBAS,指在數據庫管理系統(DBMS)支持下建立的計算機應用系統,是由數據庫系統、應用程序系統、用戶組成的。
數據管理技術的發展階段
1.人工管理階段
人工管理階段沒有操作系統及數據管理的軟件,對數據的管理均是手工操作。
本階段有如下特點:
(1)數據不能長期保存;
(2)應用程序負責管理數據;
(3)數據不能共享;
(4)數據沒有獨立性。
2.文件系統階段
在文件系統階段,出現了操作系統,并帶有專門的數據管理軟件(即文件系統),對數據的處理不僅使用手工操作,而且能夠聯機實時處理。此時各種用途的應用程序仍然具有各自的數據,數據仍然具有兩種形式,即用戶看到的邏輯結構(稱為邏輯文件)和實際存儲的物理結構(稱為物理文件)。但此時邏輯文件和物理文件之間已允許有所區別,文件管理系統提供從邏輯文件到物理文件的轉換。
本階段有如下特點:
(1)數據能夠長期保存;
(2)文件系統負責管理數據;
(3)數據可以共享,但冗余較大;
(4)數據具有獨立性,但獨立程度一般。
3.數據庫系統階段
20世紀60年代末發生了對數據庫技術有著奠基作用的3件大事,標志著以數據庫系統為基本手段的數據管理階段的開始。
(1)1968年美國的IBM公司推出了世界上第一個數據庫管理系統IMS,它是基于層次模型的。
(2)1969年美國數據系統語言協會(CODASYL)的數據庫任務組(DBTG)發表了網狀數據模型的DBTG報告。
(3)1970年美國IBM公司的高級研究員E.F.Codd連續發表論文,提出了關系數據模型,奠定了關系數據庫的理論基礎。以數據庫為中心的數據庫系統,是當代數據管理的主要方式。它克服了文件系統的弊病,是一種較完善的高級數據管理方式,獲得了廣泛的應用。
這個階段有如下特點 :
(1)整體數據結構化;
(2)數據庫管理系統統一管理和控制數據;
(3)數據共享性高,且冗余較小;
(4)數據獨立性高。
數據庫系統的發展過程和發展趨勢
1.人機交互階段
1969年,美國IBM公司研制了世界上第一個數據庫管理系統IMS(Information Management System),IMS的數據模型是層次結構的;美國CODASYL委員會(Conference On Data System Language)的DBTG(Data Base Tast Group)小組對數據庫方法進行了系統的研究、討論,于60年代末至70年代初公布了若干研究報告,稱為DBTG報告,它所提議的方法是基于網狀結構的;1970年IBM公司的研究員E.F.Codd博士發表了題為“大型共享數據庫數據的關系模型”的著名論文,提出了數據庫的關系模型,開創了數據庫關系方法和關系數據理論的研究,為數據庫技術奠定了理論基礎,被公認為是數據庫發展歷史上的一個重要里程碑。由于E.F.Codd的杰出工作,他于1981年獲得了ACM圖靈獎。這三大事件標志著數據處理已進入了數據庫技術的新時代。
2.應用捆綁階段
在20世紀70年代以后,計算機中的應用系統發展很快,它們在商業、企業管理等事務處理領域成為應用主流,此時將應用程序與數據庫系統捆綁而構成一種完整的數據庫應用系統已成為當時之必須,這就出現了應用程序與數據庫間的數據交互過程。
3.網絡階段
自20世紀90年代開始數據庫系統的應用環境進入網絡時代,出現了分布式系統與C/S結構模型在集中式數據庫應用系統中整個系統捆綁于一起,而實際上一個完整的應用程序有下面三個部分:
·存儲邏輯部分包括DBMS及相應的數據存儲;
·應用邏輯部分包括由算法語言所編寫的數據處理業務流程;
·表示邏輯部分是用于與用戶交互可視化編程,它包括圖形用戶界面(GⅥ)等。
在C/S結構模式中,由一個服務器S(server)與多個客戶機C(client)所組成,它們間由網絡相連并通過接口進行交互。
4.因特網階段
在2l世紀初,因特網的普及應用及W-eb的發展,從而出現了B/S結構、XML語言及腳本語言。在Web數據庫中一般使用典型的三層結構B/S模式,在這個結構中,由瀏覽器、Web服務器及數據庫服務器三部分組成。
數據模型
1.數據模型的概念
數據模型是數據庫的基礎,是描述數據、數據聯系、數據語義以及一致性約束的概念工具的集合。現有數據模型可分為三類:基于對象的邏輯模型、基于記錄的邏輯模型和物理模型。
2.實體一聯系模型
實體-聯系模型簡稱E-R,是Peter Chen于1976年提出的一種語義模型,是基于對現實世界的這樣一種認識:現實世界由一組稱作實體的基本對象以及這些對象聞的聯系構成。 E—R模型主要包含三個要素:實體、屬性和聯系。
3關系模型
關系模型(Relational Schema)的發展較晚,是20世紀70年代初由mM公司的E.F.Codd首先提出。關系模型是完全不同于前兩種模型的一種新的模型,它的基礎不是圖而是表格。用表的集合來表示數據和數據間的聯系,每個表有多個列,每列有惟一的列名。圖1是一個示例的關系數據庫,其中包括三個表:一個表中是銀行客戶的詳細信息,第二個表中是客戶賬戶信息,第三個表中是賬戶與客戶之間對應的信息。
圖1關系數據庫的一個例子
表a)customer 表b)account 表c)deopsitor表
4.關系模型的特點:
(1)描述的一致性。無論是信息世界中的實體還是聯系都是用一個關系來描述,保證了數據操作語言相應的一致性,對于每一種基本操作功能(插入、刪除、修改等),都只需要一種操作運算即可。
(2)利用公共屬性連接。關系模型中各個關系之間都是通過公共屬性發生聯系的。例如學生關系和選課關系是通過公共屬性“學號”連接在一起,而選課關系又可以通過“課程號”與課程關系發生聯系。
(3)結構簡單直觀。采用表結構,用戶容易理解,有利于和用戶進行交互,并且在計算機中實現也極為方便。
(4)有嚴格的理論基礎。二維表的數學基礎是關系數據理論,對二維表進行的數據操作相當于在關系理論中對關系進行運算。這樣,在關系模型中整個模型的定義與操作均建立在嚴格的數學理論基礎上。
(5)語言表達簡練。在進行數據庫查詢時,不必像前兩種模型那樣需要事先規定路徑,而用嚴密的關系運算表達式來描述查詢,從而使查詢語句的表達非常簡單直觀。
(6)關系模型的概念單一。在關系模型中,無論是實體還是實體之間的聯系都用關系來表示。
(7)關系必須是規范化的關系。所謂規范化是指關系模型中,每一個關系模式要滿足一定的要求或者稱為規范條件。
5.其他數據模型
(1)層次模型(Hierarchical Model),的設計思想是把系統劃分成若干小部分,然后,再按照層次結構逐級組合成一個整體。圖2描述了這種分層結構的構造方法,其結構類似于“倒置樹”。
圖2 層次模型的構造方法
層次模型的特點如下:
①有且僅有一個結點,無父結點,此結點是根結點,例如,在大學數據模型中的校長;
②其他結點有且僅有一個父結點,如校長下屬的學院院長,他們的父結點就是大學校長;
③適合于表示一對多的聯系,如一個校長下屬若干院長。
(2)網狀模型(Network Model),指用網狀結構表示實體及其之間聯系的模型,是以記錄類型為節點的網絡結構,網絡模型的特點是一個子節點可以有兩個或多個父節點,可以有一個以上的節點無父節點,在兩個節點之間可以有兩種或多種聯系。圖3表示了一個網狀模型的結構。
圖3 網狀模型
數據庫內部體系結構
一個數據庫系統的體系結構在很大程度上受到計算機系統的組成結構的影響。數據庫系統的結構分為三級,由外模式、模式和內模式組成,如圖4所示。
圖4數據庫的結構示意圖
1.內模式又稱存儲模式,具體描述了數據是如何組織、存儲在存儲介質上的,是系統程序員用一定的文件形式組織起來的存儲文件和聯系手段。所以內模式又稱為系統程序員視圖,只有內模式才是真正存儲數據的。
2.模式又稱邏輯模式,是數據庫中全體數據的邏輯結構和特征的描述,是所有用戶的公共數據視圖。
3.外模式通常是模式的一個子集,又稱為子模式。外模式面向的是用戶,是用戶眼中的數據庫,所以外模式又稱為用戶視圖。
MySQL簡介
MySQL是一個小型關系數據庫管理系統,它由一個服務器守護程序mysqld和很多不同的客戶程序和庫組成。它的規模小、功能有限,但是它體積小、速度快、成本低,且它提供的功能對稍微復雜的應用來說已經夠用,這些特性使得MySQL成為世界上最受歡迎的開放源代碼數據庫。
PowerDesigner簡介
PowerDesigner是Sybase公司一個功能強大而使用簡單的的CASE工具集(ComputerAided Software—CASE),使用它可以方便地對管理信息系統進行分析設計,它幾乎包括了數據庫模型設計的全過程。利用PowerDes igner可以制作數據流程圖、概念數據模型、物理數據模型,可以生成多種客戶端開發工具的應用程序,還可為數據倉庫制作結構模型,也能對團隊設計模型進行控制。
目錄
- 數據庫知識基本概念
- 思維導圖
- 數據庫的基本概念
- 信息
- 數據
- 數據與信息的關系
- 數據庫系統的組成
- 數據庫
- 數據庫管理系統
- 數據庫管理員
- 用戶
- 數據庫應用系統
- 數據管理技術的發展階段
- 1人工管理階段
- 2文件系統階段
- 3數據庫系統階段
- 數據庫系統的發展過程和發展趨勢
- 人機交互階段
- 應用捆綁階段
- 網絡階段
- 因特網階段
- 數據模型
- 數據模型的概念
- 實體一聯系模型
- 3關系模型
- 關系模型的特點
- 其他數據模型
- 數據庫內部體系結構
- MySQL簡介
- PowerDesigner簡介
- 目錄
總結
- 上一篇: 软件工程英文释义
- 下一篇: 一小时入门proteus使用教程