這個不是數據結構的內容,屬於數據庫設計的範疇。規範化設計數據庫可以減少數據冗餘,減少數據插入、更新異常。
1範式,2範式,3範式,bc範式,4範式,5範式是規範化標準。
比如:目前的所有商用數據庫設計出來的表至少必須滿足第一範式(1nf:即滿足表的所有屬性都是不能再分解的原子屬性)。
2範式-5範式這些標準多是根據表的屬性間的不同程度的函數依賴(從1nf到5nf逐步提高標準)來區分的。由數據庫設計者把握設計出來的數據庫規範化到什麼程度。理論上滿足的規範化程度越高,設計出來的數據庫越有效、穩定。但有時候考慮到數據查詢、表連接的頻率問題,不得不反規範化,減低滿足的標準才能提高程序執行效率。
簡單的講可以這樣理解:
第一範式:指表中的屬性都是原子屬性,不能再拆分了。
第二範式:在第一範式的基礎上,要求非主屬性都完全函數依賴於主鍵。
第三範式:在第二範式的基礎上,要求要求沒有非主屬性傳遞依賴於主鍵。
BC範式:在第三範式基礎上,要求所有非主鍵屬性都必須依賴於主鍵。
第四範式:在BC範式基礎上,要求表中存在的多值依賴都必須是對主鍵函數依賴。
第五範式:在第四範式的基礎上,繼續拆分表格,消除多值依賴。
在一個表中:
主屬性:所有包含在候選碼裡的屬性。
非主屬性:不包含在候選碼裡的屬性。
候選碼:一個或者一組可以唯一標識一條記錄且不含多餘屬性的屬性。
函數依賴:表中屬性X的值可以唯一確定Y的值,則說:X確定Y,或Y依賴於X(記作X->Y)。
傳遞依賴:X->Y,Y->Z。則可以說Z傳遞依賴於X。
多值依賴:一個屬性的值可以確定一組屬性。(函數依賴是一種特殊的多值依賴,依賴的整組屬性只有1個,而不是多個)
(例如假設有一個人事資料的數據表,我們根據表中記錄的一個人的姓名,我們可以查到他的年齡即有: 姓名->年齡。在沒有同名存在的情況下,姓名就是這個表的候選鍵(碼),因為姓名可以唯一確定一條記錄的其他屬性,例如:姓名->(性別、年齡、職位),同時我們把姓名選為該表的主鍵(含主屬性)。姓名以外的其他屬性即為非主屬性。有時候一個表可以有多個候選鍵,則需要選擇其中一組作為主鍵,所有候選鍵包括的屬性都是主屬性。)
以上內容都是根據自己理解信手敲出。並沒有嚴謹的校對教科書的概念。如有疏漏錯誤實屬正常,如有人補漏改錯不勝榮幸。
這個不是數據結構的內容,屬於數據庫設計的範疇。規範化設計數據庫可以減少數據冗餘,減少數據插入、更新異常。
1範式,2範式,3範式,bc範式,4範式,5範式是規範化標準。
比如:目前的所有商用數據庫設計出來的表至少必須滿足第一範式(1nf:即滿足表的所有屬性都是不能再分解的原子屬性)。
2範式-5範式這些標準多是根據表的屬性間的不同程度的函數依賴(從1nf到5nf逐步提高標準)來區分的。由數據庫設計者把握設計出來的數據庫規範化到什麼程度。理論上滿足的規範化程度越高,設計出來的數據庫越有效、穩定。但有時候考慮到數據查詢、表連接的頻率問題,不得不反規範化,減低滿足的標準才能提高程序執行效率。
簡單的講可以這樣理解:
第一範式:指表中的屬性都是原子屬性,不能再拆分了。
第二範式:在第一範式的基礎上,要求非主屬性都完全函數依賴於主鍵。
第三範式:在第二範式的基礎上,要求要求沒有非主屬性傳遞依賴於主鍵。
BC範式:在第三範式基礎上,要求所有非主鍵屬性都必須依賴於主鍵。
第四範式:在BC範式基礎上,要求表中存在的多值依賴都必須是對主鍵函數依賴。
第五範式:在第四範式的基礎上,繼續拆分表格,消除多值依賴。
在一個表中:
主屬性:所有包含在候選碼裡的屬性。
非主屬性:不包含在候選碼裡的屬性。
候選碼:一個或者一組可以唯一標識一條記錄且不含多餘屬性的屬性。
函數依賴:表中屬性X的值可以唯一確定Y的值,則說:X確定Y,或Y依賴於X(記作X->Y)。
傳遞依賴:X->Y,Y->Z。則可以說Z傳遞依賴於X。
多值依賴:一個屬性的值可以確定一組屬性。(函數依賴是一種特殊的多值依賴,依賴的整組屬性只有1個,而不是多個)
(例如假設有一個人事資料的數據表,我們根據表中記錄的一個人的姓名,我們可以查到他的年齡即有: 姓名->年齡。在沒有同名存在的情況下,姓名就是這個表的候選鍵(碼),因為姓名可以唯一確定一條記錄的其他屬性,例如:姓名->(性別、年齡、職位),同時我們把姓名選為該表的主鍵(含主屬性)。姓名以外的其他屬性即為非主屬性。有時候一個表可以有多個候選鍵,則需要選擇其中一組作為主鍵,所有候選鍵包括的屬性都是主屬性。)
以上內容都是根據自己理解信手敲出。並沒有嚴謹的校對教科書的概念。如有疏漏錯誤實屬正常,如有人補漏改錯不勝榮幸。