13.5The Process of Normalization
Normalization is a formal technique for analyzing relations based on their primary key (or
candidate keys) and functional dependencies (Codd, 1972b). The technique involves a
series of rules that can be used to test individual relations so that a database can be normalized
to any degree. When a requirement is not met, the relation violating the requirement
must be decomposed into relations that individually meet the requirements of
normalization.
Three normal forms were initially proposed called First Normal Form (1NF), Second
Normal Form (2NF), and Third Normal Form (3NF). Subsequently, R. Boyce and E.F.
Codd introduced a stronger definition of third normal form called Boyce–Codd Normal
Form (BCNF) (Codd, 1974). With the exception of 1NF, all these normal forms are based
on functional dependencies among the attributes of a relation (Maier, 1983). Higher normal
forms that go beyond BCNF were introduced later such as Fourth Normal Form (4NF)
and Fifth Normal Form (5NF) (Fagin, 1977, 1979). However, these later normal forms
deal with situations that are very rare. In this chapter we describe only the first three normal
forms and leave discussions on BCNF, 4NF, and 5NF to the next chapter.
Normalization is often executed as a series of steps. Each step corresponds to a specific
normal form that has known properties. As normalization proceeds, the relations become
progressively more restricted (stronger) in format and also less vulnerable to update
anomalies. For the relational data model, it is important to recognize that it is only First
Normal Form (1NF) that is critical in creating relations; all subsequent normal forms are
optional. However, to avoid the update anomalies discussed in Section 13.3, it is generally
recommended that we proceed to at least Third Normal Form (3NF). Figure 13.7 illustrates
the relationship between the various normal forms. It shows that some 1NF relations are
also in 2NF and that some 2NF relations are also in 3NF, and so on.
In the following sections we describe the process of normalization in detail. Figure 13.8
provides an overview of the process and highlights the main actions taken in each step of
the process. The number of the section that covers each step of the process is also shown
in this figure.
In this chapter, we describe normalization as a bottom-up technique extracting information
about attributes from sample forms that are first transformed into table format,
13.5The กระบวนการฟื้นฟู
ฟื้นฟูอย่างทางเทคนิคสำหรับวิเคราะห์ความสัมพันธ์ตามข้อมูลของคีย์หลัก (หรือ
ผู้สมัครคีย์) และหน้าที่อ้างอิง (Codd, 1972b) เทคนิคเกี่ยวข้องกับการ
ชุดของกฎที่สามารถใช้เพื่อทดสอบความสัมพันธ์แต่ละเพื่อให้ฐานข้อมูลสามารถถูกตามปกติ
ระดับใด ๆ เมื่อความต้องการไม่ตรงกับ ความสัมพันธ์ที่ละเมิดข้อกำหนด
ต้องแยกเป็นความสัมพันธ์ที่ตรงกับความต้องการของแต่ละ
ฟื้นฟู
ฟอร์มปกติที่สามเริ่มได้เสนอเรียกฟอร์มปกติแรก (1NF), สอง
แบบปกติ (2NF), และแบบฟอร์มปกติที่ 3 (3NF) ในเวลาต่อมา R. บอยซ์และ E.F.
Codd นำคำจำกัดความแข็งแกร่งของฟอร์มปกติที่สามเรียกว่าบอยซ์-Codd ปกติ
ฟอร์ม (BCNF) (Codd, 1974) ยกเว้น 1NF ฟอร์มเหล่านี้ปกติอยู่
บนหน้าที่ความสัมพันธ์ระหว่างคุณลักษณะของความสัมพันธ์ (Maier, 1983) ปกติสูง
ฟอร์มที่เกิน BCNF ได้แนะนำในภายหลังเช่นฟอร์มปกติ 4 (4NF)
และ ฟอร์มปกติ 5 (5NF) (Fagin, 1977, 1979) อย่างไรก็ตาม ฟอร์มเหล่านี้ในภายหลังปกติ
จัดการกับสถานการณ์ที่ยาก ในบทนี้ เราอธิบายเฉพาะปกติครั้งแรกสาม
แบบฟอร์ม และทิ้งสนทนา BCNF, 4NF และ 5NF จะการต่อบท
มักจะดำเนินการฟื้นฟูเป็นชุดของขั้นตอนการ แต่ละขั้นตอนสอดคล้องกับการ
ฟอร์มปกติที่มีคุณสมบัติที่รู้จักกัน ขณะดำเนินการฟื้นฟู ความสัมพันธ์ที่เป็น
ความก้าวหน้าเพิ่มเติมจำกัด (แข็ง) ในรูปแบบ และ ไม่ต้องเสี่ยงต่อการปรับปรุง
ความผิด สำหรับแบบจำลองข้อมูลเชิงสัมพันธ์ สิ่งสำคัญคือต้องรู้ว่า เป็นเพียงแรก
ปกติฟอร์ม (1NF) ที่มีความสำคัญในการสร้างความสัมพันธ์ แบบฟอร์มปกติต่อมาทั้งหมด
เลือก อย่างไรก็ตาม เพื่อหลีกเลี่ยงความผิดปรับปรุงที่อธิบายไว้ในส่วน 13.3 เป็นทั่วไป
แนะนำว่า เราดำเนินการแบบฟอร์มปกติที่ 3 (3NF) รูปที่ 13.7 แสดง
ความสัมพันธ์ระหว่างแบบปกติต่าง ๆ มันแสดงว่า ความสัมพันธ์บาง 1NF
ยัง ใน 2NF และ ความสัมพันธ์ของ 2NF บางอยู่ใน 3NF และอื่น ๆ .
ในส่วนต่อไปนี้ เราอธิบายขั้นตอนการฟื้นฟูในรายละเอียด รูปที่ 13.8
แสดงภาพรวมของกระบวนการ และเน้นการดำเนินการหลักที่ใช้ในแต่ละขั้นตอนของ
กระบวนการ ยังมีแสดงหมายเลขของหัวข้อที่ครอบคลุมแต่ละขั้นตอนของกระบวนการ
ในรูปนี้
ในบทนี้ เราอธิบายการฟื้นฟูเป็นเทคนิคด้านล่างสายแยกข้อมูล
เกี่ยวกับแอตทริบิวต์จากแบบฟอร์มตัวอย่างที่เป็นครั้งแรกในรูปแบบตาราง,
การแปล กรุณารอสักครู่..
กระบวนการของ 13.5The ปกติ
ปกติเป็นเทคนิคอย่างเป็นทางการสำหรับการวิเคราะห์ความสัมพันธ์ขึ้นอยู่กับคีย์หลักของพวกเขา (หรือ
คีย์ผู้สมัคร) และการอ้างอิงการทำงาน (Codd, 1972b) เทคนิคที่เกี่ยวข้องกับ
ชุดของกฎระเบียบที่สามารถใช้ในการทดสอบความสัมพันธ์ของแต่ละคนเพื่อให้ฐานข้อมูลสามารถปกติ
ในระดับใด เมื่อความต้องการไม่เป็นไปตามความสัมพันธ์ละเมิดข้อกำหนด
จะต้องแตกออกเป็นความสัมพันธ์ที่เป็นรายบุคคลตอบสนองความต้องการของ
บรรทัดฐาน
สามรูปแบบปกติได้รับการเสนอในขั้นต้นที่เรียกว่าแบบฟอร์มปกติแรก (1NF) สอง
แบบปกติ (2NF) และแบบปกติที่สาม (3NF) ต่อมาอาร์บอยซ์และ EF
Codd นำคำนิยามที่แข็งแกร่งของรูปแบบปกติที่สามที่เรียกว่าบอยซ์-Codd ปกติ
แบบฟอร์ม (BCNF) (Codd, 1974) ด้วยข้อยกเว้นของ 1NF, ทุกรูปแบบปกติเหล่านี้จะขึ้น
อยู่กับการพึ่งพาการทำงานในลักษณะของความสัมพันธ์ (Maier, 1983) ปกติที่สูงกว่า
รูปแบบที่นอกเหนือไปจาก BCNF ได้รับการแนะนำในภายหลังเช่นสี่ปกติแบบฟอร์ม (4NF)
และฟิฟท์แบบปกติ (5NF) (Fagin 1977, 1979) แต่รูปแบบปกติเหล่านี้ในภายหลัง
จัดการกับสถานการณ์ที่หายากมาก ในบทนี้เราจะอธิบาย แต่แรกที่สามปกติ
และออกจากรูปแบบการอภิปรายใน BCNF, 4NF และ 5NF บทต่อไป
ปกติมักจะถูกดำเนินการเป็นชุดของขั้นตอน แต่ละขั้นตอนสอดคล้องกับที่เฉพาะเจาะจง
รูปแบบปกติที่มีคุณสมบัติที่รู้จักกัน ในขณะที่รายได้ฟื้นฟูความสัมพันธ์กลายเป็น
ความก้าวหน้าที่ถูก จำกัด มากขึ้น (ดี) ในรูปแบบและยังน้อยกว่าความเสี่ยงที่จะปรับปรุง
ความผิดปกติ สำหรับรูปแบบข้อมูลเชิงสัมพันธ์เป็นสิ่งสำคัญที่จะยอมรับว่ามันเป็นเพียงครั้งแรกที่
ปกติแบบฟอร์ม (1NF) ที่มีความสำคัญในการสร้างความสัมพันธ์กับ รูปแบบปกติมาเป็น
ตัวเลือก แต่เพื่อหลีกเลี่ยงความผิดปกติการปรับปรุงที่กล่าวถึงในมาตรา 13.3 มันเป็นโดยทั่วไป
แนะนำว่าเราจะดำเนินการอย่างน้อยปกติแบบฟอร์มที่สาม (3NF) รูปที่ 13.7 แสดงให้เห็นถึง
ความสัมพันธ์ระหว่างรูปแบบปกติต่างๆ มันแสดงให้เห็นว่าบางความสัมพันธ์ 1NF จะ
ยังอยู่ใน 2NF และที่บางความสัมพันธ์ 2NF ยังอยู่ใน 3NF และอื่น ๆ
ในส่วนต่อไปนี้เราจะอธิบายขั้นตอนของการฟื้นฟูในรายละเอียด รูปที่ 13.8
แสดงภาพรวมของขั้นตอนการดำเนินการและไฮไลท์หลักของการดำเนินการในขั้นตอนของแต่ละ
กระบวนการ จำนวนของส่วนที่ครอบคลุมขั้นตอนของกระบวนการแต่ละนอกจากนี้ยังแสดงให้เห็น
ในรูปนี้
ในบทนี้จะอธิบายถึงการฟื้นฟูเป็นล่างขึ้นเทคนิคการสกัดข้อมูล
เกี่ยวกับคุณสมบัติจากรูปแบบตัวอย่างที่มีการเปลี่ยนครั้งแรกในรูปแบบตาราง
การแปล กรุณารอสักครู่..
กระบวนการของการฟื้นฟู 13.5the
ปกติเป็นเทคนิคทางการวิเคราะห์ความสัมพันธ์โดยใช้คีย์หลัก ( หรือ
คีย์ผู้สมัคร ) และการอ้างอิงการทำงาน ( พ.ศ. 1972b , ) เทคนิคที่เกี่ยวข้องกับ
ชุดของกฎที่สามารถใช้เพื่อทดสอบความสัมพันธ์ของบุคคลเพื่อให้ฐานข้อมูลสามารถปกติ
ทุกระดับ เมื่อความต้องการไม่พบความสัมพันธ์ที่ฝ่าฝืนความต้องการ
ต้องย่อยสลายลงในความสัมพันธ์ที่แยกตามความต้องการของการฟื้นฟู
.
3 รูปแบบปกติ ตอนแรกเสนอเรียกครั้งแรกแบบปกติ ( 1NF ) 2
แบบฟอร์มปกติ ( ประเทศ : ) และสามแบบปกติ ( 3nf ) ต่อมา อาร์ บอยซ์คอดด์ และ e.f.
แนะนำคำนิยามที่แข็งแกร่งของรูปแบบปกติเรียกว่า Boyce Codd ที่สาม–ปกติ
แบบฟอร์ม ( bcnf ) ( พ.ศ. 2517 ) ด้วยข้อยกเว้นของ 1NF ,รูปแบบปกติ ทั้งหมดเหล่านี้จะใช้ในการอ้างอิงในการทำงาน
คุณลักษณะของความสัมพันธ์ ( Maier , 1983 ) สูงกว่าปกติ
แบบฟอร์ม ที่ไปไกลเกินกว่า bcnf แนะนำในภายหลัง เช่น สี่รูปแบบปกติ ( 4nf )
5 รูปแบบปกติ ( 5nf ) ( เฟกิ้น , 1977 , 1979 ) อย่างไรก็ตาม , เหล่านี้ในภายหลังปกติรูปแบบ
จัดการกับสถานการณ์ที่หายากมาก ในบทนี้เราจะอธิบายเฉพาะปกติ
3 อันดับแรกรูปแบบและออกจากการสนทนา bcnf 4nf , และ 5nf ในบทถัดไป .
ปกติมักดำเนินการเป็นชุดของขั้นตอนที่ แต่ละขั้นตอนที่สอดคล้องกับเฉพาะ
รูปแบบปกติที่ได้รู้จักคุณสมบัติ เป็นเงินปกติ , ความสัมพันธ์กลายเป็น
มากขึ้นมีความก้าวหน้าจำกัด ( แข็งแกร่ง ) ในรูปแบบและน้อยกว่าความเสี่ยงที่จะปรับปรุง
ความผิดปกติ สำหรับแบบจำลองข้อมูลเชิงสัมพันธ์มันเป็นสิ่งสำคัญที่จะยอมรับว่ามันเป็นเพียงครั้งแรก
รูปแบบปกติ ( 1NF ) ที่สำคัญในการสร้างความสัมพันธ์ ในรูปแบบปกติที่ตามมาทั้งหมด
เลือก อย่างไรก็ตามเพื่อหลีกเลี่ยงการปรับปรุงความผิดปกติที่กล่าวถึงในส่วนปัญหา มันเป็นโดยทั่วไป
แนะนำว่าเราดำเนินการอย่างน้อยสามรูปแบบปกติ ( 3nf ) รูปที่ 19 แสดงให้เห็นถึงความสัมพันธ์ระหว่างต่าง ๆปกติ
แบบฟอร์มมันแสดงให้เห็นว่าความสัมพันธ์บางอย่าง 1NF เป็น
นอกจากนี้ในประเทศ : ประเทศ : และความสัมพันธ์บางอย่างก็ 3nf และอื่น ๆ .
ในส่วนต่อไปนี้เราจะอธิบายกระบวนการของการฟื้นฟูในรายละเอียด รูปที่ 11.3
จะให้ภาพรวมของกระบวนการ และเน้นหลักในการดําเนินการในแต่ละขั้นตอนของ
กระบวนการ จำนวนหัวข้อที่ครอบคลุมในแต่ละขั้นตอนของกระบวนการยังแสดง
ในรูปนี้ในบทนี้เราจะอธิบายบรรทัดฐานเป็นจากล่างขึ้นบน เทคนิคการสกัดข้อมูล
เกี่ยวกับคุณลักษณะจากตัวอย่างแบบฟอร์มที่แปลงแรกในรูปแบบตาราง
การแปล กรุณารอสักครู่..