วันเสาร์ที่ 13 ธันวาคม พ.ศ. 2551

สรุปท้ายบทที่ 3 ฐานข้อมูลและคลังข้อมูล

ระบบฐานข้อมูลเป็นสิ่งที่จำเป็นและเกี่ยวข้องกับการใช้งานประจำวัน การตัดสินใจของผู้บริหารจะกระทำได้รวดเร็ว ถ้ามีข้อมูลที่ถูกต้องและเพียงพอ จึงมีการใช้คอมพิวเตอร์ช่วยประมวลผลเพื่อให้ได้สารสนเทศดังกล่าว แต่การประมวลผลด้วยคอมพิวเตอร์จำเป็นต้องมีหลักการและวิธีการที่ทำให้ระบบมีระเบียบแบบแผนที่ดีการเก็บข้อมูลนั้นผู้จัดเก็บจำเป็นต้องทำการแยกแยะ และพยายามหาทางลดขนาดของข้อมูลให้สั้นที่สุด แต่ให้ได้ความหมายในตัวเองมากที่สุด โดยปกติข้อมูลที่ต้องการเก็บมีเป็นจำนวนมาก เช่น บริษัทแห่งหนึ่งมีข้อมูลเก็บเป็นจำนวนหลายแฟ้ม การเก็บข้อมูลจึงจำเป็นต้องแยกกลุ่มออกจากกัน แต่ข้อมูลระหว่างกลุ่มก็อาจจะมีความสัมพันธ์หรือเกี่ยวข้องกันได้ ความสัมพันธ์ระหว่างกลุ่มนี้เองเป็นส่วนที่ทำให้เกิดระบบฐานข้อมูล ซึ่งเป็นศาสตร์ที่จำเป็นต้องเข้าใจหลักการและวิธีการเพื่อให้เกิดการเก็บ เรียกหา ค้นหา หรือใช้งานข้อมูลได้ประสิทธิภาพสูงสุด จึงมีการแยกกลุ่มข้อมูล โดยยึดหลักการพื้นฐานว่าข้อมูลแต่ละกลุ่มจะเป็นสิ่งที่มองเห็นหรือจับต้องได้ เช่น คน สิ่งของ สินค้า สถานที่ ข้อมูลแต่ละกลุ่มที่แยกนี้เรียกว่า เอนทิตี (entity) โดยสรุปเอนทิตี หมายถึง สิ่งที่เราสามารถมองเห็นภาพลักษณ์ได้ โดยข้อสนเทศของเอนทิตีจะสามารถแยกออกได้เป็นสองส่วน คือ เนื้อหาและข้อมูล สำหรับเนื้อหาของเอนทิตีชนิดเดียวกันจะมีลักษณะเหมือนกัน แต่ส่วนของข้อมูลจะแตกต่างกันออกไป เนื้อหาจึงเป็นส่วนที่จะบอกรายละเอียดเพื่อขยายข้อมูลให้ได้ความหมายครบถ้วนยิ่งขึ้น พิจารณาจากระบบข้อมูลโดยดูตัวอย่างเอนทิตีของบุคลากรของบริษัทแห่งหนึ่ง ในการเก็บข้อมูลด้วยคอมพิวเตอร์ในรูปแบบแฟ้มนั้นต้องประกอบด้วยเขตข้อมูลหลาย ๆ เขตรวมกันเป็นระเบียน การเก็บและการเรียกข้อมูลจะกระทำทีละระเบียน การแบ่งประเภทของแฟ้มจึงมักแบ่งแยกตามรูปแบบลักษณะการเรียกค้นหา ซึ่งแบ่งออกเป็น 3 แบบด้วยกันคือ แฟ้มลำดับ (sequential file) แฟ้มสุ่ม (random file) และ แฟ้มดัชนี (index file) ดังนี้
1) แฟ้มลำดับ เป็นแฟ้มที่มีโครงสร้างการเก็บข้อมูลแบบพื้นฐานที่สุด กล่าวคือ เมื่อมีการเพิ่มข้อมูลลงในแฟ้มทีละระเบียน ข้อมูลจะเข้าต่อท้ายเรียงกันไป ในการย้ายข้อมูลก็จะอ่านข้อมูลที่ละระเบียน เพื่อให้เข้าใจได้ง่ายอาจเปรียบเทียบได้กับการเก็บข้อมูลเพลงในเทปคาสเซต ซึ่งสมมติว่าในม้วนเทปหนึ่งมีการเก็บเพลงได้ 10 เพลง ความยาวเพลงละ 3 นาที ซึ่งหากต้องการค้นหาเพลงใดก็ต้องเริ่มต้นจากเพลงแรกไปเป็นลำดับจนกว่าจะพบ 2) แฟ้มสุ่ม เป็นแฟ้มที่มีคุณสมบัติที่ผู้ใช้สามารถอ่านหรือเขียนที่ตำแหน่งใด ๆ ก็ได้โดยไม่ต้องเรียงลำดับจากต้นแฟ้ม เช่น กรณีของการเก็บข้อมูลเพลงในเทปคาสเซต ถ้าต้องการอ่านเพลงที่ 5 ก็จะคำนวณความยาวของสายเทป เพื่อให้มีการเคลื่อนสายเทปไปยังตำแหน่งที่ต้องการแล้วจึงเริ่มอ่าน กรณีนี้จะทำได้เร็วกว่าสแบบลำดับaaaaa3) แฟ้มแบบดัชนี แฟ้มแบบนี้จำเป็นต้องมีการจัดเรียงข้อมูลในเขตข้อมูลที่เป็นดัชนีเสียก่อน เพื่อประโยชน์ในการค้นหา การหาตำแหน่งในการเขียนการอ่านในระเบียนที่ต้องการปกติจะใช้ข้อมูลที่เป็นกุญแจสำหรับการค้นหา เพื่อความสะดวกในการกำหนดตำแหน่งการเขียนอ่าน ดังตัวอย่างเช่น ถ้าใช้ชื่อเพลงเป็นกุญแจสำหรับการค้นหา จะมีการเก็บชื่อเพลงโดยมีการจัดเรียงตามตัวอักษร เมื่อค้นหาชื่อเพลงได้ ก็ได้ลำดับเพลง ซึ่งสามารถนำไปคำนวณหาตำแหน่งที่ต้องการเขียนอ่านได้ต่อไป สมัยก่อน ในศูนย์คอมพิวเตอร์จะเห็นภาพผู้คนนั่งเจาะบัตรคอมพิวเตอร์ให้เป็นรหัสทั้งส่วนที่เป็นข้อมูลหรือโปรแกรม การทำงานในสมัยนั้นส่วนใหญ่ใช้การประมวลผลแบบกลุ่ม โดยนำข้อมูลเก็บไว้ในเทปบันทึก แล้วนำมาประมวลผล เพื่อทำรายงานตามความต้องการ การทำงานในลักษณะประมวลผลแบบกลุ่มก็ยังคงมีอยู่ถึงปัจจุบันโดยเฉพาะงานวิจัยa การแจ้งผลสอบผ่านเครือข่ายคอมพิวเตอร์ของธนาคาร ต้องมีการค้นหาข้อมูลผลสอบ และตอบให้ทราบทันทีทั้งที่เป็นระบบเสียงพูดและระบบแสดงผลบนจอภาพ เป็นตัวอย่างที่แสดงว่า การทำงานกับระบบฐานข้อมูลเริ่มมีความจำเป็นจะต้องมีการประมวลผลผ่านสายโทรศัพท์ที่เรียกว่า การประมวลผลแบบเชื่อมตรง การประมวลผลแบบนี้ มีการเรียกค้นหาข้อมูลและปรับปรุงแก้ไขข้อมูลได้ตลอดเวลา จึงนิยมใช้กันแพร่หลายมากขึ้นa ต่อมาไมโครคอมพิวเตอร์ได้เป็นที่นิยม โดยมีขีดความสามารถทางด้านความจุข้อมูลของฮาร์ดดิสก์ (hard disk) เพิ่มขึ้นในขณะที่ราคาลดลง และมีโปรแกรมสำเร็จเกี่ยวกับการจัดการฐานข้อมูลที่ใช้ง่าย ๆ เกิดขึ้นหลายโปรแกรม แนวโน้มการใช้งานประมวลผลข้อมูลด้วยไมโครคอมพิวเตอร์จึงเป็นที่นิยมมากขึ้น เทคโนโลยีด้านคอมพิวเตอร์ได้เปลี่ยนแปลงไปตามกาลเวลา วิธีจัดการฐานข้อมูลก็ได้รับการพัฒนาให้ก้าวหน้าขึ้นเป็นลำดับ การจัดการฐานข้อมูลจึงเป็นศาสตร์ที่มีการศึกษาเล่าเรียนกันในหลาย ๆ ระดับ การจัดการฐานข้อมูลจะยึดหลักการที่สำคัญคือ
1) ลดความซ้ำซ้อนของข้อมูล การจัดเก็บข้อมูลเป็นแฟ้ม โดยกระจายอยู่ในหลาย ๆ แฟ้ม มักจะพบปัญหาของการปรับแก้ไขข้อมูล เพราะต้องคอยปรับปรุงข้อมูลให้ครบทุกแฟ้ม มิฉะนั้นจะพบกับปัญหาความซ้ำซ้อนของข้อมูล ซึ่งทำให้การบริหารข้อมูลทำได้ยากข้อมูลจึงควรได้รับการออกแบบและเก็บอยู่ในฐานข้อมูลที่ใดที่เดียว เพื่อลดความซ้ำซ้อนa ในการกำหนดรูปแบบข้อมูลจะต้องทำให้ข้อมูลทั้งฐานข้อมูลเป็นรูปเดียวกัน เช่น การกำหนดข้อมูลชื่อ ให้ใช้ชื่อแล้วเว้นช่องว่างจึงเป็นนามสกุล และมีตำแหน่งต่อท้ายแทนการขึ้นต้น เช่น พ.ท. สมชาย ดีใจ เก็บเป็น สมชาย ดีใจ พ.ท. เป็นต้น เมื่อมีการกำหนดรูปแบบข้อมูลที่ชัดเจน และถือปฏิบัติใช้ทั้งฐานข้อมูลก็จะลดปัญหาการจัดการฐานข้อมูลลงไปได้มาก ทำให้ข้อมูลเป็นกลางและใช้ร่วมกันได้ นอกจากนี้ยังมีหลายสาเหตุที่อาจก่อให้เกิดความซ้ำซ้อนของข้อมูลในฐานข้อมูล ซึ่งจะต้องคำนึงถึงในการออกแบบฐานข้อมูลa ข้อมูลจะต้องใช้งานได้กับผู้ใช้หลาย ๆ ประเภท หรือหลายแบบ เช่น ข้อมูลในฐานข้อมูลของจังหวัด จะต้องใช้ได้ทุกอำเภอ ความต้องการข้อมูลของแต่ละหน่วยงานอาจมีรายละเอียดที่ต่างกัน เช่น แผนกขายต้องการชื่อที่อยู่ของลูกค้าเพื่อติดต่อส่งเสริมการขาย แผนกติดตามหนี้ต้องการได้รายละเอียดเกี่ยวกับประวัติหนี้ค้างของลูกค้าa การเรียกชื่อข้อมูล อาจจะเรียกแตกต่างกัน เช่น ชื่อสินค้า อาจเรียกได้หลายอย่างในชื่อสินค้าเดียวกัน 2) กำหนดมาตรฐานข้อมูล ในการสร้างฐานข้อมูลจะต้องให้ข้อมูลที่จัดเก็บเป็นมาตรฐาน มีการกำหนดรหัสที่เป็นมาตรฐาน มีการกำหนดคำหลัก (keyword) หรือค่าที่ใช้แทนข้อมูลอย่างเดียวกันเพื่อให้ได้ความหมายต่อการใช้งานที่ดี 3) มีระบบป้องกันความปลอดภัยของข้อมูล ข้อมูลที่จัดเก็บไว้ในฐานข้อมูลจำเป็นต้องจัดแบ่งระดับความสำคัญของข้อมูลเพื่อกำหนดผู้ใช้ มีการควบคุมข้อมูล เพื่อบ่งบอกว่าใครจะเป็นผู้แก้ไขหรือข้อมูลได้บ้าง มีการบันทึกประวัติการแก้ไขข้อมูลเพื่อตรวจสอบ ข้อมูลที่จัดเก็บนั้นอาจมีความสำคัญ ดังนั้นการแก้ไขหรือปรับปรุงข้อมูลโดยรู้เท่าไม่ถึงการณ์นั้นอาจทำให้ข้อมูลเสียหายได้ 4) มีความเป็นอิสระจากโปรแกรม ระบบจัดการฐานข้อมูลที่ดีจะต้องเป็นระบบที่ข้อมูล และฐานข้อมูลมีความเป็นอิสระจากโปรแกรม ทำให้สามารถใช้โปรแกรมจัดการฐานข้อมูลใด ๆ จัดการฐานข้อมูลได้ การออกแบบให้ข้อมูลเป็นอิสระนี้ทำให้ข้อมูลใช้ได้กับเครื่องคอมพิวเตอร์ทุกรูปแบบ 5) รวมข้อมูลเป็นฐานข้อมูลกลาง แต่เดิมมีการเก็บข้อมูลแยกเป็นแฟ้มกระจัดกระจาย จึงต้องเก็บข้อมูลด้วยเทป แต่ในปัจจุบันด้วยเทคโนโลยีที่ทันสมัยสามารถรวบรวมข้อมูลเข้าด้วยกันเป็นฐานข้อมูลกลาง ทำให้ระบบการทำงานใช้ข้อมูลร่วมกันได้
aการดำเนินงานฐานข้อมูลจะต้องมีการจัดการเตรียมฐานข้อมูลและบริหารข้อมูล โดยจัดแบ่งแยก ปรับปรุงข้อมูล และตรวจสอบความถูกต้องหน้าที่หลักของผู้บริหารฐานข้อมูล จึงประกอบด้วยการจัดเก็บข้อมูล การติดต่อประสานงานกับแหล่งข้อมูลและที่มาของข้อมูล จึงประกอบด้วยการจัดเก็บข้อมูล การติดต่อประสานงานกับแหล่งข้อมูลและที่มาของข้อมูลตรวจสอบความถูกต้องของข้อมูล แบ่งกลุ่ม จัดลำดับ กำหนดรหัสข้อมูล สรุปผลทำรายงาน คำนวณเก็บรักษาข้อมูลโดยต้องคำนึงถึงความปลอดภัยและเชื่อถือได้ของข้อมูล การค้นหาข้อมูล การสำรวจข้อมูล และเผยแพร่แจกจ่ายข้อมูล

ไม่มีความคิดเห็น: