บทที่ 3 ฐานข้อมูล และคลังข้อมูล

ฐานข้อมูล(Database) และ คลังข้อมูล (Data Warehouse) เป็นแนวการในการบริหารจัดการฐานข้อมูล

องค์ประกอบของฐานข้อมูล รูปแบบฐานข้อมูล และรูปแบบการประยุกต์คลังข้อมูลในธุรกิจ

โครงสร้างข้อมูล

โครงสร้างข้อมูลมีรูปแบบเป็นลำดับชั้นคือ

1.บิต (Bit) เป็นหน่วยข้อมูลที่เล็กที่สุดประกอบด้วยเลขฐานสอง

2.ไบต์ (Byte) ประกอบด้วยหลายบิตมาเรียงกันได้ทั้งหมด 256 ตัว

3.เขตข้อมูล (Field) เป็นนำเอาข้อมูลหลายอักขระมารวมกันให้เกิดความหมาย

4.ระเบียนข้อมูล (Record) คือกลุ่มข้อมูลที่มีความสัมพันธ์กัน ถูกนำมารวมกัน

5. ไฟล์ (File) กลุ่มของระเบียนข้อมูลที่มีความสัมพันธ์กันถูกนำมาจัดเก็บไว้ด้วยกัน

ปัญหาเกี่ยวกับแฟ้มข้อมูล

ความซ้ำซ้อนของข้อมูล (Data Redundancy)

การจัดเก็บข้อมูลมากกว่าหนึ่งแห่งทำให้ยากควบคุมที่จะควบคุมความถูกต้องตรงกันของข้อมูล

ความผูกพันระหว่างข้อมูลและโปรแกรม (Program-Data-Dependence)

ความไม่เป็นอิสระของข้อมูลจะเป็นทำให้มีผลกระทบต่อโปรแกรม และจะต้องตามแก้ไขโปรแกรมต่างทำ

ให้เกิดค่าใช้จ่ายที่สูง

การไม่สามารถใช้ข้อมูลร่วมกันได้(Lack of data Sharing)

ข้อมูลที่จัดเก็บอยู่แยกจากกันคนละส่วนงานทำให้ความพร้อมในการใช้ข้อมูลอยู่ในระดับที่ต่ำ

การขาดความคล่องตัว (Lack of Flexibility)

ระบบแฟ้มข้อมูลขาดความคล่องตัวในการตอบสนองข้อมูลใหม่ๆ

การขาดระบบรักษาความปลอดภัยที่ดี (Poor Security)

การป้องกันไม่ให้ผู้ที่ไม่มีสิทธิเข้าถึงข้อมูลและการใช้ข้อมูล

แนวทางในการใช้ฐานข้อมูลในการจัดการข้อมูล

ลดความซ้ำซ้อนของข้อมูล(Minimum Redundancy)

การนำข้อมูลมารวมกันเพื่อตัดหรือลดส่วนจะช่วยให้ลดการซ้ำซ้อนของข้อมูล ระบบฐานข้อมูลจะมี DBMS

ซึ่งเป็นซอฟต์แวร์ดูแลจัดการข้อมูลควบคุมการเกิดซ้ำซ้อนของข้อมูลได้

มีความเป็นอิสระของข้อมูล (Data Independence)

ในระบบฐานข้อมูลจะมีแหล่งรวมของข้อมูล(Repository)ที่เก็บรายละเอียดของข้อมูลต่างๆไว้ที่ส่วนกลางและมี DBMS ทำหน้าที่ในการดูแลปรับเปลี่ยนโครงสร้างฐานข้อมูลทำให้โปรแกรมต่างๆเป็นอิสระจากการ

เปลี่ยนแปลงโครงสร้างข้อมูล

สนับสนุนการใช้ข้อมูลร่วมกัน (Improved Data Sharing)

การทำข้อมูลไว้ที่ส่วนกลางช่วยสามารถทำให้ใช้ข้อมูลร่วมกันได้ โปรแกรมประยุกต์ที่พัฒนาขึ้นใหม่

สามารถใช้ข้อมูลที่มีอยู่แล้วโดยไม่จำเป็นต้องเพิ่มข้อมูลเข้าไปในระบบอีก

มีความคล่องตัวในการใช้งาน
(Improved Flexibility)DBMS โดยทั่วไปจะมีเครื่องมือสนับสนุนในการสร้างแบบฟอร์มและรายงานต่างๆช่วยลดขั้นตอนในการ

ทำงาน

มีระบบรักษาความปลอดภัยของข้อมูลสูง (High Degree of data Integrity)DBMS

จะตรวจสอบรหัสการเข้าสู่ระบบและจะอนุญาตให้ผู้ที่มรสิทธิเข้ามาทำงานในระบบทำการเรียกดู

ข้อมูลหรือแก้ไขได้ตามสิทธิที่กำหนด

องค์ประกอบของระบบฐานข้อมูล

แบ่งออกเป็น 4 ส่วนคือ

1.ข้อมูล (Data) ข้อมูลความสัมพันธ์ของข้อมูลที่จัดเก็บอยู่ในฐานข้อมูล

2.ฮาร์ดแวร์ (Hardware) เครื่องคอมพิวเตอร์ และอุปกรณ์อื่นๆ

3.ซอฟต์แวร์(Soft ware) ระบบปฏิบัติการ และระบบจัดการข้อมูล

4.ผู้ใช้ (User) บุคคากรที่เกี่ยวข้องกับระบบฐานข้อมูล

รูปแบบของฐานข้อมูล (Database Model)

แบบจำลองฐานข้อมูลถึงโครงสร้างและความสัมพันธ์มีหลายรูปแบบดังนี้

แบบลำดับชั้น

มีโครงสร้างเป็นแบบต้นไม้(Tree Structure)ข้อมูลมีความสัมพันธ์กันในลักษณะ One to Many

ข้อมูลจัดเก็บในรูปแบบ Segment โดยบนสุด Root node รองลงมาเป็น Child node ระดับบนเป็น

Parent segment สามารถมี Child Segment ได้มากกว่าหนึ่ง แต่ Child Segment สามารถมี Parent segment

ได้ 1 เดียว

ข้อดี และ ข้อจำกัด

โครงสร้างของข้อมูลเข้าใจง่ายมีความซับซ้อนน้อยเหมาะกับข้อมูลที่มีการเรียงลำดับต่อเนื่อง แต่ไม่สามารถ

รองรับความสัมพันธ์ Many to Many ได้

แบบจำลองฐานข้อมูลเครือข่าย (Network Database Model)

โครงสร้างของข้อมูลเป็นลักษณะ Multi-list-Structure ความสัมพันธ์ของข้อมูลเป็นแบบ Many to Many แต่

ละ Segment สามารถมี Parent ได้มากกว่าหนึ่ง

Parent เรียกว่า Owner

Child เรียกว่า Member

ข้อดีและข้อจำกัด

ความซ้ำซ้อนของข้อมูลน้อยกว่าแบบฐานข้อมูลลำดับชั้น และสนับสนุนความสัมพันธ์ Many to Many

ซึ่งสามารถเชื่อมโยงข้อมูลแบบไป-กลับได้ โดยใช้ Pointer ในการเชื่อมโยงและเข้าถึงข้อมูล แต่จะเปลือง

เนื้อที่ในการจัดเก็บ pointer ยังมีความยุ่งยากอยู่ในการเปลี่ยนแปลงโครงสร้างข้อมูลที่มีความซับซ้อน

แบบจำลองข้อมูลเชิงสัมพันธ์(Relational Database Model)

แบบจำลองข้อมูลเชิงสัมพันธ์แสดงโครงสร้างข้อมูลแบบตาราง เรียกว่า Relation

ประกอบด้วย แถวหรือทัพเพิล(Tuple)

คอลัมพ์ หรือ แอตทริบิวส์ (Attribute)

แต่ละรีเลชั่นจะมีแอตทริบิวส์ ซึ่งจะเรียกว่า Key เป็นตัวบอกความแตกต่างของทัพเพิล

ข้อดีและข้อจำกัด

แบบจำลองข้อมูลเชิงสัมพันธ์เข้าใจง่ายเพราะเป็นตาราง

ข้อมูลมีความเป็นอิสระจากโปรแกรม

ระบบฐานข้อมูลแบบกระจาย (Distribute Database)

ในหลายองค็กรอาจมีการกระจายข้อมูลจัดเก็บในคอมพิวเตอร์หลายเครื่องตามพื้นที่ต่างๆแทนที่จะเก็บเพียง

ที่เดียว เพื่อความคล่องตัวในการดำเนินการ เรียกว่าฐานข้อมูลแบบกระจายจึงจำเป็นต้องอาศัยซอฟต์แวร์ใน

การจัดการข้อมูลโดยเรียกระบบฐานข้อมูลแบบกระจายว่า
Distribute Database Management

System(DDBMS)

ข้อดีและข้อจำกัด

ระบบการกระจายข้อมูลมีข้อดีที่การจัดเก็บข้อมูลสอดคล้องกับการทำงานจริง

ฐานข้อมูลแบบออปเจ็ก (Object-oriented Database)

เกิดจากโปรแรมเชิงวัตถุเพื่อตอบสนองการเก็บข้อมูลที่มีความซับซ้อนมีขนาดใหญ่ การจัดเก็บข้อมูลใน

รูปแบบวัตถุ
(Object) ที่ประกอบด้วยแอตทริบิวส์และเมธอต

ข้อดีและข้อจำกัด

สามารถจัดเก็บข้อมูลพื้นฐานทั่วไป ข้อมูลวัตถุ ข้อมูล Multi Media แต่การประมวลผลทำได้ไม่รวดเร็ว

คลังข้อมูล (Data Warehouse)

ดาต้าแวร์เฮาร์ (Data warehouse)คือที่เก็บรวบรวมข้อมูลจากหลายแหล่งชนิดฐานข้อมูลทั้งภายในและ

ภายนอกองค์กร ทำให้เป็นมาตรฐานเดียวกันเพื่อให้ข้อมูลมีความพร้อมเพื่อที่จะประมวลผลสำหรับตัดสินใจ

สถานะของคลังข้อมูล

1.การแบ่งโครงสร้างตามเนื้อหา????ฐานข้อมูลที่ถูกออกแบบจากเนื้อหาหลักของงาน

2.การรวมเป็นหนึ่งเดียว????ฐานข้อมูลรวบรวมข้อมูลจากหลายแหล่ง

3.ความสัมพันธ์กับเวลา????เก็บข้อมูลย้อนหลัง 3-5 ปี

4.ความเสถียรของข้อมูล????คลังข้อมูลไม่มีการเปลี่ยนแปลงค่า

ดาต้ามาร์ท (Data-Mart)

ดาต้ามาร์ทนิยมใช้ในองค์การขนาดกลางและขนาดย่อมเป็นคลังข้อมูลที่มีลักษณะเจาะจงมากกว่าใช้ใน

องค์กรธุรกิจขนาดใหญ่ ค่าใช้จ่ายต่ำ

ธุรกิจอัจฉริยะ (Business Intelligence : BI)

คลังข้อมูล/ดาต้ามาร์ท ถูกจัดเก็บแล้วสามารถเรียกใช้ข้อมูลแหล่งนั้นตามสิทธิที่ได้รับเพื่อทำการประมวลผล

ในการสนับสนุนการตัดสินใจ

การใช้ข้อมูลองค์กรที่มีคุณค่าสนับสนุนการตัดสินใจในการดำเนินธุรกิจใช้วิเคราะห์ข้อมูลค้นหา

โอกาสใหม่ๆในการทำธุรกิจ

การประมวลผลเพื่อวิเคราะห์แบบออนไลน์ (OLAP)

OLAP เป็นเครื่องมือที่มีความสามารถค้นหาและวิเคราะห์จากคลังข้อมูลด้วยความรวดเร็ว เราสามารถใช้

OLAP วิเคราะห์ข้อมูลในลักษณะงานต่างๆเช่น

การหมุนมิติ ( Rotation ) วิเคราะห์ข้อมูลได้หลายมุมมองหลายมิติการเลือกช่วงข้อมูล

( Ranging) สามารถเลือกช่วงข้อมูลที่สนใจได้

การเลือกระดับชั้นของข้อมูล (Hierarchy) สามารถแบ่งกลุ่มตามลำดับชั้น เจาะลึกข้อมูลในระดับล่างได้

ดาต้าไมนิ่ง (Data Mining)

เครื่องมือและเทคนิคในการสกัด และประมวลผลข้อมูลในเชิงวิเคราะห์ขั้นสูงจากฐานข้อมูลขนาดใหญ่

สามารถค้นหารูปแบบ แนวโน้ม พฤติกรรม และความสัมพันธ์ที่ซ่อนอยู่ภายในข้อมูล เพื่อค้นหาคำตอบ

ลักษณะต่อไปนี้

1.ความสัมพันธ์ที่เกี่ยวข้อง

2.ลำดับของข้อมูล

3.การหากฎเกณฑ์ในการจัดกลุ่ม

4.การจัดกลุ่มคล้ายคลึง

5.การพยากรณ์

ความแตกต่างระหว่างคลังข้อมูลกับฐานข้อมูลปฏิบัติการ

ฐานข้อมูลเป็นการรวบรวมจัดการกับข้อมูลแต่คลังข้อมูลจะทำการจัดการข้อมูลให้สามารถนำมาใช้งานได้

ในเชิงวิเคราะห์และตัดสินใจ

Comment

Comment:

Tweet