Posted by: pimparnp | April 26, 2008

บทที่ 3 ฐานข้อมูล และคลังข้อมูล

 

สวมกอดด้านซ้ายบทที่ 3 ฐานข้อมูล และคลังข้อมูลสวมกอดด้านขวา

ปาร์ตี้โครงสร้างข้อมูล

                มีรูปแบบเป็นลำดับชั้นโดยเริ่มด้วยหน่วยที่เล็กที่สุด คือ บิต(Bit) ไบต์(Byte)  เขตข้อมูล(Field) ระเบียนข้อมูล(Record) และไฟล์(File)  ตามลำดับ

·        บิต (Bit) เป็นหน่วยที่เล็กที่สุดของข้อมูลที่จัดเก็บในระบบคอมพิวเตอร์ เป็นเลขฐานสอง 0 กับ 1

·        ไบต์ (Byte) ประกอบด้วยบิตหลาย ๆ บิตมาเรียงต่อกัน 8 บิต มาเรียงต่อกันเป็น 1 ไบท์ สร้างรหัสแทนข้อมูลใช้แทนอักขระ เป็นตัวเลข ตัวอักษร สัญลักษณ์ ได้ทั้งหมด 28 = 256 ตัว

·        เขตข้อมูล (Field) เป็นการนำข้อมูลหลายอักขระมารวมกันเป็นคำให้เกิดความหมาย

·        ระเบียนข้อมูล (Record) กลุ่มของเขตข้อมูลที่มีความสัมพันธ์กัน นำมารวมกัน

·        ไฟล์ (File) คือ กลุ่มของระเบียนข้อมูลที่มีความสัมพันธ์กันนำมาจัดเก็บไว้ด้วยกัน

  ปัญหาเกี่ยวกับแฟ้มข้อมูล

1.        ความซ้ำซ้อนของข้อมูล (Data Redundancy) การเก็บข้อมูลมากกว่าหนึ่งแห่ง ทำให้ยากต่อการควบคุมความถูกต้องให้ตรงกันของข้อมูล

2.        ความผูกพันระหว่างข้อมูลและโปรแกรม (Program-Data Dependence) เป็นความผูกพันระหว่างข้อมูลและโปรแกรม โดยการเรียกใช้ข้อมูลต้องมีโปรแกรม หากเปลี่ยนแปลงข้อมูล หรือโครงสร้าง จะมีผลกระทบต่อโปรแกรม ทำให้ต้องตามแก้โปรแกรมที่เกี่ยวข้อง ซึ่งทำให้เกิดค่าใช้จ่ายสูงในการบำรุงรักษาโปรแกรม

3.        การไม่สามารถใช้ข้อมูลร่วมกันได้ (Lack of Data sharing) มีการจัดเก็บข้อมูลแยกจากกันทำให้ความพร้อมการใช้ข้อมูลยาก ไม่สามารถนำข้อมูลจากหลายแฟ้มมาใช้งานร่วมกันได

4.        การขาดความร่วมมือ (Lack of Flexibility) ระบบแฟ้มข้อมูลขาดความคล่องตัวในการตอบสนองต่อความต้องการใหม่ ๆ

5.        การขาดระบบรักษาความปลอดภัยที่ดี (Poor Security) การป้องกันไม่ให้ผู้ที่ไม่มีสิทธิเข้าถึงข้อมูลและใช้ข้อมูล มีขอบเขตความสามารถจำกัด

    แนวทางในการใช้ฐานข้อมูลในการบริหารจัดการข้อมูล

  1. ลดความซ้ำซ้อนของข้อมูล (Minimum Redundancy) การนำข้อมูลมารวมกันเพื่อตัดข้อมูลที่ซ้ำกันออกไป ระบบฐานข้อมูลมี DBMS เป็นซอฟต์แวร์ที่ดูแลจัดการข้อมูลทำให้ควบคุมการเกิดความซ้ำซ้อนของข้อมูลได้
  2. มีความเป็นอิสระต่อกัน (Data Independence) ระบบฐานข้อมูลมีแหล่งรวมข้อมูลเก็บข้อมูลต่างๆ ไว้ส่วนกลาง มี DBMS ดูแลการปรับเปลี่ยนโครงสร้างของข้อมูล
  3. สนับสนุนการใช้ข้อมูลร่วมกัน (Improved Data Sharing) การจัดเก็บข้อมูลไว้ส่วนกลางช่วยให้สามารถใช้ข้อมูลร่วมกันได้ โปรแกรมประยุกต์สามารถใช้ข้อมูลที่มีอยู่แล้วโดยไม่ต้องเพิ่มข้อมูลเข้าไปในระบบอีก
  4. มีความคล่องตัวในการใช้งาน (Improved Flexibility) การรวบรวมข้อมูลไว้ที่เดียวกัน มีการควบคุมอยู่ส่วนกลางช่วยให้มีความคล่องตัวในการใช้งานได้มากกว่าระบบไฟล์ข้อมูล DBMS มีเครื่องมือช่วยในการสร้างแบบฟอร์มและรายงานต่าง ๆ ลดขั้นตอน และเวลาในการจัดทำรายงานและการเขียนโปรแกรมได้มาก
  5. มีระบบรักษาความปลอดภัยของข้อมูลสูง (High Degree of Data Integrity) ฐานข้อมูลมีระบบรักษาความปลอดภัย โดย DBMS จะตรวจสอบรหัสผ่านเข้าสู่ระบบ และอนุญาตผู้มีสิทธิเข้ามาในระบบได้เฉพาะสิทธิแต่ละคนเท่านั้น

   องค์ประกอบของระบบฐานข้อมูล

                ระบบฐานข้อมูลประกอบด้วยองค์ประกอบ 4 ส่วน คือ

  1. ข้อมูล (Data) คือ ข้อมูลและความสัมพันธ์ของข้อมูลที่จัดเก็บอยู่ในฐานข้อมูล
  2. ฮาร์ดแวร์ (Hardware) คือ เครื่องคอมพิวเตอร์ และอุปกรณ์รอบข้าง
  3. ซอฟต์แวร์ (Software) คือ ระบบปฏิบัติการ และระบบจัดการข้อมูล รวมทั้งโปรแกรมยูทิลิตี้ต่าง ๆ
  4. ผู้ใช้ (Users) คือ บุคลากรที่เกี่ยวข้องกับระบบฐานข้อมูล ผู้เขียนโปรแกรม และผู้ใช้งาน

   รูปแบบของฐานข้อมูล (Database Model)

                แบบจำลองฐานข้อมูลอธิบายถึงโครงสร้างและความสัมพันธ์ระหว่างข้อมูล แบบจำลองมีหลายรูปแบบ คือ

  1. แบบจำลองฐานข้อมูลลำดับชั้น (Hierarchical Database Model) มีโครงสร้างคล้ายต้นไม้ ข้อมูลมีความสัมพันธ์เรียกว่า One-to-Many  หนึ่งต่อกลุ่ม ข้อมูลจัดเก็บในรูปของ Segment ที่อยู่บนสุด เรียกว่า Root Node ถัดลงมาเรียกว่า Child Node ข้อดีคือมีความซับซ้อนน้อย มีโครงสร้างเข้าใจง่าย เรียงลำดับอย่างต่อเนื่อง ข้อจำกัด คือ การเข้าถึงข้อมูลมีความคล่องตัวน้อย เพราะต้องเริ่มจาก Root Segment เสมอ 
  2. แบบจำลองฐานข้อมูลเครือข่าย (Network Database Model) โครงสร้างเป็นลักษณะ Multi-list Structure มีความสัมพันธ์ของข้อมูลแบบ Many to Many  แต่ละชั้นมี Segment  สามารถมี Parent ได้มากกว่าหนึ่ง เรียก Parent ว่า Owner  ส่วน Child เรียกว่า Member  ความซ้ำซ้อนของข้อมูลมีน้อย สามารถเชื่อมโยงข้อมูลแบบไป กลับได้ แต่จะเปลืองเนื้อที่ในการจัดเก็บพอยน์เตอร์ มีความยุ่งบากในการเปลี่ยนแปลงโครงสร้างข้อมูล
  3. แบบจำลองฐานข้อมูลเชิงสัมพันธ์ (Relational Database Model) โครงสร้างข้อมูลอยู่ในรูปแบบตาราง เรียกตารางว่า รีเลชั้น แต่ละรีเลชั่น ประกอบด้วย แถวหรือทัพเพิล และคอลัมน์ เรียกว่า แอตทริบิวต์ แต่ละรีเลชั่นจะมีแอตทริบิวต์ เรียกว่า คีย์ บอกถึงความแตกต่างของแต่ละทัพเพิล  เป็นโครงสร้างที่เข้าใจง่าย ข้อมูลมีความเป็นอิสระจากโปรแกรม

   ระบบฐานข้อมูลแบบกระจาย (Distributed Database)

                 ฐานข้อมูลแบบกระจาย อาศัยซอฟต์แวร์ในการจัดการข้อมูล ซึ่งอำนวยความสะดวกให้แก่ผู้ใช้งานบนฐานข้อมูลแบบกระจาย การจัดเก็บข้อมูลสอดคล้องกับลักษณะการใช้งานจริง เรียกข้อมูลได้เร็ว

   ฐานข้อมูลแบบออบเจ็กต์ (Object-Oriented Database)

                ฐานข้อมูลเชิงวัตถุเกิดจากแนวคิดการเขียนโปรแกรมเชิงวัตถุ เพื่อการจัดเก็บข้อมูลที่มีความซับซ้อน ขนาดใหญ่ หลากหลาย  จัดเก็บข้อมูลที่ประกอบด้วยแอตทริบิวต์ ซึ่งแสดงคุณสมบัติ รายละเอียดของข้อมูล และเมธอด ซึ่งแสดงฟังก์ชั่นพื้นฐานที่ประมวลผลกับข้อมูลภายนอกออบเจ็กต์นั้น กลุ่มของออบเจ็กต์มีคุณสมบัติ และพฤติกรรมที่เหมือนกันจะจัดอยู่ในคลาสเดียวกัน

                ระบบจัดการฐานข้อมูลแบบออบเจ็กต์สามารถเก็บข้อมูลพื้นฐานทั่วไป ข้อมูลวัตถุ ข้อมูลมัลติมีเดียได้ง่าย แต่ไม่รวดเร็วเท่าระบบฐานข้อมูลแบบเชิงสัมพันธ์ ปัจจุบันจึงพัฒนาฐานข้อมูลแบบออบเจ็กต์และฐานข้อมูลเชิงสัมพันธ์มาใช้ร่วมกัน

   คลังข้อมูล (Data Warehouse)

                คลังข้อมูล เรียกว่า ดาต้าแวร์เฮาส์ คือที่เก็บรวบรวมข้อมูลจากหลายแหล่ง หลายชนิดเข้าด้วยกัน เป็นฐานข้อมูลขนาดใหญ่ขององค์การ ข้อมูลได้มาจากในองค์การ ภายนอกองค์การ  ซึ่งได้รับการเลือก กลั่นกรอง การปรับแก้ไข ทำให้เป็นมาตรฐานเดียวกัน เพื่อให้ผู้ใช้สามารถเข้าถึงข้อมูลได้อย่างสะดวกรวดเร็ว

                ลักษณะของข้อมูล

·        การแบ่งโครงสร้างตามเนื้อหา (Subject Oriented) โดยการจัดเก็บข้อมูลที่สนใจและเป็นประโยชน์มาประมวลผลเพื่อสนับสนุนการตัดสินใจ

·        การรวบรวมเป็นหนึ่งเดียว (Integration) รวบรวมข้อมูลให้อยู่ในรูปแบบมาตรฐานเดียวกัน

·        ความสัมพันธ์กับเวลา (Time Variant) ข้อมูลที่จัดเก็บในคลังต้องกำหนดช่วงเวลา

·        ความเสถียรของข้อมูล (Nonvolatile) ข้อมูลที่ถูกบันทึกไว้ในคลังข้อมูลไม่มีการเปลี่ยนแปลงค่าข้อมูลที่มีอยู่

   ดาต้ามาร์ท (Data Mart)

                การจัดทำดาต้ามาร์ท คือ คลังข้อมูลขนาดเล็กที่มีลักษณะเฉพาะสำหรับใช้ในองค์การธุรกิจ ดาต้ามาร์ทมีขนาดของข้อมูล และค่าใช้จ่ายที่ต่ำกว่า การจัดทำข้อมูลใช้เวลาสั้นกว่า  การนำไปประยุกต์ใช้ในการพัฒนาระบบสนับสนุนการตัดสินใจภายในหน่วยงานสะดวกว่าใช้คลังข้อมูลกลางขององค์การ

   ธุรกิจอัจฉริยะ (Business Intelligence: BI)

                เป็นการใช้ข้อมูลขององค์การที่มีคุณค่าช่วยสนับสนุนการตัดสินใจการดำเนินงานของธุรกิจ เกี่ยวข้องกับการเข้าใช้งานข้อมูล การวิเคราะห์ข้อมูล การค้นพบโอกาสใหม่ ๆ ในการดำเนินการธุรกิจ กระบวนการของธุรกิจอัฉริยะ คือ การสนับสนุนการตัดสินใจ การคิวรี การรายงาน การประมวลผลเชิงวิเคราะห์แบบออนไลน์ การวิเคราะห์ทางสถิติ

   การวิเคราะห์ข้อมูลหลายมิติและการค้นหาความรู้ในคลังข้อมูล

                มี 2 ประเภท คือ

  1. การประมวลผลเชิงวิเคราะห์แบบออนไลน์ (OLAP)  OLAP เป็นเครื่องมือที่มีความสามารถการค้นหา และการวิเคราะห์ข้อมูลจากคลังข้อมูล ในลักษณะต่าง ๆ เช่น
      การหมุนมิติ
    (Rotation)
    การวิเคราะห์ ดูข้อมูลหลายมิติ หลายมุมมอง
      การเลือกช่วงข้อมูล
    (Ranging)
    สามารถเลือกดูข้อมูลเฉพาะส่วนที่สนใจ และนำมาวิเคราะห์ได้โดยไม่ใช้ข้อมูลทั้งหมด
      การเลือกระดับชั้นของข้อมูล
    (Hierarchy) สามารถจัดแบ่งข้อมูลเป็นลำดับชั้น เพื่อให้เรียกดูข้อมูลจากระดับบนแล้วไประดับล่าง ดูรายละเอียดได้
  2. ดาต้าไมนิ่ง (Data Mining)  เป็นเครื่องมือและเทคนิคในการสกัดข้อมูล และประมวลผลข้อมูลเชิงวิเคราะห์ขั้นสูงจากฐานข้อมูลใหญ่ สามารถค้นหารูปแบบ แนวโน้ม พฤติกรรม ความสัมพันธ์ที่ซ่อนอยู่ภายในข้อมูลเพื่อให้ได้ความรู้ใหม่

   ความแตกต่างระหว่างคลังข้อมูลกับฐานข้อมูลปฏิบัติการ

                ฐานข้อมูลปฏิบัติการ (Operational Database) เป็นระบบที่ช่วยรวบรวม และจัดเก็บข้อมูล ซึ่งข้อมูลเพิ่มมากขึ้นเรื่อย ๆ ในแต่ละวัน การประมวลผลข้อมูลที่มีปริมาณมากจะใช้เวลานาน กระทบต่อการดำเนินงานได้ การเรียกดูข้อมูลต่าง ๆ ทำได้ไม่ง่าย ต้องอาศัยเวลาในการประมวลผล ไม่สามารถวิเคราะห์ข้อมูลในรูปแบบต่างๆ จึงมีการจัดทำคลังข้อมูลเพ่อเป็นแหล่งเก็บข้อมูลรวมขององค์การ ให้มีความเรียบง่ายต่อการค้นหา และเรียกใช้ได้อย่างรวดเร็ว สามารถรองรับการวิเคราะห์ข้อมูลที่มีปริมาณมาก ข้อมูลมีลักษณะจัดเก็บในลักษณะที่รวบรวม เป็นระเบียบตามเนื้อหา และแปรผันตามเวลา ข้อมูลซ้ำซ้อนได้ เหมาะกับการประมวลผลเชิงวิเคราะห์ที่เป็นประโยชน์

  รูปแบบการประยุกต์คลังข้อมูลในธุรกิจ

                ระบบคลังข้อมูลนี้ เรียกว่า GWIS (Glaxo Wellcome Information system) เป็นระบบที่ได้รับการพัฒนาด้วยเทคโนโลยีการวิเคราะห์ข้อมูลเชิงสัมพันธ์แบบออนไลน์ (Relational Online Analytical Processing :ROLAP) ช่วยสนับสนุนการตัดสินใจโดย GWIS ทำงานร่วมกับข้อมูลที่จัดเก็บในระบบการจัดการฐานข้อมูลเชิงสัมพันธ์ และบูรณาการเข้ากันกับข้อมูลจากแหล่งภายใน และแหล่

 


Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

Categories

%d bloggers like this: