You are on page 1of 55

Chapter 1 Introduction

to
Data Warehouse Systems
อ. สุ รินทร์ ทพิ ศักดิ์ภูวดล
คณะเทคโนโลยีสารสนเทศและการสื่ อสาร
มหาวิทยาลัยพะเยา
บทที่ 1 แนะนำระบบคลังข้ อมูล
(Introduction to Data Warehouse Systems )
Midterm Exam 20 %
Final Exam 30 %
LAB 15 %
Project 15 %
Self_Study 10 %
เนือ้ หา
1. คลังข้ อมูลคืออะไร
2. ลักษณะของคลังข้ อมูล
3. สถาปัตยกรรมของคลังข้ อมูล
4. ประโยชน์ ของ DSS
การวิเคราะห์ขอ้ มูลทางธุรกิจ
 ต้องการหากำไรสู งสุ ด  ต้องการหาต้นทุนต่ำสุ ด
 ต้องการวิเคราะห์เพื่อหาลูกค้า  ต้องการทำนาย รายได้ เมื่อมี
ใหม่ และรักษาลูกค้าเก่า (CRM) การเปลี่ยนแปลงปั จจัยต่างๆ
 เพื่อสนับสนุนการตัดสิ นใจของผู ้
 ต้องการหาพฤติกรรมการซื้ อ
บริ หาร
จากฐานข้อมูลขนาดใหญ่

การผลิตในโรงงาน โรงพยาบาล ธนาคาร โรงแรม

http://daikin.idevterest.com/daikin-quality/production
ความก้าวหน้าทางการวิเคราะห์ขอ้ มูล

ธนาคารนำ AI มาวิเคราะห์ เพื่อพิจารณาเงินกู้


Model การวิเคราะห์ต่างๆ เช่น
สามารถวิเคราะห์จากข้อมูล
การใช้จ่าย
การชำระหนี้
ความมัน่ คงทางการเงิน และ
+ CRM
อื่นๆ
Big Data
Result
User ถูกเก็บข้ อมูลพฤติกรรม จากทุกเทคโนโลยีที่ User ใช้ งาน
Picture Reference : https://www.posttoday.com/finance/news/579929
ปัญหาทางธุรกิจในปัจจุบนั
ตอบคำถามในห้องเรี ยน
Test: What is
1. Data Warehouse
2. Big Data
3. Data mining
3. Data Science
ข้อมูล สารสนเทศ องค์ความรู้ และปัญญา
(Data, Information, Knowledge and Wisdom)
 องค์ความรู้ (Knowledge)
คือ สารสนเทศที่ถูกคัดเลือกเพื่อใช้ในการแก้ปัญหาต่าง ๆ ตามต้องการได้อย่างมี
ประสิ ทธิภาพ โดยอาศัยประสบการณ์ในการเลือกสารสนเทศมาใช้ในการแก้ไข
ปัญหาได้อย่างเหมาะสม องค์ความรู้บางส่ วนได้จากการผลการวิเคราะห์ขอ้ มูลแล้ว
ได้ กฏ หรื อ รู ปแบบ ต่างๆ ที่ช่วยในการตัดสิ นใจ หรื อแก้ปัญหา
Wisdom

Knowledge Correct use of Knowledge


Information
Collection of all Information
Data
Process & Transform
องค์ความรู้ (Knowledge)
 ข้ อมูล (Data) คือ การรวบรวมข้อเท็จจริ งต่าง ๆ เข้าไว้ดว้ ยกัน โดยไม่มีการ
ประมวลผลแต่อย่างใด เช่น ข้ อมูลเวลาทำงานของพนักงาน ข้ อมูลรายละเอียด
ของใบเสร็ จ
 สารสนเทศ (Information) คือ การรวบรวมข้อมูลมาจัดเก็บ ประมวลผล และจัดการ
ให้มีความถูกต้อง ทันสมัย สะดวกและง่ายในการทำความเข้าใจแ ละสามารถนำไป
ใช้ประโยชน์ได้ทนั ที เช่น สารสนเทศของสรุ ปยอดรวมจำนวนวันที่พนักงานแต่ ละ
คนมาทำงานในแต่ ละเดือน รายงานสรุ ปการขาย
 องค์ ความรู้ (Knowledge) คือ สารสนเทศที่สามารถนำไปใช้ในการแก้ปัญหา หรื อ
ตัดสิ นใจในการดำเนินธุรกิจให้ประสบความสำเร็ จได้ ดังนั้น องค์ ความรู้ จ ำเป็ นต้ อง
อาศัยประสบการณ์ ในการเรี ยนรู้ ที่จะนำสารสนเทศมาใช้ ในการแก้ ปัญหา ซึ่งขึ้น
กับการฝึ กฝน และมุมมองในการเลือกสารสนเทศไปใช้ บางลักษณะขององค์ ความ
รู้ สามารถสร้ างรู ปแบบการแก้ ปัญหา กฏในการแก้ ปัญหา หรื อการตัดสิ นใจได้
 ปั ญญา (Wisdom) เป็ นปั ญญาที่เกิดจาก การรวบรวมประสบการณ์ และการประยุกต์
องค์ความรู้ เพื่อที่จะนำมาแก้ปัญหา และตัดสิ นใจ
องค์ความรู้

Process สารสนเทศที่เกี่ยวข้องและ
Information
นำไปใช้ประโยชน์ได้

Data Knowledge

สารสนเทศที่เกี่ยวข้องและนำไปใช้ประโยชน์ได้
Data warehouse
A data warehouse is a database that stores current and historical
data of potential interest to decision makers throughout the
company. The data originate in many core operational transaction
systems, such as systems for sales, customer accounts, and
manufacturing, and may include data from Web site transactions.
The data warehouse consolidates and standardizes information
from different operational databases so that the information can be
used for management analysis and decision making.

12
Data warehouse
คลังข้ อมูล (data warehouse) เป็ นฐานข้อมูลที่จดั เก็บข้อมูล
ปัจจุบนั และข้อมูลในอดีต ที่น่าสนใจแก่ผมู้ ีอ ำนาจตัดสิ นใจทัว่ ทั้ง
บริ ษทั ข้อมูลมาจากระบบธุรกรรมหลักในการดำเนินงาน เช่นระบบ
การขาย ระบบบัญชีลูกค้า และระบบการผลิต และอาจรวมถึงข้อมูล
จากการทำธุรกรรมบนเว็บไซต์ (Web site transactions) คลังข้อมูล
รวบรวมข้อมูล และสร้างมาตรฐานข้อมูลที่มาจากฐานข้ อมูลการ
ปฏิบัตงิ าน (Operational databases) ที่แตกต่างกัน เพื่อให้ขอ้ มูล
สามารถใช้สำหรับการวิเคราะห์การจัดการและการตัดสิ นใจ
Data warehouse
คลังข้ อมูล หมายถึง ฐานข้ อมูลที่จดั เก็บข้ อมูลที่ได้ มาจากการสกัด
ข้ อมูล(Extract) จากฐานข้ อมูลอื่น ซึง่ อาจมีโครงสร้ างแตกต่างกัน หรื ออยู่
บนระบบปฎิบตั ิการแตกต่างกันได้ เพื่อประโยชน์ในการวิเคราะห์และตัดสิน
ใจเชิงธุรกิจ
คลังข้ อมูล หมายถึง ฐานข้ อมูลขนาดใหญ่ขององค์กร ที่ได้ มาจากการ
สกัดข้ อมูล (Extract) ที่มาจากฐานข้ อมูลระบบงานประจำวัน หรื อเรี ยกอีก
อย่างว่า Operational database และฐานข้ อมูลอื่นภายนอกองค์กร หรื อ
เรี ยกว่า External database โดยข้ อมูลในคลังข้ อมูลจะถูกนำมาใช้ เพื่อ
สนับสนุนการตัดสินใจบริ หารงานของผู้บริหาร โดยเฉพาะการเป็ นข้ อมูลพื ้น
ฐานให้ กบั ระบบงาน เพื่อการบริหารงานอื่น เช่น ระบบ DSS หรื อ MIS
เป็ นต้ น
Data warehouse
คุณสมบัตขิ อง Data warehouse
 Subject-Oriented ข้ อมูลจะต้ องถูกสร้ างขึ ้นจากหัวข้ อ (subject) ธุรกิจที่สนใจ เช่น
ถ้ าบริ ษัทประกันภัยต้ องการใช้ คลังข้ อมูล ฐานข้ อมูลที่ได้ จะต้ องสร้ างขึ ้นจากประวัติ
ลูกค้ า, เบี ้ยประกัน และการเรี ยกร้ องแทนที่จะแยกตามชนิดของผลิตภัณฑ์ หรื อ
บริ การประกันภัย/ประกันชีวิต ข้ อมูลที่สร้ างขึ ้นจะประกอบด้ วยหัวข้ อที่เก็บเฉพาะ
ข่าวสารที่จำเป็ น สำหรับกระบวนการตัดสินเท่านัน้
 Integrated คือการรวบรวมข้ อมูลจากหลายฐานข้ อมูลปฏิบตั ิการเข้ าด้ วยกัน และ
ทำให้ ข้อมูลมีมาตราฐานเดียวกัน เช่นกำหนดให้ มีคา่ ตัวแปรของข้ อมูลในเนื ้อหา
เดียวกันให้ เป็ นแบบเดียวกันทังหมด้
 Time-variant ข้ อมูลซึง่ ใช้ ตดั สินใจที่เก็บไว้ จะต้ องมีอายุประมาณ 5 ถึง 10 ปี เพื่อใช้
เปรี ยบเทียบ หาแนวโน้ ม และทำนายผลลัพธ์ในอนาคตได้
 Non-volatile ข้ อมูลจะไม่อพั เดตหรื อถูกทำให้ เปลี่ยนแปลงง่ายๆ
ข้ อมูลที่จดั เก็บภายในคลังข้ อมูล จะไม่ถกู แก้ ไข แต่จะถูกเพิ่มข้ อมูลใหม่ตอ่ ท้ าย
โดยไม่ทำการแทนที่ข้อมูลเดิม
ภาพรวม
คลังข้ อมูล (Data Warehouse) : การวิเคราะห์ ข้อมูลในคลังข้ อมูล (ช่ วงเวลา)

ผล รายงาน
ขอ้ มูล Report
แหล่งข้อมูลเพื่อ Generator
การปฏิบตั ิงาน
ขอ้ มูล การใช้งาน
Data Mining ผล
Tools
Data
ูล
Warehouse ขอ้ ม
รใ ช ง้ าน ผูใ้ ช้งาน
กา
แหล่งข้อมูลเพื่อ ข้อมูล OLAP ผล
การวิเคราะห์ Generator
OLAP

คลังข้อมูล ช่วงเวลาที่องค์กรไม่ได้ปฏิบตั ิงาน ช่วงเวลาที่องค์กรปฏิบตั ิงาน


Data Warehouse

•Data Warehouse มาจากไหน


•ข้ อมูลนำเข้ ามาจากไหน
•สร้ างเพือ่ อะไร
Data Warehouse •สร้ างอย่ างไร
•ประโยชน์ คอื อะไร
•สิ่ งทีไ่ ด้ คอื อะไร ยกตัวอย่ าง
Data warehouse
ส่ วนประกอบของ Data warehouse แบบไม่ ละเอียด (คร่ าวๆ)
Data warehouse
ส่ วนประกอบของ Data warehouse แบบละเอียด (1/2)
Data Acquisition
Cleansing
Operational data and Filtering
Internal
(ระบบขาย)
Data
Sources Historical data
(ระบบขาย)
Operational data Extract
(ระบบการผลิต) Transform
Staging Extract
Data
Transform
Databse Warehouse
Historical data Load
ETL
Load
(ระบบการผลิต) ETL

External
Data External data
Sources

External data
Extract การสกัดข้อมูล เป็ นเลือกข้อมูลที่ดี และข้อมูลตามต้องการ
Transform การแปลงรู ปแบบข้อมูล ให้อยูร่ ู ปแบบที่ตอ้ งการ เช่น แปลงข้อมูลเงินจาก 50 เป็ น 50.00
Load การนำข้อมูลที่แปลงรู ปแบบ แล้วนำไปเก็บยัง ฐานข้อมูลปลายทาง DW, P10, P56, P156,
Data warehouse
ส่ วนประกอบของ Data warehouse แบบละเอียด (2/2) (ต่ อ)

Business Intelligence (BI)

End User
Data
Mart

Data Extract
Transform Data
Warehouse Mart
Load
(ETL)

Data
Mart
เลือกใช้ แบบจำลอง (Model)
ต่ างๆ

DW, P10, P56, P156, MIS P 254


Data warehouse (ภาพรวม)

Data Acquisition
Cleansing Business Intelligence (BI)
Operational data and Filtering
Internal
Data End User
Sources Historical data Data
Mart

Operational data Extract Extract


Staging Extract
Transform Transform Data Transform Data
Historical data Load Databse Load Warehouse Load Mart
ETL ETL (ETL)

Data
External External data Mart Á̈º° „Äo  ‹Îµ¨ ° Š
Data
Sources
(Model) ˜Š nµ Ç
External data
Data warehouse
วัตถุประสงค์ ของการสร้ างคลังข้ อมูล

วัตถุประสงค์ ของการสร้ างคลังข้ อมูลคือ เพื่อแยกกลุ่มข้อมูล


สารสนเทศที่ใช้ในการวิเคราะห์ทางธุรกิจออกจากฐานข้อมูลที่ใช้งาน
ประจำวัน (Operational Database) มาเก็บอยูใ่ นคลังข้อมูล (Data
Warehouse) ทำให้การเรี ยกใช้ขอ้ มูลทำได้อย่างยืดหยุน่ เพิม่ ประสิ ทธิภาพ
ในการประมวลผล ข้อมูลเก็บเฉพาะที่ตอ้ งการนำไปประมวลผล ผูบ้ ริ หาร
สามารถเรี ยกข้อมูลรายละเอียดที่จ ำเป็ น เพื่อนำผลลัพธ์ มาช่วยในการ
ตัดสิ นใจทางธุรกิจอย่างมีประสิ ทธิภาพมากขึ้น
สถาปัตยกรรมของคลังข้ อมูล
คลังข้ อมูล (Data Warehouse) : สถาปัตยกรรมของคลังข้อมูล (1/2)

Data Data Staging Data Data Warehouse Data Data Provisioning Data
Area Database Area หรื อ Data Mart

Data Acquisition System


Terminal
Metadata

Metadata
Metadata
Metadata

Metadata Repository
คลังข้ อมูล (Data Warehouse) : สถาปัตยกรรมของคลังข้อมูล (2/2)
 1. Data Acquisition System :
ทำหน้ าทีร่ ับข้ อมูลจากภายใน/นอกองค์ กร มีการตรวจสอบความถูกต้ อง (Validation) เบือ้ งต้ น
 2. Data Staging Area :
ทำหน้ าที่ Cleansing & Filtering เลือกเฉพาะข้ อมูลทีเ่ ป็ นประโยชน์ (Filtering), แปลงข้ อมูล และ
ตรวจสอบความถูกต้ อง ก่อนจะโหลดเข้ าสู่ Data Warehouse Database
 3. Data Warehouse Database :
บันทึกข้ อมูลต่ าง ๆ ทีจ่ ำเป็ นสำหรับการวิเคราะห์ ข้อมูลขององค์ กร
 4. Data Provisioning Area หรือ Data Mart :
เหมือน Data Warehouse Database แต่ ขอบเขตเนือ้ หาข้ อมูลจะแคบกว่ า คือ เพือ่ กลุ่มงานใดกลุ่ม
งานหนึ่ง
 5. End Users Terminal :
นำเสนอผลลัพธ์ ออกจากหน้ าจอ โดยจะใช้ เครื่องมือหรือระบบทีท่ ำหน้ าทีอ่ อกรายงาน เช่ น Simple
Reporting Tools, Multi-Dimensional Tools หรือ Data Mining Tools ก็ได้
 6. Metadata Repository :
เป็ นพืน้ ทีส่ ำหรับเก็บข้ อมูลต่ าง ๆ ทีจ่ ำเป็ นสำหรับควบคุมการทำงานและควบคุมข้ อมูลในคลัง
ข้ อมูล เช่ น คำนิยามของข้ อมูลใน Data Warehouse Database
1. Data Acquisition System :
1. Data Acquisition System :
ทำหน้ าทีร่ ับข้ อมูลจากภายใน/นอกองค์ กร มีการตรวจสอบความถูกต้ อง
ของข้ อมูลเบือ้ งต้ น (Validation) เช่ น ขนาดข้ อมูลอายุคน ประเภทข้ อมูลต้ องเป็ น
ตัวเลข ไม่ เกิน 180 ปี
ข้ อมูลจะถูกดึง (Extract) จากฐานข้ อมูลปฏิบัตงิ าน ขั้นตอนต่ อมาจะมีการ
ปรับเปลีย่ นรู ปแบบข้ อมูล (Transform) และหลังจากนั้นข้ อมูลจะถูกถ่ ายเท (Load)
ไปยัง Data Staging Area
2. Data Staging Area หรือ Data Staging Database : (1/2)
 Data Staging Area หรือ Data Staging Database:
เป็ นบริเวณทีพ่ กั ข้ อมูลซึ่งข้ อมูลทีร่ ับมาจากฐานข้ อมูลปฏิบัตงิ าน ใน Data Staging
Area นี้ ข้ อมูลจะมีการตรวจสอบความถูกต้ องอีกครั้งเช่ น ตรวจสอบ ความ
สอดคล้ องกัน ความตรงกันของข้ อมูล เนื่องจากข้ อมูลถูกนำมาจากหลายฐานข้ อมูล
ปฏิบัตงิ านอาจไม่ สอดคล้องกัน เช่ น Name แต่ ละฐานข้ อมูลปฏิบัตงิ านอาจจัดเก็บ
ต่ างกัน หรือไม่ มขี ้ อมูล ดังนั้นเมือ่ มารวมกันใน Data Staging Area จึงจำเป็ นต้ อง
ตรวจสอบข้ อมูลจากทุกแหล่ง เพือ่ ต้ องการจัดเก็บในรู ปแบบเดียวกันใน Data
Staging Area
นอกจากนี้ ในส่ วนนีข้ ้ อมูลบางส่ วนจะถูกทำการลบทิง้ หรือแก้ไขให้ ถูกต้ อง เรียก
ว่ าการทำความสะอาดข้ อมูล (Cleansing) หลังจากนั้นข้ อมูลจะถูกเลือกเฉพาะข้ อมูล
ทีเ่ ป็ นประโยชน์ (Filtering) เท่ านั้น จากนั้นข้ อมูลทีไ่ ด้ จะถูกทำการ Extract,
Transform, Load (ETL) เข้ าสู่ Data Warehouse Database
2. Data Staging Area หรือ Data Staging Database : (2/2)
ความหมาย Data cleansing :
Data cleansing หรือ data cleaning หมายถึง การทำความสะอาดข้อมูล เพื่อให้ขอ้ มูลมี
คุณภาพและตรงตามความต้องการของระบบ
 เป็ นกระบวนการตรวจสอบข้อมูล
 ทำการแก้ไขให้ถูกต้องตามความต้องการของระบบ
 ลบรายการข้อมูลที่ไม่ถูกต้องออกไปจากชุดข้อมูล
 ตัวอย่ างเช่ น ระบบที่ตอ้ งการ Data Warehouse ที่ตอ้ งการเก็บข้อมูลวันที่ขาย ยอดขาย เขตการขาย
เท่านั้น แต่ไม่ตอ้ งการข้อมูลหมายเหตุการขาย จึงทำการลบข้อมูล Field หมายเหตุ ที่ดึงมาจากฐานข้อมูล
ปฏิบตั ิงานออกไป
 ตัวอย่ างเช่ น รายการใบเสร็ จที่มีการยกเลิกไปแล้วหากองค์กรมองว่าไม่มีประโยชน์ ก็จะถูกลบออกไป
ทั้งหมดของรายการ ใบเสร็ จนั้นๆ
 ตัวอย่ างเช่ น ในฐานข้อมูลปฏิบตั ิงานบางรายการของ 1 ใบเสร็ จมีขอ้ มูลวันที่ขาดหายไป ถือว่ามีขอ้ มูล
ไม่ครบถ้วน ข้อมูลของทั้งใบเสร็ จนั้นจะถูกลบออกจากข้อมูลที่เตรี ยมไว้เพื่อจะนำเข้าสู่ Data
Warehouseในขั้นตอนต่อไป หรื อจะต้องประมวลผลเพื่อหาค่าวันที่มาใส่ โดยพิจารณาจากข้อมูลที่มีอยู่
3. Data
คำอธิ Warehouse
บายส่ วนประกอบของ Database
Data : แบบละเอียด (3/5)
warehouse

 Data Warehouse Database :


บันทึกข้ อมูลต่ าง ๆ ทีจ่ ำเป็ นสำหรับการวิเคราะห์ ข้อมูลขององค์ กร
ประกอบด้ วยข้ อมูล 2 ส่ วน
ส่ วนที่ 1. ข้ อมูลปฏิบัตงิ านเป็ นข้ อมูลรายละเอียด
ส่ วนที่ 2. ข้ อมูลเพือ่ การวิเคราะห์ OLAP ซึ่งข้ อมูลมีการจัดเก็บรู ปแบบ
เฉพาะ มีมติ ขิ องข้ อมูล
ซึ่งการออกแบบฐานข้ อมูลของทั้ง 2 ส่ วน จะแตกต่ างกัน จากนั้นข้ อมูล
จาก Data Warehouse Database จะถูกถ่ ายโอนข้ อมูลไปยัง Data Mart
โดยใช้ กระบวนการ ETL
4. Data Provisioning Area หรือ Data Mart
 Data Provisioning Area หรือ Data Mart : (นิยมเรียก Data Mart)
ในการทำงานบางครั้งจำเป็ นต้องการประมวลผลเฉพาะหัวข้อที่ตอ้ งการ
และต้องการความรวดเร็ ว หรื อเฉพาะข้อมูลแผนกของตนเอง ระบบจำเป็ นต้องสร้าง
Data Mart ซึ่ง Data Mart Database จะมีลกั ษณะการออกแบบฐานข้อมูล คล้ายกับ
Data Warehouse Database หรื ออาจเพิ่มเติมหรื อลดขนาดข้อมูลบางส่ วน เพื่อให้
เหมาะสมกับการใช้งาน โดยรวม Data Mart จะมีขอบเขตเนื้อหาข้อมูลแคบกว่า Data
Warehouse คือเพื่อกลุ่มงานใดกลุ่มงานหนึ่ง เช่น Data Mart เฉพาะของแผนกการขาย
เท่านั้น หลังจากนั้นข้อมูลจาก Data Mart สามารถถูกดึงไปประมวลผลโดย
กระบวนการของ ธุระกิจอัจฉริยะ (Business Intelligence : BI)
 Business Intelligence (ธุรกิจอัจฉริยะ) : (BI)
BI เป็ นกระบวนการประมวลผลข้ อมูล โดยนำข้ อมูลมาจากหลายแหล่ ง
เช่ น Data Warehouse และ Data Mart
BI เป็ นกระบวนการประมวลผลข้ อมูลเพือ่ นำผลลัพธ์ มาสนับสนุนการ
ตัดสิ นใจสำหรับผู้ใช้ งาน (End User) ประกอบด้ วย เครื่องมือหลักๆ ดังนี้
 ซอฟต์แวร์ สำหรับ การสอบถามข้อมูล และประมวลผลรายงาน(database query and
reporting)
 เครื่ องมือสำหรับการวิเคราะห์ขอ้ มูลแบบหลายมิติ (Multidimensional data
analysis) โดยใช้การประมวลผลเชิงวิเคราะห์แบบออนไลน์ (Online analytical
processing : OLAP)
 เครื่ องมือ สำหรับ Data mining
5. End Users Terminal :
 End Users Terminal :
นำเสนอผลลัพธ์ออกจากหน้าจอ โดยจะใช้เครื่ องมือหรื อ
ระบบที่ท ำหน้าที่ออกรายงาน หรื อวิเคราะห์ขอ้ มูล จากระบบธุรกิจ
อัจฉริ ยะ (BI) เช่น Simple Reporting Tools, OLAP Tools หรื อ Data
Mining Tools ก็ได้

https://powerbi.microsoft.com/en-us/features/
6. Metadata Repository
 Meta data คือ Data about data
 เป็ นส่ วนอธิบายความคุณสมบัติของข้อมูล (Data) ในฐานข้อมูล ทุกฐานข้อมูลที่ถูกสร้าง
ขึ้น
 ตย. เช่น ข้อมูล Table Customer ใครสามารถแก้ไข บันทึกข้อมูลได้บา้ ง ดังนั้นจะต้อง
ระบุการเข้าถึงข้อมูลลงไป เช่น Admin สามารถ (Add, Update, Delete) ข้อมูลได้
 นอกจากนี้ ยังเก็บข้อมูลอธิบายลักษณะข้อมูลที่จดั เก็บในแต่ละ Table ว่ามีลกั ษณะ
อย่างไร
 ตย. เช่น Table Sales ใน Database Design
 ข้อมูล Customer Name (ชื่อลูกค้าที่ซ้ื อสิ นค้า) คุณสมบัติเป็ น Character (100)

 ข้อมูล Total Sale (จำนวนเงินจากการขาย) คุณสมบัติเป็ น Double

รัฐสิ ทธิ์ 52, 97


การเปรี ยบเทียบ TPS กับ Data warehouse
การรวบรวมข้ อมูลของ Data Warehouse

Decision & Strategy Making

Process Integration &


Data Warehouse
Data Warehousing

Student
Admin Library
Affairs
Transaction
Processing system HR Payroll Finance Students
(TPS)
OLTP (Online Transaction Processing) : สารสนเทศประเภท TPS

สารสนเทศประเภท TPS :
 เป็ นการจัดการข้ อมูลรายวัน
 มีการ เพิ่มข้ อมูล ลบข้ อมูล (ลบข้ อมูล หรื อ ยกเลิกรายการ) แก้ ไข
ข้ อมูลได้ ตลอดเวลา
 ในองค์ กรมีผ้ ูใช้ เป็ นจำนวนมาก
 มักมีการแก้ ไขข้ อมูลพร้ อมๆกันอยู่ตลอดเวลา
Operational Data (TPS) เปรียบเทียบกับ Data warehouse
Topic/Function Operational (OLTP) Data Warehouse
จาก TPS
การเก็บข้อมูล ข้อมูลจะมีการเก็บ ข้อมูลจะถูกเก็บเป็ นระเบียบ มีขอ้ มูลสรุป
กระจัดกระจายอยูห่ ลายที่ ผล (Summary) ข้อมูลสำหรับการคำนวณ
ต่างๆ และข้อมูลรายละเอียดตามความ
ต้องการ นัน่ คือจะเก็บข้อมูลที่ระดับต่ำสุ ด
ของ transactional detail หรื อหลาย ๆ
ระดับของบทสรุ ปข้อมูล
องค์ประกอบข้อมูล Application by Application การรวมข้อมูลทั้งหมดในองค์กร

การจัดเก็บและช่วงเวลา เก็บข้อมูลปัจจุบนั และข้อมูล เก็บข้อมูลปัจจุบนั และข้อมูลอดีตย้อน


อดีตย้อนหลังไม่นาน หลังเป็ นเวลาหลายปี
ลักษณะของข้อมูล Dynamic Static และมีการ refreshed เป็ นรอบๆ
Operational เปรียบเทียบกับ Data warehouse
Topic/Function Operational (OLTP) จาก Data Warehouse
TPS
การ Normalization จำเป็ นต้อง Normalization มีการทำ Denormalization ใน
ขั้นตอน ETL เพื่อให้ได้ขอ้ มูล
ตามที่ออกแบบ โดยที่สามารถ
สรุ ปรวมผลในแต่ละมิติได้ง่าย
และ ลดการ Join Database
การแก้ไขข้อมูล เป็ นการแก้ไข field ต่อ field ไม่ให้มีการแก้ไขข้อมูลโดยตรง

การใช้ประโยชน์ รวดเร็ วมีโครงสร้างเพื่อการ รวดเร็ ว มีโครงสร้างเหมาะ


ทำซ้ำหลายๆครั้ง สำหรับการวิเคราะห์
http://sot.swu.ac.th/cp342/lesson15/ms2t1.htm
http://www2.cs.science.cmu.ac.th/useminar/2543/dataware/Design.htm
Data Mart คืออะไร
Data Mart

Data Mart คือ คลังข้ อมูลขนาดเล็ก เพื่อเก็บไว้ ใช้ เป็ นคลังข้ อมูลสำหรับบาง
ส่วนขององค์กร Data Mart จึงเป็ นเสมือนส่วนหนึง่ ของคลังข้ อมูลที่เน้ นเฉพาะ
ข้ อมูลสำหรับวัตถุประสงค์บางอย่าง และมักจะถูกเก็บแยกไว้ ในส่วนของ
องค์กรที่ต้องการใช้ ข้อมูลนี ้เท่านัน้ เช่น Data mart สำหรับฝ่ ายขาย และการ
ตลาด เพื่อใช้ เป็ นข้ อมูลสำหรับบริ การลูกค้ าแต่เพียงผู้เดียว
เนื่องจาก Data warehouse มีขนาดใหญ่ มาก จะต้ องใช้ เวลาในการ
ประมวลผลนาน ในบางครัง้ การใช้ งานคลังข้ อมูลโดยตรงอาจทำไม่สะดวก
และเกินความจำเป็ น (สำหรับงานที่ต้องใช้ เพียงข้ อมูลของตัวเองเท่านัน) ้ ดัง
นัน้ การแยกข้ อมูล Data Warehouse ที่ตรงกับการทำงานของแต่ละแผนก
ออกมา จึงต้ องทำ Data Mart เพื่อจำกัดขอบเขตเฉพาะแต่ละฟั งก์ชนั
โครงสร้ าง การออกแบบ ของ Database ใน Data Mart อาจเหมือน หรื อแตก
ต่างบ้ างบางส่วนจากใน Data Warehouse เพื่อให้ มีความเหมาะสมกับงาน
Data Mart
Data mart การบริหารจัดการ
การเงิน

การผลิต

การตลาด Data
Warehouse

การขาย
การบัญชี

การบริหารงานบุคคล
แสดงความสัมพันธ์ ระหว่ างคลังข้ อมูล, Data Mart ของ การบริหารจัดการ การเงิน การ
ผลิต การตลาด การขาย การบัญชี การบริหารงานบุคคล และผู้ใช้
Data Mart
ลักษณะโดยทั่วไปของ Data Mart มีดังนี ้
 ข้อมูลเจาะจงไปยังฟังก์ชนั เฉพาะกลุ่ม หรื อหน่วยงานภายในขององค์กร

 ให้ผลตอบแทนที่รวดเร็ ว คุม้ ค่ากับการลงทุนในด้านเวลา

 การบริ หาร และจัดการข้อมูลสามารถทำได้ง่าย

 ช่วยเพิ่มประสิ ทธิภาพ เนื่องจากการสอบถามข้ อมูล(Query) ถูกแบ่งไปยัง


ข้อมูลแต่ละส่ วนของฟังก์ชนั
Online Analytical Processing : OLAP คืออะไร
Online Analytical Processing : OLAP
 การประมวลผลเชิงวิเคราะห์แบบออนไลน์ เป็ นการวิเคราะห์ข้อมูล
จำนวนมากที่จดั เก็บอยูใ่ นฐานข้ อมูล Data Mart, Data
Warehouse
 คือเทคโนโลยี ที่ใช้ ดงึ ข้ อมูลจาก Data Warehouse เพื่อนำไป
วิเคราะห์และหาคำตอบที่ต้องการได้ อย่างมีประสิทธิภาพ
 ช่วยในการตัดสินใจทางธุรกิจอย่างมีประสิทธิภาพ
 ค้ นหาข้ อมูลรวดเร็ ว
 หาผลรวมได้ งา่ ย และมีประสิทธิภาพ
 เรี ยก ดูข้อมูลได้ อย่างรวดเร็ ว
Online Analytical Processing : OLAP
 OLAP เป็ นการวิเคราะห์ข้อมูลแบบหลายมิติ (Multidimensional data
analysis)
 องค์กรอาจใช้ Software วิเคราะห์ข้อมูลหลายมิติ หรื อเครื่ องมือสำหรับการ
สร้ างข้ อมูลหลายมิติโดยตรงจากระบบฐานข้ อมูลเชิงสัมพันธ์ แต่ละมิติของ
ข้ อมูล เช่น สินค้ า ราคา ค่าใช้ จ่าย เขตการขาย หรื อช่วงระยะเวลา สามารถ
แสดงให้ เห็นแนวโน้ มของข้ อมูลในแต่ละมิตเิ หล่านัน้
ตัวอย่างรูปแบบการแสดงผลการวิเคราะห์แบบหลายมิติที่เปรี ยบ
เทียบ สินค้ า เขตการขาย ยอดขายจริ ง และยอดขายที่คาดเดา
Online Analytical Processing : OLAP
Online Analytical Processing : OLAP
Online Analytical Processing : OLAP
Software ที่ใช้ ทำ OLAP
 Oracle OLAP
 IBM DB2 OLAP Server
 Microsoft SQL Server Analysis Services
 OlapCube ******
 Power BI *******
 Penthaho
 SPSS *******
 Tableau *******
เหมืองข้ อมูล (Data mining) คืออะไร
เหมืองข้ อมูล (Data mining)

หมายถึง Software หรือ วิธีการ ที่ใช้ ในการค้ นหารูปแบบที่ซอ่ นอยู่


และความสัมพันธ์ระหว่างข้ อมูล และกฏเกณฑ์สำหรับการอ้ างอิงใน
ฐานข้ อมูลขนาดใหญ่มาก สิง่ ที่ได้ รับคือการคาดเดาที่มีผลต่อข้ อมูลที่
จะเกิดขึ ้นในอนาคตซึง่ สามารถนำไปใช้ ในการตัดสินใจของผู้บริ หารได้

MIS Laudon, P185


เหมืองข้ อมูล (Data mining)
การประมวลผล แบบต่ างๆ ของงาน Data Mining

 Classification [Predictive] สร้าง model ที่เกิดจากการเรี ยนรู้ โดยมีการกำหนดกลุ่ม


ไว้ เช่น ดี , ไม่ดี และสามารถนำ model นั้นไปใช้ท ำนาย เช่น SVM, Naive Bayes, Decision Trees,
Artificial Neural Networks (ANN)
 Clustering [Descriptive] เป็ นการจัดกลุ่ม เช่น k-means, DBSCAN
 Association Rule Discovery [Descriptive] เป็ นการค้นหากฏความ
สัมพันธ์ของข้อมูล เช่น Apriori, FP-growth
 Regression Analysis [Predictive] การวิเคราะห์การถดถอย
 Others

https://en.wikipedia.org/wiki/Category:Classification_algorithms
เหมืองข้ อมูล (Data mining)
ผลประโยชน์ ท่ อี งค์ ธุรกิจได้ รับจากการทำเหมืองข้ อมูล
องค์ กร การนำเหมืองข้ อมูลไปใช้
ShopKo Stores ใช้ เหมืองข้ อมูลค้ นหาความสัมพันธ์ ระหว่ าง “เหตุ-และ-ผลกระทบ”
ระหว่ างสินค้ าที่มีขายในร้ านและนิสัยการซือ้ สินค้ าของลูกค้ า
Northstrom ใช้ เทคนิคเหมืองข้ อมูลวิเคราะห์ ข้อมูลที่ตอบสนองความต้ องการ
ของผู้ใช้ ในเว็บไซท์ เพื่อปรับปรุ งวิธีการโฆษณาและการให้ บริการแก่
ลูกค้ า
KeyCorp. ใช้ เทคนิคเหมืองข้ อมูลกับสินค้ าในครัวเรือน 3.3 ล้ านชิน้ และผู้ใช้ 7
ล้ านคนในคลังข้ อมูลเพื่อค้ นหาระยะเวลาในการตอบสนองของ
ลูกค้ าต่ อสินค้ าที่โฆษณาด้ วยการส่ งจดหมายไปยังลูกค้ าโดยตรง จะ
ได้ ทราบว่ าสินค้ าใดที่ไม่ ค้ ุมค่ ากับการตลาดนี ้
Verizon วิเคราะห์ ข้อมูลลูกค้ าของบริษัทเพื่อค้ นหาลูกค้ าใหม่ และให้ บริการ
Wireless หลังการขาย รวมทัง้ ให้ ข้อเสนอแนะแก่ ลูกค้ าที่ควรเปลี่ยนแผนการ
โปรโมทไปใช้ บริการชนิดอื่น
เหมืองข้ อมูล (Data mining)
ซอฟต์แวร์ในระดับ Data Mining
 SAS Enterprise Miner
 DBMiner
 WEKA
 RapidMiner

http://lbdwww.epfl.ch/f/teaching/courses/TPsIBD/DBMinerTutorial.pdf
Software ที่ใช้จดั เก็บข้อมูลใน DW คือ?
1.
2.
3.
Reference
 ระบบสารสนเทศเพื่อการจัดการ (Laudon) สัลยุทธ์ สว่างวรรณ แปล เรี ยบเรี ยง
 การออกแบบและพัฒนาคลังข้อมูล Data Warehouse (กิตติพงศ์ กลมกล่อม)
 Management Information Systems: Kenneth C. Laudon, Jane P. Laudon

You might also like