You are on page 1of 87

and

DATA SCIENCE
ES ระดับของสารสนเทศ

DSS

MIS

TPS
ES

DSS

MIS เก็บรวบรวมโดยมี
ปริมาณมาก ๆ
TPS
ES
ใช้กระบวนการทาง
DSS วิทยาศาสตร์ขอ้ มูล

MIS

TPS
คําว่า Big Data อาจกล่าวรวมถึง
กระบวนการทาง Data Science
หรือเรียกแยกกันก็ได้
ใครบ้างใช้ Big Data ?
ใช้ Big Data ทําอะไร ?
Customer Sentiment Analysis
Customer Sentiment Analysis
Customer Sentiment Analysis
Behavioral Analytics
เช่น
พฤติกรรมต่าง ๆ ในการเข้าใช้เว็บไซต์
พฤติกรรมการเข้าดูสินค้า
พฤติกรรมการเลือกซือสินค้า
Predictive Support
Predictive Support
Predictive Support
Fraud Detection
เช่น
ตรวจจับการทุจริตการสอบ
ตรวจจับการบุกรุกระบบเครือข่าย
ตรวจจับการทุจริตต่าง ๆ
Customer Segmentation
Customer Segmentation
Customer Segmentation
Customer Segmentation
ค ุณคิดว่า Facebook
ใช้ Big Data ?
Facebook ?
Facebook ?
Facebook ?
Facebook ?
Facebook ?
Facebook ?
Who is Songwit ?
ค ุณคิดว่า Tesco Lotus
ใช้ Big Data ?
ค ุณคิดว่า 7-11
ใช้ Big Data ?
Big Data ?
ใหญ่ขนาดไหนถึงเป็น Big Data
• Big Data หมายความถึง อภิมหาข้อมูล
• ขนาดไม่ได้วดั ความเป็ น Big Data ทีชัดเจน
• ต้องประกอบด้วย 4P
ใหญ่ขนาดไหนถึงเป็น Big Data
• Volume หมายถึง ขนาดของข้อมูล จะมีปริมาณเท่าใด อยู่ทีว่าข้อมูลนัน
เพียงพอต่อการใช้ประโยชน์หรือไม่ เช่น ข้อมูลประวัติการขายย้อนหลัง 5 ปี เป็ นต้น
อย่างไรก็ตาม ปริมาณข้อมูลทีมากเกินไป อาจไม่เกิดประโยชน์ใด เช่น ข้อมูล
ยอดขายย้อนหลัง 30 ปี อาจพบว่า มีการเปลียนพฤติกรรมการซือไปแล้ว ใช้ขอ้ มูล
ได้เพียง 3 ปี ยอ้ นหลังก็เป็ นได้
ใหญ่ขนาดไหนถึงเป็น Big Data
• Velocity หมายถึง ความเร็ว ทังในมุมของการสร้างข้อมูล และการประมวลผล
Big Data ต้องถูกใช้งานโดยเร็ว เนืองจากข้อมูลเกิดขึนอยูต่ ลอดเวลา เช่น การ
ทํา Fault Detection ในระบบการธนาคาร ทีต้องดึงข้อมูลมาจากหลายแหล่ง
และต้องมีการกระทําอย่างต่อเนืองแบบ Real-Time
ใหญ่ขนาดไหนถึงเป็น Big Data
• Variety หมายถึง ความหลากหลาย ในทีนีคือความหลากหลายของตัวข้อมูล
และชนิดของข้อมูล ตัวอย่างเช่น เมือเราป่ วย ไปโรงพยาบาล สิงทีคุณหมอถามเรา
คือ “มีอาการอย่างไร” นันก็ถือว่าเป็ นข้อมูลรู ปแบบหนึงทีเป็ นข้อความ ต่อมานาง
พยาบาลจะเข้ามาวัดความดัน ส่วนสูง นําหนัก ทังหมดนีเป็ นข้อมูลรูปแบบตัวเลข
หากต้องมีการ X-Ray ก็จะได้ขอ้ มูลประเภทรู ปภาพอีกด้วย เหล่านีเป็ นข้อมูลเพือ
ประกอบการวินิจฉัยของแพทย์ทงสิ ั น
ใหญ่ขนาดไหนถึงเป็น Big Data
• Veracity หมายถึง ความแม่นยํา เพราะข้อมูลประเภท Big Data มีขนาด
ใหญ่ ทีต้องการความเร็วในการใช้งาน และมีความหลากหลายสูง ดังนันในตัวข้อมูล
เองจะมีความไม่แน่นอนรวมอยู่ดว้ ย ซึงอาจจะเกิดจาก Error ต่างๆ ระหว่างการ
สร้างข้อมูล หรือเป็ นข้อมูลทีอยูน่ อกกรอบก็เป็ นได้ การทําให้ขอ้ มูลสะอาด ไม่มีการ
ซําซ้อนของชุดข้อมูล เป็ นเรืองทียากลําบากทีสุด และเป็ นขันตอนทีใช้เวลานานทีสุด
แต่ถือว่าเป็ นส่วนทีสําคัญทีสุดของการทํา Big Data Project
ใหญ่ขนาดไหนถึงเป็น Big Data
• Size หรือ ใหญ่อย่างเดียวจึงไม่ตอบโจทย์ทงหมดของ
ั Big Data
• หากอยากทราบว่า ข้อมูลต้องใหญ่ขนาดไหน ต้องนํา Data นันไปใช้ประโยชน์
หรือ สร้าง Model เสียก่อน เพือให้ผลลัพธ์ของ Model เป็ นตัวบ่งบอกว่าพอ
หรือไม่
Big Data สําคัญขนาดไหนกับธ ุรกิจ ?
ทําให้เข้าใจสภาพของตลาด
การนํา Big Data มาวิเคราะห์จะช่วยให้เข้าใจถึงสภาพตลาด อย่างเช่น
การวิเคราะห์พฤติกรรมการซือสินค้าของผูบ้ ริโภค ทําให้รไู้ ด้ว่าสินค้า
ชนิดใดขายได้มาก หรือสินค้าชนิดใดขายได้นอ้ ย ทําให้เราสามารถ
วางแผนผลิตสินค้าได้ดีขนึ
ทําให้เข้าใจผูบ้ ริโภคได้ดยี งขึ
ิ น
ผลจากการวิเคราะห์ Big Data นันยังทําให้เราทํานายพฤติกรรมของ
ผูบ้ ริโภคได้ดียิงขึน ทําให้สามารถตอบสนองความต้องการของผูบ้ ริโภค
ได้อย่างแท้จริง อีกทัง Big Data นันยังช่วยให้องค์กรสามารถเก็บ
รวบรวมข้อมูลความคิดเห็นทังในเชิงบวกและลบจากผูบ้ ริโภค เพือ
ปรับปรุงการบริการให้ดขี นได้ ึ
ประหยัดงบประมาณ
ถึงแม้ว่าการเริมนํา Big Data ไปใช้อาจจะต้องมีการลงทุนอยูบ่ า้ ง แต่
อนาคตในระยะยาวนันช่วยประหยัดงบได้อย่างดี เนืองจากจะช่วยลด
ภาระในการทํางานให้แก่พนักงานด้าน IT แล้วยังสามารถนําข้อมูลที
วิเคราะห์ออกมาไปใช้ประโยชน์ในส่วนอืนได้อีกด้วย ทําให้ชว่ ยลดต้นทุน
ในการบริหารจัดการได้เป็ นอย่างดี
แล้ว Data Science

https://www.youtube.com/watch?v=X3paOmcrTjQ&fbclid=IwAR1-ig0c2YZBQr6kOvvzXs-m6hFcHc4qTEFkMBLi4fLn_7GSQ-DlwXuKOMo
Data Science
Data Science คือการวิเคราะห์ดว้ ยวิธีการทางคณิตศาสตร์ เพือค้นหา
แบบจําลองตลอดจนคําตอบต่าง ๆ ทีแอบแฝงอยู่ในข้อมูล
Data Science
Data Science จะประกอบด้วยองค์ความรูท้ ีเกียวข้อง 3 ด้าน
Data Science
องค์ประกอบของการทํา Data Science

Data Analysis
Data Acquisition Data Preparation Data Visualization
And Modeling
Data Science
Data Acquisition : การเก็บรวบรวมข้อมูล
-ข้อมูลต่าง ๆ ทีเกิดขึนในระบบงาน กระบวนการ ขององค์กร รวมถึง
ข้อมูลจากภายนอก องค์กร
-ข้อมูลทีมาจากเครืองมือนําเข้าข้อมูล
-ฯลฯ
Data Science
Data Preparation : การเตรียมข้อมูล
-Data Cleaning
-Data Transformations
Data Science
Data Analysis and Modeling :
-Regression
-Association Rule
-Clustering
-Classification
Data Science
Data Analysis and Modeling :
-Regression
-Association Rule
-Clustering
-Classification
Data Science
Data Analysis and Modeling :
-Regression
-Association Rule
-Clustering
-Classification
Data Science
Data Analysis and Modeling :
-Regression
-Association Rule
-Clustering
-Classification
Data Science
Data Analysis and Modeling :
-Regression
-Association Rule
-Clustering
-Classification
Data Science
Association Rule : Example
Data Science
Association Rule : Example
Item T1 T2 T3 T4 T5 Support
Bread 1 1 0 1 1
Milk 1 0 1 1 1
Diaper 0 1 1 1 1
Beer 0 1 1 1 0
Eggs 0 1 0 0 0
Coke 0 0 1 0 1

Determine a support value = 50


Data Science
Association Rule : Example
Item T1 T2 T3 T4 T5 Support
Bread 1 1 0 1 1 80
Milk 1 0 1 1 1 80
Diaper 0 1 1 1 1 80
Beer 0 1 1 1 0 60
Eggs 0 1 0 0 0 20
Coke 0 0 1 0 1 40

𝐼𝑡𝑒𝑚(𝑌)
𝑆𝑢𝑝𝑝𝑜𝑟𝑡 = × 100
𝐼𝑡𝑒𝑚(𝑆𝑈𝑀)
Data Science
Association Rule : Example
Item T1 T2 T3 T4 T5 Support
Bread 1 1 0 1 1 80
Milk 1 0 1 1 1 80
Diaper 0 1 1 1 1 80
Beer 0 1 1 1 0 60
Eggs 0 1 0 0 0 20
Coke 0 0 1 0 1 40

Determine a support value = 50


Data Science
Association Rule : Example
Item T1 T2 T3 T4 T5 Support Item T1 T2 T3 T4 T5 Support
Bread 1 1 0 1 1 80 Bred=>Milk 1 0 0 1 1 60
Bred=>Diaper 0 1 0 1 1 60
Milk 1 0 1 1 1 80
Bred=>Beer 0 1 0 1 0 40
Diaper 0 1 1 1 1 80 Milk=>Diaper 0 0 1 1 1 60
Beer 0 1 1 1 0 60 Milk=>Beer 0 0 1 1 0 40
Diaper=>Beer 0 1 1 1 0 60
Data Science
Association Rule : Example
Item T1 T2 T3 T4 T5 Support Item T1 T2 T3 T4 T5 Support
Bread 1 1 0 1 1 80 Bred=>Milk 1 0 0 1 1 60
Bred=>Diaper 0 1 0 1 1 60
Milk 1 0 1 1 1 80
Bred=>Beer 0 1 0 1 0 40
Diaper 0 1 1 1 1 80 Milk=>Diaper 0 0 1 1 1 60
Beer 0 1 1 1 0 60 Milk=>Beer 0 0 1 1 0 40
Diaper=>Beer 0 1 1 1 0 60
Data Science
Association Rule : Example
Item T1 T2 T3 T4 T5 Support
Bred=>Milk 1 0 0 1 1 60
Bred=>Diaper 0 1 0 1 1 60
Bred=>Beer 0 1 0 1 0 40
Milk=>Diaper 0 0 1 1 1 60
Milk=>Beer 0 0 1 1 0 40
Diaper=>Beer 0 1 1 1 0 60

Item T1 T2 T3 T4 T5 Support
Bread,Milk=>Diaper 0 0 0 1 1 40
Item T1 T2 T3 T4 T5 Support

Data Science Bread


Milk
Diaper
1
1
0
1
0
1
0
1
1
1
1
1
1
1
1
80
80
80
Beer 0 1 1 1 0 60
Eggs 0 1 0 0 0 20
Coke 0 0 1 0 1 40

Item T1 T2 T3 T4 T5 Support
Item Set Confident Bred=>Milk 1 0 0 1 1 60
Bred=>Milk ? Bred=>Diaper 0 1 0 1 1 60
Bred=>Diaper ? Bred=>Beer 0 1 0 1 0 40
? Milk=>Diaper 0 0 1 1 1 60
Bred=>Beer
Milk=>Beer 0 0 1 1 0 40
Milk=>Diaper ? Diaper=>Beer 0 1 1 1 0 60
Milk=>Beer ?
Item T1 T2 T3 T4 T5 Support
Diaper=>Beer ?
Bread,Milk=>Diaper 0 0 0 1 1 40
Bread,Milk=>Diaper ?
Item T1 T2 T3 T4 T5 Support

Data Science Bread


Milk
Diaper
1
1
0
1
0
1
0
1
1
1
1
1
1
1
1
80
80
80
Beer 0 1 1 1 0 60
Eggs 0 1 0 0 0 20
Coke 0 0 1 0 1 40

Item T1 T2 T3 T4 T5 Support
Item Set Confident Bred=>Milk 1 0 0 1 1 60
Bred=>Milk .75 Bred=>Diaper 0 1 0 1 1 60
Bred=>Diaper .75 Bred=>Beer 0 1 0 1 0 40
.50 Milk=>Diaper 0 0 1 1 1 60
Bred=>Beer
Milk=>Beer 0 0 1 1 0 40
Milk=>Diaper .75 Diaper=>Beer 0 1 1 1 0 60
Milk=>Beer .50
Item T1 T2 T3 T4 T5 Support
Diaper=>Beer .75
Bread,Milk=>Diaper 0 0 0 1 1 40
Bread,Milk=>Diaper .66
Data Science
Classification : K-Nearest Neighbors (K-NN)
Data Science
Data Science
Data Science
Data Science
Data Science
Data Science
Data Science
Data Science
Data Science
Data Science
Data Science
Data Science
Data Science
Data Science

You might also like