Professional Documents
Culture Documents
แนะนำ Bigdata
แนะนำ Bigdata
DATA SCIENCE
ES ระดับของสารสนเทศ
DSS
MIS
TPS
ES
DSS
MIS เก็บรวบรวมโดยมี
ปริมาณมาก ๆ
TPS
ES
ใช้กระบวนการทาง
DSS วิทยาศาสตร์ขอ้ มูล
MIS
TPS
คําว่า Big Data อาจกล่าวรวมถึง
กระบวนการทาง Data Science
หรือเรียกแยกกันก็ได้
ใครบ้างใช้ Big Data ?
ใช้ Big Data ทําอะไร ?
Customer Sentiment Analysis
Customer Sentiment Analysis
Customer Sentiment Analysis
Behavioral Analytics
เช่น
พฤติกรรมต่าง ๆ ในการเข้าใช้เว็บไซต์
พฤติกรรมการเข้าดูสินค้า
พฤติกรรมการเลือกซือสินค้า
Predictive Support
Predictive Support
Predictive Support
Fraud Detection
เช่น
ตรวจจับการทุจริตการสอบ
ตรวจจับการบุกรุกระบบเครือข่าย
ตรวจจับการทุจริตต่าง ๆ
Customer Segmentation
Customer Segmentation
Customer Segmentation
Customer Segmentation
ค ุณคิดว่า Facebook
ใช้ Big Data ?
Facebook ?
Facebook ?
Facebook ?
Facebook ?
Facebook ?
Facebook ?
Who is Songwit ?
ค ุณคิดว่า Tesco Lotus
ใช้ Big Data ?
ค ุณคิดว่า 7-11
ใช้ Big Data ?
Big Data ?
ใหญ่ขนาดไหนถึงเป็น Big Data
• Big Data หมายความถึง อภิมหาข้อมูล
• ขนาดไม่ได้วดั ความเป็ น Big Data ทีชัดเจน
• ต้องประกอบด้วย 4P
ใหญ่ขนาดไหนถึงเป็น Big Data
• Volume หมายถึง ขนาดของข้อมูล จะมีปริมาณเท่าใด อยู่ทีว่าข้อมูลนัน
เพียงพอต่อการใช้ประโยชน์หรือไม่ เช่น ข้อมูลประวัติการขายย้อนหลัง 5 ปี เป็ นต้น
อย่างไรก็ตาม ปริมาณข้อมูลทีมากเกินไป อาจไม่เกิดประโยชน์ใด เช่น ข้อมูล
ยอดขายย้อนหลัง 30 ปี อาจพบว่า มีการเปลียนพฤติกรรมการซือไปแล้ว ใช้ขอ้ มูล
ได้เพียง 3 ปี ยอ้ นหลังก็เป็ นได้
ใหญ่ขนาดไหนถึงเป็น Big Data
• Velocity หมายถึง ความเร็ว ทังในมุมของการสร้างข้อมูล และการประมวลผล
Big Data ต้องถูกใช้งานโดยเร็ว เนืองจากข้อมูลเกิดขึนอยูต่ ลอดเวลา เช่น การ
ทํา Fault Detection ในระบบการธนาคาร ทีต้องดึงข้อมูลมาจากหลายแหล่ง
และต้องมีการกระทําอย่างต่อเนืองแบบ Real-Time
ใหญ่ขนาดไหนถึงเป็น Big Data
• Variety หมายถึง ความหลากหลาย ในทีนีคือความหลากหลายของตัวข้อมูล
และชนิดของข้อมูล ตัวอย่างเช่น เมือเราป่ วย ไปโรงพยาบาล สิงทีคุณหมอถามเรา
คือ “มีอาการอย่างไร” นันก็ถือว่าเป็ นข้อมูลรู ปแบบหนึงทีเป็ นข้อความ ต่อมานาง
พยาบาลจะเข้ามาวัดความดัน ส่วนสูง นําหนัก ทังหมดนีเป็ นข้อมูลรูปแบบตัวเลข
หากต้องมีการ X-Ray ก็จะได้ขอ้ มูลประเภทรู ปภาพอีกด้วย เหล่านีเป็ นข้อมูลเพือ
ประกอบการวินิจฉัยของแพทย์ทงสิ ั น
ใหญ่ขนาดไหนถึงเป็น Big Data
• Veracity หมายถึง ความแม่นยํา เพราะข้อมูลประเภท Big Data มีขนาด
ใหญ่ ทีต้องการความเร็วในการใช้งาน และมีความหลากหลายสูง ดังนันในตัวข้อมูล
เองจะมีความไม่แน่นอนรวมอยู่ดว้ ย ซึงอาจจะเกิดจาก Error ต่างๆ ระหว่างการ
สร้างข้อมูล หรือเป็ นข้อมูลทีอยูน่ อกกรอบก็เป็ นได้ การทําให้ขอ้ มูลสะอาด ไม่มีการ
ซําซ้อนของชุดข้อมูล เป็ นเรืองทียากลําบากทีสุด และเป็ นขันตอนทีใช้เวลานานทีสุด
แต่ถือว่าเป็ นส่วนทีสําคัญทีสุดของการทํา Big Data Project
ใหญ่ขนาดไหนถึงเป็น Big Data
• Size หรือ ใหญ่อย่างเดียวจึงไม่ตอบโจทย์ทงหมดของ
ั Big Data
• หากอยากทราบว่า ข้อมูลต้องใหญ่ขนาดไหน ต้องนํา Data นันไปใช้ประโยชน์
หรือ สร้าง Model เสียก่อน เพือให้ผลลัพธ์ของ Model เป็ นตัวบ่งบอกว่าพอ
หรือไม่
Big Data สําคัญขนาดไหนกับธ ุรกิจ ?
ทําให้เข้าใจสภาพของตลาด
การนํา Big Data มาวิเคราะห์จะช่วยให้เข้าใจถึงสภาพตลาด อย่างเช่น
การวิเคราะห์พฤติกรรมการซือสินค้าของผูบ้ ริโภค ทําให้รไู้ ด้ว่าสินค้า
ชนิดใดขายได้มาก หรือสินค้าชนิดใดขายได้นอ้ ย ทําให้เราสามารถ
วางแผนผลิตสินค้าได้ดีขนึ
ทําให้เข้าใจผูบ้ ริโภคได้ดยี งขึ
ิ น
ผลจากการวิเคราะห์ Big Data นันยังทําให้เราทํานายพฤติกรรมของ
ผูบ้ ริโภคได้ดียิงขึน ทําให้สามารถตอบสนองความต้องการของผูบ้ ริโภค
ได้อย่างแท้จริง อีกทัง Big Data นันยังช่วยให้องค์กรสามารถเก็บ
รวบรวมข้อมูลความคิดเห็นทังในเชิงบวกและลบจากผูบ้ ริโภค เพือ
ปรับปรุงการบริการให้ดขี นได้ ึ
ประหยัดงบประมาณ
ถึงแม้ว่าการเริมนํา Big Data ไปใช้อาจจะต้องมีการลงทุนอยูบ่ า้ ง แต่
อนาคตในระยะยาวนันช่วยประหยัดงบได้อย่างดี เนืองจากจะช่วยลด
ภาระในการทํางานให้แก่พนักงานด้าน IT แล้วยังสามารถนําข้อมูลที
วิเคราะห์ออกมาไปใช้ประโยชน์ในส่วนอืนได้อีกด้วย ทําให้ชว่ ยลดต้นทุน
ในการบริหารจัดการได้เป็ นอย่างดี
แล้ว Data Science
https://www.youtube.com/watch?v=X3paOmcrTjQ&fbclid=IwAR1-ig0c2YZBQr6kOvvzXs-m6hFcHc4qTEFkMBLi4fLn_7GSQ-DlwXuKOMo
Data Science
Data Science คือการวิเคราะห์ดว้ ยวิธีการทางคณิตศาสตร์ เพือค้นหา
แบบจําลองตลอดจนคําตอบต่าง ๆ ทีแอบแฝงอยู่ในข้อมูล
Data Science
Data Science จะประกอบด้วยองค์ความรูท้ ีเกียวข้อง 3 ด้าน
Data Science
องค์ประกอบของการทํา Data Science
Data Analysis
Data Acquisition Data Preparation Data Visualization
And Modeling
Data Science
Data Acquisition : การเก็บรวบรวมข้อมูล
-ข้อมูลต่าง ๆ ทีเกิดขึนในระบบงาน กระบวนการ ขององค์กร รวมถึง
ข้อมูลจากภายนอก องค์กร
-ข้อมูลทีมาจากเครืองมือนําเข้าข้อมูล
-ฯลฯ
Data Science
Data Preparation : การเตรียมข้อมูล
-Data Cleaning
-Data Transformations
Data Science
Data Analysis and Modeling :
-Regression
-Association Rule
-Clustering
-Classification
Data Science
Data Analysis and Modeling :
-Regression
-Association Rule
-Clustering
-Classification
Data Science
Data Analysis and Modeling :
-Regression
-Association Rule
-Clustering
-Classification
Data Science
Data Analysis and Modeling :
-Regression
-Association Rule
-Clustering
-Classification
Data Science
Data Analysis and Modeling :
-Regression
-Association Rule
-Clustering
-Classification
Data Science
Association Rule : Example
Data Science
Association Rule : Example
Item T1 T2 T3 T4 T5 Support
Bread 1 1 0 1 1
Milk 1 0 1 1 1
Diaper 0 1 1 1 1
Beer 0 1 1 1 0
Eggs 0 1 0 0 0
Coke 0 0 1 0 1
𝐼𝑡𝑒𝑚(𝑌)
𝑆𝑢𝑝𝑝𝑜𝑟𝑡 = × 100
𝐼𝑡𝑒𝑚(𝑆𝑈𝑀)
Data Science
Association Rule : Example
Item T1 T2 T3 T4 T5 Support
Bread 1 1 0 1 1 80
Milk 1 0 1 1 1 80
Diaper 0 1 1 1 1 80
Beer 0 1 1 1 0 60
Eggs 0 1 0 0 0 20
Coke 0 0 1 0 1 40
Item T1 T2 T3 T4 T5 Support
Bread,Milk=>Diaper 0 0 0 1 1 40
Item T1 T2 T3 T4 T5 Support
Item T1 T2 T3 T4 T5 Support
Item Set Confident Bred=>Milk 1 0 0 1 1 60
Bred=>Milk ? Bred=>Diaper 0 1 0 1 1 60
Bred=>Diaper ? Bred=>Beer 0 1 0 1 0 40
? Milk=>Diaper 0 0 1 1 1 60
Bred=>Beer
Milk=>Beer 0 0 1 1 0 40
Milk=>Diaper ? Diaper=>Beer 0 1 1 1 0 60
Milk=>Beer ?
Item T1 T2 T3 T4 T5 Support
Diaper=>Beer ?
Bread,Milk=>Diaper 0 0 0 1 1 40
Bread,Milk=>Diaper ?
Item T1 T2 T3 T4 T5 Support
Item T1 T2 T3 T4 T5 Support
Item Set Confident Bred=>Milk 1 0 0 1 1 60
Bred=>Milk .75 Bred=>Diaper 0 1 0 1 1 60
Bred=>Diaper .75 Bred=>Beer 0 1 0 1 0 40
.50 Milk=>Diaper 0 0 1 1 1 60
Bred=>Beer
Milk=>Beer 0 0 1 1 0 40
Milk=>Diaper .75 Diaper=>Beer 0 1 1 1 0 60
Milk=>Beer .50
Item T1 T2 T3 T4 T5 Support
Diaper=>Beer .75
Bread,Milk=>Diaper 0 0 0 1 1 40
Bread,Milk=>Diaper .66
Data Science
Classification : K-Nearest Neighbors (K-NN)
Data Science
Data Science
Data Science
Data Science
Data Science
Data Science
Data Science
Data Science
Data Science
Data Science
Data Science
Data Science
Data Science
Data Science