You are on page 1of 145

Statistical Software

การใช้ งาน Minitab 18 : วิเคราะห์ สถิตเิ บืองต้ น

โดย ชลทิชา จํารัสพร


บริษัท โซลูชนั เซ็นเตอร์ จํากัด
การใช้ งาน Minitab 18
วิเคราะห์ สถิติเบืองต้ น

เนือหาในเล่ม
แนะนําเบืองต้ นการใช้ งาน Minitab 18
ภาพรวมการวิเคราะห์ทางสถิติ
สถิติเชิงพรรณา(Descriptive Statistics)
การวิเคราะห์สหสัมพันธ์(Correlation Analysis)
การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis testing for Mean)
การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute Data)
การทดสอบสมมติฐานสําหรับค่าความแปรปรวน (Variance Test)
การทดสอบการแจกแจง (Distribution test)
โดย ชลทิชา จํารัสพร
บริษัท โซลูชนั เซ็นเตอร์ จํากัด
คํานํา

หนังสือเล่มนีจัดทําขึนด้ วยความตังใจทีจะให้ ผ้ ใู ช้ งานสามารถเรี ยนรู้การวิเคราะห์สถิติด้วย


โปรแกรม Minitab เพือให้ เป็ นคู่มือสําหรับผู้สนใจศึกษาการใช้ งานทัวไป โดยไม่ได้ เน้ นวิชาการมากนักแต่จะ
อธิบายผ่านตัวอย่างเพือเน้ นไปทีการประยุกต์ใช้ กบั สถานการณ์การวิเคราะห์ข้อมูลทีคิดว่าน่าจะใกล้ เคียง
กับสถานการณ์จริง

จากประสบการณ์การทํางานและการใช้ งาน Minitab มากว่า 15 ปี ผู้เขียนเชือว่าสถิติไม่ได้ ยาก


หากเราเข้ าใจและเห็นการประยุกต์ ใช้ มากๆ และยิงในปั จจุบนั เราไม่ต้องสูญเสียเวลากับการคํานวณด้ วยมือ
เพราะการใช้ โปรแกรมสําเร็จรูปอย่าง Minitab ก็สามารถช่วยในการทํางานด้ านการวิเคราะห์ข้อมูลสะดวก
และรวดเร็วขึนมากอยู่แล้ ว ผู้เขียนหวังเป็ นอย่างยิงว่าหนังสือเล่มนีจะเป็ นประโยชน์ไม่มากก็น้อย นอกจาก
หนังสือแล้ วผู้เขียนยังได้ สร้ างช่องทางการแนะนําการใช้ งานโปรแกรม Minitab ผ่านหน้ าบล็อกของบริษัทฯ
โดยภายในประกอบด้ วยบทความทีแปลจาก Minitab Blog, กรณีศกึ ษา และวีดีโอแนะนําการใช้ งาน ซึง
ผู้อ่านสามารถเข้ าไปศึกษาเพิมเติมได้ อีกช่องทางหนึง

หนังสือเล่มนีจะเกิดขึนไม่ได้ ถ้าไม่ได้ รับการสนับสนุนแหล่งความรู้ จาก Minitab Inc. และบริษัท


โซลูชนั เซ็นเตอร์ จํากัด ตัวแทน Minitab ในประเทศไทย รวมถึงประสบการณ์ทีได้ จากการตอบคําถาม
ลูกค้ าและผู้ใช้ งาน Minitab ในประเทศไทยตลอดการทํางานในตําแหน่ง Technical Support และการ
บรรยายในหลายๆบริษัท

ชลทิชา จํารัสพร

หน้ า A
คํานํา

หน้ า B
สารบัญ

หน้ า

บทนํา - แนะนําเบืองต้ นการใช้ งาน Minitab 1

บทที 1 - ภาพรวมการวิเคราะห์ทางสถิติ 17

บทที 2 - สถิติเชิงพรรณา (Descriptive Statistics) 25

บทที 3 - การวิเคราะห์สหสัมพันธ์ (Correlation Analysis) 49

บทที 4 - การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis testing for Mean) 63

บทที 5 - การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute Data) 95

บทที 6 - การทดสอบสมมติฐานสําหรับค่าความแปรปรวน (Variance test) 117

บทที 7 - การทดสอบการแจกแจง (Distribution test) 125

หน้ า C
สารบัญ

หน้ า D
บทนํา แนะนําเบืองต้ นการใช้ งาน Minitab

แนะนําเบืองต้ นการใช้ งาน Minitab


เกียวกับ Minitab
Minitab Inc. บริษัทชันนําผู้ผลิตซอฟต์แวร์ ทางด้ านสถิติและบริการทางด้ านการปรับปรุงคุณภาพ,
ด้ านการเรียนการสอนและงานวิจยั โดยสร้ างเครืองมือวิเคราะห์ทางด้ านสถิติทีมีความถูกต้ อง น่าเชือถือ
และใช้ งานง่าย ปั จจุบนั Minitab มีสาํ นักงานใหญ่อยู่ทีสเตทคอลเลท รัฐเพนซิลวาเนีย ประเทศสหรัฐ
อเมริกา มีสาํ นักงานอยู่ในประเทศอังกฤษ ฝรังเศสและออสเตรเลีย รวมถึงมีตวั แทนมากกว่า 40 ประเทศ
ทัวโลกรวมถึงประเทศไทย (บริษัท โซลูชนั เซ็นเตอร์ จํากัด)
ทีมา : เว็บไซต์ www.Minitab.com/en-us/company/
ประวัติ
ได้ เริมพัฒนาในปี ค.ศ. 1972 ทีมหาวิทยาลัยเพนซิลวาเนีย สเตท (Pennsylvania State) เพือใช้ ช่วย
ในการสอนสถิติด้วยคอมพิวเตอร์ เพือให้ นกั เรี ยน นักศึกษา มุ่งไปทีการเรี ยนเนือหาวิชาทางสถิติมากกว่าการ
คํานวณด้ วยมือ ปั จจุบนั Minitab มีมากกว่า 4,000 มหาวิทยาลัยทัวโลกใช้ ในการเรียนการสอน มากกว่า
90% ของบริษัททีถูกจัดอันดับใน 100 อันดับแรกของนิตยสารฟอร์ จนู (Fortune 100) เลือกใช้ Minitab และ
บริษัทเอกชนหลายแห่งทีสนใจเรืองของการปรับปรุ งคุณภาพก็เลือกใช้ ซอฟต์แวร์ Minitab
ทีมา : เว็บไซต์ www.Minitab.com/en-us/company/
เริ มต้ นใช้ งาน Minitab
ปั จจุบนั (มิถนุ ายน ปี ค.ศ.2017) Minitab เวอร์ ชนล่
ั าสุดคือ Minitab 18 ซึงจะใช้ ในหนังสือเล่มนี
ทังหมด โดยสามารถดาวน์ โหลดซอฟต์แวร์ ทดลองใช้ 30 วันหลังติดตังได้ จากเว็บไซต์ www.Minitab.com
หลังติดตังซอฟต์แวร์ แล้ วเมือเปิ ดโปรแกรม Minitab จะมีลกั ษณะหน้ าตาดังภาพ

หน้ า 1
บทนํา แนะนําเบืองต้ นการใช้ งาน Minitab

Menu bar
&Toolbar
s

Session Window

Data Window

Project Manager
window(minimized)

Minitab จะเปิ ดโปรเจกต์ขนมาโดยจะแสดงสองหน้


ึ าต่างสําคัญคือ หน้ าต่าง Session กับหน้ าต่าง
เวิร์คชีท โดยจะเป็ นหน้ าต่างว่างทังคู่ แต่โปรเจกต์ ยงั มีสว่ นต่างๆทีสําคัญซึงจะอธิบายผ่านตัวอย่างต่อไป
รู้ จกั ส่ วนต่ างๆของ Minitab
ตัวอย่างบทนํา : อายุการใช้ งานหลอดไฟฟ้า (LIGHTBULB.mpj) โดยไฟล์ตวั อย่างสามารถเข้ าไปดาวน์
โหลดได้ ที http://www.solutioncenterminitab.com/datasets/R18/book1.zip
ไฟล์ตวั อย่างนีประกอบด้ วยเวิร์คชีททังหมด 2 เวิร์คชีท ทีเก็บข้ อมูลอายุการใช้ งานหลอดไฟในหน่วย
ชัวโมงการใช้ งาน แต่ละเวิร์คชีทจะมีลกั ษณะการเก็บข้ อมูลทีแตกต่างกัน นอกจากนีโปรเจกต์นีจัดเก็บกราฟ
ทีได้ ทําการวิเคราะห์ไว้ ทังหมด 4 กราฟ
1. ไปยังเมนู File>Open Project สําหรับ Minitab 18

หน้ า 2
บทนํา แนะนําเบืองต้ นการใช้ งาน Minitab

2. เลือกไฟล์ LIGHTBULB.mpj (ไดเรกทอรีทีเก็บไฟล์ตวั อย่าง)


3. คลิก Open

หมายเหตุ : เมื อเราเปิ ดโปรเจกต์ ใดๆทีมี การจัดเก็บ (Save) มาก่อนหน้า Minitab จะแสดงลักษณะการจัดวาง
หน้าต่างเหมื อนกับทีจัดเก็ บไว้ก่อนจัดเก็บ (Save)

ส่ วนประกอบสําคัญของโปรเจกต์ (Project Windows)


Project Manager เป็ นส่วนทีใช้ สาํ หรับการจัดการโปรเจกต์ ในการจัดการเวิร์คชีท, ผลลัพธ์ , กราฟ
และไฟล์หรือลิงก์ต่างๆทีเกียวข้ อง
Session เป็ นหน้ าต่างทีไว้ สําหรับการเรียกดูผลลัพธ์ ทางสถิติ และใช้ สาํ หรับป้อนคําสังกรณีต้องการ
ใช้ งานมาโคร
Worksheet เป็ นส่วนเก็บข้ อมูลและจัดการข้ อมูล โดยลักษณะของข้ อมูลทีเก็บในเวิร์คชีทจะถูก
จัดเก็บในตัวแปรคอลัมน์ (Column) โดยสามารถนําข้ อมูล (Import) จากเอ็กเซล (Excel) และจัดเก็บเป็ น
ไฟล์เฉพาะข้ อมูลได้ (.mtw)
Graph จะแสดงเมือมีการประมวลผลทีต้ องการให้ ผลลัพธ์ ออกมาในรูปแบบของกราฟ โดยหนึง
รูปกราฟจะถูกวางบนหนึงหน้ าต่าง

หน้ า 3
บทนํา แนะนําเบืองต้ นการใช้ งาน Minitab

Project Manager Toolbar


ทูลบาร์ สาํ คัญเพือทําการชีไปยังส่วนต่างๆของโปรเจกต์ จะขอแนะนําปุ่ มสําคัญ 3 ปุ่ มบนทูลบาร์ ดงั
ภาพข้ างใต้

เมือคลิกไปยัง Show Session Folder

หน้ า 4
บทนํา แนะนําเบืองต้ นการใช้ งาน Minitab

โดยปกติ Minitab จะแสดงจํานวนทศนิยมทีเหมาะสมให้ กบั Output บน Session Window สําหรับ


กรณีทีคุณต้ องการให้ แสดงทศนิยมทีมากกว่า คุณสามารถคลิกปุ่ มขวากับส่วนทีคุณอยากแสดงทศนิยมที
มากกว่า จากนันเลือก Decimal Places และเลือกจํานวนทีต้ องการโดย Minitab สามารถแสดงจํานวน
ทศนิยมได้ มากสุด 16 ตําแหน่ง จากภาพข้ างใต้ สมมติกําหนดทศนิยมให้ แสดง 4 ตําแหน่ง

Minitab จะแสดงจํานวนทศนิยมใหม่ตามทีเรากําหนด

หน้ า 5
บทนํา แนะนําเบืองต้ นการใช้ งาน Minitab

เมือคลิกไปยัง Show Worksheet Folder

เมือคลิกไปยัง Show Graph Folder

นอกจากนีในโปรเจกต์ยงั มีส่วนประกอบต่างๆอีกหลายส่วนสามารถศึกษาเพิมเติมได้ ที
Minitab>Help

หน้ า 6
บทนํา แนะนําเบืองต้ นการใช้ งาน Minitab

การเปิ ดไฟล์ ข้อมูลจากไฟล์ เอ็กเซล (Excel)


หลายครังทีผู้ใช้ งานได้ จดั เก็บข้ อมูลไว้ ในไฟล์เอ็กเซลแต่ต้องการนําข้ อมูลทีได้ เหล่านันมาทําการ
ประมวลผลด้ วยโปรแกรม Minitab ดังนันขอแนะนําวิธีการนําข้ อมูลเข้ าจากเอ็กเซล
ลักษณะการรับข้ อมูลทีจัดเก็บระหว่างเอ็กเซลกับ Minitab จะเป็ นช่องต่อช่อง (Cell) ดังนี

กรณีทีช่องใดๆในเอ็กเซลเก็บเป็ นสูตรการคํานวณ Minitab จะรับข้ อมูลมาเฉพาะค่าผลลัพธ์ (Value)


หากข้ อมูลทีรับมาไม่ถูกรูปแบบของการคํานวณใน Minitab ทีมีลกั ษณะเป็ นคอลัมน์ ต้ องทําการ
จัดการข้ อมูล (Manipulate) ก่อน

หน้ า 7
บทนํา แนะนําเบืองต้ นการใช้ งาน Minitab

การนําข้ อมูลเข้ าจากเอ็กเซลโดยใช้ คําสัง Open ทําตามขันตอนต่อไปนี


(คุณสามารถเปิ ดโปรเจกต์ ใหม่ขึนมาโดยคลิ ก File>New Project หรื อเริ มโปรแกรม Minitab ใหม่)
1. สําหรับ Minitab 18 ให้ ไปยังเมนู File>Open Worksheet จากนันเลือก Excel Files ตรงส่วน
Files of type (ดูภาพข้ างใต้ )

2. เลือกไฟล์ LIGHTBULB.xlsx (ไฟล์ตัวอย่าง) จากไดเรกทอรีทีจัดเก็บ


3. คลิกปุ่ ม Open ตรงบริเวณด้ านล่างของไดอะล็อกบ็อกซ์

Minitab จะเริ มต้ นรับข้ อมูลจากแถวแรกมาเก็บไว้ ทีชือคอลัมน์


(หากไม่ต้องการให้มี Variable name ให้คลิ กไม่เลื อก “Data has columns names”)

หน้ า 8
บทนํา แนะนําเบืองต้ นการใช้ งาน Minitab

4. เมือตรวจดูภาพรวมแล้ วถูกต้ องให้ คลิก Open

กรณีทีไฟล์ Excel ทีต้ องการเปิ ดบรรจุไว้ หลายชีท Minitab จะแสดงแท็บด้ านบนเพือคลิกเลือก


กําหนดแต่ละชีท หากไม่ต้องการชีทใดสามารถคลิกไม่เลือก “Import the sheet”

หน้ า 9
บทนํา แนะนําเบืองต้ นการใช้ งาน Minitab

การนําข้ อมูลเข้ าโดยใช้ Query Database (ODBC: Open Database Connectivity) Minitab
สามารถทีจะเปิ ดโปรแกรมจากไฟล์ฐานข้ อมูลได้ หลากหลาย เช่น Microsoft Access, SQL เป็ นต้ น โดย
อาศัย ODBC ซึงเป็ นเหมือนสะพานเชือมไปยังฐานข้ อมูล ในบางครังต้ องทําการติดตังไดรเวอร์ เพิมเติมหาก
ในระบบวินโดวส์ของเราไม่มี (ซึงแต่ละเครืองจะไม่เหมือนกัน) หรืออาจจะต้ องมีรหัสผ่านทีผู้ดแู ลระบบฐาน
ข้ อมูลป้องกันไว้
สําหรับกรณีจดั เก็บข้ อมูลในรูปแบบของเอ็กเซลไฟล์ นอกจากการเปิ ดด้ วย Open Files แล้ วยัง
สามารถเปิ ดด้ วย Query Database ODBC ได้ เช่นกัน โดยทําตามขันตอนต่อไปนี
1. ไปยังเมนู File>Query Database(ODBC)

Minitab 18

2. เลือกแท็บชือ Machine Data Source จากนันเลือก Excel Files คลิก OK

หน้ า 10
บทนํา แนะนําเบืองต้ นการใช้ งาน Minitab

3. ไปยังไดเร็กทอรีทีเก็บไปไฟล์ Excel ทีต้ องการเปิ ด

4. เลือก Available tables: และ Available fields:

Sheet Name ใน Excel

Column ใน Excel

5. คลิก OK ตรวจดูผลลัพธ์ ทีได้

หน้ า 11
บทนํา แนะนําเบืองต้ นการใช้ งาน Minitab

ข้อสังเกต : การเปิ ดโดยใช้ ODBC จะเหมาะกับกรณี ทีต้องการเปิ ดหรื อนําข้อมูลจากแหล่งทีมี ลกั ษณะการเก็ บ
ข้อมูลแบบ Database เช่น MSExcel , MSAccess หรื อ SQL ในขณะทีข้อมูลทีเก็บในลักษณะ Database จะไม่สามารถ
เปิ ดด้วย File>Open เช่น Text , CSV หรื อ Dat File เป็ นต้น แต่สําหรับกรณี Excel สามารถเปิ ดหรื อนําเข้าข้อมูลได้ 2 แบบ
ข้ อมูลในเวิร์คชีท
เมือเราได้ ข้อมูลในเวิร์คชีทแล้ ว Minitab จะเก็บข้ อมูลเป็ นลักษณะคอลัมน์โดยมีชือเรียก C ตามด้ วย
ดัชนีคอลัมน์ C1 C2 C3 …. ในแต่ละคอลัมน์คือตัวแปรเก็บข้ อมูล เราสามารถตังชือคอลัมน์ได้ แต่ไม่
สามารถใช้ ชือคอลัมน์ ซํากันได้
ข้ อมูลในคอลัมน์ ใน Minitab สามารถเป็ นได้ 3 รูปแบบคือ ตัวเลข (Numeric), ตัวอักษร (Text) ซึง
จะมีสญ
ั ลักษณ์ –T และ วันทีและเวลา (Date/Time) ซึงมีสญ ั ลักษณ์ –D แสดงดังภาพ

หน้ า 12
บทนํา แนะนําเบืองต้ นการใช้ งาน Minitab

Date/Time Text Numeric

ชือ
คอลัมน์

เมือเราทราบแล้ วว่า Minitab มีลกั ษณะการเก็บข้ อมูลเป็ นตัวแปรคอลัมน์ เวลาใช้ งาน Minitab จะ
ถือว่าทีแถวเดียวกันจะเป็ นรายการเดียวกัน จากภาพข้ างใต้ เป็ นตัวอย่างเวิร์คชีททีเก็บข้ อมูล 3 คอลัมน์ ที
รายการหรือแถวที 17 แสดงความหมายว่า ชินงาน (Part) หมายเลข 6 มีค่าวัด (Response) เท่ากับ -0.11
โดยพนักงาน (Operator) A เป็ นคนวัด

หน้ า 13
บทนํา แนะนําเบืองต้ นการใช้ งาน Minitab

การใช้ งานไดอะล็อกบ็อกซ์ ของคําสังใน Minitab


เมือคุณทราบแล้ ว Minitab มีลกั ษณะโครงสร้ างของข้ อมูลเป็ นคอลัมน์ เวลาทีเราใช้ งานคําสังสถิติใน
Minitab (สมมติเลือกเมนู Stat>Basic Statistics>Display Descriptive Statistics) เมือเราทําการคลิกใน
ช่องทีต้ องการให้ เราป้อนข้ อมูลคอลัมน์ สามารถทําได้ ดังภาพต่อไปนี

เมือคุณคลิกทีช่อง
Variables: กรอบทาง
ด้ านซ้ ายจะแสดงคอลัมน์
ในเวิร์คชีททีสามารถ
เลือกใช้ ได้
การเลือกคอลัมน์คลิก
คอลัมน์ทีต้ องการคลิกปุ่ ม
Select หรือดับเบิลคลิก
คอลัมน์ทีต้ องการ

หน้ า 14
บทนํา แนะนําเบืองต้ นการใช้ งาน Minitab

จากไฟล์ตวั อย่าง(LIGHTBULB.mpj) หากเราเลือกเวิร์คชีทชือ “stackdata” สามารถทําการ


วิเคราะห์ข้อมูลคอลัมน์ Life และทําการแยกด้ วยคอลัมน์ Manufacturer สามารถทําการป้อนคอลัมน์ ดงั
ภาพข้ างใต้ จากนันคลิก OK เพือทําชุดคําสัง

หน้ า 15
บทนํา แนะนําเบืองต้ นการใช้ งาน Minitab

หน้ า 16
บทที 1 ภาพรวมการวิเคราะห์ทางสถิติ

ภาพรวมการวิเคราะห์ ทางสถิติ
ในการวิเคราะห์ทางด้ านสถิติมหี ลากหลายวิธีการวิเคราะห์โดย Minitab มีความสามารถในการ
วิเคราะห์ทางด้ านสถิติมากมาย โดยส่วนใหญ่จะเริมจากประเภทข้ อมูลทีคุณต้ องการจะวิเคราะห์ว่าเป็ น
ข้ อมูลวัด (Variable) หรือข้ อมูลนับ (Attribute) แล้ วถึงเลือกคําสังในการวิเคราะห์ ในเบืองต้ นเราจะใช้ คําสัง
Descriptive Statistics ในการหาค่าตัวสถิติหรือค่าพารามิเตอร์ ทีสนใจและเมือต้ องการทดสอบสมมติฐาน
ทางสถิติแนวทางการเลือกคําสังวิเคราะห์เขียนเป็ นแนวทางได้ ดงั ภาพข้ างใต้

แผนภาพทีแสดงเป็ นเพียงภาพรวมการวิเคราะห์ เครืองมือทีใช้ ในการวิเคราะห์ทางสถิติยงั มีอีก


มากมาย เช่น Correlation Regression Analysis, General Linear Model (ANOVA), Nonparametric
Test, Logistic Regression และอืนๆอีกมากมาย รวมถึงชุดคําสังทีเป็ นการนําเอาสถิติไปประยุกต์ใช้ เช่น
Control Chart, Process Capability Analysis, Reliability Analysis เป็ นต้ น

หน้ า 17
บทที 1 ภาพรวมการวิเคราะห์ทางสถิติ

สําหรับหนังสือเล่มนีจะกล่าวถึงในส่วนเฉพาะวิธีการใช้ งาน Minitab กับสถิติพืนฐานและในการ


ประมาณค่าและการทดสอบสมมติฐานสําหรับสิงตัวอย่างหนึงกลุ่ม (1-sample) กับสองกลุ่ม (2-sample)
เท่านัน ได้ แก่
การคํานวณและแสดงตัวสถิติเชิงพรรณา (Descriptive statistics)

สําหรับคําสังทีใช้ ในการคํานวณและแสดงตัวสถิติเชิงพรรณา(Descriptive statistics) ใน Minitab


จะมี 3 แบบให้ เลือกใช้ ดงั นี
 Display Descriptive Statistics : ผลของการคํานวณจะแสดงตัวสถิติไว้ ที session window
และแสดงกราฟบนหน้ าต่างกราฟ
 Store Descriptive Statistics : ผลของการคํานวณเก็บค่าตัวสถิติในคอลัมน์
 Graphical Summary : ผลของการคํานวณแสดงแบบสรุปผลลัพธ์ ไว้ บนหน้ าต่างกราฟ
สําหรับรายชือตัวสถิติที Minitab สามารถคํานวณและเก็บค่าได้ มีดงั ต่อไปนี

หน้ า 18
บทที 1 ภาพรวมการวิเคราะห์ทางสถิติ

การหาช่ วงความเชือมันและการทดสอบสมมติฐานของค่ าเฉลีย


(Confidence intervals and hypothesis tests of means)

มีทงหมด
ั วิธี ในการหาช่วงความเชือมัน และการทดสอบสมมติฐานของค่าเฉลีย และค่าเฉลียของ
กลุม่ ประชากร จะต้ องมีพืนฐานว่าสิงตัวอย่างต้ องมีการแจกแจงแบบปกติ และภายใต้ ทฤษฎีแนวโน้ มสู่
ศูนย์กลาง (Central limit theorem) ทีว่าค่าเฉลียสิงตัวอย่างทีมีการแจกแจงแบบใดๆจะสามารถประมาณ
ให้ เป็ นการแจกแจงแบบปกติได้ ดีขนึ เมือจํานวนสิงตัวอย่างเพิมขึน
 1-Sample Z เป็ นการคํานวณช่วงความเชือมันหรือการทดสอบสมมติฐานของค่าเฉลียเมือทราบ
ค่าความเบียงเบนมาตรฐานของประชากร  เนืองด้ วยวิธีการนีมีพืนฐานจากการใช้ ข้อมูลทีมี
การแจกแจงแบบปกติ ดังนันเมือสิงตัวอย่างมีจํานวนน้ อยและมาจากประชากรทีมีการแจกแจง
แบบปกติ หรือมีการแจกแจงเข้ าใกล้ การแจกแจงแบบปกติ วิธีนีดีทีสุด จากทฤษฎีแนวโน้ มสู่
ศูนย์กลาง (Central Limit Theorem) วิธีการนียังสามารถใช้ ได้ กบั กรณีสงตั
ิ วอย่างทีมีขนาด
จํานวนสีงตัวอย่างขนาดใหญ่ แล้ วใช้ ค่าความเบียงเบนมาตรฐานสิงตัวอย่างแทน ซึงโดยทัวไป
เมือขนาดสิงตัวอย่างเท่ากับ หรือมากกว่าถือว่าเป็ นขนาดสิงตัวอย่างขนาดใหญ่ และ
นักวิเคราะห์ สว่ นใหญ่มักจะเลือกใช้ การทดสอบ t แทนการทดสอบ Z เมือไม่ร้ ูค่า 
 1- Sample t เป็ นการคํานวณช่วงความเชือมันหรือการทดสอบสมมติฐานของค่าเฉลียเมือไม่
ทราบค่าความเบียงเบนมาตรฐานของประชากร  เนืองด้ วยวิธีการนีมีพืนฐานจากการใช้ ข้อมูล
ทีมีการแจกแจงแบบ t ซึงมีรากฐานมาจากการแจกแจงแบบปกติทีไม่ทราบค่าเบียงเบน
มาตราฐานประชากร ดังนันเมือสิงตัวอย่างมีจํานวนน้ อยและมาจากประชากรทีมีการแจกแจง
แบบปกติ หรือมีการแจกแจงเข้ าใกล้ การแจกแจงแบบปกติ วิธีนีดีทีสุด

หน้ า 19
บทที 1 ภาพรวมการวิเคราะห์ทางสถิติ

วิธีนีเหมาะสมกว่ากว่าวิธี Z โดยเฉพาะเมือสีงตัวอย่างขนาดเล็กและไม่ร้ ูค่าความเบียงเบน


มาตรฐานของประชากร นักวิเคราะห์ สว่ นมากเลือกใช้ วิธี t แทนวิธี Z ทุกครังเมือไม่ทราบค่า 
จากทฤษฎีแนวโน้ มสูศ่ นู ย์กลาง (Central Limit Theorem) คุณสามารถเพิมความเชือมันของ
ผลลัพธ์ ได้ ด้วยการเพิมจํานวนสิงตัวอย่าง เพราะการแจกแจงของค่าเฉลียสิงตัวอย่างจะเข้ าใกล้
การแจกแจงแบบปกติ
 2-Sample t เป็ นการคํานวณช่วงความเชือมันหรือการทดสอบสมมติฐานของความแตกต่าง
ค่าเฉลียของ ประชากร เมือไม่ทราบค่าความเบียงเบนมาตรฐานของประชากร  และสิง
ตัวอย่างสุม่ มาอย่างอิสระต่อกัน เนืองด้ วยวิธีการสามารถเพิมความเชือมันของผลลัพธ์ ได้ ด้วย
การเพิมจํานวนตัวอย่างทดสอบนีมีพืนฐานจากการใช้ ข้อมูลทีมีการแจกแจงแบบ t ดังนันเมือสิง
ตัวอย่างมีจํานวนน้ อยและมาจากประชากรทีมีการแจกแจงแบบปกติ หรือมีการแจกแจงเข้ าใกล้
การแจกแจงแบบปกติ วิธีนีดีทีสุด และคุณสามารถเพิมความเชือมันของผลลัพธ์ ได้ ด้วยการเพิม
จํานวนตัวอย่างทดสอบ
 Paired t เป็ นการคํานวณช่วงความเชือมันหรือการทดสอบสมมติฐานของความแตกต่าง
ค่าเฉลียของ ประชากร โดยทีสีงตัวอย่างมาเป็ นคู่ (paired) เมือข้ อมูลเป็ นคู่ โดยทําการวัดค่า
ก่อนและหลัง (วัดติดต่อกัน) ผลลัพธ์ จากวิธี paired t จะให้ ค่าความแปรปรวนขนาดเล็กและ
สามารถจับค่าความแตกต่างได้ ดีกว่าวิธี 2 sample t ซึงสิงตัวอย่างเกิดขึนจากการอย่างอิสระ

การหาช่ วงความเชือมันและการทดสอบสมมติฐานของค่ าสัดส่ วน


(Confidence intervals and hypothesis tests of proportions)

หน้ า 20
บทที 1 ภาพรวมการวิเคราะห์ทางสถิติ

 1 proportion เป็ นการคํานวณช่วงความเชือมันหรือการทดสอบสมมติฐานของค่าสัดส่วนของ


ประชากร กลุ่ม
 2 proportions เป็ นการคํานวณช่วงความเชือมันหรือการทดสอบสมมติฐานของความแตกต่าง
ของค่าสัดส่วนของประชากร กลุม่

การหาช่ วงความเชือมันและการทดสอบสมมติฐานของอัตราปั วร์ ซอง


(Confidence intervals and hypothesis tests of Poisson rate)

 1 sample Poisson rate เป็ นการคํานวณช่วงความเชือมันหรือการทดสอบสมมติฐานของอัตรา


การเกิด (occurrence rate) และค่าเฉลียจํานวนการเกิดในกระบวนการปั วร์ ซอง (Poisson
processes)
 2 sample Poisson rate เป็ นการคํานวณช่วงความเชือมันหรือการทดสอบสมมติฐานของความ
แตกต่างของอัตราการเกิด (occurrence rate) และความแตกต่างของค่าเฉลียจํานวนการเกิดใน
กระบวนการปั วร์ ซอง (Poisson processes) กระบวนการ

การหาช่ วงความเชือมันและการทดสอบสมมติฐานของค่ าความแปรปรวน


(Confidence intervals and hypothesis tests of variance)

หน้ า 21
บทที 1 ภาพรวมการวิเคราะห์ทางสถิติ

 1 variance เป็ นการคํานวณช่วงความเชือมันหรือการทดสอบสมมติฐานของค่าความแปรปรวน


ของสิงตัวอย่าง กลุม่
 2 variances เป็ นการคํานวณช่วงความเชือมันหรือการทดสอบสมมติฐานเรืองความเท่ากัน
(equality) หรือ ความเป็ นหนึงเดียวกัน(homogeneity) ของค่าความแปรปรวนของสีงตัวอย่าง
กลุม่
ค่ าสหสัมพันธ์ และความแปรปรวนร่ วม (Correlation and Covariance)

 ค่าสหสัมพันธ์ (Correlation) เป็ นการคํานวณผลลัพธ์ ของโมเนต์ของค่าสัมประสิทธิ สหสัมพันธ์


ของตัวแบบเพียร์ สนั หรือเรี ยกว่า ค่าสัมประสิทธ์ สหสัมพันธ์ (correlation coefficient) หรือ ค่า
สหสัมพันธ์ (correlation) สําหรับตัวแปร (variable) ทีเป็ นคู่ ค่าสัมประสิทธ์ สหสัมพันธ์ เป็ นการ
วัดองศาความเป็ นเส้ นตรงของความสัมพันธ์ ระหว่าง ตัวแปร ซึงคุณจะใช้ ค่า p-value เป็ นค่า
ตัดสินใจในการทดสอบว่าค่าสัมประสิทธ์ สหสัมพันธ์ นนมี ั ค่าไม่เท่ากับศูนย์อย่างมีนยั สําคัญทาง
สถิติหรือไม่
ด้ วยการผสมผสานการใช้ คําสังใน Minitab คุณยังสามารถคํานวณหาค่าสหสัมพันธ์ ของสเปี ยร์
แมน (Spearman’s correlation) ค่าสหสัมพันธ์ ของสเปี ยร์ แมน คือการหาค่าสหสัมพันธ์ บนค่า
อันดับ (rank) ของสิงตัวอย่าง กลุ่ม
 ความแปรปรวนร่วม (covariance) เป็ นการคํานวณค่าความแปรปรวนร่ วมของตัวแปรทีเป็ นคู่
ซึงเป็ นการวัดค่าความสัมพันธ์ ของตัวแปร ตัวทีไม่ได้ มีการปรับค่ามาตรฐาน ด้ วยการ
ปรับเปลียนค่าสัมประสิทธิ สหสัมพันธ์ ด้ วยการหารด้ วยค่าเบียงเบนมาตรฐานของตัวแปรทัง
ตัว

หน้ า 22
บทที 1 ภาพรวมการวิเคราะห์ทางสถิติ

การทดสอบการแจกแจง (Distribution Test)

 การทดสอบการแจกแจงแบบปกติ (Normality test) ทําการสร้ างแผนภาพการแจกแจงแบบปกติ


และทดสอบสมมติฐานเพือทําการตรวจสอบว่าข้ อมูลนันมีการแจกแจงแบบปกติหรือไม่ เนือง
ด้ วยวิธีการทางสถิติหลายๆตัว เช่น Z test หรือ t test จะใช้ ได้ ก็ต่อเมือข้ อมูลนันเป็ นข้ อมูลทีมา
การแจกแจงแบบปกติ ดังนันจึงใช้ วิธีนีเพือทดสอบว่าข้ อมูลนันมีการแจกแจงแบบปกติหรือไม่
 การทดสอบภาวะสารูปดีของการแจกแจงแบบปั วร์ ซอง (Goodness of fit test for Poisson)
เป็ นการประเมินว่าข้ อมูลนันมีการแจกแจงแบบปั วร์ ซองหรือไม่ วิธีทางสถิติบางอย่าง เช่น
แผนภูมิยู (U chart) ซึงมีสมมติฐานว่าข้ อมุลต้ องมีการแจกแจงแบบปั วร์ ซอง จึงใช้ วิธีนีในการ
ทดสอบว่าเป็ นไปตามสมมติฐานนีหรือไม่

หน้ า 23
บทที 1 ภาพรวมการวิเคราะห์ทางสถิติ

หน้ า 24
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

สถิตเิ ชิงพรรณา (Descriptive Statistics)


สถิติเชิงพรรณา (Descriptive Statistics) คือ วิธีการจัดระเบียบข้ อมูลและการนําเสนอข้ อมูล โดยการ
นําเสนอข้ อมูลอาจแสดงอยู่ในรูปข้ อความ ตาราง กราฟ เช่น การแสดงการกระจายของข้ อมูลด้ วย
ฮีสโตแกรม หรือการนําเสนอข้ อมูลด้ วยตัวสถิติ เช่น การแสดงค่าแนวโน้ มเข้ าสู่สว่ นกลางโดยแสดงด้ วย
ค่าเฉลีย (mean) และการแสดงค่าการกระจายของข้ อมูลด้ วยค่าความเบียงเบนมาตรฐาน (standard
deviation) เป็ นต้ น
ตัวสถิติ(Statistics) คือ ค่าทางคณิตศาสตร์ ทีใช้ ในการประมาณค่าพารามิเตอร์ เพืออธิบายลักษณะ
ประชากรหรือตัวอย่าง
ตัวสถิติ(Statistics) ใน Minitab
ค่าเฉลีย (Mean) เป็ นตัวอธิบายชุดข้ อมูลทังหมด ด้ วยค่ากลางของชุดข้ อมูล ค่าเฉลียหรือ ค่าเฉลีย
เลขคณิต (arithmetic average) คือ ผลรวมของข้ อมูลทังหมดหารด้ วยจํานวนข้ อมูล เช่น เวลาในการ
ให้ บริการ (หน่วยนาที) ลูกค้ า 5 คนในธนาคาร คือ 3, 3, 4, 2 และ 4 ค่าเฉลียในการให้ บริการ คือ
= = 3.2 นาที
ค่าเฉลียจะให้ ค่านําหนักกับข้ อมูลเท่ากันทุกตัว แม้ กระทังค่าทีแตกต่างสูงสุด (Extreme values) ซึง
อาจทําให้ ไม่สามารถเป็ นตัวแทนกับกรณีทีข้ อมูลมีความเบ้ (skewed data) อธิบายได้ ดังนี
Histogram of Service Time Histogram of Service Time
1.037 1.019
50
90

80
40
70
Frequency

60
Frequency

30
50

20 40

30

10 20

10

0 0
-0.4 0.0 0.4 0.8 1.2 1.6 2.0 2.4 0 1 2 3 4 5 6 7
C2 C1
Worksheet: Worksheet 1 Worksheet: Worksheet 1

ข้ อมูลทีมีความสมมาตร (Symmetric data) ค่าเฉลีย (เส้ นสีชมพู) จะวางอยู่ตรงกลางของรูปการ


กระจายของข้ อมูล (รูปซ้ าย) ซึงค่าเฉลียนีเป็ นตัวแทนทีดีของชุดข้ อมูลนีได้ ข้ อมูลทีมีความเบ้ (skewed
data) ค่าเฉลีย (เส้ นสีชมพู) ซึงจะเห็นว่าเอียงมาอยู่ทางส่วนข้ อมูลทีมีค่ามากกว่า ทําให้ ค่าเฉลียทีได้ ไม่
สามารถเป็ นตัวแทนค่ากลางของชุดข้ อมูลได้ (รูปขวา)

หน้ า 25
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

ส่วนมากแล้ วนักวิเคราะห์ทางสถิติ จะนิยมใช้ ค่าเฉลีย เป็ นจุดอ้ างอิงมาตรฐานของข้ อมูล, µ จะใช้


เป็ นสัญลักษณ์แทนค่าเฉลียประชากร และ ̅ หรือ μ จะใช้ เป็ นสัญลักษณ์แทนค่าเฉลียสิงตัวอย่าง
ค่าคลาดเคลือนมาตรฐานของค่าเฉลีย (Standard Error of Mean, SE of Mean) เป็ นการวัดความ
เทียงตรงของค่าเฉลียสิงตัวอย่างนัน สามารถประมาณค่าเฉลียประชากรได้ อย่างไร และไว้ ใช้ ในการ
ประมาณช่วงความเชือมันของค่าเฉลียประชากร ค่า SE Mean ยิงน้ อย ยิงหมายถึงว่าสามารถประมาณ
ค่าเฉลียประชากรได้ เทียงตรงมากขึน
ค่า SE Mean คือ ค่าความเบียงเบนมาตรฐานหารด้ วย รากทีสองของจํานวนสิงตัวอย่าง (n) ดังนัน
 ค่าเบียงเบนมาตรฐานทีมีขนาดใหญ่ ยิงทําให้ ค่า SE Mean มีค่ามาก
 ขนาดจํานวนสิงตัวอย่างยิงมาก ยิงทําให้ ค่า SE Mean มีค่าน้ อย
ตัวอย่างเช่น ค่าเฉลียเวลาในการรอสินค้ า คือ 3.8 วัน และมีค่าเบียงเบนมาตรฐานคือ 5.67 วัน ซึง
มาจากข้ อมูลเวลาในการส่งมอบจํานวน 342 ค่า และจากข้ อมูลนีให้ ค่า SE Mean เท่ากับ 0.30 วัน (มา
.
จาก ) หมายความว่า ถ้ าทําการสุม่ ตัวอย่างมาจากประชากรกลุม่ เดียวกัน ด้ วยจํานวนเท่ากับครังนี

ค่าเบียงเบนมาตรฐานของค่าเฉลียของกลุม่ สิงตัวอย่างเหล่านี จะมีค่าประมาณเท่ากับ 0.30 วัน
ค่า SE Mean ยังสามารถนํามาใช้ สร้ างช่วงความเชือมันของค่าเฉลียประชากร จากตัวอย่างนี
ประมาณช่วงความเชือมัน 95% ซึงช่วงความเชือมันนีจะขยายค่าเฉลียออกไป +/- 2 เท่าของค่า SE Mean
ดังนันจากตัวอย่างจะได้ ช่วงความเชือมัน 95% คือ (5.07, 6.27) วัน ซีงหมายความว่า 95% ของค่าเฉลีย
ประชากรจะตกอยู่ในช่วงนี
ค่าความเบียงเบนมาตรฐาน (Standard deviation) เป็ นตัววัดการกระจาย หรือ การกระจายตัวของ
ข้ อมูลจากค่าเฉลีย ค่าเบียงเบนมาตรฐานเป็ นการประมาณการ ค่าเฉลียระยะห่างของข้ อมูลแต่ละค่ากับ
ค่าเฉลีย ยิงมีค่าเบียงเบนมากหมายถึงข้ อมูลมีการกระจายตัวมาก

หน้ า 26
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

ค่าเบียงเบนมาตรฐานสามารถใช้ เป็ นตัวเปรี ยบเทียบพืนฐานเรืองความผันแปร (Variation) ของ


กระบวนการได้ ตัวอย่างเช่น แผนกบริหารและจัดการทําการตรวจติดตามค่าเวลาทีผู้ป่วยใช้ ในการรักษาใน
แผนกฉุกเฉินของ 2 โรงพยาบาล ถึงแม้ ว่าค่าเฉลียเวลาในการรักษาของผู้ป่วยจะมีค่าเท่ากันคือ 35 นาที แต่
ค่าเบียงเบนมาตรฐานมีค่าแตกต่างกันอย่างมีนัยสําคัญ (significantly different)
Individual Value Plot of Time
70

60

50

40
Time

35
30

20

10

0
H1 H2
Hospital
Worksheet: Worksheet 2

โรงพยาบาลที 1 ค่าเบียงเบนมาตรฐานคือ 6 โดยเฉลียแล้ วผู้ป่วยใช้ เวลาในการรักษาเบียงเบนจาก


ค่าเฉลีย (เส้ นสีนําเงิน) ไป 6 นาที โรงพยาบาลที ค่าเบียงเบนมาตรฐานคือ 20 โดยเฉลียแล้ วผู้ป่วยใช้ เวลา
ในการรักษาเบียงเบนจากค่าเฉลีย (เส้ นสีนําเงิน) ไป 20นาที
ค่าเบียงเบนมาตรฐาน มีค่าเท่ากับรากทีสอง (ค่าบวก) ของค่าความแปรปรวน (Variance) ค่า
ความแปรปรวนเป็ นค่าหนึงในการวัดค่าการกระจายของข้ อมูล ค่าเบียงเบนมาตรฐานมีความสะดวกและ
สามารถเข้ าใจความหมายได้ ง่ายและเหมาะสมต่อการใช้ งาน เพราะว่ามีหน่วยเดียวกันกับข้ อมูล เช่น ถ้ า
ชินส่วนงานหนึงมีนําหนักเป็ นกรัม ค่าเบียงเบนมาตรฐานของนําหนักชินงานจะแสดงเป็ นกรัมเช่นกัน แต่
สําหรับความแปรปรวนจะแสดงเป็ น กรัม2
ในการแจกแจงแบบปกติ (ทีมีรูปแบบการกระจายเป็ นแบบระฆังควํา) การบ่งบอกค่าเบียงเบน
มาตรฐานเป็ นจํานวนเท่าจากค่าเฉลียเป็ นเหมือนการบอกสัดส่วนของจํานวนข้ อมูล เช่น

หน้ า 27
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

Distribution Plot
Normal, Mean=35, StDev=5
-2 -1 0 +1 +2
0.09

0.08

0.07

0.06
Density

0.05

0.04

0.03

0.02

0.01
0.02275 0.02275
0.00
25 35 45
X
Worksheet: Worksheet 2

ประมาณ 95% ของข้ อมูลตกอยู่ใน 2 เท่าของค่าเบียงเบนมาตรฐานทีเบียงออกจากค่าเฉลีย ซึง


แสดงด้ วยพืนทีระหว่างค่า 25 ถึง 45 ,ประมาณ 68% ของข้ อมูลตกอยู่ในช่วงทีนับจากค่าเฉลียออกไป +1
ถึง -1 เท่าของค่าเบียงเบนมาตรฐาน และประมาณ 99.7% ของข้ อมูลตกอยู่ในช่วงทีนับจากค่าเฉลียออกไป
+3 ถึง -3 เท่าของค่าเบียงเบนมาตรฐาน
โดยทัวไป  จะใช้ เป็ นสัญลักษณ์แทนค่าเบียงเบนมาตรฐานของประชากร และ S จะใช้ เป็ น
สัญลักษณ์แทนค่าเบียงเบนมาตรฐานของสิงตัวอย่าง ความผันแปรทีเกิดขึนในกระบวนการทีเป็ นแบบสุม่
มักจะหมายถึงค่ารบกวน (noise)
ความแปรปรวน (Variance) เป็ นตัววัดค่าการกระจาย การกระจายหมายถึงการดูชดุ ข้ อมูลหรือ
รูปแบบการกระจายของข้ อมูลรอบค่าเฉลีย การตรวจติดตามค่าความแปรปรวนมีความจําเป็ นต่อการผลิต
และคุณภาพในการผลิตเพราะว่าการลดความแปรปรวนของกระบวนการผลิตเป็ นการเพิมความเทียงตรง
(precision) และลดจํานวนสิงบกพร่อง (defects)
ตัวอย่างเช่น โรงงานผลิตตะปูขนาดยาว 50 มม. ซึงมีค่าขนาดจําเพาะ (Specification) คือ 50 ± 2
มม. โรงงานมีการใช้ เครืองจักร 2 ชนิดในการผลิต เครืองจักรทัง 2 ชนิด สามารถผลิตได้ ตะปูทีมีขนาดความ
ยาว 50 มม. และมีรูปแบบค่าความยาวกระจายตัวแบบปกติ ทีค่าลียความยาวตะปู เท่ากับ 50 มม

หน้ า 28
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

แต่อย่างไรก็ตามเครืองจักรแต่ละเครืองมีค่าความแปรปรวนแตกต่างกัน เครืองจักร A ซึงมีรูปแบบ


การกระจายตัวตามเส้ นประ และมีค่าความแปรปรวน เท่ากับ 9 มม2 เครืองจักร B ซึงมีรูปแบบการกระจาย
ตัวตามเส้ นทึบ และมีค่าความแปรปรวนเท่ากับ 1 มม2 การกระจายตัวของค่าความยาวของตะปูทีผลิตโดย
เครืองจักรทัง 2 เครือง มีส่วนทีออกนอกเขตค่าจํากัดเฉพาะทังขีดจํากัดบนและล่าง
Distribution Plot
Normal, Mean=50
48 52
0.4 StDev
Machine A
Machine B

0.3
Density

0.2

0.1

0.0
40 45 50 55 60
X
Worksheet: Worksheet 2

ตะปูทีมาจากเครืองจักร A มีค่าความแปรปรวนขนาดใหญ่กว่าตะปูทีมาจากเครืองจักร B ดังนันตะปู


ทีมาจากเครืองจักร A จะมีโอกาสมากกว่าทีจะทําให้ ออกนอกขอบเขตค่าขีดจํากัดเฉพาะ เมือเทียบกับตะปู
ทีมาจากเครืองจักร B
เพราะว่าความแปรปรวน คือ หน่วย/ขนาด กําลังสอง ซึงทําให้ สบั สนในการนําไปใช้ ได้ ตัวอย่างเช่น
ค่าความยาวชินงาน มีค่าเฉลียเท่ากับ 15 มิลลิเมตร และค่าความแปรปรวนเท่ากับ 9 มิลลิเมตร2 (ตาราง
มิลลิเมตร) เพือทําให้ เข้ าใจได้ ง่ายขึน ความแปรปรวนมักจะแสดงด้ วยค่ารากทีสอง ซึงเท่ากับค่าเบียงเบน
มาตรฐาน ซึงเป็ นตัววัดทีสามารถแสดงภาพรวมได้ ดีกว่า ดังนัน ค่าความแปรปรวนของความยาวชินงาน
เท่ากับ 9 มิลลิเมตร2 มีค่าเท่ากับ ค่าเบียงเบนมาตรฐาน 3 มิลลิเมตร
ค่าสัมประสิทธิ ความแปรปรวน(Coefficient of Variance) เป็ นตัววัดความผันแปรสัมพัทธ์ ซึงมีค่า
เท่ากับ ความเบียงเบนมาตรฐานหารด้ วยค่าเฉลีย (ใน Minitab จะทําการคูณผลหารด้ วย 100) เนืองจากค่า
นีเป็ นการวัดแบบไม่มีหน่วยทําให้ มีประโยชน์ในการเปรียบเทียบการกระจายตัวของประชากรทีมีค่าเฉลีย
แตกต่างกันอย่างมาก

หน้ า 29
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

ตัวอย่างเช่น พนักงานตรวจสอบคุณภาพโรงงานขวดนมแห่งหนึง ซึงมีทงขวดขนาดเล็


ั กและใหญ่ ทํา
การสุม่ ตัวอย่างขวดเล็กและใหญ่ ซึงค่าเฉลียปริ มาตรของขวดเล็กเท่ากับ 1 ถ้ วย และค่าเบียงเบนมาตรฐาน
เท่ากับ 0.08 ถ้ วย และค่าเฉลียปริ มาตรของขวดใหญ่เท่ากับ 1 แกลลอน (16 ถ้ วย) และค่าเบียงเบน
มาตรฐานเท่ากับ 0.4 ถ้ วย ถึงแม้ ว่าค่าเบียงเบนมาตรฐานของขวดขนาดใหญ่จะมีขนาดเป็ น 5 เท่าของขวด
ขนาดเล็ก แต่ในการสรุปผลให้ ดูค่าสัมประสิทธิ ความแปรปรวนเพือดูความแตกต่าง
ขวดขนาดใหญ่ COV = 100 * 0.4 ถ้ วย / 16 ถ้ วย = 2.5
ขวดขนาดเล็ก COV = 100 * 0.08 ถ้ วย / 1 ถ้ วย = 8
จะเห็นได้ ว่า สัมประสิทธิ ความแปรปรวนของขวดขนาดเล็กมากกว่าของขวดขนาดใหญ่ อยู่3 เท่า
หรืออีกนัยหนึงหมายความว่าถึงแม้ ว่าขวดขนาดใหญ่จะมีค่าเบียงเบนมาตรฐานทีมากกว่า แต่ความผันแปร
ของค่าปริ มาตรรอบค่าเฉลียของขวดขนาดเล็กมีมากกว่า
ค่าควอไทล์(Quartile) คือ การแบ่งข้ อมูลออกเป็ นส่วน ซึงสามารถนํามาใช้ ในการประเมินการ
กระจายตัวและค่าแนวโน้ มสูศ่ นู ย์ กลาง (Central tendency) ของข้ อมูลได้ ซึงเป็ นฐานแรกในการทําความ
เข้ าใจเกียวกับข้ อมูล
Q1 : ควอไทล์ทีหนึง (1st Quartile) คือส่วนข้ อมูล 25% หรือ น้ อยกว่านัน
Q2 : ควอไทล์ทีสอง (2nd Quartile) คือ ค่ามัธยฐาน(median)ของข้ อมูลเท่ากับส่วน 50% ของข้ อมูล
Q3 : ควอไทล์ทีสาม (3rd Quartile) คือ ส่วน 75% หรือน้ อยกว่านันของชุดข้ อมูล
ค่าพิสยั ระหว่างควอไทล์ (Interquartile range) คือระยะห่างระหว่างควอไทล์ทีหนึง และ ควอไทล์ที
สาม (Q3 – Q1) หรือ เท่ากับระยะของข้ อมูลตรงส่วน 50%
ตัวอย่างเช่น ชุดข้ อมูล 7, 9, 16, 36, 39, 45, 45, 46, 48, 51
Q1 = 14.25, Q2 = 42, Q3 = 46.50, Interquartile range = 14.25 ถึง 46.50 = 32.35
เพราะว่าควอไทล์ไม่ได้ รวมอิทธิพลของค่าสูงสุดและค่าตําสุดของชุดข้ อมูล ดังนันค่ามัธยฐานและค่า
พิสยั ระหว่างควอไทล์ จึงสามารถเป็ นตัววัดเรืองค่าแนวโน้ มสู่ศนู ย์ กลางและค่าความเบ้ ของชุดข้ อมูลได้
ดีกว่าค่าเฉลีย (Mean) และ ค่าความเบียงเบนมาตรฐาน (standard deviation)

หน้ า 30
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

ค่ามัธยฐาน (median)
คือค่าตรงกลางขงชุดข้ อมูล ซึงแสดงว่ามีข้อมูลจํานวนครึงหนึงมีค่าน้ อยกว่า และ ข้ อมูลอีกครึงหนึง
มีค่ามากกว่า ค่ามัธยฐานตัวนี
2 5 6 20 50
ถ้ าชุดข้ อมูลเป็ นจํานวนเลขคี ค่ามัธยฐานสามารถหาได้ โดยง่าย ซึงเท่ากับค่าตรงกลางของชุดข้ อมูล
เช่น จากชุดข้ อมูลนี คือ 6 ซึงมีข้อมูล 2 ตัวทีมีค่าน้ อยกว่า และข้ อมูลอีก 2 ตัวทีมีค่ามากกว่า
2 5 6 12 20 50
ถ้ าชุดข้ อมูลเป็ นจํานวนเลขคู่ ค่ามัธยฐานหาได้ จากค่าเฉลียของข้ อมูล 2 ตัวตรงกลางของชุดข้ อมูล
เช่นจากตัวอย่างค่ามัธยฐานคือ ค่า 6 และ 12 ซึงทําให้ ค่ามัธยฐานเท่ากับ 9 เมือเปรียบเทียบกับค่าเฉลีย
ค่ามัธยฐานจะไม่ไวต่อข้ อมูลทีมีค่าผิดปกติ (มากเกินไป หรือ น้ อยเกินไป) ซีงทําให้ สาระข้ อมูลเรืองค่ากลาง
และความเบ้ ของข้ อมูลได้ ดีกว่า ตัวอย่างเช่น ค่าเฉลียอาจจะเป็ นตัวสถิติทีไม่ดีในการอธิบายเรืองเงินเดือน
ของพนักงานในบริษัท เนืองจากว่าสัดส่วนของเงินเดือนสูงในชุดข้ อมูล จะถ่วงนําหนักกับค่าเฉลียทังหมด
ทําให้ ได้ เงินเดือนของบริษัทไม่ตรงกับความเป็ นจริ ง ในกรณีนีค่ามัธยฐานจะให้ สาระข้ อมูลได้ ดีกว่า ซึงหาได้
จาก ควอไทล์ทีสอง หรือ เปอร์ เซ็นต์ไทล์ที 50
ค่าฐานนิยม (Mode) คือค่าข้ อมูลทีมีการเกิดมากทีสุดในชุดข้ อมูลนันๆ ค่าฐานนิยมอาจจะนํามาใช้
ร่วมกับค่าเฉลีย และค่ามัธยฐานเพืออธิบายลักษณะการแจกแจงของข้ อมูล ค่าเฉลียและค่ามัธยฐานจะต้ อง
มีการคํานวณ ค่าฐานนิยมสามารถหาได้ ง่ายโดยการนับจํานวนในการเกิดของข้ อมูลในชุดนัน
การหาค่าฐานนิยมช่วยทําให้ คณ
ุ เข้ าใจลักษณะการแจกแจงของข้ อมูลได้ ดียิงขึน

หน้ า 31
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

การแจกแจงแบบยอดเดียว (Unimodal)

มีหนึงยอด ค่าฐานนิยมคือ ค่า 4 เป็ นตัวเลขทีเกิดมากทีสุด การแจกแจงแบบสองยอด (Bimodal)

มี 2 ยอด ค่าฐานนิยมคือ ค่า 4 และ 8 ข้ อมูลการแจกแจงทีมียอดมากกว่าหนึงยอด บ่งบอกให้ ร้ ู ว่า


ข้ อมูลทีได้ มาอาจจะมาจากประชากรทีมากกว่าหนึงกลุม่ ตัวอย่างเช่น คุณเก็บค่าเวลาในการรอของลูกค้ า
ทีมาทําเรืองการเบิกเงินสดจากเชค และเรืองการทําสินเชือ ไปพร้ อมๆกัน ซึงเพือให้ เกิดความชัดเจนของ
ข้ อมูลควรทีจะทําการเก็บข้ อมูลแยกจากกัน ถ้ าการแจกแจงมีมากกว่าสองยอด จะเรี ยกว่าเป็ นการแจกแจง
แบบหลายยอด (multimodal)
Trimmed Mean ค่าเฉลียทีมีการตัดค่าทีมากทีสุดและตําสุดออกจากชุดข้ อมูล ค่าเฉลีย Trimmed
จะลดผลกระทบทีเกิดจากค่าสูงสุดและตําสุดออกไป ซึงทําให้ ได้ สาระข้ อมูลทีแท้ จริ งของค่าแนวโน้ มสู่
ศูนย์กลางทีแท้ จริง
จากรูป เส้ นสีนําเงินจะแทนค่าเฉลียเริมต้ น ซึงจะเห็นได้ ว่าได้ รับอิทธิพลจากค่าสูงสุดทีอยู่นอกกลุ่ม
(ด้ านปลายขวา) ส่วนเส้ นสีแดงเป็ นค่า Trimmed mean ทีจะเลือนมาทางด้ านซ้ ายเล็กน้ อย เพราะว่ามีการ
ตัดอิทธิพลของค่าสูงสุดออกไป

หน้ า 32
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

Histogram of C1
Trimmed Mean = 35.14 Mean = 35.31

25

20
Frequency

15

10

0
25 30 35 40 45 50 55 60
C1
Worksheet: Worksheet 1

Minitab จะคํานวณ trimmed mean โดยใช้ ตวั เลขเท่ากับ 5% ซึงเท่ากับการไม่นบั รวมค่าตัวเลข


สูงสุด 5% และ ค่าตําสุด 5% แล้ วทําการหาค่าเฉลียจากข้ อมูลทีเหลือ
Sum: ผลรวมของตัวเลขจํานวน 2 ตัว หรือ มากกว่านัน
Minimum: ค่าตําทีสุด
Maximum: ค่ามากทีสุด
Range: ค่าผลต่างระหว่างค่าตัวเลขทีมากทีสุดและค่าตัวเลขทีน้ อยทีสุด
N nonmissing: N missing: N total: คือจํานวนข้ อมูลทีหายได้ จํานวนข้ อมูลทีไม่ได้ หายไป และ
จํานวนข้ อมูลทังหมดทีมีอยู่ในคอลัมน์ทีอยู่ใน worksheet
N missing จะนับจากเซลล์ทีมีสญ
ั ลักษณ์ * หรือ สัญลักษณ์อืนทีแทนข้ อมูลทีหายไป
N nonmissing จะนับจากเซลล์ทีมีข้อมูลตัวเลขอยู่
N total คือผลรวมของค่าตัวสถิติทังสองตัวทีกล่าวมา หรือ เท่ากับจํานวนข้ อมูลทังหมดทีมีใน
คอลัมน์

หน้ า 33
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

Cumulative N: คือ การนับค่าความถีสะสมของจํานวนข้ อมูลทีมีอยู่ในแต่ละกลุ่มประเภทตัวแปร


(หมายถึง ตัวบ่งชีประเภทตัวแปร ซึงเรี ยกคอลัมน์นนว่ ั า BY) ตัวอย่างเช่น คุณจะทําการหาจํานวนคู่สญ ั ญา
ทีบริษัทได้ มีการทํางานให้ ในปลายปี ทีแล้ ว ถ้ าคุณใช้ ไตรมาสเป็ นตัวแบ่งกลุ่มข้ อมูล จากตัวอย่างจะแสดงใน
หน้ าต่าง session ดังนี ถ้ าคุณเลือกแสดง Cumulative N ผลจะแสดงได้ ดังนี

Variable Quarter CumN


Contract # 1 600
2 1000
3 1300
4 1600

จากตัวอย่างหมายความว่า ในไตรมาสทีหนึง คุณมีค่สู ญ ั ญาจํานวน 600 ไตรมาสทีสองมีค่สู ญ ั ญา


จํานวน 400 และไตรมาสทีสามและทีสีมีค่สู ญ ั ญาจํานวนไตรมาสละ 300 รวมทังหมดตลอดทังปี มีค่สู ญ ั ญา
จํานวน 1600
เปอร์ เซ็นต์ (Percent) ค่าทีแสดงว่ามีนําหนักหรือขนาดเท่าไหร่จากทังหมด ค่าเปอร์ เซ็นต์คํานวณได้
ด้ วยการนําค่าความถีของกลุ่มนันๆหารด้ วยความถีทังหมด และคูณด้ วย 100
ตัวอย่างเช่น ทําการตรวสอบชินงาน 400 ชินและ 21 ชินงานนันเป็ นชินงานบกพร่อง ดังนัน
เปอร์ เซ็นต์ข้อบกพร่องทีได้ คือ
21
100 = 5.25%
400

เปอร์ เซ็นต์สะสม (Cumulative percent) เป็ นค่าผลรวมของค่าเปอร์ เซ็นต์ของแต่ละกลุม่ จนถึงกลุม่ ที


กําลังพิจารณา

หน้ า 34
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

Pareto Chart of Defects


100 100

80 80

Percent
Count
60 60

40 40

20 20

0 0
Defects

sh
e

re

re

re

r
t
ou
l le

he
ti o

c
an

i lu

i lu

i lu
ni

Ot
ro

e-
le
ria

fa

fa

fa
en

nt

at
ep
va

m
p

co

Pl
ain

m
tr

ar
n

pu

pu

en
en
m
io

Al
at

yg
ag
ng

c.

r.
tr

Re

Pa

Ox
Re
bi
en

Tu
nc
Co

Count 36 16 14 9 6 5 5 5 4
Percent 36.0 16.0 14.0 9.0 6.0 5.0 5.0 5.0 4.0
Cum % 36.0 52.0 66.0 75.0 81.0 86.0 91.0 96.0 100.0
Worksheet: bar-pie-parato

จากซ้ ายไปขวา จํานวนแท่งข้ อมูล 9 แท่ง จากพาเรโต ซึงมีค่า 36, 16, 15, 9, 6, 5, 5, 5 และ 4 ใน
ภาพเส้ นสีแดงคือตําแหน่งค่าเปอร์ เซ็นต์สะสมทีตําแหน่งแท่งข้ อมูลแต่ะลจุด คือ 36%, 52%, 66%,
75%,81%,86%, 91%, 96% และ 100%
ค่าผลรวมกําลังสอง (Sum of Squares) ทําการยกกําลังสองข้ อมูลทีละตัวในแต่ละคอลัมน์ และรวม
ค่าทังหมด ถ้ าคอลัมน์นงมีั ตวั เลขคือ x1, x2, ……,xn ค่าผลรวมกําลังสองคือ x12 + x22 +……+ xn2 ซึงค่านี
จะรวมค่าความผิดพลาด (error)ไว้ ด้วยเพราะว่าไม่ได้ มีการลบค่าเฉลียออกก่อนทีจะนําไปยกกําลังสองแล้ ว
รวมกัน
ความเบ้ (Skewness) เป็ นตัวบ่งบอกความสมมาตรของข้ อมูล ซึงช่วยให้ คุณสามารถทําความเข้ าใจ
เบืองต้ นเกียวกับข้ อมูลของคุณได้ ค่าความเบ้ สามารถประเมินได้ โดยดูจากกราฟ (คล้ ายกับ ฮีสโตแกรม)
หรือ ตัวสถิติความเบ้ (skewness)

หน้ า 35
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

การแจกแจงทีสมมาตรหรือไม่เบ้
Histogram of Data
60

50

40
Frequency

30

20

10

0
46.8 48.0 49.2 50.4 51.6 52.8
Data
Worksheet: Worksheet 1

เมือข้ อมูลมีความสมมาตร ค่าความเบ้ จะกลายเป็ นศูนย์ ข้ อมูลทีมีการแจกแจงเป็ นปกติ (normal


distribution) ตามนิยามแล้ วจะแสดงความเบ้ เล็กน้ อย ซึงถ้ าลากเส้ นผ่านกลางของชุดข้ อมูลตาม
ฮีสโตแกรมจะได้ รูปทีแบ่งกลางสองส่วนทีคล้ ายกัน (เหมือนภาพสะท้ อนกระจก) แต่เรืองความเบ้ อย่างเดียว
ไม่สามารถนํามาตัดสินได้ ว่า ข้ อมูลนันมีการแจกแจงเป็ นปกติหรือไม่

การแจกแจงแบบเบ้ ความหรือมีค่าความเบ้ เป็ นบวกหรือเบ้ ขวา ซึงดูจากส่วนหางของการแจกแจง


ยาวลาดไปทางด้ านขวา และเพราะค่าความเบ้ มีค่าเป็ นบวก มากกว่าศูนย์ เช่น ข้ อมูลเงินเดือน มักจะมี
รูปแบบเป็ นการแจกแจงแบบเบ้ ขวา ซึงพนักงานส่วนใหญ่จะมีค่าเงินเดือนน้ อย และในจํานวนพนักงาน
จํานวนไม่มากทีมีค่าเงินเดือนสูง

หน้ า 36
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

การแจกแจงทีมีลกั ษณะเบ้ ขวา

Histogram of Data
60

50

40
Frequency

30

20

10

0
0.00 0.75 1.50 2.25 3.00 3.75 4.50 5.25
Data
Worksheet: Worksheet 1

ซึงดูจากส่วนหางของการแจกแจงยาวลาดไปทางด้ านขวา และเพราะค่าความเบ้ มีค่าเป็ นบวก


มากกว่าศูนย์ เช่น ข้ อมูลเงินเดือน มักจะมีรูปแบบเป็ นการแจกแจงแบบเบ้ ขวา ซึงพนักงานส่วนใหญ่จะมีค่า
เงินเดือนน้ อย และในจํานวนพนักงานจํานวนไม่มากทีมีค่าเงินเดือนสูง

การแจกแจงแบบเบ้ ซ้ายหรือมีค่าความเบ้ เป็ นลบค่าความเบ้ เป็ นลบหรือเบ้ ซ้าย ซึงดูจากส่วนหาง


ของการแจกแจงยาวลาดไปทางด้ านซ้ าย และเพราะค่าความเบ้ มีค่าเป็ นลบ เช่น ข้ อมูลอัตราความล้ มเหลว
(failure rate) มักจะมีรูปแบบเป็ นการแจกแจงแบบเบ้ ซ้าย เช่น หลอดไฟจะมีการเสียในระยะเริมต้ นใช้ งาน
เพียงเล็กน้ อย แต่โดยจํานวนมากจะสามารถมีอายุการใช้ งานได้ นาน

การแจกแจงทีมีลกั ษณะเบ้ ซ้าย

Histogram of Data
50

40
Frequency

30

20

10

0
69 72 75 78 81 84
Data
Worksheet: Worksheet 1

หน้ า 37
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

ความโด่ง (Kurtosis) เป็ นตัวบ่งบอกองศายอดของชุดข้ อมูล ซึงช่วยให้ คณ


ุ สามารถทําความเข้ าใจ
เบืองต้ นเกียวกับข้ อมูลของคุณได้ ค่าความโด่งสามารถประเมินได้ โดยดูจากกราฟ (คล้ ายกับฮีสโตแกรม)
หรือ ตัวสถิติความโด่ง (kurtosis)
ตัวเทียบมาตรฐาน การแจกแจงแบบปกติ

Histogram of Data

40

30
Frequency

20

10

0
42 45 48 51 54 57
Data
Worksheet: Worksheet 2

การแจกแจงแบบปกติจะถือเป็ นตัวมาตรฐาน เพราะมีลกั ษณะทีไม่ราบไปและไม่โด่งเกินไป ข้ อมูลที


มีการแจกแจงแบบปกติโดยสมบูรณ์ จะให้ ค่าความโด่งเท่ากับศูนย์ เนืองจากค่าความโด่งทีต่างไปจากค่านี
จะสามารถบ่งชีได้ ชดั เจนว่าข้ อมูลไม่มีการแจกแจงแบบปกติ ดังนันในการพิจารณาเรืองการแจกแจงของ
ข้ อมูลว่าเป็ นแบบปกติหรือไม่ ให้ พิจารณาจากเรืองความโด่งได้
ข้ อมูลทีมีความโด่งมาก ข้ อมูลจะมีค่าความโด่งเป็ นบวก และมีการแจกแจงทีมียอดสูงกว่าการแจก
แจงแบบปกติดังภาพ

หน้ า 38
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

Histogram of Data
160

140

120

100
Frequency

80

60

40

20

0
48.0 48.8 49.6 50.4 51.2 52.0
Data
Worksheet: Worksheet 2

ข้ อมูลทีมีความราบ (โด่งน้ อย) ข้ อมูลจะมีค่าความโด่งเป็ นลบและมีการแจกแจงทีมียอดราบตํากว่า


การแจกแจงแบบปกติดงั ภาพ

Histogram of Data
180

160

140

120
Frequency

100

80

60

40

20

0
48.0 48.8 49.6 50.4 51.2 52.0
Data
Worksheet: Worksheet 2

Mean Square Successive Difference, MSSD ใช้ เป็ นตัวประมาณค่าความแปรปรวน ซึงคํานวณ


จาก ผลรวมของค่าผลต่างระหว่างข้ อมูลทีติดกันแล้ วยกกําลังสอง แล้ วนํามาผลรวมนันมาหาค่าเฉลียและ
หารด้ วยสอง
ตัวอย่างเช่น คุณทําการเก็บข้ อมูลจากเครืองเติมวัคซีนลงหลอดบรรจุ เพือดูว่าเครืองจักรมีการ
ทํางานได้ ข้อมูลแบบสุม่ หรือไม่ คือ ไม่มีสาเหตุแห่งความผันแปรแบบผิดปกติ (special cause of variation)

หน้ า 39
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

ปริมาตรบรรจุจากหลอดวัคซีน(มล.) 12 หลอด ดังนี 0.50, 0.48, 0.49, 0.50, 0.505, 0.50, 0.49,
0.498, 0.50, 0.479, 0.49 และ 0.51

∑( − )
= = 0.00008
2( − 1)

จากการคํานวณถ้ าทําการหาผลต่างระหว่าง 0.48 และ 0.50 ซึงได้ ค่าผลต่างคือ 0.02 และผลต่าง


ตัวต่อมาคือ (-0.01) ซึงหาจากผลต่างระหว่าง 0.49 และ 0.48 ทําต่อไปจนได้ ผลต่างครบ 11 ค่า แล้ วนําไป
ยกกําลังสองทีละตัวจากนันมารวมกันทังหมด แล้ วหารด้ วย 22 ซึงมาจาก 2 (n-1)

กราฟทีเกียวข้ องกับคําสัง Descriptive Statistics


แผนภูมิฮีสโตแกรม(Histogram) และแผนภูมิฮีสโตแกรมของโค้ งการแจกแจงแบบปกติ (Histogram
with Normal) แผนภูมิทีใช้ ในการดูรูปร่างและการกระจายข้ อมูลแบบต่อเนือง คุณสามารถสร้ างฮีสโตแกรม
ก่อนการวิเคราะห์หรือพร้ อมๆไปกับการวิเคราะห์ข้อมูลเพือช่วยในการสรุปผลข้ อสมมติฐานและแนะ
แนวทางสําหรับการวิเคราะห์ ต่อเนือง ในการสร้ างฮีสโตแกรม Minitab จะทําการแบ่งข้ อมูลออกเป็ นช่วง
เรียก bin ซึงโดยปกติแล้ วโปรแกรมจะแสดงข้ อมูลตามจํานวนเป็ นแท่งในแต่ละ bin (ค่าความถีในการเกิด
ข้ อมูล)
ตัวอย่างต่อไปนีเป็ นกรณีทีสามารถใช้ ฮีสโตแกรมในการช่วยวิเคราะห์ได้
รูปแบบการแจกแจงเป็ นไปแบบปกติหรือไม่
รูปแบบการแจกแจงเป็ นแบบเบ้ ซ้ายหรือขวา หรือไม่
ข้ อมูลมีการเกิดอยู่ในค่ากลุม่ ใดกลุม่ หนึงหรือไม่
ข้ อมูลเกิดกระจายอยู่ในขอบเขตค่าจํากัดเฉพาะหรือไม่

หน้ า 40
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

Histogram of Data Histogram of Data


90 90

80 80

70 70

Frequency 60 60

Frequency
50 50

40 40

30 30

20 20

10 10

0 0
31.5 36.0 40.5 45. 0 49.5 54. 0 58.5 63.0 31.5 36.0 40.5 45.0 49.5 54.0
Data Data
Worksheet : Worksheet 3 Worksheet: Worksheet 3

Histogram of Data Histogram of Data


60
20
50

15
40
Frequency

Frequency
30
10

20

5
10

0 0
0.00 0.75 1.50 2.25 3.00 3.75 4. 50 5.25 200 240 280 320 360 400 440 480
Data Data
Worksheet : Worksheet 3 Worksheet: Worksheet 3

Individual Value Plot ใช้ เพือการประเมินและเปรียบเทียบการแจกแจงของสิงตัวอย่างทีละค่า หรือ


โดยกลุม่ หรือตัวแบ่งตัวแปร (by variable) จะมีความคลึงกับ boxplot ในเรืองของการดูข้อมูลผิดปกติ
(outliers) และรูปร่างการแจกแจงของข้ อมูล แต่แต่ละแผนภาพยังมีลกั ษณะเฉพาะทีแตกต่างกัน ใน
แผนภาพนีเหมาะกับกรณีทีมีจํานวนข้ อมูลไม่มากและต้ องการดูอิทธพลทีส่งผลต่อข้ อมูลแต่ละตัวเฉพาะ

Individual Value Plot of Life vs Manufacturer


1300

1200

1100

1000
Life

900

800

700

A B
Manufacturer
Worksheet: stackdata

หน้ า 41
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

Boxplot of Data เป็ นการอธิบายรูปแบบการกระจายข้ อมูลด้ วยรูปภาพ ซึงจะแสดงรูปแบบการ


กระจาย ค่าแนวโน้ มสูศ่ นู ย์กลาง และค่าความแปรปรวน ปกติ Boxplot จะแสดงค่าดังต่อไปนี
1. ค่าผิดปกติ (outlier) แสดงด้ วยสัญลักษณ์ * ซึงเป็ นค่าทีมากกว่าค่าสูงสุดและตําสุดของส่วน
หนวด (Whisker)
2. ค่าสูงสุดของหนวด (Upper whisker) เป็ นค่าต่อเนืองจากค่าสูงสุดของข้ อมูล ซึงเท่ากับ 1.5 เท่า
ของค่าสูงสุดของกล่องข้ อมูล โดยเพิมออกจากส่วนสูงสุดของกล่องข้ อมูล
3. ค่า Interquartile rang box ส่วน 50% ของข้ อมูล
เส้ นบนสุด – Q3 ควอไทล์ทีสาม คือ ส่วนทีมีข้อมูล 75% มีค่าเท่ากับหรือน้ อยกว่าค่านี
เส้ นกลาง – Q2 ค่ามัธยฐาน (median) คือ ส่วนทีมีข้อมูล 50% มีค่าเท่ากับหรือน้ อยกว่าค่านี
เส้ นล่าง – Q1 ควอไทล์ทีหนึง คือ ส่วนทีมีข้อมูล 25% มีค่าเท่ากับหรือน้ อยกว่าค่านี
4. ค่าตําสุดของหนวด (Lower whisker) เป็ นค่าต่อเนืองจากค่าตําสุดของข้ อมูล ซึงเท่ากับ 1.5 เท่า
ของค่าตําสุดของกล่องข้ อมูล โดยเพิมออกจากส่วนตําสุดของกล่องข้ อมูล

Boxplot เป็ นเครืองมือในการใช้ แสดงเกียวกับควอไทล์ ซึงแสดงในรูปกล่อง จากภาพในส่วนบนของ


กล่องสีเหลียมคือควอไทล์ทีสาม และส่วนล่างของกล่องสีเหลียมจะเป็ นค่าควอไทล์ทีหนึง และเส้ นกลางของ
กล่องคือค่าควอไทล์ทีสองหรือค่ามัธยฐาน เส้ นทีลากต่อออกจากกล่องสีเหลียมเรียกว่าหนวด (whiskers)
และแสดงค่าช่วงของข้ อมูลทีนับจาก ควอไทล์ทีหนึงและสามไปยังค่าสูงสุดและตําสุดของชุดข้ อมูล

หน้ า 42
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

ตัวอย่ าง 2-1: อายุการใช้ งานหลอดไฟฟ้า (LIGHTBULB.mpj)


เมือคุณต้ องการเปรียบเทียบอายุการใช้ งานหลอดไฟ (หน่วยชัวโมง) ของผู้ผลิต A (Manufacturer =
A) และผู้ผลิต B (Manufacturer = B) โดยเลือกใช้ กราฟ box plot ในการแสดงเปรียบเทียบ โดยได้ ข้อมูล
อายุการใช้ งานจากผู้ผลิตทังสองอย่างละ 40 ข้ อมูลดังภาพ

1. ไปยังเมนู Stat > Basic Statistics > Display Descriptive Statistics


2. ป้อนคอลัมน์และรายละเอียดตามไดอะล็อกบ็อกซ์ต่อไปนี

หน้ า 43
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

หมายเหตุ : กรณี ใช้ข้อมูลในเวิร์คชี ท “unstackdata”และป้ อนคอลัมน์ในทังสองจะได้ผลกราฟแบบแยกหนึง


กราฟต่อหนึงหน้าต่างกราฟซึงจะแตกต่างจากการป้ อนข้อมูลแบบไดอะล็อกบ็อกซ์ ข้างต้นทีจะให้กราฟแบบ
เปรี ยบเทียบ

3. คลิก OK

ผลลัพธ์

หน้ า 44
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

ผลกราฟ
Individual Value Plot of Life vs Manufacturer
1300

1200

1100

1000
Life

900

800

700

A B
Manufacturer
Worksheet: stackdata

Histogram (with Normal Curve) of Life by Manufacturer


700 800 900 1000 1100 1200
A B A
12 Mean 907.3
StDev 93.90
10 N 40
B
Mean 1018
Frequency

8 StDev 96.90
N 40
6

0
700 800 900 1000 1100 1200
Life
Panel variable: Manufacturer
Worksheet: stackdata

Boxplot of Life
1300

1200

1100

1000
Life

900

800

700

A B
Manufacturer
Worksheet: stackdata

หน้ า 45
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

การแปลผล
ค่าเฉลียทีคํานวณได้ และจาก boxplot แสดงให้ เห็นว่าอายุใช้ งานหลอดไฟจากผู้ผลิต B ยาวนาน
กว่าผู้ผลิต A ประมาณ 110 ชัวโมง แต่การกระจายของอายุการใช้ งานหลอดไฟของผู้ผลิต B มากกว่าของ
ผู้ผลิต A
กราฟ Individual plot และ Histogram ไม่แสดงสิงผิดปกติ มีการกระจายตัวสมําเสมอ
กราฟ Boxplot พบว่ามีจดุ * จากข้ อมูลผู้ผลิต A ทีมีค่าอายุการใช้ งานตําผิดปกติอยู่ 1 จุด ตรวจดู
ค่ามัธยฐานของกราฟอยู่ตรงกลางไม่พบมีลกั ษณะเบ้ ไปทางซ้ ายหรือทางขวา
เราสามารถใช้ คําสัง Brush บนกราฟเพือเรียกดูค่าในเวิร์คชีทดังภาพ โดยคลิกเม้ าส์ปมขวาบนกราฟ
ุ่
จากนันเลือกคําสัง Brush

หน้ า 46
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

ตัวอย่ าง 2-2: เวลาในการให้ บริ การ (SERVICETIME.mpj)


ฝ่ ายพัฒนาคุณภาพการได้ ทําการศึกษาเวลาทีพนักงานให้ บริการด้ าน การเปิ ดบัญชีใหม่ การ
สอบถามข้ อมูลสินเชือ เพือทําการพัฒนาปรับปรุงต่อไป โดยทําการจับเวลา(นาที)เริมตังแต่ลกู ค้ าได้ รับ
บริการจนกระทังได้ รับบริการเสร็จสิน(ไม่นบั เวลาในการรอคิว) จํานวน 50 ราย

1. ไปยังเมนู Stat > Basic Statistics > Graphical Summary


2. ป้อนคอลัมน์และรายละเอียดตามไดอะล็อกบ็อกซ์ต่อไปนี

3. คลิก OK

หน้ า 47
บทที 2 สถิติเชิงพรรณา (Descriptive Statistics)

ผลกราฟ
Summary Report for ServiceTime
Anderson-Darling Normality Test
A-Squared 0.17
P-Value 0.921
Mean 19.784
StDev 3.093
Variance 9.565
Skewness -0.042738
Kurtosis -0.504565
N 50
Minimum 13.300
1st Quartile 17.800
Median 20.000
3rd Quartile 21.825
Maximum 26.000
95% Confidence Interval for Mean
15 18 21 24 18.905 20.663
95% Confidence Interval for Median
18.669 21.033
95% Confidence Interval for StDev
2.584 3.854

95% Confidence Intervals

Mean

Median

19.0 19.5 20.0 20.5 21.0

หมายเหตุ : คุณสามารถคัดลอกกราฟใดๆไปวางยังโปรแกรมอื นได้โดยคลิ กเม้าส์ปมุ่ ขวาจากนันเลื อก Copy Graph

การแปลผล
ค่าเฉลียของเวลาในการให้ บริการ คือ 19.784 นาที, ค่าเบียงเบนมาตรฐานคือ 3.093 นาทีและ 95%
ช่วงความเชือมันคือ 18.905 และ 20.663
ถ้ าใช้ ค่าระดับนัยสําคัญเท่ากับ 0.05 จะได้ ค่า Anderson-Darling ทีใช้ ในการทดสอบเรืองการแจก
แจงแบบปกติ ได้ ค่า A-Squared = 0.17, P-Value = 0.921 ซึงชีให้ เห็นว่า เวลาในการให้ บริการลูกค้ ามีการ
แจกแจงเป็ นแบบปกติ (Normal Distribution) สําหรับคําอธิบายเพิมเติมเรืองการทดสอบการแจกแจง
สามารถศึกษาเพิมเติมได้ ในบทที 7 เรืองการทดสอบการแจกแจง

หน้ า 48
บทที 3 การวิเคราะห์สหสัมพันธ์ (Correlation Analysis)

การวิเคราะห์ สหสัมพันธ์ (Correlation Analysis)


สหสัมพันธ์ (Correlation)
เป็ นการศึกษาความสัมพันธ์ เชิงเส้ นตรงระหว่างสองตัวแปร เช่น คุณอาจจะคิดว่านําหนักและ
ส่วนสูงของคนจะมีความสัมพันธ์ ไปในทิศทางเดียวกัน โดยคนทีมีนําหนักตัวมากควรจะมีส่วนสูงมากกว่า
คนทีมีนําหนักเบากว่า โปรแกรมจะทําการหาค่าสหสัมพันธ์ ซึงเป็ นค่าตัวเลขสัมประสิทธิ แสดงอิทธิพลและ
ทิศทาง (strength and direction) ของความสัมพันธ์ ค่าสัมประสิทธิ สหสัมพันธ์ (correlation coefficient)
อยู่ในช่วง -1 ถึง 1 โดย

-1 อธิบายความสัมพันธ์ ว่าเมือตัวแปรหนึงเพิมขึน อีกตัวแปรหนึงจะมีค่าลดลง


Scatterplot of Y vs X
450

425

400
Y

375

350

2000 2500 3000 3500 4000


X
Worksheet: Scatter

0 อธิบายลักษณะความสัมพันธ์ แบบไม่มีรูปแบบ
Scatterplot of X,Y
3000

2500

2000
Y

1500

1000

500

400 500 600 700 800


X
Worksheet: Correlation-RepairTime

หน้ า 49
บทที 3 การวิเคราะห์สหสัมพันธ์ (Correlation Analysis)

1 อธิบายว่ามีความสัมพันธ์ ทีเมือตัวแปรหนึงเพิมขึนอีกตัวแปรหนึงก็เพิมด้ วยเช่นกัน


Scatterplot of X,Y
130

120

110

100
Y

90

80

70
70 80 90 100 110 120 130
Y
Worksheet: scatter

ค่าสหสัมพันธ์ มีค่าระหว่าง -1 ถึง 1 ซึงแสดงให้ เห็นว่าความสัมพันธ์ จะเป็ นลักษณะเส้ นตรงหรือไม่


เหมือนความสัมพันธ์ ระหว่างรัศมีวงกลมและเส้ นรอบวง อย่างไรก็ดีค่าทีแท้ จริงของค่าสหสัมพันธ์ ไม่ได้ บอก
ว่ามีความสัมพันธ์ แท้ จริงมากน้ อยไหร่เป็ นเพียงการบอกว่าตัวแปรสองตัวมีความสัมพันธ์ กนั ส่วนใหญ่เพือ
จะนํามาวิเคราะห์ สมการถดถอย (Regression analysis) เพืออธิบายว่ามีความสัมพันธ์ แบบใด
ค่าสหสัมพันธ์ เป็ นเพียงค่าทางคณิตศาสตร์ ต้ องระวังการอธิบายความเป็ นเหตุเป็ นผลของ
ความสัมพันธ์ เช่น ยอดขายไอศกรีมมีค่าสหสัมพันธ์ เป็ นบวกกับอัตราการโจรกรรม ซึงอาจจะเป็ น
ข้ อผิดพลาดได้ ถ้ามีการสรุปว่าการบริโภคไอศกรี มจะทําให้ มีโอกาสโดนโจรกรรมมากขึน ตัวอย่างคําอธิบาย
ทีดูจะเป็ นเหตุเป็ นผลกว่า คือ อากาศทีร้ อนขึนทําให้ มีการกินไอศกรีมเพิมขึน
ค่าสหสัมพันธ์ ตํา อาจไม่ได้ หมายความว่าไม่มีความสัมพันธ์ เพียงอย่างเดียว แต่จะหมายความว่าไม่
มีความสัมพันธ์ เชิงเส้ นตรงมากกว่า เช่น แผนภาพข้ างใต้ มีความสัมพันธ์ กนั ของตัวแปรแต่ค่าสหสัมพันธ์ ทีได้
คือศูนย์

หน้ า 50
บทที 3 การวิเคราะห์สหสัมพันธ์ (Correlation Analysis)

Fitted Line Plot


460

440

420

400

380
Y

360

340

320

300
2000 2500 3000 3500 4000 4500 5000
X
Worksheet: NozzleTemp

ความสัมพันธ์ เชิงเส้ นตรง (Linear relationship)


แนวโน้ มของข้ อมูลทีสามารถแทนด้ วยตัวแบบเส้ นตรง ซึงแสดงให้ เห็นว่ามีอตั ราการเพิมขึนหรือ
ลดลงอย่างสมําเสมอ
Scatterplot of X,Y
130

120

110

100
Y

90

80

70
70 80 90 100 110 120 130
Y
Worksheet: scatter

ถ้ าความสัมพันธ์ ระหว่างสองตัวแปรไม่เป็ นแบบเส้ นตรง อัตราการเปลียนแปลงอาจจะเพิมขึนหรือ


ลดลงเมือตัวแปรหนึงเปลียนแปลง อาจจะทําให้ เกิดรูปแบบโค้ ง (Curved pattern) แนวโน้ มแบบโค้ งจะต้ อง
ใช้ สมการทีไม่เป็ นเชิงเส้ น (nonlinear function) เช่น สมการกําลังสอง (Quadratic function) หรือสมการ
กําลังสาม (Cubic function) หรือสมการทีแปลงให้ เป็ นเส้ นตรงหรื อตัวแปรทังสองไม่มีความสัมพันธ์ ใดๆเลย

หน้ า 51
บทที 3 การวิเคราะห์สหสัมพันธ์ (Correlation Analysis)

Fitted Line Plot Scatterplot of X,Y


460 3000

440
2500
420

400 2000

Y
Y
380
1500
360

340 1000

320
500
300
2000 2500 3000 3500 4000 4500 5000 400 500 600 700 800
X X
Worksheet : NozzleT emp Worksheet : Correlation-RepairTime

เป็ นแบบเส้ นโค้ ง ไม่มีความสัมพันธ์

ค่ าสัมประสิทธิสหสัมพันธ์ (Coefficient Correlation)


 Pearson product moment correlation เป็ นค่าทีประเมินความสัมพันธ์ เชิงเส้ นตรงระหว่างตัว
แปร(Continuous) สองตัวว่าเมือเปลียนค่าตัวแปรตัวหนึงจะมีผลต่อค่าของตัวแปรอีกตัวใน
สัดส่วนมากน้ อยเท่าใด
 Spearman rank-order correlation (หรือเรียกอีกชือหนึงว่า Spearman's rho) เป็ นค่าที
ประเมินความสัมพันธ์ ของลําดับทางเดียว(Monotonic relationship) ระหว่างตัวแปรสองตัว
(Continuous หรือ Ordinal) ว่าตัวแปรทีศึกษามีแนวโน้ มต่อการเปลียนค่าทังหมดหรือไม่โดยไม่
จําเป็ นว่าจะต้ องเป็ นอัตราคงที ค่าสัมประสิทธิ Spearman correlation จะคํานวณโดยมุ่งเน้ นที
ลําดับของค่าแต่ละค่ามากกว่าค่าของข้ อมูล โดยส่วนใหญ่เราจะใช้ การศึกษาสหสัมพันธ์ แบบ
Spearman กรณีทีเราต้ องการศึกษาเกียวกับข้ อมูลแบบ Ordinal ตัวอย่างเช่น คุณต้ องการ
ศึกษาว่าระยะเวลา (เดือน) การเข้ าเป็ นพนักงานมีความสัมพันธ์ กับผลการจัดอันดับการทดสอบ
ของพนักงานแต่ละคนหรือไม่

หน้ า 52
บทที 3 การวิเคราะห์สหสัมพันธ์ (Correlation Analysis)

ความแปรปรวนร่ วม (Covariance)
เป็ นตัววัดความสัมพันธ์ เชิงเส้ นตรงระหว่างตัวแปรสองตัว ค่าความแปรปรวนร่วมไม่ใช่ตวั วัด
มาตรฐานเหมือนกับค่าสัมประสิทธิ สหสัมพันธ์ ดังนัน ค่าความแปรปรวนร่วมจะมีค่าจากลบInfinity จนถึง
ค่าบวก infinity ค่าความแปรปรวนร่วมทีเป็ นบวกจะบอกว่าค่าทีอยู่เหนือค่าเฉลียของตัวแปรหนึง สอดคล้ อง
กับค่าทีอยู่เหนือค่าเฉลียของอีกตัวแปรหนึงและค่าทีอยู่ใต้ ค่าเฉลียในลักษณะเดียวกัน ส่วนค่าความ
แปรปรวนร่วมทีเป็ นค่าลบจะบอกว่า ค่าทีอยู่เหนือค่าเฉลียของตัวแปรหนึง สอดคล้ องกับค่าทีอยู่ใต้ ค่าเฉลีย
ของอีกตัวแปรหนึง ตัวอย่างเช่น ความแปรปรวนร่ วมคํานวณจากผลรวมของค่าทีเบียงเบนของข้ อมูลจาก
ค่าเฉลีย หารด้ วย n-1
ค่าสัมประสิทธิ สหสัมพันธ์ คือ ค่าความแปรปรวนร่วมหารด้ วยผลคูณของค่าเบียงเบนมาตรฐานของ
ตัวแปรแต่ละตัว คุณสามารถคํานวณความแปรปรวนร่ วมของทุกคู่ข้อมูลทีอยู่ในคอลัมน์ เช่นกันกับค่า
สัมประสิทธิ สหสัมพันธ์ เพียร์ สนั ความแปรปรวนร่ วมคือตัววัดความสัมพันธ์ ระหว่างตัวแปรสองตัว แต่
อย่างไรก็ดีความแปรปรวนร่วมไม่ใช่ตวั วัดมาตรฐานเหมือนกับค่าสัมประสิทธิ สหสัมพันธ์ การปรับค่า
สัมประสิทธิ สหสัมพันธ์ จะนําไปหารด้ วยค่าเบียงเบนมาตรฐานของตัวแปรทังสองตัว

ตัวอย่ าง 3-1: เวลาในการซ่ อมเครื องจักร (REPAIRTIME.mpj)


ทําการศึกษาความสัมพันธ์ ระหว่างเวลาในการซ่อมกับค่าใช้ จ่ายในการซ่อมว่ามีความสัมพันธ์ กนั
หรือไม่โดยนําข้ อมูลทังหมด 219 ข้ อมูลในอดีตมาทําการวิเคราะห์

หน้ า 53
บทที 3 การวิเคราะห์สหสัมพันธ์ (Correlation Analysis)

1. ทําการสร้ างแผนภาพการกระจายโดยไปยังเมนู Graph > Scatter Plot

2. เลือก Simple และป้อนคอลัมน์ ตามไดอะล็อกบ็อกซ์ ต่อไปนี

3. คลิก OK

ผลกราฟ
Scatterplot of Repair Cost vs Repair Time
3000

2500
Repair Cost

2000

1500

1000

500

400 500 600 700 800


Repair Time
Worksheet: Worksheet 1

หน้ า 54
บทที 3 การวิเคราะห์สหสัมพันธ์ (Correlation Analysis)

กราฟแผนภาพการกระจายไม่แสดงความสัมพันธ์ ทีชัดเจน
ทําการวิเคราะห์เพือหาค่าสหสัมพันธ์
4. ไปยังเมนู Stat > Basic Statistics > Correlation
5. ป้อนคอลัมน์และรายละเอียดตามไดอะล็อกบ็อกซ์ต่อไปนี

6. คลิก OK
ผลลัพธ์

การแปลผล
ค่าสหสัมพันธ์ ของเพียร์ สนั ระหว่าง Repair Cost กับ Repair Time คือ -0.383 ค่า P-values ของ
การทดสอบสหสัมพันธ์ มีค่า 0.000 สรุปได้ ว่าทีระดับนัยสําคัญ (α = 0.05) ค่าสหสัมพันธ์ ไม่เท่ากับศูนย์
แสดงว่าระหว่าง Repair Cost กับ Repair Time มีความสัมพันธ์ เชิงลบโดยมีระดับความสัมพันธ์ กนั 38%
แต่ถ้าดูจากกราฟแผนภาพการกระจายและค่าสหสัมพันธ์ ทีได้ แสดงให้ เห็นว่าระดับความสัมพันธ์ ยงั มีระดับ
น้ อยไม่สามารถนําไปทํานายค่าใดๆได้ ดีเพียงพอ

หน้ า 55
บทที 3 การวิเคราะห์สหสัมพันธ์ (Correlation Analysis)

ตัวอย่ าง 3-2: ค่ าความหนืดของนํามันหล่ อลืน (VISCOSITY.mpj)


ทําการศึกษาความสัมพันธ์ ระหว่างอุณหภูมิกบั ค่าความหนืดของนํามัน โดยทําการบันทึกค่า 33
ข้ อมูลมาเพือทําการศึกษา

1. ทําการสร้ างแผนภาพการกระจายโดยไปยังเมนู Graph > Scatter Plot

2. เลือก Simple และป้อนคอลัมน์ ตามไดอะล็อกบ็อกซ์ ต่อไปนี

3. คลิก OK

หน้ า 56
บทที 3 การวิเคราะห์สหสัมพันธ์ (Correlation Analysis)

ผลกราฟ
Scatterplot of Viscosity vs Temperature
210

200

190
Viscosity

180

170

160

150
50 60 70 80 90
Temperature
Worksheet: Worksheet 1

กราฟแผนภาพการกระจายแสดงความสัมพันธ์ เชิงลบ เมืออุณหภูมิสงู ขึนค่าความหนืดมีแนวโน้ ม


ลดลง แต่ในช่วงปลายๆจะมีการกระจายมาก
ทําการวิเคราะห์เพือหาค่าสหสัมพันธ์
4. ไปยังเมนู Stat > Basic Statistics > Correlation
5. ป้อนคอลัมน์และรายละเอียดตามไดอะล็อกบ็อกซ์ต่อไปนี

6. คลิก OK

หน้ า 57
บทที 3 การวิเคราะห์สหสัมพันธ์ (Correlation Analysis)

ผลลัพธ์

การแปลผล
ค่าสหสัมพันธ์ ของเพียร์ สนั ระหว่าง Viscosity กับ Temperature คือ -0.813 ค่า P-values ของการ
ทดสอบสหสัมพันธ์ มีค่า 0.000 สรุปได้ ว่าทีระดับนัยสําคัญ (α=0.05) ค่าสหสัมพันธ์ ไม่เท่ากับศูนย์ แสดงว่า
ระหว่าง Viscosity กับ Temperature มีความสัมพันธ์ เชิงลบโดยมีระดับความสัมพันธ์ กนั 81.3%
เนืองจากเป็ นการศึกษาเชิงเส้ นตรง คุณสามารถคลิกเม้ าส์ปมขวาที
ุ่ กราฟเพือเพิมเส้ นสมการลงบน
กราฟให้ ทําการเลือก Add>Regression Fit จากนันเลือก Model Order เป็ นแบบ Linear และคลิก OK

หน้ า 58
บทที 3 การวิเคราะห์สหสัมพันธ์ (Correlation Analysis)

ผลกราฟ

การแปลผล
เมือเราเพิมเส้ นสมการเส้ นตรง ถ้ าเราเลือนเม้ าส์ไปบนเส้ นสมการ Minitab จะโชว์รายละเอียด
สมการ และค่า R-Sq = 66.1% ซึงเป็ นค่าความสามารถของตัวแปร Temperature ในการทํานายหรือ
อธิบายตัวแปร Viscosity ซึงสามารถศึกษาเพิมเติมได้ ในหัวเรือง Regression
ในกรณีทีเราต้ องการวิเคราะห์เพิมเติมถึงสมการเส้ นโค้ งกําลังสอง (Quadratic) คุณสามารถคลิก
เม้ าส์ปมขวาที
ุ่ กราฟเพือเพิมเส้ นสมการลงบนกราฟให้ ทําการเลือก Add>Regression Fit จากนันเลือก
Model Order เป็ นแบบ Quadratic และคลิก OK

หน้ า 59
บทที 3 การวิเคราะห์สหสัมพันธ์ (Correlation Analysis)

จะเห็นได้ ว่าเมือเราเปลียนเส้ นสมการเป็ นแบบ Quadratic สมการจะเพิมเทอมกําลังสองเข้ ามาใน


สมการ ค่า R-Sq=73.2% แสดงว่าค่าความสามารถของตัวแปร Temperature ในการทํานายหรืออธิบายตัว
แปร Viscosity มีค่ามากขึนกว่าเดิม (คุณสามารถใช้ คําสัง Stat>Regression>Fitted Line Plot ทําการ
วิเคราะห์ได้ เช่นกัน)
ตัวอย่ าง 3-3: ค่ าใช้ จ่ายในการพักผ่ อน (LEISUREEXPENSE.mpj)
ทําการศึกษาความสัมพันธ์ ระหว่างอายุกบั ค่าใช้ จ่ายทีใช้ การพักผ่อน ท่องเทียว เฉลียต่อเดือน โดย
นําข้ อมูลจากกลุม่ ตัวอย่าง 250 คนมาทําการศึกษา
1. ทําการสร้ างแผนภาพการกระจายโดยไม่ยงั เมนู Graph > Scatter Plot

หน้ า 60
บทที 3 การวิเคราะห์สหสัมพันธ์ (Correlation Analysis)

2. เลือก Simple และป้อนคอลัมน์ตามไดอะล็อกบ็อกซ์ ต่อไปนี

3. คลิก OK
ผลกราฟ
Scatterplot of Expense vs Ages
18000

16000

14000

12000
Expense

10000

8000

6000

4000

2000

0
20 30 40 50 60 70
Ages
Worksheet: Worksheet 1

กราฟแผนภาพการกระจายแสดงความสัมพันธ์ เชิงบวก เมืออายุมากขึนค่าใช้ จ่ายในการพักผ่อนและ


ท่องเทียวมีแนวโน้ มเพิมขึน แต่จะเห็นได้ ว่าข้ อมูลมีการกระจายมาก
ทําการวิเคราะห์เพือหาค่าสหสัมพันธ์
4. ไปยังเมนู Stat > Basic Statistics > Correlation

หน้ า 61
บทที 3 การวิเคราะห์สหสัมพันธ์ (Correlation Analysis)

5. ป้อนคอลัมน์และรายละเอียดตามไดอะล็อกบ็อกซ์ต่อไปนี

6. คลิก OK

ผลลัพธ์

แปลผล
ค่าสหสัมพันธ์ ของเพียร์ สนั ระหว่าง Ages กับ Expense คือ 0.645 ค่า P-values ของการทดสอบ
สหสัมพันธ์ มีค่า 0.000 สรุ ปได้ ว่าทีระดับนัยสําคัญ (α=0.05) ค่าสหสัมพันธ์ ไม่เท่ากับศูนย์ แสดงว่าระหว่าง
อายุ (Ages) กับค่าใช้ จ่าย (Expense) มีความสัมพันธ์ เชิงบวกโดยมีระดับความสัมพันธ์ กนั 64.5%
หมายความว่าอายุมากขึนค่าใช้ จ่ายในการพักผ่อนจะเพิมขึนอธิบายความสัมพันธ์ ได้ 64.5%

หน้ า 62
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

การทดสอบสมมติฐานสําหรับค่ าเฉลีย (Hypothesis testing for Mean)


การทดสอบสมมติฐาน (Hypothesis testing)
คือกระบวนการในการประเมินข้ อความเกียวกับประชากร 2 ข้ อความทีสัมพันธ์ กนั การทดสอบ
สมมติฐานจะใช้ ข้อมูลจากตัวอย่างทดสอบเพือบ่งชีว่าตรงกับข้ อความ ข้ อความทังสองจะเรียกว่า
สมมติฐานหลัก (null hypothesis) และสมมติฐานทางเลือก (alternative hypothesis) ข้ อความจะเป็ น
เรืองราวเกียวกับคุณสมบัติของประชากรเช่น ค่าพารามิเตอร์ ต่างๆ ค่าความแตกต่างระหว่างพารามิเตอร์
ของประชากรหลายกลุ่มๆ หรือ รูปแบบการแจกแจงของประชากร ซึงคําถามทีเกียวข้ องในการทดสอบ
สมมติฐานอาจจะได้ แก่
 ค่าเฉลียความสูงของนักศึกษามีค่าเท่ากับ 65 เซ็นติเมตรใช่หรือไม่
 ค่าเบียงเบนมาตรฐานของความสูงของนักศึกษาผู้หญิงมีค่าเท่ากับ 5 เซ็นติเมตรใช่หรือไม่
 ค่าเฉลียความสูงของนักศึกษาผู้หญิงและผู้ชายมีค่าเท่ากันหรือไม่
 ค่าเฉลียความสูงของนักศึกษาผู้หญิงเป็ นไปตามรูปแบบการแจกแจงแบบปกติหรือไม่
ตัวอย่างการเขียนสมมติฐาน : ผู้จดั การของโรงงานผลิตท่อแห่งหนึงต้ องการวัดค่าเส้ นผ่าศูนย์กลาง
ของท่อด้ านในว่ามีค่าเท่ากับ 10 ซม หรือไม่ ผู้จัดการจึงทําการสุ่มท่อมาบางส่วนจากสายการผลิตและทํา
การวัดค่าเส้ นผ่าศูนย์กลางด้ านในของท่อ จากกนันทําการทดสอบสมมติฐานค่าเฉลียเส้ นผ่าศูนย์กลางด้ าน
ในของท่อ ซึงเริมต้ นจะต้ องมีการสร้ างสมมติฐาน ดังนี
สมมติฐานหลัก H0: ข้ อความทีบอกเกียวกับค่าพารามิเตอร์ นนเป็ ั นไปตามค่าทีต้ องการทดสอบ
หรือไม่ ซึงเขียนได้ ว่า H0: ค่าเฉลียประชากร (เส้ นผ่านศูนย์กลางด้ านในท่อ) เท่ากับ 10 หรือ µ=10
สมมติฐานหลัก H1:ข้ อความทีบอกเกียวกับค่าพารามิเตอร์ นนแตกต่
ั างไปจากค่าพารามิเตอร์ ทีอยู่ใน
สมมติฐานหลัก ดังนันจากตัวอย่างนี สามารถสร้ างสมมติฐานทางเลือกได้ 3 แบบดังนี

หน้ า 63
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

ถ้ าคุณคิดว่า | สมมติฐานทางเลือก H1 จะเป็ นดังนี


ค่าเฉลียของประชากรทีแท้ จริงน้ อยกว่าค่าเป้าหมาย | ทางเดียว (one-sided): µ<10
ค่าเฉลียของประชากรทีแท้ จริงมากกว่าค่าเป้าหมาย | ทางเดียว (one-sided): µ>10
ค่าเฉลียของประชากรทีแท้ จริงแตกต่างจาก
ค่าเป้าหมาย แต่ไม่ร้ ู ว่ามากหรือน้ อยกว่า | สองทาง (two sided): µ≠10

ช่ วงความเชือมัน (Confidence interval)


เป็ นช่วงของพารามิเตอร์ ทีไม่ร้ ูค่าของประชากร ซึงหาได้ จากค่าสถิติของสิงตัวอย่าง ด้ วยคุณสมบัติ
เรืองการสุ่ม ถ้ ามีการทําซําหลายครังๆเปอร์ เซนต์ของช่วงความเชือมันจะครอบคลุมค่าพารามิเตอร์ ทีไม่ร้ ู ค่า
นีได้ ซึงค่าเปอร์ เซ็นต์ทีครอบคลุมค่าพารามิเตอร์ นี คือระดับความความเชือมันของช่วงความเชือมัน
ตัวอย่างเช่น คุณต้ องการหาค่าเฉลียของค่าเวลาการประกอบยานยนต์ของสายการผลิตหนึง คุณทํา
การสุม่ ตัวอย่างรถยนต์จํานวนหนึงและบันทึกค่าเวลาประกอบรถยนต์นนๆ ั โดย 95% ช่วงความเชือมัน
สร้ างขึนจากสิงตัวอย่างซึงจะส่งผลถึงค่าพารามิเตอร์ ประชากรด้ วย ดังนันถ้ าสรุปว่าค่าเฉลียเวลาในการ
ประกอบรถยนต์นีจะต้ องอยู่ในช่วงของค่าสูงสุดและตําสุดของช่วงซึงเรียกว่าค่าขีดจํากัดของช่วงความ
เชือมัน

หน้ า 64
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

การสร้ างช่วงความเชือมัน อนุมานเหมือนการโยนตาข่ายเพือหาเป้าหมายทีไม่ทราบค่า จากนันทํา


การกําหนดตําแหน่งดังภาพ ซึงเป็ นช่วงความเชือมันทีมาจากสิงตัวอย่าง 50 ตัว ซึงมาจากประชากร
เดียวกัน เส้ นสีดําเป็ นค่าทีกําหนดขึนเพือแทนค่าพารามิเตอร์ ของประชากร เส้ นสีฟ้าแทนค่าของพารามิเตอร์
ทีอยู่ในช่วงความเชือมัน ส่วนเส้ นสีแดงคือค่าพารามิเตอร์ ทีอยู่นอกช่วงความเชือมันหรืออธิบายได้ อีกแบบ
คือมีค่า 48 จาก 50 ค่าทีอยู่ใน 95% ช่วงความเชือมัน หรือ 95% จากประชากรเดียวกันจะให้
ค่าพารามิเตอร์ ทีอยู่ในช่วงความเชือมัน
ค่ าโอกาสทีสมมติฐานหลักจะเป็ นจริ ง (P-Value)
เป็ นค่าทีไว้ ชีบ่งการปฏิเสธสมมติฐานหลักในการทดสอบสมมติฐาน ค่า P-Value มีค่าตังแต่ 0 -
ค่า P-Value ทียิงมีค่าน้ อยหมายถึงค่าความน่าจะเป็ นในการปฏิเสธสมมติฐานหลักผิดยิงน้ อยลงด้ วย ก่อน
หน้ าทีจะทําการวิเคราะห์ จะต้ องมีการกําหนดค่าระดับนัยสําคัญ α (Alpha) โดยปกติจะกําหนดให้ เท่ากับ
0.05 ถ้ าทําการทดสอบตัวสถิติแล้ วพบว่าค่า P-Value มีค่าน้ อยกว่า α จะทําการปฏิเสธสมมติฐานหลัก
ด้ วยความสําคัญของการทดสอบสมมติฐาน ค่า P-Value จึงมีการใช้ ทวไปในพื
ั นฐานสถิติ ซึงตัวหลัก
คือการทําความเข้ าใจเกียวกับสมมติฐานหลักและสมมติฐานทางเลือกของการทดสอบ ซึงค่า P-Value เป็ น
ตัวช่วยในการตัดสินใจว่าจะปฏิเสธสมมติฐานหลักหรือไม่
ตัวอย่างเช่น การทดสอบ 2-sample ซึงเป็ นการทดสอบความแตกต่างของค่าเฉลียระหว่างค่าความ
แข็งแรง (strength) ของเหล็กกล้ าจากโรงผลิตเหล็ก 2 ที ซึงถูกเลือกมาอย่างสุ่ม ในกรณีนี สมมติฐานหลัก
คือประชากร สองกลุม่ นีมีความเหมือนกัน ส่วนสมมติฐานทางเลือกคือ ประชากรสองกลุม่ นีมีค่าไม่เท่ากัน
ซึงค่า P-Value ทีน้ อยกว่าค่า α แสดงว่าประชากรสองกลุ่มนีมีค่าไม่เท่ากัน
ค่า P-Value คํานวณได้ จากสิงตัวอย่างและเป็ นค่าความน่าจะเป็ นของความผิดพลาดในการปฏิเสธ
สมมติฐานหลัก เมือสมมติฐานหลักนันเป็ นจริง (ปฏิเสธสมมติฐานหลักทังทีสมมติฐานหลักเป็ นจริง, Type I
error) หรือหมายความว่า ความน่าจะเป็ นทีจะทําให้ เกิดความแตกต่างอย่างน้ อยทีสุดทีอยู่ระหว่างค่าทีได้
จากสิงตัวอย่างและค่าทีกําหนดไว้ ในสมมติฐาน

หน้ า 65
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

ค่ าระดับนัยสําคัญ (α- Alpha)


ใช้ ในการทดสอบสมมติฐาน ซึงค่า α คือค่าความเสียงทีมากทีสุดทียอมรับได้ ในการปฏิเสธ
สมมติฐานหลักทังทีสมมติฐานหลักเป็ นจริง (Type I error) และเป็ นค่าความน่าจะเป็ นทีมีค่าระหว่าง 0 ถึง
1 ค่า alpha เรียกอีกชือหนึงว่า ค่าระดับนัยสําคัญ (significance level) ค่า α จะถูกกําหนดขึนก่อนการ
วิเคราะห์และนํามาใช้ เปรี ยบเทียบกับค่า P-Value เพือบอกตัดสินใจเรืองความมีนัยสําคัญ
 ถ้ าค่า P-Value มีค่าน้ อยกว่าหรือเท่ากับ ค่า α จะทําการปฏิเสธสมมติฐานและยอมรับ
สมมติฐานทางเลือก
 ถ้ าค่า P-Value มีค่ามากกว่า ค่า α ให้ ไม่สามารถปฏิเสธสมมติฐานหลักหรือต้ องยอมรับ
สมมติฐานหลัก
ค่า α ทัวไปจะใช้ เท่ากับ 0.05 ในค่าระดับนีไม่ได้ หมายถึงว่าโอกาสในการพบว่าความมีนัยสําคัญ
นันจะมีเพียง 5% เท่านัน ดังนันค่า alpha ยิงน้ อย ยิงทําให้ โอกาสในการเกิดความผิดพลาดในการปฏิเสธ
สมมติฐานหลักนันน้ อยลงไปด้ วย แต่ว่าค่า alpha ยิงน้ อย ยิงทําให้ โอกาสในการตรวจเจอปั จจัยทีมีอิทธิพล
ต่อค่าตอบสนองนันน้ อยลง อํานาจแห่งการทดสอบ (power) น้ อยลง
บางครังการเลือกค่า α น้ อยก็ให้ ผลดีกว่า ตัวอย่างเช่น คุณทําการทดสอบสิงตัวอย่างทีได้ จาก
เครืองกัดตัวใหม่เพือนํามาตัดสินใจว่าจะซือเครืองจักรตัวนีหรือไม่ โดยเชือว่าเครืองจักรนีผลิตชินงานทีมี
ของเสียน้ อยลงซึงจะทําให้ เป็ นการประหยัดต้ นทุน อย่างไรก็ตามการลงทุนซือเครืองจักรใหม่จํานวนมาก
ต้ องใช้ เงินลงทุนจํานวนมาก ดังนันจะต้ องมันใจว่าเครืองจักรสามารถผลิตชินงานได้ เทียงตรง ในกรณีนี
จะต้ องเลือกค่า α น้ อยๆ เช่น 0.01 เพือทําให้ ได้ โอกาส 1% ทีจะสรุ ปว่าเครืองจักรใหม่นีมีความเทียงตรง
มากกว่า ในทางตรงกันข้ าม ค่า α มากๆ อาจจะให้ ผลดี ตัวอย่างเช่น ถ้ าคุณเป็ นผู้ผลิตเครืองยนต์เจทแห่ง
หนึงและคุณต้ องการทดสอบความแข็งแรงของตลับลูกปื นทีมีราคาถูกลง ซึงการใช้ ตลับลูกปื นทีมีความ
แข็งแรงน้ อยลงไม่ได้ สง่ ผลอันตรายร้ ายแรงต่อเครืองยนต์ แต่ได้ ประโยชน์จากการประหยัดต้ นทุน การเลือก
ค่า α กรณีนีสามารถกําหนดให้ สงู ขึนได้ เช่น 0.1 ซึงเท่ากับให้ โอกาสทีจะปฏิเสธสมมติฐานหลักเมือ
สมมติฐานหลักเป็ นจริงมีโอกาสมากขึน หมายความว่าโอกาสทีจะได้ ตลับลูกปื นทีราคาถูกกว่ามาใช้ ในการ
ผลิตมีสงู ขึนด้ วย

หน้ า 66
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

ภาพแสดงการตัดสินใจด้ วยค่า P-Value เทียบกับระดับนัยสําคัญ

การทดสอบสมมติฐานแบบ 1-Sample Z
เพือคํานวณหาช่วงความเชือมัน หรือ ทดสอบสมมติฐานของค่าเฉลีย เมือค่าทราบค่า σ สําหรับการ
ทดสอบสองด้ านของ 1-Sample Z โดยสมมติฐานคือ

H0: μ = μ0

H1: μ ≠ μ0 , H1: μ > μ0 , H1: μ < μ0

เมือ μ คือค่าเฉลียประชากร และ μ0 คือค่าเฉลียประชากรตามทีตังสมมติฐานไว้

หน้ า 67
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

ตัวอย่ าง 4-1: นําหนักไฟเบอร์ (FIBERWEIGHT.mpj)


พนักงานห้ องแล็บกําลังศึกษานําหนักไฟเบอร์ ตวั อย่างในกระบวนการ โดยค่าส่วนเบียงเบน
มาตรฐานจากการทดลองก่อนหน้ าคือ 2 กรัม พนักงานได้ ทําการสุ่มตัวอย่างมาทังหมด 10 ตัวเพือทดสอบ
ว่าค่าเฉลียนําหนักไฟเบอร์ น้อยกว่า 90 กรัมอย่างมีนยั สําคัญทางสถิติหรือไม่ทีระดับนัยสําคัญ 0.05

1. ไปยังเมนู Stat > Basic Statistics > 1-Sample Z


2. ป้อนคอลัมน์ ตามไดอะล็อกบ็อกซ์ต่อไปนี

3. คลิก OK

หน้ า 68
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

ผลลัพธ์

การแปลผล
ค่า P-Value = 0.647 มากกว่าค่าระดับนัยสําคัญ (α=0.05) ทีกําหนดไว้ ซึงต้ องยอมรับสมมติฐาน
หลัก H0 แสดงว่าไม่สามารถสรุปได้ ว่าค่าเฉลียนําหนักไฟเบอร์ น้อยกว่า 90 กรัม

ผลกราฟ
Histogram of weight
(with Ho and 95% Z-confidence interval for the Mean, and StDev = 2)

3.0

2.5

2.0
Frequency

1.5

1.0

0.5

0.0 _
X
Ho
-0.5
89.0 89.5 90.0 90.5 91.0 91.5
weight

หน้ า 69
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

Individual Value Plot of weight


(with Ho and 95% Z-confidence interval for the Mean, and StDev = 2)

_
X
Ho

89.0 89.5 90.0 90.5 91.0 91.5 92.0


weight

Boxplot of weight
(with Ho and 95% Z-confidence interval for the Mean, and StDev = 2)

_
X
Ho

89.0 89.5 90.0 90.5 91.0 91.5 92.0


weight

ผลกราฟทีได้ จะเห็นได้ ว่าค่าทีตังสมมติฐานไว้ (H0 จุดแดงบนกราฟ) อยู่บนเส้ นหรือไม่มากกว่า 95%


ช่วงความเชือมันด้ านบน (Upper Bound) คือ 91.279 ซึงทําให้ คุณไม่สามารถปฎิเสธสมมติฐานหลักได้

หน้ า 70
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

การทดสอบสมมติฐานแบบ 1-Sample t
ทําการทดสอบ t-test สําหรับสิงตัวอย่างกลุม่ เดียวหรือช่วงความเชือมันของค่าเฉลียโดยใช้ การแจก
แจงแบบ t เราจะใช้ การทดสอบแบบ 1-Sample t ในการคํานวณช่วงความเชือมันและทําการทดสอบ
สมมติฐานค่าเฉลียสําหรับกรณีทีไม่ทราบค่าเบียงเบนมาตรฐานของประชากร σ
เพือคํานวณหาช่วงความเชือมันหรือทดสอบสมมติฐานของค่าเฉลีย โดยสมมติฐานคือ

H0: μ = μ0

H1: μ ≠ μ0 , H1: μ > μ0 , H1: μ < μ0

เมือ μ คือค่าเฉลียประชากร และ μ0 คือค่าเฉลียประชากรตามทีตังสมมติฐานไว้

ตัวอย่ าง 4-2: เวลาในการรอคิว (WAITINGTIME.mpj)


ผู้จดั การธนาคารแห่งหนึงได้ ทําการปรับปรุงคุณภาพการให้ บริการเพือลดเวลารอคิวของลูกค้ า
ต้ องการทราบว่ากระบวนการให้ บริการปั จจุบนั ลูกค้ าต้ องรอในคิวโดยเฉลียน้ อยกว่า 8 นาทีอย่างมี
นัยสําคัญทางสถิติหรือไม่ทีระดับนัยสําคัญ 0.05 โดยผู้จดั การได้ ทําการสุม่ เก็บข้ อมูลการรอคิวลูกค้ า 50
รายโดยเริ มจับเวลาตังแต่ลกู ค้ าได้ รับบัตรคิวจนกระทังได้ รับบริการ

หน้ า 71
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

1. ไปยังเมนู Stat > Basic Statistics > 1-Sample t


2. ป้อนคอลัมน์ ตามไดอะล็อกบ็อกซ์ต่อไปนี

3. คลิก OK

ผลลัพธ์

หน้ า 72
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

การแปลผล
ค่า P-Value = 0.000 น้ อยกว่าค่าระดับนัยสําคัญ (α=0.05) ทีกําหนดไว้ ซึงต้ องปฏิเสธสมมติฐาน
หลัก H0 แสดงว่า เวลาในการรอโดยเฉลียของลูกค้ าน้ อยกว่า 8 นาทีอย่างมีนยั สําคัญทางสถิติ
ผลกราฟทีได้ จะเห็นได้ ว่าค่าทีตังสมมติฐานไว้ (H0 จุดแดงบนกราฟ) ไม่อยู่บนเล้ นหรือมากกว่า 95%
ช่วงความเชือมันด้ านบน (Upper Bound) คือ 6.469 ซึงคุณต้ องปฏิเสธสมมติฐานหลัก

ผลกราฟ
Histogram of Times
(with Ho and 95% t-confidence interval for the mean)
8

5
Frequency

0 _
X
-1 Ho
2 4 6 8 10
Times

Individual Value Plot of Times


(with Ho and 95% t-confidence interval for the mean)

_
X
Ho

0 2 4 6 8 10 12
Times

หน้ า 73
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

Boxplot of Times
(with Ho and 95% t-confidence interval for the mean)

_
X
Ho

0 2 4 6 8 10 12
Times

ตัวอย่ าง 4-3: กระบวนการบรรจุ (FILLINGWEIGHT.mpj)


กระบวนการบรรจุเครืองดืมใส่ขวดพลาสติกโดยค่าปริมาตรบรรจุเป้าหมายคือ 16 ออนซ์ วิศวกร
ต้ องการทดสอบว่ากระบวนการบรรจุยงั อยู่ที 16 ออนซ์หรือไม่ (ระดับนัยสําคัญ, α=0.05) โดยทําการสุม่
ขวดทีผ่านกระบวนการบรรจุมาทังหมด 10 ขวด และวิศวกรต้ องการตรวจสอบด้ วยว่าจํานวนตัวอย่าง 10
ขวดมีความสามารถในการทดสอบความแตกต่างของค่าเฉลียทีขนาด 0.025 ออนซ์หรือไม่ โดยต้ องการ
ความสามารถในการทดสอบไม่ตํากว่า 80%

1. ไปยังเมนู Stat>Basic Statistics>1-Sample-t


2. ป้อนคอลัมน์ ตามไดอะล็อกบ็อกซ์ต่อไปนี

หน้ า 74
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

3. คลิก OK

ผลลัพธ์

การแปลผล
ค่า P-Value = 0.005 น้ อยกว่าค่าระดับนัยสําคัญ (α=0.05) ทีกําหนดไว้ ซึงต้ องปฏิเสธสมมติฐาน
หลัก H0 แสดงว่าปริมาตรบรรจุเฉลียไม่เท่ากับ 16 ออนซ์อย่างมีนยั สําคัญทางสถิติ

หน้ า 75
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)
ผลกราฟ
Histogram of Weight
(with Ho and 95% t-confidence interval for the mean)

3.0

2.5

Frequency 2.0

1.5

1.0

0.5

0.0 _
X
Ho
-0.5
15.99 16.00 16.01 16.02 16.03 16.04 16.05
Weight

Individual Value Plot of Weight


(with Ho and 95% t-confidence interval for the mean)

_
X
Ho

15.99 16.00 16.01 16.02 16.03 16.04 16.05


Weight

Boxplot of Weight
(with Ho and 95% t-confidence interval for the mean)

_
X
Ho

15.99 16.00 16.01 16.02 16.03 16.04 16.05


Weight

ผลกราฟทีได้ จะเห็นได้ ว่าค่าทีตังสมมติฐานไว้ (H0 จุดแดงบนกราฟ) อยู่นอกช่วง 95% ช่วงความ


เชือมัน คือ (16.0095, 16.0405) ซึงคุณต้ องปฏิเสธสมมติฐานหลัก

หน้ า 76
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

อํานาจการทดสอบและจํานวนตัวอย่ างทดสอบ (Power and Sample Size)


ในการทําการทดสอบสมมติฐานเราควรทําการศึกษาเรืองอํานาจการทดสอบ(Power) กับจํานวน
ตัวอย่างทดสอบ โดยปกติเราจะทําการศึกษาเรืองนีก่อนทําการทดสอบหรือหลังทําการทดสอบ
อํานาจการทดสอบ(Power) คือ ความสามารถทีเราจะสรุปว่าความแตกต่างอย่างมีนยั สําคัญนันมี
อยู่จริงหรือเป็ นค่าโอกาสทีเราจะถูกต้ องเมือเราไปปฎิเสธ H0 เมือ H0 เป็ นเท็จ
ผลลัพธ์ มีจะเกิดจากการตัดสินใจมี 4 แบบดังนี

จํานวนตัวอย่างทดสอบ (Sample size) จะส่งผลต่อค่าอํานาจการทดสอบ เมือจํานวนตัวอย่าง


ทดสอบเพิมขึนอํานาจการทดสอบจะเพิมขึนด้ วย อย่างไรก็ตามบางครังอาจจะไม่สามารถทําการทดสอบ
ด้ วยขนาดสิงตัวอย่างจํานวนมากได้ เนืองจากความไม่ค้ มุ ค่าทางต้ นทุน เช่น ผู้ผลิตผลิตภัณฑ์บรรจุพลาสติก
ต้ องการใช้ พลาสติกทีสามารถทนความร้ อนได้ ดีขนึ การจะเปลียนมาใช้ พลาสติกใหม่นีจะมีความคุ้มค่ามาก
ถ้ าสามารถทําให้ อุณหภูมิในการละลายเพิมขึนได้ 20° หรือมากกว่า การทดสอบสิงตัวอย่างเพิมจะทําให้
เพิมโอกาสในการตรวจับได้ ว่ามีความแตกต่างในการเปลียนเป็ นพลาสติกหรือไม่ แต่การทดสอบจํานวน
มากจะเพิมค่าใช้ จ่ายและเวลา ซึงอาจจะทําให้ ไม่ค้ มุ ค่าเพราะได้ ผลไม่แตกต่างนัก ในการประมาณจํานวน
สิงตัวอย่างทีต้ องการเพือตรวจสอบได้ ว่ามีความแตกต่างเกิดขึน 20° หรือไม่ ด้ วยระดับอํานาจทดสอบเท่าที
ต้ องการ

หน้ า 77
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

โดยสรุปปั จจัยทีมีผลต่ออํานาจการทดสอบ(Power) คือ 


 , ค่าโอกาสของ Type I error (หรือเรียกว่าค่าระดับนัยสําคัญ) โดยถ้ าค่า  เพิมขึนค่าโอกาส
ของ Type II error () จะลดลง แสดงว่าถ้ าค่า  เพิมขึน อํานาจการทดสอบ (คํานวณจาก
1) จึงเพิมขึนด้ วย
 , ความผันแปรของประชากร (หรือความผันแปรจากการทดลอง) โดยทีค่าถ้ าค่า  ลด
อํานาจการทดสอบก็จะเพิมขึนด้ วย
 ขนาดความแตกต่าง(difference หรือ effect) ถ้ าหากขนาดความแตกต่างเพิมขึน อํานาจการ
ทดสอบจะเพิมขึน
 จํานวนตัวอย่างทดสอบเพิมขึน อํานาจการทดสอบเพิมขึน

ตัวอย่ างการหา Power and Sample Size ต่ อเนืองจากตัวอย่ าง 4-3


วิศวกรต้ องการตรวจสอบด้ วยว่าจํานวนตัวอย่าง 10 ขวดมีความสามารถในการทดสอบความ
แตกต่างของค่าเฉลียทีขนาด 0.025 ออนซ์หรือไม่ โดยต้ องการความสามารถในการทดสอบไม่ตํากว่า 80%
จากผลการทดสอบได้ ค่า Standard Deviation = 0.0217

1. ไปยังเมนู Stat>Power and Sample Size >1-Sample-t


2. ป้อนคอลัมน์ ตามไดอะล็อกบ็อกซ์ต่อไปนี

หน้ า 78
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

3. คลิก OK

ผลลัพธ์

แปลผล
จากผลลัพธ์ ทีได้ แสดงว่าจํานวนตัวอย่างทดสอบ 10 มีความสามารถ 89.87% ในการทดสอบขนาด
ความแตกต่าง 0.025 ดังนันแสดงว่าจํานวนตัวอย่างทดสอบ 10 นันเหมาะสมเพราะมีความสามารถ
เพียงพอมากกว่า 80% ทีวิศวกรตังไว้

หน้ า 79
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

การทดสอบสมมติฐานแบบ 2-Sample t
ในกรณีทีสิงตัวอย่างเป็ นอิสระต่อกันใช้ 2-sample t ในการทดสอบและสร้ างช่วงความเชือมัน ส่วน
ในกรณีทีสิงตัวอย่างทีขึนต่อกัน (dependant sample)ที ใช้ Stat > Basic Statistics > Paired t ใช้ 2-
sample t ในการทดสอบสมมติฐานและคํานวณช่วงความเชือมันของค่าความแตกต่างของค่าเฉลีย
ประชากรสองกลุม่ เมือไม่ทราบค่าความเบียงเบนมาตรฐาน สําหรับการทดสอบ 2-sample t สองด้ าน
H0: μ1 − μ2 = δ0 versus H1: μ1 − μ2 ≠ δ0

เมือ μ1 และ μ2 คือ ค่าเฉลียประชากร และ δ0 คือค่าความแตกต่างระหว่างค่าเฉลียของประชากร


สองกลุม่ ตามสมมติฐาน
ตัวอย่ าง 4-4: เวลาทีใช้ ในการเผา (BURNTIME.mpj)
ในกระบวนการเผาผลาญจะใช้ ถ่านเป็ นวัตถุดิบ ฝ่ ายผลิตต้ องการทราบว่าถ่านสองชนิดให้ เวลาใน
การเผาพลาญเท่ากันหรือไม่ โดยทําการสุม่ มาชนิดละ 10 ตัวอย่าง ทําการจับเวลาในหน่วยนาทีตงแต่
ั เริ ม
เผาไหม้ จนหมด (ระดับนัยสําคัญ, α=0.05)
การเตรียมข้ อมูลใน Minitab สามารถเตรียมได้ สองลักณะดังภาพ

หน้ า 80
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

1. ไปยังเมนู Stat>Basic Statistics >2-Sample-t


2. ป้อนคอลัมน์ ตามไดอะล็อกบ็อกซ์ต่อไปนี
กรณีเลือกใช้ คอลัมน์ C1-Type1 และ C2-Type2

กรณีเลือกใช้ คอลัมน์ C4-BurnTime และ C4-Model

3. คลิก OK

หน้ า 81
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

ผลลัพธ์

การแปลผล
เมือพิจาณาจากช่วงความเชือมัน 95% (-5.75, 11.95) ได้ รวมค่าศูนย์อยู่ด้วย และค่า P-Value =
0.471 มากกว่าค่าระดับนัยสําคัญ (α=0.05) ทีกําหนดไว้ ซึงไม่สามารถปฏิเสธสมมติฐานหลัก H0 ได้ แสดง
ว่ายังไม่สามารถสรุปได้ ว่าถ่านทังสองชนิดให้ เวลาในการเผาผลาญโดยเฉลียแตกต่างกัน
เนืองจากได้ กําหนด Assume equal variances ดังนัน Minitab จะแสดงค่า Both use Pooled
StDev = 9.42 (สําหรับการทดสอบความแปรปรวนของข้ อมูลสองชุดอธิบายไว้ ในบทที 6 เรืองการทดสอบ
สมมติฐานสําหรับค่าความแปรปรวน)

หน้ า 82
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

ผลกราฟ
Individual Value Plot of Type1, Type2
85

80

75
Data

70

65

60

55

Type1 Type2

Boxplot of Type1, Type2


85

80

75
Data

70

65

60

55

Type1 Type2

เมือพิจารณาจากกราฟจะเห็นได้ ว่าค่าเฉลียของเวลาในการเผาผลาญของถ่านทังสองชนิดยังไม่
เห็นความแตกต่างอย่างเห็นได้ ชดั

หน้ า 83
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

ตัวอย่ าง 4-5: การลดนําหนัก (LOSEWEIGHT.mpj)


เรารู้กนั อยู่แล้ วว่าการออกกําลังกายช่วยลดนําหนักลงได้ ต้ องการทดสอบว่าความถีในการออกกําลัง
กายต่อสัปดาห์ มีผลต่อนําหนักทีลดลงหรือ ทําการสุม่ ชาย-หญิ ง มาทังหมด 100 คน แบ่งเป็ นสองกลุม่ กลุม่
ละ 50 คน โดยกลุม่ ทีหนึงให้ ออกกําลังกายตามโปรแกรม 2 ครังต่อสัปดาห์ กลุม่ ทีสองให้ ออกกําลังกายตาม
โปรแกรม 4 ครังต่อสัปดาห์ โดยระยะเวลาในการเข้ าโปรแกรมคือ 3 เดือนหรือ 12 สัปดาห์ ทําการหาผลต่าง
ของนําหนักก่อนและหลังเข้ าโปรแกรม

1. ไปยังเมนู Stat > Basic Statistics > 2-Sample t


2. ป้อนคอลัมน์ ตามไดอะล็อกบ็อกซ์ต่อไปนี

3. คลิก OK

หน้ า 84
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

ผลลัพธ์

การแปลผล
เมือพิจาณาจากช่วงความเชือมัน 95% (-2.727, 0.739) ได้ รวมค่าศูนย์อยู่ด้วย และค่า P-Value =
0.258 มากกว่าค่าระดับนัยสําคัญ (α=0.05) ทีกําหนดไว้ ซึงไม่ปฏิเสธสมมติฐานหลัก H0 ได้ แสดงว่ายังไม่
สามารถสรุปได้ โปรแกรมลดนําหนักทังสองแบบมีผลต่อการลดนําหนักอย่างมีนัยสําคัญทางสถิติ

หน้ า 85
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

ผลกราฟ
Individual Value Plot of Group 1, Group 2
20

15

10
Data

Group 1 Group 2

Boxplot of Group 1, Group 2


20

15

10
Data

Group 1 Group 2

เมือพิจารณาจากกราฟจะเห็นได้ ว่าค่าเฉลียผลต่างนําหนักก่อนและหลังยังไม่เห็นความแตกต่าง
อย่างเห็นได้ ชัด

หน้ า 86
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

การทดสอบสมมติฐานแบบ Paired t
การใช้ การทดสอบ Paired t ซึงใช้ กบั การทดสอบความแตกต่างค่าเฉลียของสิงตัวอย่างทีเป็ นคู่ เมือ
ค่าแตกต่างของแต่ละคู่เป็ นการแจกแจงแบบปกติ
ใช้ คําสังใน Paired t เพือคํานวณหาช่วงความเชือมันและทดสอบสมมติฐานในการทดสอบค่าเฉลีย
ของค่าความแตกต่างของคู่ค่าสังเกต การทดสอบแบบ paired t จะเหมาะกับค่าตอบสนองทีมีลกั ษณะไม่
เป็ นอิสระต่อกัน (dependent) หรือเป็ นแบบ pair wise ซึงการจับคู่จะทําให้ อธิบายความผันแปรระหว่างคู่
ข้ อมูลและให้ ความผิดพลาดทีน้ อยลง ซึงทําให้ เพิมความไว (sensitivity) ในการทดสอบสมมติฐานหรือการ
หาช่วงความเชือมัน ตัวอย่างโดยทัวไปของกรณีนีคือค่าการวัดทีทําเป็ นคู่ คือ ค่าวัดก่อนและหลัง
สําหรับการทดสอบแบบ Paired t

H0: μd = μ0 กับ H1: μd ≠ μ0

เมือ μd คือ ค่าเฉลียความแตกต่างระหว่างคู่ค่าสังเกต และ μ0 ค่าเฉลียความแตกต่างระหว่างคู่ค่า


สังเกตตามเป้าหมายในสมมติฐาน
ตัวอย่ าง 4-6: ใบสมัครออนไลน์ (FILLFORM.mpj)
ผู้พฒ
ั นาระบบการกรอกแบบฟอร์ มใบสมัครเปิ ดบัญชีบัตรเครดิตผ่านระบบออนไลน์กบั การกรอก
ข้ อมูลกระดาษ ต้ องการทดสอบว่าเวลาในการกรอกแบบฟอร์ ม(นาที) แตกต่างอย่างมีนยั สําคัญทางสถิติ
หรือไม่ โดยทําการสุ่มเลือกผู้สมัคร 100 คน โดยให้ แต่ละคนทําการกรอกทังแบบกระดาษและแบบออนไลน์
โดยทําการจับเวลาทีใช้ ในการกรอกแบบฟอร์ มในหน่วยนาที

หน้ า 87
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

1. ไปยังเมนู Stat > Basic Statistics > Paired t


2. ป้อนคอลัมน์ ตามไดอะล็อกบ็อกซ์ต่อไปนี

3. คลิก OK
ผลลัพธ์

หน้ า 88
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

การแปลผล
ช่วงความเชือมัน 95% (2.427, 4.773) ของค่าเฉลียระหว่างคู่ค่าความแตกต่างระหว่างเวลากรอก
แบบฟอร์ มกระดาษกับออนไลน์จะไม่รวมค่าศูนย์ ซึงแปลความได้ ว่ามีความแตกต่างระหว่างวิธีการทังสอง
ในการกรอกแบบฟอร์ ม ค่า P-Value = 0.000 ทําให้ ต้องปฏิเสธสมมติฐานหลักแสดงว่าวิธีการกรอก
แบบฟอร์ มทังสองแบบแตกต่างกันอย่างมีนยั สําคัญทางสถิติ

ผลกราฟ
Histogram of Differences
(with Ho and 95% t-confidence interval for the mean)
20

15
Frequency

10

0 _
X
Ho
-10 -5 0 5 10 15
Differences

Individual Value Plot of Differences


(with Ho and 95% t-confidence interval for the mean)

_
X
Ho

-10 -5 0 5 10 15 20
Differences

หน้ า 89
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

Boxplot of Differences
(with Ho and 95% t-confidence interval for the mean)

_
X
Ho

-10 -5 0 5 10 15 20
Differences

ผลกราฟทีได้ จะเห็นได้ ว่าค่าศูนย์ทีตังสมมติฐานไว้ (H0 จุดแดงบนกราฟ) อยู่นอกช่วง 95% ช่วง


ความเชือมัน คือ (2.427, 4.773) ซึงคุณต้ องปฏิเสธสมมติฐานหลัก

ตัวอย่ าง 4-7: วัสดุหนังทํารองเท้ า (SHOESLEATHER.mpj)


บริษัทรองเท้ าแห่งหนึง ต้ องการเปรี ยบเทียบวัสดุหนังสองอย่างคือ A และ B ในการทํารองเท้ า
เด็กผู้ชาย ในตัวอย่างนีจะให้ เด็ก 16 คนใส่รองเทาทีทําจากวัสดุ A ข้ างซ้ าย และ B ข้ างขวา หลังจากนัน 3
เดือนจะทําการวัดการสึกหรอของรองเท้ า
จากข้ อมูลทีได้ จะต้ องใช้ ทําการเปรี ยบเทียบเป็ นคู่ ดังนันวิธี Paired t จะทําให้ เกิดความผิดพลาด
น้ อยกว่าวิธีอืนเพราะว่ามีการนําความผันแปรของความแตกต่างของแต่ละคู่เปรียบเทียบออกไปแล้ ว เช่น
เด็กคนหนึงอยู่ในเมืองอาจจะเดินบนทางเท้ าเสียเป็ นส่วนมาก แต่เด็กอีกคนอยู่นอกเมืองก็ไม่ค่อยได้ เดินบน
ทางเท้ ามากเท่าไหร่

หน้ า 90
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

1. ไปยังเมนู Stat > Basic Statistics > Paired t


2. ป้อนคอลัมน์ ตามไดอะล็อกบ็อกซ์ต่อไปนี

3. คลิก OK

หน้ า 91
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

ผลลัพธ์

การแปลผล
ช่วงความเชือมัน 95% (-0.2091, 0.0591) ของค่าเฉลียระหว่างคู่ค่าความแตกต่างระหว่างอัตราการ
สึกหรอของวัสดุทงสองชนิ
ั ดรวมค่าศูนย์อยู่ด้วย และค่า P-Value = 0.252 แสดงว่ายังไม่สามารถปฏิเสธ
สมมติฐานหลักได้ แสดงว่าวัสดุทํารองเท้ าทังสองชนิดไม่แตกต่างกัน และเมือดูจากกราฟจะเห็นได้ ว่าค่า
ศูนย์ทีตังสมมติฐานไว้ (H0 จุดแดงบนกราฟ) อยู่ในช่วงความเชือมัน

ผลกราฟ
Histogram of Differences
(with Ho and 95% t-confidence interval for the mean)

3
Frequency

0 _
X
Ho
-0.4 -0.2 0.0 0.2
Differences

หน้ า 92
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

Individual Value Plot of Differences


(with Ho and 95% t-confidence interval for the mean)

_
X
Ho

-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4
Differences

Boxplot of Differences
(with Ho and 95% t-confidence interval for the mean)

_
X
Ho

-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4
Differences

เมือดูจากกราฟทังสามจะเห็นได้ ว่าค่าศูนย์ทีตังสมมติฐานไว้ (H0 จุดแดงบนกราฟ) อยู่ในช่วง 95%


ช่วงความเชือมันดังนันคุณยังไม่สามารถปฏิเสธสมมติฐานหลักได้

หน้ า 93
บทที 4 การทดสอบสมมติฐานสําหรับค่าเฉลีย (Hypothesis Testing for Mean)

หน้ า 94
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for


Attribute Data)
ประชากรและสิงตัวอย่ าง (Population and samples)
ประชากร (Population) หมายถึง กลุ่มของคน สิงของ หรือ เหตุการณ์ทีเกียวกับกับสิงทีคุณต้ องการ
คําสรุป ซึงในการทดสอบบางครังอาจมีความไม่สะดวกทีคุณจะทําการทดสอบสมาชิกทุกตัวในกลุม่
ประชากรทังกลุม่ ตัวอย่างเช่น ในความเป็ นจริงคงไม่สามารถจะนับจํานวนชินงานเสียทีเกิดจากการผลิด
ทังหมดได้ อาจจะทําการนับชินงานเสีย จากกลุม่ ย่อยของชินงานทีผลิตได้ ทงหมดแทน
ั ซึงกลุม่ ย่อยเหล่านี
จะเรียกว่าสิงตัวอย่าง ซึงถ้ าสิงตัวอย่างทีได้ มามีขนาดมากพอจะสามารถได้ สาระข้ อมูลทีเป็ นตัวแทนของ
ประชากรได้ เช่นกัน

ประชากร (Population) สิงตัวอย่าง (Sample)


สิงตัวอย่าง (Sample) เป็ นกลุ่มย่อยของประชากรทีเลือกมาโดยให้ โอกาสในการถูกเลือกมามีค่า
เท่ากัน ทางสถิติเราจะใช้ สงตั
ิ วอย่างเพืออธิบายหรืออนุมานเกียวกับประชากร ดังนันการเลือกสิงตัวอย่าง
ควรไม่มีความลําเอียง เพราะจะทําให้ ไม่ได้ ตัวแทนประชากรทีแท้ จริง
สัดส่ วน (Proportion)
สัดส่วนคือค่านับหรือความถีสัมพัทธ์ กบั จํานวนทังหมด ตัวอย่างเช่น บริษัทคุณผลิตสารอัลลอยด์
เงิน (silver alloy ) สําหรับฟิ ลม์ถ่ายภาพ (Photographic film) ถ้ าคุณสนใจสัดส่วนของเงิน (silver) โดย
นําหนัก ในส่วนผสมทังหมด โดยไม่ได้ สนใจว่านําหนักเงิน (ปอนด์) เท่าใดทีถูกใช้ ไปในโรงงานแต่ละวัน แต่
ต้ องการเพียงค่าสัดส่วนของเงินทีอยู่ในอัลลอยด์ สมมติว่าครึงหนึงของอัลลอยด์คือ เงิน สัดส่วนของเงินทีได้
คือ 50% หรือ 0.5 หรือ ½

หน้ า 95
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

ค่าสัดส่วนจะทําให้ เราสามารถเปรี ยบเทียบระหว่างกลุม่ ทีมีจํานวนสมาชิกไม่เท่ากัน ตัวอย่างเช่น


ศูนย์บริ การข้ อมูลหนึงต้ องรับสายจํานวน 10,000 สายต่อวัน ซึงด้ วยเครืองมืออทีจํากัดทําให้ สามารถตอบ
รับสายได้ 500 สาย ซึงถ้ าดูเป็ นสัดส่วนจะมีสดั ส่วนทีเท่ากันระหว่างสายทีได้ รับการตอบรับและสายที
ยกเลิกการติดต่อ
อัตราการเกิดเหตุการณ์ (Occurrence Rate)
อัตราการเกิด คือ จํานวนเหตุการณ์ทีเกิดขึนจากสิงตัวอย่างทีมาจากกระบวนการเกิดแบบปั วร์ ซอง
ซึงเป็ นการอธิบายจํานวนเหตุการณ์ทีสนใจเกิดขึนในช่วงการศึกษาซึงอาจเป็ น ช่วงเวลา พืนที หรือ ปริ มาตร
ทีกําหนด
ตัวอย่างเช่น
 จํานวนสายทีโทรเข้ ามาทีศูนย์ข้อมูลในแต่ละวัน
 จํานวนตําหนิทีเกิดขึนบนเส้ นลวดขดหนึง
 จํานวนคนเข้ าชมเว็บไซต์ ต่อวัน
ช่ วงการศึกษา (Length of observation)
ในกระบวนการปั วร์ ซองจะเป็ นการนับการเกิดเหตุการณ์ภายใต้ ช่วงทีกําหนด ซึงอาจได้ แก่ เวลา
พืนที ปริมาตร หรือ จํานวนหน่วยหนึง เป็ นต้ น ช่วงการศึกษาจะแสดงขนาดของช่วงเวลา หรือ ขนาดของ
เวลาทีทําการสังเกตุการเกิดเหตุการณ์ หรือจํานวนหน่วยของสิงทีต้ องการนับเหตุการณ์ทีเกิดขึน
ตัวอย่างเช่น ทําการนับจํานวนการเกิดเหตุการณ์ ตลอดเวลาหนึงปี คุณอาจจะนับเป็ นอัตราการเกิด
ในหนึงปี และให้ ช่วงการศึกษาคือ 1 หรือทําการพิจารณาอัตราการเกิดรายเดือน ช่วงการศึกษาคือ 12
การจัดรูปแบบมาตรฐานให้ อัตราปั วร์ ซอง (Poisson rate) ทําให้ สามารถวิเคราะห์ได้ ง่ายขึน โดยการ
กําหนดช่วงการศึกษามีความจําเป็ นโดยเฉพาะกับการเปรี ยบเทียบอัตราปั วร์ ซองทีวัดคุณสมบัติเดียวเรือง
เดียวกันแต่ระยะเวลาแตกต่างกัน

หน้ า 96
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

ตัวอย่างเช่น ผู้ขายผ้ าต้ องการเปรียบเทียบผ้ าของสองบริษัทในเรืองตําหนิผ้าของบริษัทใดน้ อยกว่า


กัน บริษัท A ผลิตผ้ าหนึงม้ วนขนาด 100 m2 ส่วน ผลิตผ้ าหนึงม้ วนขนาด 300 m2 คนขายผ้ านําผ้ าของทัง
สองบริษัทนี มาตรวจนับตําหนิและหาค่าเฉลียจํานวนตําหนิต่อม้ วน โดยผ้ าบริษัท A มีค่าเฉลีย 50 ตําหนิ
ต่อม้ วน และผ้ าจากบริษัท B มีค่าเฉลีย 60 ตําหนิต่อม้ วน ซึงถ้ าเปรียบเทียบตัวเลขโดยตรงจะพบว่า ผ้ าของ
บริษัท B มีตําหนิมากกว่า แต่ถ้าทําการพิจารณาค่า length of observation (บริษัท A คือ 100 m2บริษัท B
300 m2) จะได้ ว่าบริษัท B ผลิตผ้ าทีมีตําหนิน้อยกว่า โดยดูค่าตําหนิต่อตารางเมตร บริษัท A มีค่า 0.5
ตําหนิ/m2 ส่วนบริษัท B มีค่า 0.2 ตําหนิ/m2 จะเห็นไดว่าการกําหนดช่วงการศึกษามีความสําคัญในการทํา
ความเข้ าใจข้ อมูลให้ ถกู ต้ อง
การใช้ ข้อมูลดิบและข้ อมูลความถี (Raw and frequency data) ใน Minitab
ข้ อมูลดิบ (Raw data): เป็ นค่าข้ อมูลจากสิงตัวอย่างและอยู่ในคอลัมน์เดียวกัน
ข้ อมูลความถี (Frequency data): เป็ นค่าข้ อมูลจากสิงตัวอย่างทีมีค่าเฉพาะบอกถึงเหตุการณ์ใน
คอลัมน์หนึงและความถีในการเกิดเหตุการณ์นนอี ั กคอลัมน์หนึง

หน้ า 97
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

การทดสอบสมมติฐานแบบ 1-Proportion
เพือใช้ ในการทําการทดสอบสัดส่วนไบโนเมียล (Binomial proportion) เราใช้ 1-Proportion test ใน
การคํานวณหาช่วงความเชือมัน และทําการทดสอบสมมติฐานของสัดส่วน
การทดสอบสมมติฐานจะทําการทดสอบว่าสัดส่วนของการเกิดเหตุการณ์นนเป็ ั นไปตามเป้าหมาย
หรือไม่ วิธีการทดสอบนีจะมีสมมติฐานหลักคือ สัดส่วนประชากร (Population proportion, p) จะเท่ากับค่า
ตามเป้าหมายในสมมติฐานหรือไม่ (H0: p =p0) สมมติฐานหลักคือ H0: p =p0 ส่วนสมมติฐานทางเลือก
อาจจะเป็ นด้ านเดียว ด้ านซ้ าย คือ p < p0 หรือ ด้ านขวา p > p0 หรือสองด้ าน p ≠ p0 ตัวอย่างทีข้ อมูลมี
ลักษณะเป็ นสัดส่วนได้ แก่
 สัดส่วนของถัวด้ านในกระปุกถัวลิสงอบแห้ ง
 สัดส่วนของผู้ลงคะแนนให้ กบั ผู้สมัคร A ในการเลือกตัง
 สัดส่วนของสินค้ าทีผ่านการทดสอบความปลอดภัย
สมมติว่าคุณเป็ นผู้จดั การแผนกรับประกันสินค้ าของบริษัทผลิตโทรทัศน์หนึง ซึงคุณต้ องการจะรู้ว่า
โทรทัศน์ทีคุณผลิตนีมีสดั ส่วนของเสียน้ อยกว่าของอุตสาหกรรมประเภทเดียวกันทีมีสดั ส่วนของเสียที 0.045
หรือไม่ คุณทําการสุ่มสิงตัวอย่างมาจํานวน 1000 เครืองและพบว่ามีของเสีย 30 เครือง หรือเท่ากับมีสดั ส่วน
คือ 0.03 จากนันใช้ การทดสอบสัดส่วนด้ านเดียวซึงมีสมมติฐานดังนี
H0: p = 0.045
H1: p < 0.045
การทดสอบภายใต้ การประมาณค่าว่าประชากรมีความใกล้ เคียงการแจกแจงแบบปกติ (Normal
Approximation) ซึงจะมีความเทียงตรงในกรณีทีขนาดสิงตัวอย่างมากกว่า 5 หรือความแตกต่างระหว่าง
จํานวนเหตุการณ์ทเกิ
ี ดขึนกับเหตุการณ์ทงหมดมากกว่
ั า 5 ส่วนการทดสอบ Fisher's exact จะเหมาะกับ
ทุกกรณีโดยหากต้ องการเปลียนสามารถเลือกไปที Option

หน้ า 98
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

ตัวอย่ าง 5-1: กระบวนการปิ ดผนึกกล่ อง (SEALRESULT.mpj)


คุณกําลังทําการปรับปรุงกระบวนการปิ ดผนึกกล่อง ปั จจุบนั พบว่าจํานวนกล่องทีปิ ดผนึกแล้ ว 10
กล่องจะพบกล่องปิ ดผนึกไม่สมบูรณ์อยู่ 1 กล่องซึงจะต้ องนําไปทําการแก้ ไข คุณได้ ทําการปรับปรุงระบบ
การปิ ดผนึกใหม่คุณต้ องการทราบว่าจํานวนกล่องทีจะต้ องนํากลับไปแก้ ไขลดลงหรือไม่ จึงได้ ทําการ
ทดสอบสมมติฐานโดยการสุม่ กล่องมาจํานวน 200 กล่องพบว่ามีกล่องทีต้ องนํากลับไปแก้ ไขจํานวน 11

H : สัดส่วนกล่องทีต้ องนําไปแก้ ไข = 0.1


0
H : สัดส่วนกล่องทีต้ องนําไปแก้ ไข < 0.1
1

1. ไปยังเมนู Stat > Basic Statistics > 1 Proportion


2. ป้อนข้ อมูลตามไดอะล็อกบ็อกซ์ต่อไปนี (กรณีไม่ใช้ ข้อมูลดิบ)

หน้ า 99
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

หรือป้อนคอลัมน์และข้ อมูลตามไดอะล็อกบ็อกซ์ต่อไปนี (กรณีใช้ ข้อมูลดิบ)

3. คลิก OK
ผลลัพธ์

หน้ า 100
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

การแปลผล
ค่า P-Value ทีได้ เท่ากับ 0.017 ซึงมีค่าน้ อยกว่าค่าระดับนัยสําคัญ (=0.05) ดังนันเราต้ องปฏิเสธ
สมมติฐาน (H0) และต้ องยอมรับ H1 แสดงว่าสัดส่วนของเสียทีได้ มีค่าน้ อยกว่า 0.1 หรือจากโจทย์แสดงว่า
วิธีการทีได้ ทําการปรับปรุ งทําให้ สดั ส่วนของเสียทีได้ มีค่าลดลงหรือน้ อยกว่า 0.1

ตัวอย่ าง 5-2: เครื องบินลงจอดตรงเวลา (LANDING.mpj)


จากข้ อมูลในอดีตพบว่าเทียวบินทีลงจอดในสนามบินมี 92% จากเทียวบินทังหมดลงจอดได้ ตรง
เวลา สนามบินตรงการทําการทดสอบประสิทธิภาพการลงจอดในสนามบินจึงทําการสุม่ เทียวบินมาทังหมด
165 เทียวบินพบว่ามีเพียง 153 เทียวบินทีลงจอดได้ ตรงเวลา

H : อัตราเทียวบินจอดตรงเวลา = 0.92
0
H : อัตราเทียวบินจอดตรงเวลา < 0.92
1

1. ไปยังเมนู Stat > Basic Statistics > 1 Proportion


2. ป้อนข้ อมูลตามไดอะล็อกบ็อกซ์ต่อไปนี

หน้ า 101
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

4. คลิก OK
ผลลัพธ์

การแปลผล
ค่า P-Value ทีได้ เท่ากับ 0.676 ซึงมีค่ามากกว่าค่าระดับนัยสําคัญ (=0.05) ดังนันจึงไม่สามารถ
ปฏิเสธสมมติฐาน (H0) ได้ แสดงว่าประสิทธิภาพการลงจอดได้ ตรงเวลายังไม่ลดลง

หน้ า 102
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

การทดสอบสมมติฐานแบบ 2 Proportions
เพือทําการทดสอบสัดส่วนไบโนเมียลสองกลุม่ ประชากร (Two binomial proportions) เราใช้ คําสัง
2 Proportions เพือทําการคํานวณช่วงความเชือมันและการทดสอบสมมติฐานสําหรับค่าความแตกต่างของ
สัดส่วนประชากร 2 กลุม่
ตัวอย่างเช่น สมมติคณ ุ ต้ องการรู้ว่าสัดส่วนของลูกค้ าทีทําการคืนผลสํารวจจะเพิมขึนหรือไม่ถ้ามี
การแจกสินค้ าตัวอย่างเป็ นการตอบแทน ดังนันจึงทําการส่งสินค้ าตัวอย่างพร้ อมกับแบบสํารวจไปยัง
ครึงหนึงของจํานวนทีทําการส่งแบบสํารวจไปยังลูกค้ า และดูว่ามีผลตอบกลับมาอย่างไรเปรี ยบเทียบกับ
กลุม่ ทีไม่ได้ รับสินค้ าตัวอย่าง
สําหรับการทดสอบสองด้ านสมมติฐานคือ
H0: p1 - p2 = p0 กับ H1: p1 - p2 ≠ p0
เมือ p1 และ p2 คือ สัดส่วนของเหตุการณ์ทีสนใจในประชากรกลุ่มที 1 และ 2 ตามลําดับ และ p0
คือ ค่าความแตกต่างของสัดส่วนของสองประชากรตามทีตังเป้าหมายไว้ ในสมมติฐาน

ตัวอย่ าง 5-3: การตัดสินใจซือขยายเวลารั บประกันสินค้ า (WARRANTYEXTEND.mpj)


ร้ านขายกล้ องและอุปกรณ์ กล้ อง ต้ องการศึกษาเกียวกับการตัดสินใจซือการขยายเวลารับประกัน
สินค้ า โดยต้ องการทดสอบว่าช่วงเวลาการซือปกติกบั โปรโมชันลดราคา มีผลต่อการตัดสินใจหรือไม่
1. ไปยังเมนู Stat > Basic Statistics > 2 Proportions
2. ป้อนข้ อมูลตามไดอะล็อกบ็อกซ์ต่อไปนี (กรณีไม่ใช้ ข้อมูลดิบ)

หน้ า 103
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

หรือป้อนคอลัมน์และข้ อมูลตามไดอะล็อกบ็อกซ์ต่อไปนี (กรณีใช้ ข้อมูลดิบ)

3. คลิก OK

หน้ า 104
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

ผลลัพธ์

การแปลผล
ค่า P-Value ทังสองวิธี = 0.343 และ 0.374 ซึงมากกว่าค่าระดับนัยสําคัญ (α =0.05) ทังคูด่ งั นัน
ข้ อมูลสนับสนุนสมมติฐานหลัก หมายความว่าสัดส่วนประชากรทังสองกลุม่ เท่ากัน หรือการตัดสินใจซือ
ประกันระหว่างช่วงเวลาปกติกบั ช่วงโปรโมชันมีสดั ส่วนไม่แตกต่างกัน

หน้ า 105
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

ตัวอย่ าง 5-4: ปรั บปรุ งกระบวนการ (PROCESSIMPROVE.mpj)


กระบวนการผลิตอุปกรณ์การแพทย์ รายหนึง พบว่ากระบวนการปั จจุบนั ทีเป็ นอยู่มีอตั ราของเสียสูง
ถึง 40% และเมือเร็วๆนีได้ มีคนนํากระบวนการใหม่มาเสนอ ฝ่ ายบริหารได้ ประเมินแล้ วว่าถ้ าหาก
กระบวนการใหม่นีลดลงได้ 8% คุ้มค่าทีจะเปลียน จึงได้ ทําการทดสอบโดยใช้ ตวั อย่าง 300 ตัวจากทัง
กระบวนการปั จจุบนั และกระบวนการใหม่ พบว่ากระบวนการปั จจุบนั มีของเสีย 108 และ 33 ตัว สําหรับ
กระบวนการใหม่ คุณช่วยฝ่ ายบริหารประเมินหน่อยว่าควรจะเปลียนกระบวนการหรือไม่
H0 : อัตราของเสียกระบวนการใหม่ = อัตราของเสียกระบวนการปั จจุบนั
H1 : อัตราของเสียกระบวนการใหม่ ≠ อัตราของเสียกระบวนการปั จจุบนั

1. ไปยังเมนู Stat > Basic Statistics > 2 Proportions


2. ป้อนข้ อมูลตามไดอะล็อกบ็อกซ์ต่อไปนี

3. คลิก OK

หน้ า 106
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

ผลลัพธ์

การแปลผล
ค่า P-value = 0.000 น้ อยกว่าค่าระดับนัยสําคัญ (α =0.05) ดังนันต้ องปฏิเสธสมมติฐานหลัก
แสดงว่ากระบวนการใหม่มีอตั ราของเสียแตกต่างจากกระบวนการปั จจุบนั อย่างมีนยั สําคัญทางสถิติ โดย
เฉลียแล้ วสัดส่วนของเสียแตกต่างกันอยู่ 0.25 หรือ 25% โดยกระบวนการปั จจุบนั มากกว่ากระบวนการใหม่
แสดงว่ากระบวนการใหม่สามารถลดของเสียลงได้ มากกว่า 8%

หน้ า 107
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

จากตัวอย่าง 5-4 คุณอาจตังสมมติฐานได้ อีกแบบ


H0 : อัตราของเสียกระบวนการใหม่ = อัตราของเสียกระบวนการปั จจุบนั
H1 : อัตราของเสียกระบวนการใหม่ < อัตราของเสียกระบวนการปั จจุบนั

1. ไปยังเมนู Stat > Basic Statistics > 2 Proportions


2. ป้อนข้ อมูลตามไดอะล็อกบ็อกซ์ต่อไปนี และคลิก OK

การแปลผล
ค่า P-value = 0.000 น้ อยกว่าค่าระดับนัยสําคัญ (α =0.05) ดังนันต้ องปฏิเสธสมมติฐานหลัก
แสดงว่ากระบวนการใหม่มีอตั ราของเสียลดลงจากกระบวนการปั จจุบนั อย่างมีนัยสําคัญทางสถิติ โดยเฉลีย
แล้ วสัดส่วนของเสียลดลงถึง 0.25 หรือ 25% โดยกระบวนการปั จจุบนั มากกว่ากระบวนการใหม่แสดงว่า
กระบวนการใหม่สามารถลดของเสียลงได้ มากกว่า 8%

หน้ า 108
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

การทดสอบสมมติฐานแบบ 1-Sample Poisson Rate


เป็ นการทดสอบค่าเฉลียของจํานวนเหตุการณ์ทีเกิดจากกระบวนการแบบปั วร์ ซองซึงเป็ นการ
อธิบายจํานวนเหตุการณ์ทีสนใจเกิดขึนในช่วงเวลา พืนที หรือ ปริ มาตรทีกําหนด กับเท่ากับค่าเป้าหมาย
หรือไม่
การทดสอบสมมติฐานหลักค่าเฉลีย() หรืออัตราการเกิดเหตุการณ์ () จากกระบวนการปั วร์
ซองว่าเท่ากับค่าทีต้ องการทดสอบหรือไม่ (H : =  ) โดยสมมติฐานรองกรณีสองทางเป็ นได้ สองแบบ
0 0

คือ ( <  ), ( >  ) หรือแบบสองทาง ( ≠  )


0 0 0

ตัวอย่ าง 5-5 จํานวนอุบัติเหตุ (ACCIDENT.mpj)


หน่วยกู้ภัยต้ องการนับจํานวนอุบัติเหตุทีเกิดขึนบนถนนทีเกิดความสูญเสียในพืนทีๆหน่วย
รับผิดชอบต่อเดือน โดยปั จจุบนั มีอบุ ตั ิเหตุประมาณ 20 ครังต่อเดือน หน่วยงานได้ รณรงค์ประชาสัมพันธ์ มี
เป้าหมายเพือลดอุบตั ิเหตุหน่วยงานต้ องการดูว่าจากข้ อมูลทีมีอบุ ัติเหตุได้ ลดน้ อยลงหรือไม่ โดยทําการ
เก็บช้ อมูลจํานวนอุบตั ิเหตุรายเดือนตังแต่เริมรณรงค์เป็ นระยะเวลาสองปี

H : จํานวนอุบตั ิเหตุตอ่ เดือน = 20


0
H : จํานวนอุบตั ิเหตุตอ่ เดือน < 20
1

1. ไปยังเมนู Stat > Basic Statistics > 1-Sample Poisson Rate


2. ป้อนข้ อมูลตามไดอะล็อกบ็อกซ์ต่อไปนี

หน้ า 109
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

3. คลิก OK

ผลลัพธ์

หน้ า 110
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

การแปลผล
ค่า P-Value ของการทดสอบสมมติฐานคือ 0.000 ดังนันต้ องทําการปฏิเสธสมมติฐานหลักและ
สรุปว่าจํานวนอุบัติเหตุน้อยกว่า 20 และเมือทําการประมาณค่า 95% พิกดั บนของช่วงความเชือมันของ
อัตราการเกิดมีค่าเท่ากับ 15.9758 สรุปได้ ว่าจํานวนอุบัติเหตุต่อเดือนลดน้ อยลงว่าเดิมทีมี 20 ครังต่อเดือน
อย่างมีนยั สําคัญทางสถิติ

หน้ า 111
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

การทดสอบสมมติฐานแบบ 2-Sample Poisson Rate


ทําการเปรียบเทียบสองกลุม่ ประชากรจากกระบวนการปั วร์ ซอง เพือนํามาทดสอบสมมติฐานและหา
ช่วงความเชือมันของค่าความแตกต่างระหว่างอัตราการเกิดของสองกลุ่มประชากร และความแตกต่าง
ระหว่างค่าเฉลียจํานวนเหตุการณ์ทีเกิดขึนของสองกลุม่ ประชากร
การทดสอบสมมติฐานหลักค่าเฉลีย() หรืออัตราการเกิดเหตุการณ์ () จากกระบวนการปั วร์ ซอง
ว่าเท่ากับค่าทีต้ องการทดสอบหรือไม่ (H :  =  ) โดยสมมติฐานรองกรณีสองทางเป็ นได้ สองแบบคือ
0 1 2

( <  ), ( >  ) หรือแบบสองทาง ( ≠  )


1 2 1 2 1 2

ตัวอย่ าง 5-6 การเคลมหน้ าจอมือถือสมาร์ ทโฟน (CLAIMRATE.mpj)


คุณต้ องการศึกษาว่าอัตราการเคลมหน้ าจอมือถือของโทรศัพท์มือถือ 2 รุ่น ว่ามีอตั ราการเคลม
แตกต่างกันหรือไม่ โดยจัดเก็บข้ อมูลจํานวนการเคลมจากลูกค้ าเป็ นรายสัปดาห์เป็ นเวลา 52 สัปดาห์
H0 : จํานวนการเคลมหน้ าจอโมเดล A = จํานวนการเคลมหน้ าจอโมเดล B
H1 : จํานวนการเคลมหน้ าจอโมเดล B ≠ จํานวนการเคลมหน้ าจอโมเดล B
1. ไปยังเมนู Stat > Basic Statistics > 2-Sample Poisson Rate
2. ป้อนข้ อมูลตามไดอะล็อกบ็อกซ์ต่อไปนี

3. คลิก OK

หน้ า 112
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

ผลลัพธ์

การแปลผล
ค่า P-Value = 0.000 ซึงน้ อยกว่าค่าระดับนัยสําคัญ (α=0.05) ดังนันจึงทําการปฏิเสธสมมติฐาน
หลักและสรุปว่ามีความแตกต่างกันระหว่างอัตราการเคลมต่อสัปดาห์ของทังรุ่นโทรศัพท์ โดยอัตราการเคลม
ต่อสัปดาห์ของโมเดล A จะน้ อยกว่าโดยประมาณ 3-4 รายต่อสัปดาห์

หน้ า 113
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

ตัวอย่ าง 5-7 ตําหนิบนหน้ าจอโทรทัศน์ (SCREENDEFECT.mpj)


ผู้ผลิตโทรทัศน์ทําการนับตําหนิทีเกิดขึนบนหน้ าจอของโทรทัศน์ทีผลิตเป็ นเวลาหลายสิบปี โดย
ชินส่วนหน้ าจอจะมาจากสองบริษัท A และ B โดยบริษัท A จะนับตําหนิทีเกิดขึนบนหน้ าจอของโทรทัศน์ที
ผลิตต่อไตรมาส (ทุกๆสามเดือน) แต่บริษัท B จะนับตําหนิทีเกิดขึนบนหน้ าจอของโทรทัศน์ทีผลิตต่อทุกหก
เดือน คุณต้ องการวิเคราะห์เปรียบเทียบว่าตําหนิทีเกิดจากสองบริ ษัทนีแตกต่างกันหรือไม่ คุณจึงนําข้ อมูล
ย้ อนหลังสิบปี มาทําการวิเคราะห์โดยบริษัท A มีข้อมูลจํานวน 40 และบริษัท B จํานวน 20

H : จํานวนตําหนิบนหน้ าจอของบริษัท A = จํานวนตําหนิบนหน้ าจอของบริษัท B


0

H : จํานวนตําหนิบนหน้ าจอของบริษัท A ≠ จํานวนตําหนิบนหน้ าจอของบริษัท B


1

\
1. ไปยังเมนู Stat > Basic Statistics > 2-Sample Poisson Rate
2. ป้อนข้ อมูลตามไดอะล็อกบ็อกซ์ต่อไปนี

หน้ า 114
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

3. คลิก OK
ผลลัพธ์

หน้ า 115
บทที 5 การทดสอบสมมติฐานสําหรับข้ อมูลนับ (Hypothesis testing for Attribute data)

การแปลผล
ค่า "Length" of observation คือ เดือน ซึงต้ องทําการหาว่าในแต่ละเดือนมีตําหนิเกิดขึนเท่าไหร่ แต่
เนืองจากทังสองบริษัท มีการนับตําหนิในช่วงเวลาต่างกัน การเปรี ยบเทียบตัวเลขเลยจึงไม่สามารถทําได้
ดังนันจึงต้ องมีการกําหนดค่า "length" ให้ กบั โปรแกรมเพือนําไปหาค่าเฉลียตําหนิต่อเดือนของแต่ละบริษัท
การทดสอบสมมติฐานจะทําการทดสอบว่าค่าความแตกต่างระหว่างอัตราการเกิดตําหนิต่อเดือนของบริษัท
ต่างกันอย่างมีนัยสําคัญหรือไม่ (statistically significant)
จากผลลัพธทีได้ จะมีสองส่วนคือจํานวนตําหนิเฉลียโดยบริษัท A อยู่ที 5.94167 ต่อเดือนและ
17.825 ต่อไตรมาส ส่วนบริษัท B อยู่ที 4.29167 ต่อเดือนและ 25.750 ต่อหกเดือน สําหรับส่วนการทดสอบ
สมมติฐานจะใช้ ส่วนทดสอบจํานวนตําหนิต่อเดือนเพือเปรียบเทียบในช่วง Length เดียวกัน ค่า P-Value =
0.000 ซึงน้ อยกว่าค่าระดับนัยสําคัญ (α=0.05) แสดงว่าเราต้ องปฏิเสธสมมติฐานสรุปได้ ว่าจํานวนตําหนิต่อ
เดือนของสองบริษัทนีแตกต่างอย่างมีนยั สําคัญทางสถิติ

หน้ า 116
บทที 6 การทดสอบสมมติฐานสําหรับค่าความแปรปรวน (Variance Test)

การทดสอบสมมติฐานสําหรับค่ าความแปรปรวน (Variance Test)


การทดสอบสมมติฐานสําหรับตัวสถิติวดั การกระจายของข้ อมูล ตัวสถิติวดั การกระจายของข้ อมูลที
ใช้ ในการทดสอบมี 2 ตัวคือค่าความเบียงเบนมาตรฐานกับค่าความแปรปรวน เนืองจากตัวสถิติทงสองตั
ั วนี
มีความสัมพันธ์ กนั ทางคณิตศาสตร์ โดยค่าความเบียงเบนมาตรฐานคือค่ารากทีสองของค่าความแปรปรวน
ดังนันในการทดสอบสามารถเลือกตัวใดตัวหนึงก็ได้ แต่ความแตกต่างจะอยู่ทีการอธิบายโดย
ค่าความเบียงเบนมาตรฐาน (Standard deviation) เป็ นตัววัดการกระจาย (dispersion) หรือ การ
กระจายตัวของข้ อมูลจากค่าเฉลีย ค่าเบียงเบนมาตรฐานเป็ นการประมาณการ ค่าเฉลียระยะห่างของข้ อมูล
แต่ละค่ากับค่าเฉลีย ยิงมีค่าเบียงเบนมากหมายถึงข้ อมูลมีการกระจายตัวมาก
ความแปรปรวน (Variance) เป็ นตัววัดค่าการกระจาย การกระจายหมายถึงการดูชดุ ข้ อมูลหรือ
รูปแบบการกระจายของข้ อมูลรอบค่าเฉลีย
การทดสอบสมมติฐานสําหรั บค่ าความแปรปรวนแบบ 1 Variance (1 Variance test)
เป็ นการทดสอบสมมติฐานเพือดูว่าความแปรปรวนของประชากรหนึงกลุ่มว่ามีค่าเท่ากับค่า
เป้าหมายหรือไม่ โดยสมมติฐานในการทดสอบสําหรับการทดสอบแบบสองทางคือ
H0:  = 
2 20

H1:  ≠ 
2 20

เมือค่า  คือค่าความแปรปรวนของประชากร และ  คือค่าความแปรปรวนทีต้ องการทดสอบ


2 20

สําหรับตัดสินใจจะใช้ ค่า P-value ประเมินเทียบกับค่าระดับนัยสําคัญทีตังไว้ โดยส่วนใหญ่จะอยู่ที 0.05

ตัวอย่ าง 6-1: นําหนักบรรจุยา (DRUGWEIGHT.mpj)


วิศวกรควบคุมคุณภาพของโรงงานผลิตยาแห่งหนึงพบว่าจากกระบวนการผลิตปั จจุบนั ค่านําหนักที
บรรจุได้ มีความผันแปรโดยอธิบายด้ วยค่าความเบียงเบนมาตรฐานเท่ากับ 4 มิลลิกรัม วิศวกรต้ องการ
ทดสอบว่าถ้ าทําการใช้ วิธีการผลิตแบบใหม่จะทําให้ ความผันแปรลดลงโดยถ้ าค่าความเบียงเบนมาตรฐาน
น้ อยกว่า 4 โดยต้ องลดลงอย่างน้ อยให้ ได้ ค่าความเบียงมาตรฐานอย่างน้ อย 3 มิลลิกรัมถึงจะพิจารณาการ
ลงทุนเปลียนระบบ

หน้ า 117
บทที 6 การทดสอบสมมติฐานสําหรับค่าความแปรปรวน (Variance Test)

วิศวกรทําการพิจารณาหาจํานวนทดสอบ(Sample Size) โดยค่าความเบียงเบนทีต้ องการลดคือ 3


มิลลิกรัมเทียบกับค่าความเบียงเบนปั จจุบนั คือ 4 มิลลิกรัมดังนันอัตราส่วนทีต้ องการทดสอบคือ ¾ =0.75
โดยต้ องการความสามารถในการทดสอบไม่ตํากว่า 80% (Power)
1. ไปยังเมนู Stat>Power and Sample Size>1-Variance
2. ป้อนข้ อมูลตามไดอะล็อกบ็อกซ์ต่อไปนี

3. คลิก OK

ผลลัพธ์

หน้ า 118
บทที 6 การทดสอบสมมติฐานสําหรับค่าความแปรปรวน (Variance Test)

แปลผล
ในการทดสอบอัตราส่วนค่าความเบียงเบนมาตรฐานขนาด 0.75 คุณต้ องใช้ จํานวนตัวอย่าง
ทดสอบ 42 เพือให้ ได้ ความสามารถในการทดสอบ 80% และจํานวนตัวอย่างทดสอบ 55 เพือให้ ได้
ความสามารถในการทดสอบ 90%
วิศวกรเลือกใช้ จํานวนตัวอย่างทดสอบ 50 เพือให้ ได้ ระดับความสามารถในการทดสอบอยู่ในช่วง
80-90% จากนันทําการเก็บข้ อมูลเพือทําการทดสอบ

1. ไปยังเมนู Stat > Basic Statistics > 1 Variance


2. ป้อนคอลัมน์และข้ อมูลตามไดอะล็อกบ็อกซ์ ต่อไปนี

3. คลิก OK

หน้ า 119
บทที 6 การทดสอบสมมติฐานสําหรับค่าความแปรปรวน (Variance Test)

ผลลัพธ์

การแปลผล
ค่า P-Value จากการทดสอบสมมติฐานทังวิธี Chi-Square และ Bonett เท่ากับ .478 และ 0.443
ซึงจะเห็นว่าค่านีมีค่ามากกว่าระดับนัยสําคัญ (α=0.05) ทังคู่ และทําให้ สรุปว่าไม่สามารถปฏิเสธ
สมมติฐานและมีความหมายว่าค่าเบียงเบนมาตรฐานไม่ได้ น้อยกว่า 4 มิลลิกรัม ยังไม่สามารถพิจารณา
เปลียนแปลงระบบใหม่ได้

หน้ า 120
บทที 6 การทดสอบสมมติฐานสําหรับค่าความแปรปรวน (Variance Test)

การทดสอบสมมติฐานสําหรั บค่ าความแปรปรวนแบบ (2 Variances test)


ใช้ เพือทําการทดสอบสมมติฐานเรืองความเท่ากัน (equality )หรือความเป็ นหนึงเดียวกัน
(Homogeneity) ของกลุ่มประชากรสองกลุ่มโดยใช้ F- test และ Levene's test วิธีการทางสถิติรวมทัง two
sample t-test ทีมีสมมติฐานว่าสิงตัวอย่างจากสองกลุ่มประชากรมีความแปรปรวนเท่ากัน ซึงการพิสจู น์
ความเท่ากันของความแปรปรวนให้ ใช้ วิธี 2 variances test
เป็ นการทดสอบสมมติฐานเพือดูว่าความแปรปรวนของประชากรสองกลุ่มต่างกันอย่างมีนยั สําคัญ
หรือไม่ วิธีการนีจะใช้ สมมติฐานหลักคือความแปรปรวนสองค่ามีค่าเท่ากัน (H0: σ = σ ) และสมมติฐาน
ทางเลือกคือ น้ อยกว่า (left tailed, σ < σ ), มากกว่า (right-tailed,σ > σ ), และ ไม่เท่ากับ (two-tailed,
σ ≠σ )

ตัวอย่างเช่น ผู้จดั การฝ่ ายผลิตต้ องการจะเปลียนลูกเบียวยีห้ อใหม่ (ผู้ผลิต A) ซึงบอกว่ามีความ


แปรปรวนของลูกเบียวน้ อยกว่ายีห้ อเดิมคือ ผู้ผลิต B จากกฎความปลอดภัยกําหนดข้ อกําหนดเฉพาะของ
เส้ นผ่านศูนย์กลางไว้ ช่วงแคบ ดังนันผู้จดั การฝ่ ายผลิตจึงต้ องทําการเลือกลูกเบียวจากผู้ผลิตทีผลิตแล้ วมี
ความแปรปรวนน้ อยกว่า โดยทําการเก็บลูกเบียวตัวอย่างและนํามาทดสอบ 2 variances แบบด้ านเดียว
ตามสมมติฐานดังนี
H0: σ =σ (ผู้ผลิตทังสองยีห้ อ ผลิตลูกเบียวด้ วยค่าความแปรปรวนของเส้ นผ่านศูนย์กลางเท่ากัน)
H1: σ <σ (ผู้ผลิตยีห้ อ A ผลิตลูกเบียวด้ วยค่าความแปรปรวนของเส้ นผ่านศูนย์กลางน้ อยกว่า)
ถ้ าผลการทดสอบว่าปฏิเสธสมมติฐานหลัก ผู้จดั การฝ่ ายผลิตจะถือว่าผู้ผลิตยีห้ อ A ผลิตลูกเบียว
ด้ วยค่าความแปรปรวนของเส้ นผ่านศูนย์กลางน้ อยกว่า การทดสอบนีจะเป็ นการทวนสอบเพือดูว่าความ
แปรปรวนสองค่านีเท่ากันหรือไม่

หน้ า 121
บทที 6 การทดสอบสมมติฐานสําหรับค่าความแปรปรวน (Variance Test)

F-test กับ Levene's test และ Bonett’s test


โปรแกรมจะคํานวณตัวสถิติในการทดสอบและค่า P-value ของการทดสอบแบบ F-test ,Bonett’s
test และ Levene's test กับการทดสอบสมมติฐานหลักด้ วยข้ อความความแปรปรวนมีค่าเท่ากัน กับ
สมมติฐานทางเลือกด้ วยข้ อความความแปรปรวนมีค่าไม่เท่ากัน วิธี F-test ใช้ กบั ข้ อมูลทีมีการแจกแจงแบบ
ปกติ และ วิธี Bonett’s test กับ Levene's test จะใช้ กบั ข้ อมูลทีเป็ นค่าต่อเนืองแต่ไม่จําเป็ นต้ องมีการแจก
แจงแบบปกติ อย่างไรก็ตามหากผลการทดสอบทังสามแบบสรุปผลไปในทิศทางเดียวกันเราอาจจะไม่
จําเป็ นต้ องพิจารณาว่าข้ อมูลมีการแจกแจงแบบปกติหรือไม่ก็ได้
การทดสอบแบบ F-test มีความแม่นยําเฉพาะในกรณีทีข้ อมูลมีการแจกแจงแบบปกติ แต่จะไม่
แม่นยําหากข้ อมูลไม่ได้ มีการแจกแจงแบบปกติ ในขณะที Bonett’s test กับ Levene’s test จะแม่นยํากว่า
ในกรณีข้อมูลไม่ได้ มีการแจกแจงแบบปกติและมีจํานวนตัวอย่างทดสอบน้ อย สําหรับการทดสอบว่าข้ อมูลมี
การแจกแจงแบบปกติหรือไม่สามารถศึกษาได้ ในบทที 7 เรืองการทดสอบการแจกแจง

ตัวอย่ าง 6-2 เวลาทีใช้ ในการเผา (BURNTIME.mpj)


จากตัวอย่าง 4-4 ฝ่ ายผลิตต้ องการทราบว่าความแปรปรวนของข้ อมูลสองกลุม่ เท่ากันหรือไม่
1. ไปยังเมนู Stat > Basic Statistics > 2 Variances
2. ป้อนคอลัมน์และข้ อมูลตามไดอะล็อกบ็อกซ์ ต่อไปนี

หน้ า 122
บทที 6 การทดสอบสมมติฐานสําหรับค่าความแปรปรวน (Variance Test)

สําหรับกรณีทีข้ อมูลทังสองชุดมีการแจกแจงแบบปกติ(ดูเรืองการทดสอบได้ ในบทที 7 เรืองการ


ทดสอบการแจงแจง) สามารถกําหนดการทดสอบเป็ นแบบ F-test โดยเลือกไปที Option และคลิกเลือกตาม
ไดอะล็อกบ็อกซ์ต่อไปนี

3. คลิก OK

ผลกราฟ
กรณีไม่ได้ เลือก Use test and confidence intervals based on normal distribution
Test and CI for Two Variances: Type1, Type2
Ratio = 1 vs Ratio ≠ 1

95% CI for σ(Type1) / σ(Type2)


Bonett’s Test
Bonett
P-Value 0.823
Levene’s Test
Leven e
P-Value 0.879
0.50 0.75 1.00 1.25 1.50 1.75

95% CI for StDevs

Type1

Type2

6 8 10 12 14 16

Boxplot of Type1, Type2

Type1

Type2

55 60 65 70 75 80 85

หน้ า 123
บทที 6 การทดสอบสมมติฐานสําหรับค่าความแปรปรวน (Variance Test)

กรณีเลือก Use test and confidence intervals based on normal distribution


Test and CI for Two Variances: Type1, Type2
Ratio = 1 vs Ratio ≠ 1
95% CI for σ(Type1) / σ(Type2)

F-Test
P-Value 0.876

0.50 0.75 1.00 1.25 1.50 1.75 2.00

95% Chi-square CIs for StDevs

Type1

Type2

5.0 7.5 10.0 12.5 15.0 17.5

Boxplot of Type1, Type2

Type1

Type2

55 60 65 70 75 80 85

การแปลผล
ในตัวอย่างนีค่า P-Value สําหรับวิธี Levene และ Bonett คือ 0.823 และ 0.879 และค่า P-Value
สําหรับ F-test คือ 0.876 ซึงมากกว่าค่าระดับนัยสําคัญ (α=0.05) ทังหมดทําให้ ไม่สามารถปฏิเสธ
สมมติฐานหลักทีว่าความแปรปรวนมีค่าเท่ากันได้ เพราะว่าข้ อมูลไม่สามารถให้ สาระได้ เพียงพอในการทีจะ
บอกว่าประชากรสองกลุม่ นีมีความแปรปรวนไม่เท่ากัน ดังนันให้ สมมติได้ ว่าความแปรปรวนมีค่าเท่ากัน
ขณะทีคุณทดสอบสมมติฐาน 2-Sample t ในตัวอย่าง 4-4

หน้ า 124
บทที 7 การทดสอบสมมติฐานการแจกแจงข้ อมูล (Distribution Test)

การทดสอบการแจกแจง (Distribution test)


การแจกแจงความน่ าจะเป็ น (Probability Distribution)
คือการแจกแจงโอกาสทีจะเกิดเหตุการณ์ของตัวแปรสุม่ ทีเราสนใจ นักสถิติได้ ค้นพบ Probability
Distribution หลากหลายชนิด แต่ทีเป็ นทีคุ้นเคยและใช้ งานบ่อยๆในงานอุตสาหกรรม สําหรับข้ อมูลนับ
ได้ แก่ Binomial, Poisson distribution, Hyper geometric สําหรับข้ อมูลวัด ได้ แก่ Exponential, Weibull ,
Normal Distribution เนือหาบทนีจะกล่าวถึงเฉพาะในส่วนการทดสอบว่าข้ อมูลทีเราเก็บมาได้ มีการแจก
แจงแบบปกติ(Normal) กับการแจงแจงแบบปั วร์ ซอง(Poisson) หรือไม่
การแจกแจงแบบปกติ (Normal distribution)
มีรูปร่ างเส้ นโค้ งระฆังควําทีสมมาตรซ้ าย-ขวาจากค่าเฉลีย การแจกแจงแบบปกติเป็ นการแจกแจงที
นิยมใช้ กันทัวไปทางสถิติเพราะว่าเป็ นลักษณะโดยทัวไปของข้ อมูลของเหตุการณ์ทางกายภาพ ชีวภาพ หรือ
ลักษณะสังคม การวิเคราะห์ทางสถิติโดยมากต้ องการข้ อมูลทีมาจากประชากรทีมีการแจกแจงแบบปกติ
ค่าเฉลีย (µ) และค่าความเบียงเบนมาตรฐาน () เป็ นค่าพารามิเตอร์ ในการอธิบายการแจกแจง
แบบปกติ ค่าเฉลียคือค่าสูงสุดหรือค่าตรงกลางของเส้ นโค้ งระฆังควํา ค่าความเบียงเบนมาตรฐานคือค่าการ
กระจายของข้ อมูล โดยประมาณ
68% ของข้ อมูลจะอยู่ในช่วง +/- 1 เท่าของค่าเบียงเบนมาตรฐานกับค่าเฉลีย
95% ของข้ อมูลจะอยู่ในช่วง +/- 2 เท่าของค่าเบียงเบนมาตรฐานกับค่าเฉลีย
99% ของข้ อมูลจะอยู่ในช่วง +/- 3 เท่าของค่าเบียงเบนมาตรฐานกับค่าเฉลีย
ตัวอย่างเช่น ข้ อมูลความยาวชินงานจากกระบวนการผลิตวัดได้ ในหน่วยนิวมีการแจกแจงแบบปกติ
มีค่าเฉลียเท่ากับ 50 นิวและค่าความเบียงเบนมาตรฐานเท่ากับ 2 นิว

หน้ า 125
บทที 7 การทดสอบสมมติฐานการแจกแจงข้ อมูล (Distribution Test)

ประมาณ 68% ของความยาวชินงานอยู่ระหว่าง 48 นิว (µ - 1) และ 52 นิว (µ + 1)


Distribution Plot
Normal, Mean=50, StDev=2
0.6827
0.20

0.15
Density

0.10

0.05

0.00
48 50 52
X

ประมาณ 95% ของความยาวชินงานอยู่ระหว่าง 46 นิว (µ - 2) และ 54 นิว (µ + 2)


Distribution Plot
Normal, Mean=50, StDev=2
0.9545
0.20

0.15
Density

0.10

0.05

0.00
46 50 54
X

ประมาณ 99% ของความยาวชินงานอยู่ระหว่าง 44 นิว (µ - 3) และ 56 นิว (µ + 3)


Distribution Plot
Normal, Mean=50, StDev=2
0.9973
0.20

0.15
Density

0.10

0.05

0.00
44 50 56
X

หน้ า 126
บทที 7 การทดสอบสมมติฐานการแจกแจงข้ อมูล (Distribution Test)

กราฟการแจกแจงความน่ าจะเป็ น (Probability Plot)


ใช้ ในการประมาณการแจกแจงของข้ อมูลว่าเป็ นรูปแบบใด ใช้ ประมาณค่าเปอร์ เซ็นต์ไทล์ และ
เปรียบเทียบการแจกแจงสิงตัวอย่างรูปแบบต่างๆ
ตัวอย่างเช่น ผู้จดั การธนาคารต้ องการหาค่าเปอร์ เซ็นต์ทีลูกค้ าต้ องใช้ เวลารออาหาร ซึงตังเป้าหมาย
ไว้ ที 5 นาที หรือน้ อยกว่านัน ทําการบันทึกค่าเวลาของลูกค้ า 15 คนซึง แสดงใน Probability Plot ตามรูป
ซึงได้ ผลดังนี
Probability Plot of Data
Normal - 95% CI
99
Mean 3.936
StDev 0.8635
95 N 15
AD 0.394
90 89.098 P-Value 0.329
80
70
Percent

60
50
40
30
20

10
5
5

1
1 2 3 4 5 6 7
Data

 เพราะว่าจุดข้ อมูลวางตัวใกล้ เคียงกับเส้ นตรง ค่า P-value คือ 0.329 มากกว่าระดับนัยสําคัญ


0.05 ทีตังไว้ และค่าตัวสถิติ AD มีค่าตํา ทําให้ สามารถสรุปได้ ว่าข้ อมูลนีมีการแจกแจงแบบปกติ
ดังนัน จึงสามารถใช้ สมการเส้ นทํานาย (fitted line) ในการประมาณค่าเปอร์ เซ็นต์ไทล์ได้ ใน
กรณีทีการแจกแจงไม่ตรงกัน ก็สามารถทดลองการแจกแจงแบบอืนๆได้
 ค่าเฉลียเวลาในการรอ คือ 3.936 นาที และค่าความเบียงเบนมาตรฐานคือ 0.8635
 จะเห็นได้ ว่าประมาณ 89% ของข้ อมูลมีค่าเวลาตํากว่า 5 นาที

หน้ า 127
บทที 7 การทดสอบสมมติฐานการแจกแจงข้ อมูล (Distribution Test)

Probability Plot ทําหน้ าทีคล้ ายกับ Empirical CDF (Cumulative Density Function) plot โดย
พล็อตจะแสดงเปอร์ สะสม (เส้ นสีนําเงิน)
Empirical CDF of Data
Normal

100 Mean 3.936


StDev 0.8635
89.1 N 15

80

60
Percent

40

20

5
2 3 4 5 6
Data

การทดสอบความเป็ นปกติ (Normality test)


การทดสอบสมมติฐานเพือดูว่าประชากรทีคุณทําการสุ่มตัวอย่างมานันมีการแจกแจงแบบปกติ
หรือไม่ กระบวนวิธีทางสถิติโดยส่วนใหญ่มีข้อสมมติฐานว่าประชากรจะต้ องเป็ นการแจกแจงแบบปกติ
ดังนันจะต้ องมีการทดสอบความเป็ นปกติเพือดูว่าข้ อสมมติฐานนีผ่านหรือไม่เพือจะได้ ทําการวิเคราะห์ขนั
ต่อไปได้ สมมติฐานหลักของการทดสมมติฐานคือ ประชากรมีการแจกแจงแบบปกติ สมมติฐานทางเลือก
คือประชากรมีการแจกแจงไม่เป็ นแบบปกติ
H0: ประชากรมีการแจกแจงแบบปกติ
H1: ประชากรมีการแจกแจงไม่เป็ นแบบปกติ
โดยทําการทดสอบได้ จาก 4 วิธีการนี

หน้ า 128
บทที 7 การทดสอบสมมติฐานการแจกแจงข้ อมูล (Distribution Test)

เทคนิคกราฟ (Graphical technique)


คุณสามารถประเมินว่าประชากรมีการแจกแจงแบบปกติหรือไม่โดยใช้ Normal Probability Plot
กราฟนีจะพล็อตค่าข้ อมูลเรียงตามลําดับ โดยเทียบเคียงกับค่าทีคาดว่าจะเป็ นการแจกแจงแบบปกติ ถ้ า
ประชากรมาจากการแจกแจงปกติ กราฟทีได้ จะเห็นว่าจุดข้ อมูลจะเป็ นเส้ นตรง
Probability Plot of Normal Data Probability Plot of Nonnormal Data
Probability Plot of Data Probability Plot of Data
Normal Normal
99 .9 99 .9
Mean 0.049 50 Mean 0.9 277
StDev 1.0 08 StDev 1.007
99 N 3 00 99 N 3 00
AD 0.3 68 AD 17.0 43
95 P-Value 0.428 95 P-Value <0.0 05
90 90
80 80
70 70
Percent

Percent
60 60
50 50
40 40
30 30
20 20
10 10
5 5

1 1

0.1 0.1
-3 -2 -1 0 1 2 3 4 -2 -1 0 1 2 3 4 5 6 7
Data Data

การทดสอบ Anderson-Darling
เป็ นการทดสอบเพือเปรียบเทียบฟั งก์ชนการแจกแจงสะสมของข้
ั อมูลสิงตัวอย่างกับการแจกแจง
แบบปกติตามทีคาดการณ์ไว้ ถ้ ามีความแตกต่าง(ค่า AD) เกิดขึนมากพอ การทดสอบจะให้ ผลการปฏิเสธ
สมมติฐานหลักทีว่าประชากรมีการแจกแจงแบบปกติ โดยถ้ าค่า P-Value ของการทดสอบทีน้ อยกว่าระดับ
นัยสําคัญ (α) จะทําการปฏิเสธสมมติฐานหลักและสรุปว่าประชากรมีการแจกแจงทีไม่ใช่การแจกแจงปกติ
การทดสอบความเป็ นปกติแบบ Ryan-Joiner
เป็ นการทดสอบการแจกแจงแบบปกติด้วยการคํานวณค่าสหสัมพันธ์ ระหว่างข้ อมูลและคะแนน
ความเป็ นปกติของข้ อมูล ถ้ าค่าสัมประสิทธิ สหสัมพันธ์ มีค่าเข้ าใกล้ 1 ประชากรมีการแจกแจงเข้ าใกล้ การ
แจกแจงแบบปกติ ตัวสถิติ RJ (Ryan-Joiner) เป็ นการประเมินนําหนักค่าสหสัมพันธ์ ถ้ าค่า Ryan-Joiner
น้ อยกว่าค่าวิกฤต จะทําการปฏิเสธสมมติฐานหลักว่าประชากรมีการแจกแจงแบบปกติ การทดสอบนีมี
ลักษณะคล้ ายกับการทดสอบความเป็ นปกติแบบ Shapiro-Wilk โดยถ้ าค่า P-Value ของการทดสอบทีน้ อย
กว่าระดับนัยสําคัญ (α) จะทําการปฏิเสธสมมติฐานหลักและสรุปว่าประชากรมีการแจกแจงทีไม่ใช่การแจก
แจงปกติ

หน้ า 129
บทที 7 การทดสอบสมมติฐานการแจกแจงข้ อมูล (Distribution Test)

การทดสอบความเป็ นปกติ แบบ Kolmogorov-Smirnov


เป็ นการทดสอบเพือเปรียบเทียบฟั งก์ชนการแจกแจงสะสมของข้
ั อมูลสิงตัวอย่างกับการแจกแจง
แบบปกติตามทีคาดการณ์ไว้ ถ้ ามีความแตกต่าง (ค่า KS) เกิดขึนมากพอ การทดสอบจะให้ ผลการปฏิเสธ
สมมติฐานหลักว่าประชากรมีการแจกแจงแบบปกติ โดยถ้ าค่า P-Value ของการทดสอบทีน้ อยกว่าระดับ
นัยสําคัญ (α) จะทําการปฏิเสธสมมติฐานหลักและสรุปว่าประชากรมีการแจกแจงทีไม่ใช่การแจกแจงปกติ

ตัวอย่ าง 7-1: ความดันบรรจุนําอัดลม (DRINKBOTTLE.mpj)


ในกระบวนการบรรจุนําอัดลมมีการสุ่มวัดความดันภายในขวด พนักงานได้ ทําการวัดความดัน
ภายในขวดจํานวน 15 ขวด คุณต้ องการตรวจดูว่าข้ อมูลมีการแจกแจงแบบปกติหรือไม่ จึงทําการทดสอบ
ความเป็ นปกติ
1. ไปยังเมนู Stat > Basic Statistics > Normality Test
2. ป้อนคอลัมน์ ตามไดอะล็อกบ็อกซ์ต่อไปนี

3. คลิก OK

หน้ า 130
บทที 7 การทดสอบสมมติฐานการแจกแจงข้ อมูล (Distribution Test)

ผลกราฟ
Probability Plot of Pressure
Normal
99
Mean 205.0
StDev 11.21
95 N 15
AD 0.476
90
P-Value 0.203
80
70
Percent

60
50
40
30
20

10

1
180 190 200 210 220 230
Pressure

การแปลผล
การทดสอบ Anderson-Darling ค่า P-Value 0.203 ซึงมีค่ามากกว่าระดับนัยสําคัญ (α=0.05) จึง
ไม่มีหลักฐานเพียงพอทีจะสรุปได้ ว่าข้ อมูลไม่เป็ นไปตามการแจกแจงแบบปกติ แสดงว่าข้ อมูลมีการแจงแจง
แบบปกติ

ตัวอย่ าง 7-2: เวลาในการซ่ อมแซมเครื องจักร (TIMETOREPAIR.mpj)


ฝ่ ายซ่อมบํารุงได้ ทําการเก็บข้ อมูลเวลาทีใช้ ในการซ่อมแซมเครืองจักรทีใช้ ในการผลิตหลังจากได้ รับ
แจ้ งซ่อมในหน่วยชัวโมง ทางฝ่ ายต้ องการนําข้ อมูลทีมีการจัดเก็บในอดีตจํานวน 50 ข้ อมูลมาประเมินดูว่า
เวลาทีใช้ มีการแจกแจงแบบปกติหรือไม่
1. ไปยังเมนู Stat > Basic Statistics > Normality Test
2. ป้อนคอลัมน์ ตามไดอะล็อกบ็อกซ์ต่อไปนี

หน้ า 131
บทที 7 การทดสอบสมมติฐานการแจกแจงข้ อมูล (Distribution Test)

3. คลิก OK
ผลกราฟ
Probability Plot of TimeToRepair
Normal
99
Mean 28.28
StDev 25.21
95 N 50
AD 2.292
90
P-Value <0.005
80
70
Percent

60
50
40
30
20

10
5

1
-50 -25 0 25 50 75 100 125
TimeToRepair

การแปลผล
การทดสอบ Anderson-Darling ค่า P-Value < 0.005 ซึงมีค่าน้ อยกว่าระดับนัยสําคัญ (α=0.05)
จึงสรุปได้ ว่าข้ อมูลไม่เป็ นไปตามการแจกแจงแบบปกติ

หน้ า 132
บทที 7 การทดสอบสมมติฐานการแจกแจงข้ อมูล (Distribution Test)

การแจกแจงแบบปั วร์ ซอง (Poisson distribution)


เป็ นการอธิบายจํานวนครังในการเกิดเหตุการณ์ในช่วงระยะทีกําหนด ตัวอย่างเช่น จํานวน
ข้ อบกพร่องในระบบกลไกของเครืองยนต์ หรือจํานวนสายเรี ยกเข้ ามายังศูนย์บริ การข้ อมูล การแจกแจง
แบบปั วร์ ซองมักจะใช้ กบั การควบคุมคุณภาพ การศึกษาเรืองความเชือมันผลิตภัณฑ์และการประกัน
ตัวแปรทีมีการแจกแจงแบบปั วร์ ซองจะต้ องมีเงือนไขดังนี
 ข้ อมูลเป็ นจํานวนนับของเหตุการณ์ (จํานวนเต็มบวก ไม่มีขอบเขตด้ านบน)
 ทุกๆเหตุการณ์เป็ นอิสระต่อกัน
 อัตราการเกิดเฉลียไม่เป็ นเปลียนแปลงตลอดระยะทีสนใจ
การแจกแจงแบบปั วร์ ซองกําหนดด้ วยพารามิเตอร์ คือ  ค่าพารามิเตอร์ นีเท่ากับค่าเฉลีย และความ
แปรปรวน โดยทีเมือค่า  มีค่าเพิมขึน การแจกแจงแบบปั วร์ ซองจะเข้ าใกล้ การแจกแจงแบบปกติ รูปข้ างใต้
แสดงความแตกต่างระหว่างค่า =3 กับ =10 จะเห็นว่าที =10 ฮีสโตแกรมมีลกั ษณะคล้ ายการแจกแจง
แบบปกติมากกว่า =3
Histogram of Lamda=3 Histogram of Lamda=10
25
14

12
20

10
Frequency

Frequency

15
8

10 6

4
5
2

0 0
0 2 4 6 8 3 6 9 12 15 18
Lamda=3 Lamda=10

การแจกแจงแบบปั วร์ ซองคล้ ายกับการแจกแจงแบบไบโนเมียลเพราะว่าตัวแบบทังสองเป็ นเรืองของ


การนับเหตุการณ์ โดยการแจกแจงแบบปั วร์ ซองเป็ นตัวแบบของข้ อมูลจํานวนนับเหตุการณ์ทีเป็ นจํานวน
เต็มบวกมีค่ามากกว่าเท่ากับศูนย์ การแจกแจงแบบไบโนเมียลเป็ นตัวแบบทีเป็ นจํานวนครังเหตุการณ์ที
สนใจจากเหตุการณ์ทงหมดตั
ั งแต่ 0 ถึง n เหตุการณ์

หน้ า 133
บทที 7 การทดสอบสมมติฐานการแจกแจงข้ อมูล (Distribution Test)

การทดสอบภาวะสารู ปดีของการแจกแจงแบบปั วร์ ซอง (Goodness of fit test for Poisson)


การทดสอบภาวะสมรูปดีของการแจกแจงแบบปั วร์ ซองเป็ นการชีให้ เห็นว่าตัวเบบสถิติทีสนใจนีมี
ความแตกต่างจากตัวแบบทีคาดการณ์ไว้ หรือไม่
การทดสอบภาวะสารูปสนิทดีมีสมมติฐานดังนี
H0: ประชากรมีการแจกแจงตามแบบทีคาดหวัง
H1: ประชากรไม่มีการแจกแจงตามแบบทีคาดหวัง
โดยการทดสอบเราจะใช้ ตัวสถิติ Chi-Square เป็ นค่าวัดความแตกต่างระหว่างการแจกแจงของ
ข้ อมูลและการแจกแจงทีคาดการณ์ไว้ ในสมมติฐาน ถ้ าค่า P-Value จากการทดสอบ Chi-Square มีค่าน้ อย
กว่าค่าระดับนัยสําคัญ (α=0.05) ผลการทดสอบคือปฏิเสธสมมติฐานหลัก ซึงสรุปว่าตัวแปรสองตัวเป็ น
อิสระต่อกัน ประชากรไม่มีการแจกแจงตามแบบทีคาดหวัง
ตัวอย่ าง 7-3: จํานวนผลิตภัณฑ์ บกพร่ อง (DEFECTUNIT.mpj)
ฝ่ ายตรวจสอบคุณภาพ บันทึกจํานวนผลิตภัณฑ์บกพร่อง(Defect) ทีเกิดในแต่ละวัน เป็ นเวลา 20
วัน ต้ องการดูว่าข้ อมูลเป็ นไปตามการแจกแจงแบบปั วร์ ซองหรือไม่
1. ไปยังเมนู Stat > Basic Statistics > Goodness-of-Fit Test for Poisson
2. ป้อนคอลัมน์ ตามไดอะล็อกบ็อกซ์ต่อไปนี

3. คลิก OK

หน้ า 134
บทที 7 การทดสอบสมมติฐานการแจกแจงข้ อมูล (Distribution Test)

ผลลัพธ์

ผลกราฟ
Chart of Observed and Expected Values
Expected
5
Observed

3
Value

0
Unit <=12 13 14 - 15 16 - 17 18 - 19 20 - 21 >=22

หน้ า 135
บทที 7 การทดสอบสมมติฐานการแจกแจงข้ อมูล (Distribution Test)

Chart of Contribution to the Chi-Square Value by Category


2.5

2.0

Contributed Value
1.5

1.0

0.5

0.0
<=12 16 - 17 14 - 15 >=22 18 - 19 20 - 21 13
Unit

การแปลผล
ค่า Chi-Square มีค่าไม่มากพอทีจะทําให้ เกิดการปฏิเสธสมมติฐาน เพราะค่า P-Value = 0.356 ซึง
มากกว่าระดับนัยสําคัญ (α=0.05) ดังนันคุณสามารถสรุปไม่มีหลักฐานเพียงพอทีจะปฏิเสธสมมติฐาน
แสดงว่าจํานวนผลิตภัณฑ์บกพร่องทีเกิดเป็ นไปตามการแจกแจงแบบปั วร์ ซอง

ตัวอย่ าง 7-4: จํานวนสายโทรศัพท์ (CALLCENTER.mpj)


ศูนย์บริ การให้ ข้อมูลลูกค้ าทางโทรศัพท์(Call center) ทําการบันทึกจํานวนสายโทรศัพท์ทีเข้ ามาใช้
บริการในแต่ละวัน ทางศูนย์ต้องการดูว่าข้ อมูลเป็ นไปตามการแจกแจงแบบปั วร์ ซองหรือไม่ ได้ ทําการเก็บ
ข้ อมูลจํานวนสายเข้ ามาขอรับบริ การเป็ นระยะเวลา 2 เดือน (60 วัน)
1. ไปยังเมนู Stat > Basic Statistics > Goodness-of-Fit Test for Poisson
2. ป้อนคอลัมน์ ตามไดอะล็อกบ็อกซ์ต่อไปนี

หน้ า 136
บทที 7 การทดสอบสมมติฐานการแจกแจงข้ อมูล (Distribution Test)

3. คลิก OK

ผลลัพธ์

หน้ า 137
บทที 7 การทดสอบสมมติฐานการแจกแจงข้ อมูล (Distribution Test)

ผลกราฟ
Chart of Observed and Expected Values
Expected
25 Observed

20

15
Value

10

0
C2 <=50 51 52 53 >=54

Chart of Contribution to the Chi-Square Value by Category


35

30
Contributed Value

25

20

15

10

0
52 51 53 <=50 >=54
C2

การแปลผล
ค่า Chi-Square มีค่ามากพอทีจะทําให้ เกิดการปฏิเสธสมมติฐาน เพราะค่า P-Value = 0.000 ซึง
น้ อยกว่าระดับนัยสําคัญ (α=0.05) ดังนันคุณสามารถปฏิเสธสมมติฐาน แสดงว่าจํานวนสายโทรศัพท์ทีเข้ า
มาแต่ละวันทีเกิดไม่เป็ นไปตามการแจกแจงแบบปั วร์ ซอง

หน้ า 138
แนะนําแหล่งความรู้เพิมเติมสนับสนุนการใช้ งาน Minitab

http://www.solutioncenterminitab.com/blog

ภายในประกอบด้ วย บทความแปลจาก Minitab,กรณีศกึ ษาจากบริ ษัทชันนํา,ประสบการณ์จากทีปรึกษา,


วีดีโอแนะนําการใช้ งานทังการจัดการข้ อมูลและคําสังสถิติ และน่าสนใจอีกมากมาย

ติดตามเราได้ ที

You might also like