Professional Documents
Culture Documents
สถิติในการวิจัย
สมรัตน เลิศมหาฤทธิ์
16.1 บทนํา
ปจจุบันนี้ สถิติถูกนํามาใชอยางแพรหลายในงานตางๆ หลายสาขา
เชน ธุรกิจ สังคมศาสตร ระบาดวิทยา การแพทย และสาธารณสุข ฯลฯ
ในทางการแพทยนั้น สถิติถูกนํามาใชในงานโรงพยาบาล, การตรวจสอบ,
การจัดสรรทรัพยากร และดานอื่นๆ
การทํ า วิ จั ย จํ า เป น ต อ งใช ส ถิ ติ ม าช ว ยตั้ ง แต เ ริ่ ม ต น ได แ ก การ
คํา นวณขนาดตัว อย า งที่ เ หมาะสม กระบวนการสุ ม กระบวนการจั ด สรร
หลั ง จากเก็ บ ข อ มู ล ได สถิ ติ เ ป น เครื่ อ งมื อ สํ า คั ญ ที่ ใ ช ใ นการวิ เ คราะห
จนกระทั่งสุดทายคือการรายงานผลและการตีพิมพก็มีการแสดงผลทางสถิติ
เพื่อแสดงถึงความนาเชื่อถือของผลการวิจัย และการนําไปใช ดังนั้น ถาการ
ใชสถิติไมถูกตอง ก็จะทําใหผลที่นําเสนอนั้นไมถูกตอง เมื่อผูอานนําไปใชก็
จะผิดพลาดได
การคํานวณ
คาเฉลี่ย = 3+3+.................+18) / 12 =8
7+7
คามัธยฐาน = =7
2
คาฐานนิยม = 7 =7
16.2.1 การพรรณนาขอมูล(Describing data)
สิ่งที่ควรตองมีในการพรรณนา คือ แนวโนมเขาสู วิเ คราะห เนื่ อ งจากข อ มู ล มีค า แตกต า งกั น มาก วิ ธีบ อก
ส ว นกลาง และความผั น แปรของข อ มู ล ซึ่ ง มี วิ ธี ใ นการ แนวโนมเขาสูสวนกลางที่เหมาะสมจึงควรใช มัธยฐาน
คํานวณหลายวิธี ดังนี้
ตอบ จํานวนวันที่คนไข อยูโรงพยาบาล คือ 7 วันโดยเฉลี่ย
i. วิธีบอกแนวโนมเขาสูสวนกลาง (measures of
central tendency) วิธีที่นิยมใชและรูจักกัน คือ ii. วิธีบอกความผันแปร (measures of variability) มีวิธี
ก. คาเฉลี่ย (Mean) หรือคาเฉลี่ยเลขคณิต ตางๆ ที่ใชไดแก
(arithmatic mean) ซึ่งไดจากการรวมทุกๆ คาของขอมูล ก. พิสัย (Range) หมายถึง คาสูงสุด ถึงคา
แลวหารดวยจํานวนตัวอยาง วิธีนี้มีขอดีคือ คาทุกคาไดถูก ต่ํา สุด เปน วิธีบ อกความผัน แปรที่ครา ว คือไมมีก าร
นํามาใช และคาเฉลี่ยสามารถนําไปใชในการทดสอบ กลั่นกรองคาตางๆในขอมูลนั้น ไมนิยมใชมากนัก
สมมติ ฐ านต อ ไปได แต ค า เฉลี่ ย ก็ มี ข อ ไม ดี คื อ ถู ก ข. เปอรเซนไทล (Percentile) หมายถึงคาของ
กระทบกระเทือนไดงาย จากขอมูลบางอันที่มีคาสูงหรือต่ํา ขอมูลที่จํานวนต่ํากวาคานั้นวามีกี่เปอรเซ็นต เชน P20 ของ
เกินไป ทําใหคาเฉลี่ยสูงหรือต่ํากวาความเปนจริงได น้ําหนักตัวของนักเรียนชั้นประถมแหงหนึ่งเทากับ 28 กก.
ข. มัธยฐาน (Median) เปนคาที่อยูในตําแหนง หมายความวามีจํานวนนักเรียน 20% ที่มีน้ําหนักต่ํากวา
ตรงกลางของข อ มู ล เมื่ อ นํ า ข อ มู ล ทั้ ง หมดมาเรี ย งกั น 28 กก. การบอกเปนเปอรเซ็นตไตล คือการแบงจํานวนของ
ตามลําดับคาจากมากไปนอย ขอดีของวิธีนี้คือ ถามีการ ขอมูลทั้งหมดเปน 100 สวน ถาแบงจํานวนทั้งหมดของ
f 225 e
สถิติในการวิจัย
ขอมูลเปน 10 สวน จะเรียกวา เดไซล (Decile) และถา ตําแหนง สวนคา SD ใหมีคาทศนิยมมากกวาคาเฉลี่ยอยู 1
แบงเปน 4 สวน จะเรียกวา ควอไทล (Quartile) วิธีที่นิยม ตําแหนง
ในการบอกความผันแปรของขอมูลซึ่งใชคูกับมัธยฐาน คือ ข. ตาราง (tables)
Inter-quartile range หรือคือ คาระหวาง P25 และ P75 หรือ การนําเสนอในรูปตารางใหแสดงกลุมที่ตองการ
Q3-Q1 จําแนกอยูในแนวตั้ง (column) ตัวแปรตางๆ ใหแสดงใน
ค . ค า ค ว า ม แ ป ร ป ร ว น (Variance) แ ล ะ แนวนอน (row) ถาจํานวนคาสังเกตไมมากไมจําเปนตอง
คาเบี่ยงเบนมาตรฐาน (Standard deviation, SD) คํานวณรอยละ ควรใหเสนอเปนจํานวนที่แทจริง เนื่องจาก
คาแปรปรวน (Variance) คือผลรวมของความตางของ การนําเสนอในรูปรอยละ อาจทําใหเขา ใจผิดวา จํานวน
ขอมูลแตละอันจากคาเฉลี่ย ดังสูตร ตัวอยางมีมาก
Variance =
∑ (X − X )
i
2
ลักษณะของตารางที่ดี ไดแก
n−1 - ควรบอกผูอานถึงเรื่องนั้นๆ ใหชัดเจน
โดย Xi = คาที่สังเกต, X = คาเฉลี่ย, - คาทั้งหมด หรือจํานวนคาสังเกต (n) ทั้งหมด
n = จํานวนคาสังเกต ควรระบุไวในตาราง
- ถามีการแสดงรอยละ ควรบอกใหชัดเจนถึงที่มา
คา เบี่ ย งเบนมาตรฐาน (SD) คื อ รากที่ส องของค า ความ ของคารอยละ เชน รอยละตามแถว (row percentage)
แปรปรวน ( Variance ) หรือรอยละตามคอลัมน (column percentage) เพื่อให
∑ (X i − X ) 2 ผูอานไดแปลผลถูกตอง
SD =
n−1 - ควรระบุหนวยการวัดใหชัดเจน อาจระบุไวที่หัว
โดย Xi = คาที่สังเกต, X = คาเฉลี่ย, ตาราง
n = จํานวนคาสังเกต - ตารางควรเสนอผลอยางชัดเจน และควร
หลีกเลี่ยงตารางที่ซับซอนเกินไป เพราะจะทําใหการแปล
คา SD นิยมใชมากกวา ผลผิดพลาดและเกิดความสับสน
เหตุผลที่ไมนิยมใชคาแปรปรวน เนื่องจากหนวย
เปนกําลังสอง จึงตองถอดรากที่สอง (ซึ่งคือ SD) เพื่อให ในกรณีที่ขอมูลเปนชนิดจํานวนและตองมีการจัด
หนวยเหมือนกับขอมูล จึงจะนําไปใชในการวิเคราะหตอไป กลุ ม หรื อ การแบ ง ชั้ น เพื่ อ การนํ า เสนอในรู ป ตารางเป น
ได จํานวนนับแยกตามชั้น มีขอแนะนํา ดังนี้
- จํานวนชั้นที่จัดแบง ควรจะอยูระหวาง 10-20
16.2.2 การนําเสนอขอมูล (Data presentation) ชั้น ถามีจํานวนชั้นนอยเกินไป จะทําใหชวงของชั้นกวาง
ก. ในรูปของจํานวน (numerical presentation) มากอาจขาดรายละเอียดของขอมูล แตถามีจํานวนชั้นมาก
ไม ค วรนํ า เสนอข อ มู ล ในรู ป ของค า เฉลี่ ย เพี ย ง
ไปก็อาจไมพบขอมูลในบางชั้น
อยางเดียว แตควรมีคาที่บอกความผันแปรควบคูไปดวย
- ขีดแบงของแตละชั้นตองสอดคลองกับคาของ
โดยทั่วไปจะแสดงคา SD ในวงเล็บ ไมแนะนําการเขียนใน
ขอมูลดิบ
รูปแบบ mean + SD เชน คาเฉลี่ยความดันโลหิตเปน
- ชวงกวางของชั้น ถาเทาๆ กันจะสะดวกในการ
102.3 (SD 11.9) มม.ปรอท ไมแนะนําใหเขียนวา 102.3
คํานวณขั้นตอไป
+ 11.9 มม.ปรอท สําหรับตัวเลขหลังจุดทศนิยม แนะนํา
- ชวงกวางแตละชั้น จะตองแยกจากกันแทจริง
เสนอค า เฉลี่ ย ที่ มี ค า ทศนิ ย มมากกว า ข อ มู ล ดิ บ อยู 1
- ควรหลีกเลี่ยงการจัดชั้นที่เปนชวงเปด
f 226 e
สถิติในการวิจัย
- ในกรณีจัดชั้นไวกอนแลว ถาไมสามารถหา ข . ต ร ว จ ส อ บ ท า ง ต ร ร ก วิ ท ย า (logical
ขอมูลดิบไดก็อาจใชจุดกลางชั้น (mid point) แทน check) เปนการตรวจดูวาตัวแปรที่เกี่ยวของกันนั้นมีความ
ค. กราฟ (graphs) สมเหตุสมผลหรือไม เชน การคํานวณจํานวนครั้งของการ
ปจจุบัน มีโปรแกรมสําเร็จรูป ตางๆ สํา หรับ การ ตั้งครรภซึ่งจะมีคําตอบเฉพาะผูหญิง ดังนั้นขอมูลนี้ใน
นําเสนอขอมูลเปนรูปกราฟหรือแผนภูมิ ซึ่งทําไดสวยงาม กลุ ม เพศชายไม ค วรมี การเตรี ย มก อ นการวิ เ คราะห
แตผูวิจัยควรทราบถึงชนิดของกราฟหรือแผนภูมิที่เลือกใช สามารถให ร หั ส กลุ ม ที่ ไ ม เ ข า ข า ยเพื่ อ แยกออกจากการ
โดยดูจากลักษณะของขอมูล กลาวคือ วิเคราะห จะไดทําการวิเคราะหเฉพาะรหัสกลุมที่มีความ
สําหรับขอมูลเชิงปริมาณ:ฮิสโตแกรม, Frequency เปนไปไดเทานั้น
polygon, Box-plot ค. การตรวจสอบวันเวลา (dates) ในการ
สําหรับขอมูลเชิงคุณภาพ: แผนภูมิแทง, แผนภูมิ วิ เ คราะห บ างอย า ง เช น การวิ เ คราะห ก ารมี ชี วิ ต รอด
วงกลม, แผนภูมิรูปภาพ (Survival analysis) ขอมูลที่บันทึกเกี่ยวกับเวลาทั้งหมดมี
สําหรับแสดงความสัมพันธระหวางตัวแปร 2 ตัว: ความสําคัญ มาก ถามีการลงตัวเลขผิด ผลที่ไดจากการ
Scatter diagrams คํ า นวณก็ ผิ ด พลาด ดั ง นั้ น จึ ง ควรตรวจทานตั ว เลขที่
เกี่ยวของกับเวลาอีกครั้ง ใหแนใจวาบันทึกไดตรง บางครั้ง
16.2.3 การเตรี ย มการก อ นการวิ เ คราะห อาจตรวจสอบคราวๆ เชน ดูเวลาที่เริ่มเปนโรคและเวลาที่
ขอมูล (preparing to analyze data) เสี ย ชี วิ ต ของคนไข แ ต ล ะคน มี ลํ า ดั บ ของเวลาถู ก ต อ ง
การตรวจสอบขอมูลมีความสําคัญมาก ควรทํา หรือไม เปนตน
กอนที่จะมีการวิเคราะหเสมอ แนวทางในการตรวจสอบมี ง. ขอมูลที่สูญหาย (missing data) ในการ
ดังนี้ ตรวจขอมูลกอนการวิเคราะหนั้น มักพบวามีบางตัวแปรที่
ก. ตรวจสอบชว งของข อมูล (range check) ไมสามารถเก็บขอมูลไดครบ ซึ่งอาจเปนไปไดวาผูตอบ
เปนการตรวจดูความเปนไปไดของคาที่บันทึก กรณีของ
แบบสอบถามไม อ ยากเป ด เผยข อ มู ล ในส ว นนี้ หรื อ
ข อ มู ล บอกลั ก ษณะ เช น หมู เ ลื อ ด ถ า มี ก ารบั น ทึ ก ที่
ผูสัมภาษณไมสามารถสํารวจขอมูลสวนนี้ไดครบ เมื่อมี
นอกเหนือจาก A, B, O และ AB แสดงวาเปนขอมูลที่
ขอมูลขาด ผูวิจัยอาจตัดสินใจแยกขอมูลชุดที่ไมครบออก
บันทึกผิดพลาด กรณีขอมูลบอกปริมาณ ใหดูคาต่ําสุดและ
ตางหากจากการวิเคราะห หรืออาจแกไขโดยการประมาณ
คาสูงสุดวามีโอกาสเปนไปไดหรือไม เชน อายุของมารดา
คาสําหรับขอมูลที่ขาดหายไป โดยวิธีใชคาเฉลี่ยของขอมูล
เมื่อมีบุตรคนแรก ชวงอายุที่เปนไปไดคือ 14 ถึง 45 ป ถามี
ที่มีอยูแทนลงไป การแกไขโดยใสคาเฉลี่ยมีความจําเปนใน
คาต่ําเกินไปหรือสูงเกินไปจากชวงนี้ ซึ่งเรียกวา Outliers
การวิ เ คราะห บ างอย า ง เช น การวิ เ คราะห เ ชิ ง พหุ
ตองตรวจสอบดูวาการเก็บขอมูลมีความผิดพลาดหรือไม
(Multivariate analysis) ตัวอยางของขอมูลที่มักขาดไป
การตรวจสอบนี้ ยังมีประโยชน เพื่อพิจารณาแยก
เชน รายได อายุ เปนตน ซึ่งมักประมาณคาโดยใสคาเฉลี่ย
คาบางคาที่ตางจากกลุมมากๆ ออกมากอนการวิเคราะห
กรณีข องขอ มู ลที่ข าดเปน วัน เดือ นป ใหใ สค า โดยใชวั น
เช น ในกรณี ข องผลตรวจทางห อ งปฏิ บั ติ ก าร เพราะถ า
กึ่งกลางของเดือน คือวันที่ 15 และเดือนกึ่งกลางของป คือ
นําเขารวมในการวิเคราะหอาจทําใหคาเฉลี่ยที่ไดเปลี่ยนไป
เดือนที่ 6 หรือ 7
มาก การตรวจสอบทําใหผูวิจัยไดทราบลักษณะของขอมูล
และตัดสินใจวาควรจะนําคาของขอมูลที่เปน Outlier เขา 16.2.4 การวิเคราะหขอมูล (Data analysis)
มาสูการวิเคราะหหรือไม หรืออาจทําการวิเคราะหทั้งแบบ ชนิ ด ของสถิ ติ นิ ย มแบ ง เป น สถิ ติ เ ชิ ง พรรณนา
ที่ใชและไมใช Outlier ของขอมูลนั้นแลวดูผลเปรียบเทียบ (descriptive statistics) และสถิติเชิงอนุมาน (inferential
กัน statistics)
f 227 e
สถิติในการวิจัย
สถิ ติ เ ชิ ง พรรณนาใช สํ า หรั บ การวิ จั ย รู ป แบบ ตรวจสอบการแจกแจงของขอ มู ลวา เปน ไปตามเงื่ อ นไข
เชิงสํารวจและพรรณนา ซึ่งไมมีการทดสอบสมมติฐาน สมมติ (Assumption) หรือไม เชน มีการแจกแจงแบบปกติ
สถิ ติ เ ชิ ง อนุ ม านใช สํ า หรั บ การวิ จั ย รู ป แบบเชิ ง หรือไม ถาไมเปนไปตามเงื่อนไขสมมติ อาจตองมีการ
วิเคราะหและเชิงทดลอง ที่ตองมีการทดสอบสมมุตติฐาน แปลงขอมูลเชน ใช logarism เปลี่ยนลักษณะของการ แจก
เพื่อตอบคําถามวิจัย แจงใหเปนแบบปกติกอน จึงทําการวิเคราะหตอไป
การอนุ ม าน คื อ การอ า งสรุ ป ผลที่ ไ ด จ าก 3. ขั้นตอนการวิเคราะหทางสถิติ (Statistical
การศึกษาตัวอยาง เปนลักษณะของประชากรเปาหมาย analysis) ขั้นตอนนี้เปนการวิเคราะหผลโดยใชโปรแกรมที่
ถ า ตั ว อย า งที่ สุ ม มานั้ น ไม เ ป น ตั ว แทนที่ ดี ข องประชากร เหมาะสม โดยทั่วไป โปรแกรมสําหรับขอมูลเชิงลักษณะ
ย อ มจะนํ า ไปสู ก ารสรุ ป ที่ ผิ ด พลาด ถึ ง แม ว า จะใช วิ ธี และขอมูลเชิงจํานวนจะแตกตางกัน และโปรแกรมสําหรับ
วิเคราะหอยางถูกตองก็ตาม นอกจากนี้ ความนาเชื่อถือ วิเคราะหการแจกแจงขอมูลแบบปกติ (bell shape) และ
ของผลการอนุมานยังขึ้นอยูกับปจจัย 2 อยาง คือ จํานวน การแจกแจงข อ มู ล ที่ มี ก ารเบ ข องกราฟ (skew) จะไม
ตัวอยาง และ ธรรมชาติความผันแปรมากหรือนอย ใน เหมือนกัน ดังนั้น นักวิจัยจึงควรรูกอนวา ขอมูลเปนชนิดใด
ประชากรที่ศึกษา และการแจกแจงขอมูลเปนแบบปกติหรือไม
ถาการศึกษาใชจํานวนตัวอยางมาก การอนุมาน โปรแกรมการวิเคราะหอาจแยกตามการใชงานได
จะมีความนาเชื่อถือมากขึ้น ขณะเดียวกัน ถาคุณลักษณะ เปน 3 กลุมใหญ ดังนี้
ในประชากรศึกษามีความผันแปรนอ ย การอนุมานจะมี ก. การประมาณค า พารามิ เ ตอร (Parameter
ความนาเชื่อถือมากขึ้น estimation)
การวิเคราะหสําหรับสถิติเชิงพรรณนาและสถิติ ข. การทดสอบสมมติฐาน (Hypothesis testing)
เชิงอนุมานใชกระบวนการวิเคราะหอันเดียวกัน เพียงแต - การทดสอบสําหรับขอมูลชนิดปริมาณ
สถิติเชิงพรรณนาไมตองมีการพิสูจนสมมติฐานหรือการดู - การทดสอบสําหรับขอมูลชนิดกลุม
ความแตกตางกันอยางมีนัยสําคัญทางสถิติเหมือนในสถิติ - การทดสอบโดยการวิเคราะหความแปรปรวน
เชิงอนุมาน โดยทั่วไปกระบวนการในการวิเคราะหมีสาม ค. การดูความสัมพันธของตัวแปรและการทํานาย
ขั้นตอน ดังนี้ คาตัวแปร (Correlation and Regression)
1. ขั้ น ต อ น ก า ร จั ด ก า ร ข อ มู ล เ พื่ อ ก า ร
วิเคราะห (Data management) เปนขั้นตอนที่ทํากอนจะ 16.3 การประมาณคาพารามิเตอร (Parameter
เริ่ ม วิ เ คราะห โดยมี ก ารลงรหั ส และใส ค า ข อ มู ล ใน estimation)
คอมพิวเตอร ในขั้นตอนนี้ควรมีนักสถิติดูแลใกลชิดรวมกับ ค า พารามิ เ ตอร (Parameter) คื อ ค า ที่ บ อก
ผูที่จัดการขอมูล ซึ่งประกอบดวย คนลงรหัส, คนปอน ลักษณะของประชากร สวนคาสถิติ (Statistics) คือคาที่
ขอ มูลเขา คอมพิว เตอรแ ละโปรแกรมเมอร ทั้ ง นี้เพื่อ การ บอกลักษณะของตัวอยางการใชสัญลักษณจะตางกัน ดังนี้
เตรียมขอมูลใหพรอมสําหรับการวิเคราะหดวยโปรแกรม
สําเร็จรูปทางสถิติ ตอไป คาที่วัด Parameter Statistics
2. ขั้ น ตอนการวิ เ คราะห เ ชิ ง สํ า รวจข อ มู ล
(Exploratory data analysis) ขั้นตอนนี้จะเริ่มวิเคราะห คาเฉลี่ย μ X
โดยตรวจดู ผ ลเบื้ อ งต น ที่ เ ป น ไปได โดยอาจทํ า การหา คาความแปรปรวน σ2 S2
คาความถี่, รอยละ, คาเฉลี่ย เปนตน ถาคาใดมีคาสูงหรือ คาเบี่ยงเบน σ S
ต่ําจนผิดปกติจากกลุม หรือที่เรียกวา Outlier จะได มาตรฐาน
พิจารณาวาควรนําเขาไปวิเคราะหหรือไม นอกจากนี้ จะได คาสัดสวน P p
f 228 e
สถิติในการวิจัย
ลักษณะ ประชากรกลุม ประชากรสองกลุม คา SE จึงแตกตางจาก SD กลาวคือ SD เปน
การวัด เดียว การบอกความผั น แปรของข อ มู ล จากตั ว อย า งว า การ
คาเฉลี่ย ประมาณค า เฉลี่ ย ประมาณผลตางของ กระจายเปนอยางไร ขณะที่ SE จะบอกถึงความผันแปร
ของความดั น โลหิ ต ค า เฉลี่ ย ความดั น ของคาสถิติตางๆ (เชน Sample means) ซึ่งคา SE มีความ
ในประชากรเขตเมือง โลหิ ต ระหว า งคนใน เกี่ยวของกับ SD และ n โดยสูตรดังนี้
เขตเมืองและชนบท SE = SD / n
คาสัดสวน ประมาณค า สั ด ส ว น ประมาณผลตางของ การประมาณคาพารามิเตอรนิยมการประมาณ
หรือ ของความเครี ย ดใน สัดสว นความเครียด แบบเปนชวง (Interval estimation) โดยประเมินวาจะมี
รอยละ ประชากรเขตเมือง ระหว า งคนในเขต โอกาสเท า ใดที่ ค า พารามิ เ ตอร จ ะตกอยู ใ นช ว งนั้ น การ
เมืองและชนบท รายงานผลจะบอกคา 1 คา รวมกับชวงของคาตามรอยละ
ของความเชื่อมั่น (Confidence Intervals หรือ CI) เชน
การประมาณคาพารามิเตอร คือ การใชสถิติใน ความดันโลหิตโดยเฉลี่ยในประชากรเทากับ 135 (130.5,
การคาดคะเนผลที่ เ ป น ของประชากร (ค า เฉลี่ ย และค า 139.5) มม.ปรอท หมายความวาถาสุมตัวอยาง 100 ครั้ง
ความแปรปรวน) จากการศึกษาในตัวอยางที่สุมออกมา จะมี 95 ครั้งที่คาเฉลี่ยจะมีคาเทากับ 130.5 ถึง 139.5 มม.
เนื่องจากผลการศึกษาที่นักวิจัยไดจากการเก็บขอมูลจะ ปรอท
เปนลักษณะของตัวอยาง (ยังไมใชลักษณะของประชากร) คา Parameter = คา Statistics + k × SE
ซึ่งแทจริงแลว เกิดขึ้นจากเราสุมมาหนึ่งแบบ คาเฉลี่ยของ โดยที่ k คื อ ค า สั ม ประสิ ท ธิ์ ค วามเชื่ อ มั่ น (Reliability
ตัวอยาง (Sample mean, X ) ที่คํานวณได มาจาก coefficient) ซึ่งไดแกคา t หรือ Z
การศึกษาครั้งเดียวที่ใชจํานวน n ชิ้น สุมออกมาจาก การคํานวณชวงของความเชื่อมั่น (Calculating confidence
ประชากรที่มีจํานวน N ชิ้น ดังนั้น หากมีการสุมใหมโดยใช Intervals)
จํานวน n ชิ้นอีกครั้งเพื่อทําการคํานวณคาเฉลี่ยของ 16.3.1 การประมาณค า พารามิ เ ตอร จ าก
ตัวอยางครั้งใหม ก็จะไดคาเฉลี่ยอีกคาหนึ่ง ( X2 ) ซึ่งมักไม คาเฉลี่ยของตัวอยาง (Mean estimation)
เทากันพอดีกับคาเฉลี่ยคาแรก ( X1 ) ถาเราทําการสุมมาก i ตัวอยางชุดเดียว (One sample)
σ
ครั้ ง ขึ้ น อี ก ในที่ สุ ด เราจะได ค า เฉลี่ ย ของตั ว อย า ง มี ค า คาเฉลี่ยของประชากร (μ) = X ± Ζ
n
ตางๆ คือ X1 , X2 , X3 ....................... Xn ถานําคาเฉลี่ย X = คาเฉลี่ยของตัวอยาง
ของตัวอยางทั้งหลายเหลา นี้มาดูการแจกแจง จะพบวา
σ = คา SD ในประชากร
เปนรูปแบบการแจกแจงปกติ (Normal distribution) และ
n = จํานวนตัวอยาง
มีคุณสมบัติดังนี้ คือ
Z = คาปกติมาตรฐานซึ่งขึ้นกับการกําหนด
ก. คาเฉลี่ยของ Sample means ( μ X ) มีคา
ชวงความเชื่อมั่น
เทากับคาเฉลี่ยของประชากร (μ) โดยที่ 90 % CI, Z = + 1.64
ข. คาเบี่ยงเบนมาตรฐาน ของ Sample means 95 % CI, Z = + 1.96
( σ X ) มีคาเทากับ σ / n 99 % CI, Z = + 2.58
คาเบี่ยงเบนของ Sample means หรือคือชวงที่
แตในทางปฏิบัติแลวคา σ มักจะไมทราบ ดังนั้น
เปนไปไดของคา μ เรียกวา Standard error ของ mean จะใช SD ในตัวอยางแทน และใชคา t แทนคา Z ซึ่งคา t ก็
อันเปนที่มาของชื่อ Standard Error (SE) นั่นเอง ไดจากการเปดตารางแจกแจงคา t โดยกําหนดให degree
f 229 e
สถิติในการวิจัย
of freedom (df) เปน n-1 ดังนั้นการประมาณคา μ จะ กลุมที่ไมเกี่ยวของกัน เชน การดูผลของการรักษาดวยยา ก
เปนดังนี้ และ ยา ข
μ = X ±t
S กําหนดให X1 , X2 = คาเฉลี่ยของตัวอยางชุดที่ 1 และ 2
n S1, S2 = SD ของตัวอยางชุดที่ 1 และ 2
ถ า ขนาดของตั ว อย า งมี จํ า นวนมากพอ (อาจ
n1, n2 = ขนาดตัวอยางชุดที่ 1 และ 2
กลาวไดวามากกวา 30) การแจกแจงคา t ก็จะเขาใกล
μ1, μ2 = คาเฉลี่ยของประชากรชุดที่ 1 และ 2
คา Z ก็อาจใชคา Z แทนได
ในทางทางปฏิบัตินั้นไมอาจทราบคาของความ
ตัวอยางที่ 16.2 จากการสุมตัวอยางประชากรปกติ 100
แปรปรวนของประชากร (σ2 ) ในแตละกลุมจึงอาจมีการ
คน พบวาคาเฉลี่ยของอัตราการเตนของหัวใจเทากับ 85
ทดสอบวา σ2 ของทั้ง 2 กลุมเทากันหรือไม โดยใช F-test
ครั้ง/นาที และ SD เทากับ 10.2 ครั้ง/นาที จงประมาณ
แตในที่นี้จะกําหนดให σ2 เทากันทั้ง 2 กลุม ( σ12 = σ22 )
ค า เฉลี่ ย ของอั ต ราการเต น ของหั ว ใจประชากรทั่ ว ไปที่
ดังนั้นคา SE ของผลตางเฉลี่ยสามารถคํานวณไดจาก
95 % CI
(n1 − 1)S12 + (n2 − 1)S 22
การคํานวณ Sp2 (Pooled variance) =
n1 + n2 − 2
X = 85, SD = 10.2, n = 100
1 1
ที่ 95 % CI, Z = 1.96 SE ของ X1 - X2 = Sp +
n1 n2
(10.2)
ดังนั้น μ = 85 ± 1.96
100 ดังนั้น CI ของ μ1 - μ2 = ( X1 - X2 ) + ( t หรือ Z) SE
= 85 + 2.0
คา t จากตารางเปดที่ df = n1 + n2 - 2 แตถาตัวอยางมี
= 83.0, 87.0
ขนาดใหญพอ (กลุมละ 30 ขึ้นไป) ก็ใชคา Z ได
ตอบ
คาเฉลี่ยของอัตราการเตนของหัวใจในประชากรอยู ตัวอยางที่ 16.3 จากการวัดระดับ serum amylase ใน
ในชวง 83 ถึง 87 ครั้ง /นาที ประชากร 2 กลุม ไดคาเฉลี่ยและ SD ดังตาราง (มีหนวย
ตอ 100 ml)
จากตัวอยางขางตน จะเห็นวาชวงของการประมาณ Subjects n X S
จะขึ้นอยูกับ Hospitalised 22 120 40
1. ขนาดตัวอยาง (n) ถามีคามากชวงการประมาณ Healthy 15 96 35
จะแคบลงและมีความแมนยํามากขึ้น
2. คาความผันแปรในที่นี้คือคา (SD)(2) ถามีคามาก คํานวณ
จะทําใหชวงการประมาณกวางขึ้นความแมนยํา 1 1
คา SE ของ X1 - X2 = Sp +
ก็นอยลง 15 22
Sp2 = (22 − 1)(40) + (15 − 1)(35)
2 2
ii ตัวอยางสองชุด (Two samples) เปนการ
ประมาณคาผลตา งของค าเฉลี่ยจากตัว อยา ง 2 ชุด 22 + 15 − 2
= 1450
ซึ่งแบงเปน 2 กรณี คือ
iia ตัวอยางที่เปนอิสระกัน (Independent Sp = 38.08
samples) หมายถึงตัวอยาง 2 ชุดนี้มาจากประชากร 2
f 230 e
สถิติในการวิจัย
แทนคาใน SE ของ X1 - X2 จะได = 12.75 ตัว อย า งที่ 16.4 จากการศึ ก ษาผลของยาคุ มกํ า เนิด ใน
คา t ที่ 95 % CI, df = 35 มีคา 2.03 ผูหญิง 9 คน โดยชั่งน้ําหนักกอนและหลังใหยา 3 เดือน
ดังนั้น 95% CI ของ μ1-μ2 = (120-96) + 2.03(12.75) ไดผลดังตาราง จงประมาณวาที่ 95% CI คาความ
= -1.88 ถึง 49.88 แตกตางของน้ําหนักตัวโดยเฉลี่ยเปนเทาไร
ตอบ
สามารถสรุปไดวาที่ความเชื่อมั่น 95 % ความแตกตางของ น้ําหนัก
ระดับ Serum amylase ในคน 2 กลุมอยูระหวาง -1.88 คนที่ กอน หลัง ผลตาง (di)
ถึง 49.88 ซึ่งชวงนี้ครอบคลุม 0 ดวย จึงชี้ใหเห็นวาไมมี 1 120 123 +3
ความแตกตางกันระหวางคาเฉลี่ยของระดับ Serum 2 141 143 +2
amylase ในคน 2 กลุมนี้ จะเห็นวาคาประมาณนี้จะให 3 130 140 +10
ผลสรุ ป เหมื อ นกั บ การทดสอบสมมติ ฐ านแบบสองทาง 4 150 145 -5
(Two-tailed test) ซึ่งจะกลาวในเรื่องการทดสอบ 5 135 140 +5
สมมติฐานตอไป 6 140 143 +3
7 120 118 -2
iib ตั ว อ ย า ง ที่ มี ค ว า ม เ กี่ ย ว ข อ ง กั น 8 140 141 +1
(Dependent samples) ในกรณีที่ตัวอยาง 2 ชุด มีความ 9 130 132 +2
เกี่ ย วข อ งกั น ได แ ก การวั ด ก อ นและหลั ง การทดลอง,
คํานวณ
การศึกษาแบบ matched pair, การศึกษาแบบ Cross-
∑ di 19
over design ความแตกต า งของข อ มู ล ที่ วั ด ได นี้ จ ะเป น คาเฉลี่ยของผลตาง ( d ) = = = 2.11
n 9
ความแตกตางในแตละคาสังเกต ดังนั้น การวิเคราะหจะนํา ∑(di − d)2
Sd = =
ผลตางที่เปลี่ยนแปลงในแตละคาสังเกตมาทําการคํานวณ n−1
เชน การดูผลการเปลี่ยนแปลงน้ําหนักตัวในผูหญิงกอน 4.197
และหลังการรับประทานยาคุมกําเนิดเปนเวลา 3 เดือน 4.197
คา SE ของ d = = 1.40
หรือในกรณีที่ขอมูลวัดจากคนละกลุมกันแตทั้ง 2 9
คา t ที่ df = 9 - 1 = 8 มีคา 2.31
กลุมมีการจัดใหเหมือนกันเปนคูๆ (Matched pairs) ตาม
ดังนั้น 95 % CI ของคาเฉลี่ยของผลตาง
ป จ จั ย ที่ คิ ด ว า จะมี ส ว นเกี่ ย วข อ งก็ จ ะถื อ ว า ข อ มู ล ทั้ ง
= 2.11 ± (2.31 × 1.40)
2 ชุดเกี่ยวของกัน แมแตการศึกษาในฝาแฝด, สวนของ
= - 1.12 ถึง 5.34
อวัยวะที่มี 2 สวน เชน ตาซาย/ขวา, ไตซาย/ขวา เปนตน
Sd ตอบ
CI ของคาผลตาง ( d ) = d ± t. สรุปไดวามีความเชื่อมั่น 95% ที่คาเฉลี่ยน้ําหนัก
n
โดยที่ d = คาเฉลี่ยของผลตางในแตละคู ตั ว ที่ เ ปลี่ ย นแปลงในผู ห ญิ ง หลั ง จากรั บ ประทานยา
Sd = คา SD ของผลตาง คุมกําเนิด 3 เดือน มีคาตั้งแต น้ําหนักลดลง 1.12 ปอนด
n = จํานวนคูของขอมูล จนถึงน้ําหนักเพิ่มขึ้น 5.34 ปอนด นอกจากนี้ชวงที่ไดยัง
t = คา t ที่ระดับความเชื่อมั่น ดวย df = n-1 คลุม 0 ดังนั้นน้ําหนักตัวกอนและหลังรับประทานยาไมมี
ขอสมมติ (Assumption) ในที่นี้ คือ การแจกแจงของ ความแตกตางกัน
ผลตางในแตละคูจะตองแจกแจงเปนแบบปกติ
f 231 e
สถิติในการวิจัย
16.3.2 การประมาณคาพารามิเตอรจากคา การประมาณคาผลตางของสัดสวนในตัวอยาง 2 ชุด
สัดสวนของตัวอยาง (Proportion estimation) ในกรณีที่ โดยใชสูตร
ตั ว วั ด เป น แบบ Binary หรื อ Dichotomous ค า ที่ จ ะใช p1 (1 − p1 ) p 2 (1 − p 2 )
P1 - P2 = (p1 - p2) ± Z +
สรุปผลจะเปนรูปแบบสัดสวนหรือรอยละ n1 n2
i ตัวอยางชุดเดียว โดยทดสอบคา np และ n(1-p) ในแตละชุดมากกวา 5
ให p เปนคาสัดสวนของตัวอยาง = จํานวนตัวอยางที่สนใจ
จํานวนตัวอยางทั้งหมด ตั ว อย า งที่ 16.6 ในการศึ ก ษาเปรี ย บเที ย บผลของการ
เชน สัดสวนของนักศึกษาที่สูบบุหรี่ รักษาอาการปวดหลังเรื้อรังดวยการใหยาและการผาตัด
= จํานวนนักศึกษาที่สูบบุหรี่ พบวาในคนไขที่ไดรับการผาตัด100 ราย หายจากการปวด
จํานวนนักศึกษาทั้งหมด หลัง 80 ราย ขณะที่คนไขไดรับยา 100 ราย เชนกัน
SE ของ p =
p(1 − P) หายเพียง 50 ราย จงประมาณวาที่ 90% CI ผลตางของ
n สัดสวนที่หายจากการปวดหลังในคนไขที่ไดรับการรักษา
โดยการผาตัดและรับประทานยาเปนเทาไร
เนื่องจากการวัดผลเปนเพียงเหตุการณ 2 อยาง คือ ใช/ คํานวณ
ไมใช ดังนั้นการแจกแจงเปนแบบทวินาม (Binomial นั่นคือประมาณคา P1 - P2 ที่ 90 % CI นั่นเอง
distribution) แตเมื่อ n มีจํานวนมากจนคา np และ n (1- p1 = 0.8, p2 = 0.5
p) มากกวา 5 ก็สามารถประมาณใหเปนการแจกแจงแบบ n1 = 100, n2 = 100
ปกติได โดยการประมาณคาจะเปนดังนี้
p(1 − P)
P = p±Z ทดสอบคา np และ n(1-p) ในแตละกลุมมากกวา 5
n
ดังนั้น 90 % CI ของ P1 - P2
ตัวอยางที่ 16.5 จงประมาณคาที่ 95% CI ของสัดสวน 0.8 × 0.2 0.5 × 0.5
= (0.8 - 0.5) ± 1.64 +
100 100
การสูบบุหรี่ในนักศึกษาชาย ซึ่งสุมตัวอยางมา 50 คน
= 0.3 ± 0.11
พบวาสูบบุหรี่ 15 คน
= 0.19, 0.41
คํานวณ
ตอบ
15
p = = 0.30 สรุ ป ว า ที่ ระดับ ความเชื่ อ มั่น 90% สัด สว นที่ จ ะ
50
np = 15 > 5 และ n(1-p) = 35 จึงใชการ หายจากการปวดหลั ง ด ว ยวิ ธี ก ารผ า ตั ด สู ง กว า การ
แจกแจงแบบปกติได ดังนั้นที่ 95 % CI ของ P = 0.30 ± รับประทานยาอยูระหวาง 0.19 และ 0.41 หรือ 19% ถึง
(.3)(1 − .3) 41% และความแตกตางนี้มีนัยสําคัญทางสถิติดวยเพราะ
1.96 = 0.17, 0.43
50 ไมคลุม 0 อยูในชวงนั้น
ตอบ จะเห็ น ว า การประมาณค า parameter ทํ า ให
สรุปวา มีความเชื่อมั่นได 95% ที่สัดสวนการสูบบุหรี่ใน ทราบถึงลักษณะของประชากรโดยใชผลจากตัวอยาง ใน
นักศึกษาชายมีคาอยูระหวาง 0.17 และ 0.43 หรือ 17% ป จ จุ บั น วารสารทางการแพทย จ ะกํ า หนดให ก ารเสนอ
ถึง 43% ผลงานตองรายงานคาประมาณที่ชวงความเชื่อมั่นไวดวย
ii ตั ว อย า งสองชุ ด ในที่ นี้ จ ะกล า วถึ ง เฉพาะ โดยนิยมใชที่ 95% CI
ตัวอยาง 2 ชุด ที่ไมเกี่ยวของกัน (Independent samples)
f 232 e
สถิติในการวิจัย
16.4 การทดสอบสมมติฐาน (Hypothesis testing) การตั้งในลักษณะนี้ จะเห็นวาระบุเพียงแตวาแตกตางกัน
การทดสอบสมมติฐานในการวิจัยนั้น หมายถึง แตไมทราบวาคนกลุมไหนจะมีคาเฉลี่ยความดันโลหิตสูง
การทดสอบเพื่อตอบคําถามของการวิจัยวาเปนไปตามที่ตั้ง กวา การตั้งแบบนี้เรียกวา ตั้งแบบสองหาง คือ Two-
ไวหรือไม โดยคําถามการวิจัยจะนําไปสูการตั้งสมมติฐาน tailed test แตถาตั้งแบบเจาะจงอยางใดอยางหนึ่งคือ Ha
การวิจัย และมีการทดสอบสมมติฐานทางสถิติตอไป ดัง : คาเฉลี่ยความดันโลหิตในผูสูงอายุเขตเมืองสูงกวาเขต
ตัวอยางคําถามในการวิจัย: คาเฉลี่ยของความดันโลหิตใน ชนบท
ผู สู ง อายุ เ ขตเมื อ งต า งกั บ คนในเขตชนบทหรื อ ไม ?
สมมติฐานการวิจัย ซึ่งจะนําไปสูการทดสอบทางสถิติจะ μ1 >μ2 หรือ μ1 – μ2 > 0
เปนดังนี้ การตั้งแบบเจาะจงลงไป เรียกวา ตั้งแบบหางเดียว คือ
“คาเฉลี่ยของความดันโลหิตในผูสูงอายุเขตเมือง One-tailed test ซึ่งจะทําใหไดคําตอบที่เฉพาะลงไป แต
และเขตชนบท ไมแตกตางกัน” ดังนั้นจะนําไปสูการ การตั้งแบบนี้จะทําไดยากเพราะกอนที่จะวิเคราะหขอมูล
ทดสอบทางสถิติตอไป เพื่อพิสูจนสมมติฐานขางตนวาเปน นั้น ตองตั้งสมมติฐานกอนจึงยากที่จะกําหนดลงไปใน
จริงหรือไม การทดสอบสมมติฐานนี้อาจเรียกอีกชื่อหนึ่งวา ทิศทางใดทิศทางหนึ่ง การตั้งแบบสองหางจึงนิยมมากกวา
การทดสอบนัยสําคัญ (Significance test) ก็ได แบบหางเดียว แตถามีหลักฐานเพียงพอที่จะสงสัยวากลุม
หนึ่งดีกวาอีกกลุมหนึ่งก็ควรตั้งแบบหางเดียว
ขั้นตอนในการทดสอบสมมติฐาน (Step taken in
hypothesis testing) ขั้ น ต อ น ที่ ส อง :ก า ร ตั้ ง ร ะดั บนั ยสํ าคั ญ
ขั้ น ตอนแรก: การตั้ง สมมติฐ าน สมมติฐ าน (Significance level) ในการสรุปผลการทดสอบนั้นจะสรุป
ทางสถิติแบงออกเปน 2 ชนิด คือ ตามขอมูลที่ไดมา ดังนั้นจะตองมีความผิดพลาดเกิดขึ้นได
ก. สมมติฐานวาง (Null hypothesis) ใชตัว แตถาความผิดพลาดนั้นไมเกินจากที่กําหนดไวก็ถือวาผลที่
ย อ ว า Ho หมายถึ ง สมมติ ฐ านที่ ตั้ ง ขึ้ น โดยให ไ ม มี ค วาม ไดเปนความแตกตางที่เกิดขึ้นจริง ไมใชเปนการบังเอิญ
แตกตางระหวางสิ่งที่ตองการเปรียบเทียบ ดังตัวอยาง ความผิดพลาดแบงออกเปน 2 ชนิด คือ
Ho : คาเฉลี่ยความดันโลหิตในผูสูงอายุเขตเมืองไมตาง ก. Type I error เปนความผิดพลาดที่เกิดขึ้น
กับเขตชนบท เมื่อปฏิเสธ(Reject) Ho เมื่อ Ho นั้นถูกตอง ดังเชน Ho ที่ตั้ง
โดยเขียนในรูปของเครื่องหมายทางสถิติคือ ไววาคาเฉลี่ยความดันโลหิตของคน 2 กลุมไมตางกันนั้นถา
μ1 = μ 2 หรือ μ1 – μ2 = 0 ถูกตองแลวแตเราปฏิเสธ คือไมยอมรับ เชนนั้น ความ
จะเห็ น ว า การตั้ ง สมมติ ฐ านทางสถิ ติ จ ะใช ตั ว ผิดพลาดก็เกิดขึ้น ดังนั้น Type I error ก็คือระดับนัยสําคัญ
พารามิเตอร ทั้งนี้เพราะวาผลการทดสอบจะนําไปสรุปเปน ซึ่งใชสัญลักษณ α (Alpha)
ของประชากร ข. Type II error เป น ความคลาดเคลื่ อ นที่
ข. สมมติฐานแยง(Alternative hypothesis) เกิดขึ้นเนื่องจากไมปฏิเสธ Ho ทั้งๆที่ Ho นั้นผิดหมายความ
ใชตัวยอวา Ha หมายถึง สมมติฐานที่ตั้งขึ้นตรงกันขามกับ วาจริงๆแลวความดันโลหิตเฉลี่ยในคน 2 กลุมนั้นตางกัน
Ho ทั้งนี้เพื่อคนหาคําตอบใหไดวามีความแตกตางจริง (Ha ถูกตองนั่นเอง) แตสรุปผลวาไมตางกัน (ยอมรับ Ho)
หรื อ ไม ข อ มูล ที่ มี อ ยู เ พี ย งพอหรื อ ไม ที่ จ ะสนั บ สนุ น ความผิดพลาดชนิดนี้ใชสัญลักษณ β (ฺBeta) ดังสรุปใน
สมมติฐานแยง ดังตัวอยาง ตารางขางลางนี้
Ha : คาเฉลี่ยความดันโลหิตในผูสูงอายุ เขตเมืองตางกับ
เขตชนบท
μ1 ≠ μ2 หรือ μ1 – μ2 ≠ 0
f 233 e
สถิติในการวิจัย
ความดันโลหิตเฉลี่ยของ 2 กุลม (Proportion) แตถาเก็บเปนเชิงปริมาณการวัดจะออกมา
การตัดสิน ไมตางกัน ตางกัน ในรูปของคาเฉลี่ย (Mean) โดยทั้งนี้ขึ้นอยูกับสมมติฐาน ที่
(Ho true) (Ho false, Ha true) กําหนดไวนั่นเอง
ปฏิเสธ Ho Type I error Power ข. ขอตกลงเบื้องตน (Assumption) การ
(Reject Ho) (α) (1–β) วิเคราะหเพื่ออนุมานทางสถิตินั้น จะมีความถูกตองเมื่อ
ไมปฏิเสธ Ho ถูกตอง Type II error ข อ มู ล นั้ น เ ป น ไ ปตามข อ ตกลงเบื้ องต นที่ กํ า ห น ด
(Do not (1–α) (β) ขอกําหนดที่ควรพิจารณาไดแก
reject Ho) - ขอมูลนั้นมีการแจกแจงแบบปกติ (Normal
distribution)
โอกาสที่ ตัด สิ น ว า ปฏิเ สธ Ho เมื่อ Ho ผิด นั้น จะ - ตั ว อ ย า ง ที่ ไ ด เ ป น ตั ว อ ย า ง ที่ สุ ม ม า
เทากับ 1–β ซึ่งเรียกวา อํานาจของการทดสอบทาง (Random samples)
สถิติ (Power of the statistical test) การตั้งระดับนัย - ทราบค า ความแปรปรวนของประชากร
สําคัญโดยทั่วไปจะนิยมใชคา α ที่ 0.05 หมายความวาจะ หรือไม (Population variance) ซึ่งในทาง
ยอมใหสรุปผิดไดไมเกิน 5 ครั้ง ใน 100 ครั้ง หรือยอมใหผิด ปฏิ บั ติ เ รามั ก จะไม ท ราบและจะใช ข อง
ไดเพียง 1 ใน 20 นั้นเอง แตถาตองการใหมีนัยสําคัญสูง ตัวอยาง คือ S2 (Sample variance) แทน
กวานี้ก็ให α นอยลงมาได เชน α=0.01 หรือตั้งคา α ไว
มากกวานี้คือ α=0.10 ซึ่งในทางสังคมศาสตรนิยมตั้งคา วิธีการทดสอบคาเฉลี่ย และคาสัดสวน สําหรับ
ตรงคานี้เพราะการวิจัยไมไดเกี่ยวของกับสิ่งมีชีวิต ตัวอยาง ชุดเดียว และ สองชุด ไดแก Z-test และ t-test
การตัดสินวาจะปฏิเสธ Ho หรือไมนั้น จะดูจาก (การเลื อ กใช วิ ธี ก ารต า งๆ และเงื่ อ นไขจะกล า วในการ
คา p-value ซึ่งหมายถึง โอกาสที่จะเกิดผิดพลาดในการที่ ทดสอบ) โดยมี สู ต รของการคํ า นวณค า สถิ ติ ที่ ท ดสอบ
จะปฏิเสธ Ho ในขณะที่ Ho ถูกตอง ตัวอยางเชน ในความ โดยทั่วไปคือ
เปนจริงแลวความดันโลหิตเฉลี่ยของทั้ง 2 กลุมไมตางกัน Test statistic = Observed value – Hypothesised value
Standard error
(Ho ถูกตอง) แตไปสรุปวาตางกัน ดังนั้นถาคา p นอยกวา
Test statistic หมายถึง คา Z และ คา t
α ที่ตั้งไว ก็แสดงวามีขอมูลเพียงพอที่จะปฏิเสธ Ho และ
Observed value หมายถึง คาสถิติของตัวอยาง เชน X , p
ยอมรับ Ha วาคาเฉลี่ยทั้ง 2 กลุมตางกันอยางมีนัยสําคัญ
Hypothesised value หมายถึงคาที่กําหนดไวใน Ho เชน
ทางสถิติ แตถาคา p มากกวา α ก็จะไมสามารถปฏิเสธ
μo สําหรับกลุมเดียวถาเปน 2 กลุม
Ho แสดงวาคาเฉลี่ยทั้ง 2 กลุม ไมตางกัน (รายละเอียดจะ
มักจะเปน 0 เชน μ1 – μ2 = 0
กลาวในขั้นตอนที่ 4 และ 5)
Standard error หมายถึง คา SE ของ mean หรือ
proportion ดังไดกลาวแลวในเรื่อง
ขั้ น ตอนที่ ส าม: การเลื อ กวิ ธี ก ารทางสถิ ติ
การประมาณคา
(Statistical test) การเลือกใชวิธีการทดสอบนั้นจะคํานึงถึง
ตัววัดเปนหลักโดยคาที่วัดจะขึ้นอยูกับลักษณะของขอมูลที่
ขั้นตอนที่สี่ : คํานวณคาสถิติ และ p-value
เก็บมานอกจากนี้ยังตองคํานึงถึงขอสมมติ (Assumption)
เมื่อเลือกใชวิธีใดๆ แลวอาจคํานวณโดยใชเครื่องคิดเลข
ที่กําหนดดังจะกลาวตอไปนี้
โดยแทนคาลงไปในสูตร แตถางานวิจัยใหญๆที่มีขอมูล
ก. ขอมูล (Data) ถาขอมูลที่เก็บมาเปน
จํานวนมากตองใชโปรแกรมทางสถิติชวยในการวิเคราะห
เชิ ง คุ ณ ภาพการวั ด จะออกมาในรู ป ของค า สั ด ส ว น
เชน SPSS, SAS, STATA etc โดยเครื่องจะคํานวณคา
f 234 e
สถิติในการวิจัย
p-value ให แตสิ่งที่ควรคํานึงถึงคือการเลือกวิธีทดสอบ จากตารางใช สู ต รสํ า หรั บ การทดสอบค า เฉลี่ ย ของ
เพราะถาเลือกวิธีการผิดผลการวิเคราะหที่ไดก็ผิด ตัวอยางชุดเดียว
X − μo
t =
ขั้นตอนที่หา : การสรุปผล เมื่อไดคา p แลวทํา S/ n
การเปรียบเทียบกับ α ที่กําหนดไววาจะปฏิเสธ Ho 96 − 120
= = - 2.66
35 / 15
หรือไมปฏิเสธ Ho (จะไมสรุปวายอมรับเพียงแตสรุปวาไมมี
หลักฐานเพียงพอที่จะปฏิเสธ Ho) กอนที่จะกลาวถึงการ
เปดตารางคา t ที่ df = 14 ไดแก t = 2.14 คา
ดําเนินการทดสอบสมมติฐานเพื่อทดสอบคาเฉลี่ย และ
p-value ไดแก พื้นที่ที่อยูมากกวาคา t = 2.66 และนอย
สัดสวนในตัวอยางชุดเดียวและสองชุด จะสรุปการเลือกใช
กวาคา t = -2.66 ดังรูป ซึ่งจากรูปคา p-value ทั้ง 2 ขาง
วิธีการ สูตรตางๆ และเงื่อนไขไวในตารางดังนี้
รว มกั นแ ล วน อ ย ก ว า 0.05 ถ า คํ า น ว ณ ค า p ด ว ย
16.4.1 การทดสอบคาเฉลี่ย
คอมพิวเตอรจะไดคา p เทากับ 0.0186
i ตั ว อย า งชุ ด เดี ย ว เพื่ อ ดู ว า ค า เฉลี่ ย ของ
นั่นคือ ปฏิเสธ H0 สรุปวาคาเฉลี่ยของ serum
ตัวอย างที่สุมมานั้น มีความแตกตางไปจากคาเฉลี่ยของ
amylase ตางจากของประชากรที่เทากับ 120 units/100
ประชากรหรือไม
ml อยางมีนัยสําคัญทางสถิติ (p = 0.0186 หรือ p <
ให X = คาเฉลี่ยของตัวอยาง
n = จํานวนตัวอยาง 0.05) หรือจะกลาวอีกอยางหนึ่งวาถาคา μ = 120 (Ho
ถูกตอง) แลวโอกาสที่จะปฏิเสธ Ho ขณะที่ Ho ถูกตองมีได
μo = คาเฉลี่ยของประชากร
ไมเกิน 0.05 จากขอมูลที่ไดพบวาโอกาสที่จะปฏิเสธ Ho มี
สมมติฐาน Ho : μ = μ0
เพียง 0.0186 ซึ่งไมเกินไปจาก α ที่ตั้งไวจึงสรุปวาคา
Ha : μ ≠ μ0 สําหรับ Two-tailed test
เฉลี่ยที่ไดตางไปจากของประชากรจริง
μ<μ0หรือ μ>μ0 สําหรับ One-tailed test
f 235 e
สถิติในการวิจัย
สรุปการเลือกใชชนิดของการทดสอบและเงื่อนไข
Population Parameter Sample Statistic Assumptions Test Statistic
1. Mean
1.1 Single mean 1. ประชากรแจกแจงแบบปกติ X − μ0
t=
μ X 2. ตัวอยางเชิงสุม S/ n
โดยที่ μ0 คือคาเฉลี่ยใน Ho
คา t ที่ df = n - 1
f 236 e
สถิติในการวิจัย
iia ตัวอยาง 2 ชุด เปนอิสระกัน เปนการ วิธีทํา
ทดสอบวาคาเฉลี่ยของตัวอยาง 2 ชุดนั้น มาจากประชากร สมมติฐาน Ho : คาเฉลี่ย Serum amylase ในประชากร
ที่มีคาเฉลี่ยตางกันหรือไม สวนใหญจะไมทราบคาความ ทั้ง 2 กลุม ไมตางกัน
แปรปรวนของประชากร (σ2 ) ดัง นั้น จึ ง ใชค าสถิติ t μ1 = μ2
ทดสอบและกํ า หนดให ค วามแปรปรวนของประชากร Ha : คาเฉลี่ย Serum amylase ในประชากรทั้ง 2
เ ท า กั น (σ12 = σ22 ) ห รื อ ถ า จ ะ ท ด ส อ บ ว า ค า ค ว า ม กลุมตางกัน
แปรปรวนเทากันหรือไมเทากันก็ใช F-test แตยังไม μ1 ≠ μ2
กลาวถึงในตอนนี้ จึงตั้งขอสมมติใหเทากันกอน และใชสูตร กําหนดให ระดับนัยสําคัญ (α) = 0.05
ดังในตาราง
การคํานวณ คา t คํานวณไดจากสูตรดังตารางโดย
ตัวอยางที่ 16.8 จากคา Serum amylase ของคนปกติ กําหนดให
และคนไขในโรงพยาบาลเปรียบเทียบความแตกตางของ X1 , X2 = 96 และ 120
ค า เฉลี่ ย ว า มาจากประชากรที่ มี ค า เฉลี่ ย เท า กั น หรื อ ไม
S1, S2 = 35 และ 40
โดยมีขอมูลดังนี้
n1 , n 2 = 15 และ 22
ตัวอยาง n X SD
ในที่ นี้ จ ะแสดงผลการวิ เ คราะห ด ว ยโปรแกรมสํ า เร็ จ รู ป
คนปกติ 15 96 35
STATA ซึ่งผลที่ไดเขาใจงาย แตถาคํานวณโดยใชสูตรก็
คนไข 22 120 40
ไดผลเชนเดียวกัน
ตัวอยางผลการวิเคราะหดวยโปรแกรม STATA
คําสั่ง ttesti 15 96 35 22 120 40
Two-sample t test with equal variances
--------------------------------------------------------------------------------------------=====-------------------------
------------+----------------------------------------------------------------------------------------------------------------
x| 15 96 9.036961 35 76.61765 115.3824
y| 22 120 8.528029 40 102.265 137.735
------------+----------------------------------------------------------------------------------------------------------------
Combined | 37 110.2703 6.477456 39.40082 97.13338 123.4072
------------+----------------------------------------------------------------------------------------------------------------
diff | -24 12.75052 -49.88493 1.884932 d
------------------------------------------------------------------------------------------------------------------------------
diff = mean(x) – mean(y) t = -1.8823
Ho : diff = 0 degrees of freedom = 35
f 237 e
สถิติในการวิจัย
จากผลการวิเคราะห คา p-value ไดจากผล วิธีทํา
หมายเลข c การทดสอบเปนแบบสองหางที่แสดงวา Ha: สมมติฐาน Ho : คาเฉลี่ยของระดับโคเลสเตอรอลกอน
diff !≠ 0 (ไมเทากับ 0), Pr > | t | = 0.0681 หมายความ และหลังเขาโปรแกรมไมตางกัน
วาคาของพื้นที่ที่มากกวาคา t (1.88) และพื้นที่ที่นอยกวา D =0
คา t (- 1.88) มีคาเทากับ 0.0681 ซึ่งมากกวา 0.05 จึงไม Ha : โปรแกรมนี้ชวยใหระดับโคเลสเตอรอลลดลง
สามารถปฏิเสธ Ho สรุปวาคาเฉลี่ยของ Serum amylase D > 0 ( D = Before – After)
ของประชากร 2 กลุมนี้ไมมีความแตกตางกัน (p=0.0681)
และที่ 95% CI ของผลตางอยูระหวาง -49.88 ถึง 1.88 ผลการวิเคราะห ดวยโปรแกรม SPSS
คลุม 0 ดวยในผลหมายเลข d แสดงขอมูลจํานวน 12 ราย โดยวัดกอน (before) และ
iib ตัวอยาง 2 ชุดมีความเกี่ยวของกัน เปน หลัง (after) การทดลอง
การทดสอบความแตกตางระหวางคาที่ไดจากขอมูล 2 ชุด before after ผลตาง (กอน–หลัง)
ซึ่งอาจจะเปนคาที่วัดจากคนคนเดียวกันแตดูผลกอนและ 1. 201 200 +1
หลัง (Before/After) หรือดูผลของยาตางชนิดกันโดยจัดให 2. 231 236 –5
ตัวอยาง 2 ชุด มีความคลายกันมากที่สุดคือเปน Matched 3. 221 216 +5
pairs หรือการศึกษาในรูปตางๆ ที่เกี่ยวของกัน สวนใหญ 4. 260 233 +27
จะเปนการวิจัยเชิงทดลอง 5. 228 224 +4
6. 237 216 +21
ตั ว อย า งที่ 16.9 จากการศึ ก ษาผลของโปรแกรม diet- 7. 326 296 +30
exercise เพื่ อ ดู ว า ระดั บ โคเลสเตอรอลนั้ น ลดลงหรื อ ไม 8. 235 195 +40
โดยศึกษาในคนทั้งหมด 12 ราย วัดระดับโคเลสเตอรอล 9. 240 207 +33
กอนเขาโปรแกรมและหลังโปรแกรมวัดอีกครั้งหนึ่ง ถามี 10. 267 247 +20
การควบคุ มตัว แปรอื่ น ๆ ที่จ ะส ง ผลต อ การเปลี่ย นแปลง 11. 284 210 +74
ระดับโคเลสเตอรอล แลวจงทดสอบวาโปรแกรมนี้ชวยลด 12. 201 209 –8
ระดับโคเลสเตอรอลจริงหรือไม
f 238 e
สถิติในการวิจัย
จากผลการวิเคราะหขอมูลดวยโปรแกรม SPSS กําหนดใหระดับนัยสําคัญที่ α=0.05 คา Z = 1.96
ไดผลดังขางบนนี้ที่หมายเลข c คือคาเฉลี่ยของผลตาง จะเห็นวาคา |Z| ที่คํานวณไดมากกวาคา Z ที่
= 20.167 ที่หมายเลข d คือชวงของผลตางที่ 95% CI กําหนดดังนั้น p < 0.05
อยูระหวาง 5.47 ถึง 34.86 ซึ่งไมคลุม 0 ดังนั้นคาเฉลี่ย สรุปวา จากขอมูลนี้การใชเข็มขัดนิรภัยของประชากรที่สุม
ของโคเลสเตอรอลจึงตางกันจริง เมื่อดูผลการทดสอบ ตัวอยางมาไมเทากับ 50% ( p < 0.05)
สมมติฐาน หมายเลข e ที่ Sig. คือ p=.012 ซึ่งนอยกวา iia ตัวอยาง 2 ชุดเปนอิสระกัน เปนการ
.05 จึ ง ปฏิ เ สธ Ho สรุ ป ว า โปรแกรมนี้ ช ว ยให ร ะดั บ ทดสอบความแตกตางของสัดสวนในตัวอยาง 2 ชุด วามา
โคเลสเตอรอลกอนและหลังตางกันอยางมีนัยสําคัญทาง จากประชากรที่มีสัดสวนตางกันหรือไม
สถิติ (p < 0.05) แตการศึกษานี้ทดสอบแบบหางเดียว คา
p จึงเทากับ 0.012/2 คือ .006 สรุปวาระดับโคเลสเตอรอล ตัวอยางที่ 16.11 ในการศึกษาเพื่อเปรียบเทียบผลของยา
ลดลงจริง ใหมที่รักษาโรค Migraineกับ ยามาตรฐานที่ใชอยูกอนโดย
ศึกษาในผูปวยกลุมละ 100 รายที่ใชยาแตละชนิด พบวา
16.4.2 การทดสอบความแตกตางของสัดสวน กลุมที่ใชยาเดิมมีอาการดีขึ้น 78 ราย ผูที่ใชยาใหมอาการ
i ตัวอยางชุดเดียว เปนการทดสอบคาสัดสวน ดีขึ้น 90 ราย จากขอมูลนี้พอจะสรุปไดหรือไมวา ยาใหม
ในตัวอยางวาตางไปจากประชากรที่กําหนดไวหรือไม ใหผลดีกวายามาตรฐาน
ตัวอยางที่ 16.10 จากการสํารวจผูที่ขับรถยนต จํานวน วิธีทํา
300 ราย พบวาใชเข็มขัดนิรภัยสม่ําเสมอ 123 คน จาก สมมติฐาน Ho : ยาใหมใหผลไมตางไปจากยาเดิม
ขอมูลที่สํารวจนี้พอจะสรุปไดหรือไมวาสัดสวน ในการใช P1 = P2 หรือ P1 − P2 = 0
เข็มขัดนิรภัยของผูขับรถยนตนั้นไมเทากับ 0.50 Ha : ยาใหมใหผลดีกวายาเดิม
วิธีทาํ P1 > P2 หรือ P1 − P2 > 0
สมมติฐาน
ดังนั้น Ho จะเปน P1 − P2 < 0
Ho : สัดสวนในการใชเข็มขัดนิรภัยของประชากร
90
ที่ขับรถยนตเทากับ 0.50 p1 = 100 = 0.9
P = 0.50 78
p2 = 100 = 0.78
Ha : สัดสวนในการใชเข็มขัดนิรภัยของประชากร
0.9 − 0.78
ที่ขับรถยนต ไมเทากับ 0.5 แทนคาสูตร Z =
0.9 × 0.1 0.78 × 0.22
P ≠ 0.50 100 + 100
ตรวจสอบคา nP = 300 × 0.50 = 150 มากกวา 5 = 2.35
p −P
จึงใชสูตร Z = P(1− P) เมื่อเทียบกับคา Z ที่ระดับนัยสําคัญ 0.05 แลว
n คา Z จากการคํานวณได 2.35 มากกวา Z = 1.96 จึงตก
123 อยูในเขตปฏิเสธ Ho สรุปวา ยาใหมชวยใหอาการดีขึ้น
p = = 0.41
300 มากกวายาเดิมอยางมีนัยสําคัญทางสถิติ (p < 0.05)
ศึกษาผลการวิเคราะหโดยใชโปรแกรม STATA
0.41 − 0.5
แทนคา Z = 0.5 × 0.5 = - 3.12
300
f 239 e
สถิติในการวิจัย
คําสั่ง prtesti 100 90 100 78, count
Two-sample test of proportion x : Number of obs = 100
y : Number of obs = 100
---------------------------------------------------------------------------------------------------------------------
Variable | Mean Std. Err. z P>|z| [95% Conf. Interval]
----------+---------------------------------------------------------------------------------------------------------
x| .9 .03 .8412011 .9587989
y| .78 .0414246 .6988092 .8611908
----------+---------------------------------------------------------------------------------------------------------
diff | .12 .0511468 .019754 .220246 c
| under Ho: .0518456 2.31 0.021
---------------------------------------------------------------------------------------------------------------------
diff = prop(x) – popo (y) z = 2.3146
Ho: diff = 0
Ha: diff < 0 Ha: diff ! = 0 Ha: diff > 0 d
Pr (Z<z) = 0.9897 Pr(|Z|<|z|) = 0.0203 Pr(Z>z) = 0.0103
f 240 e
สถิติในการวิจัย
Ho: ผลการตรวจจาก Medium A และ B ไมตางกัน อยางไรก็ตามเปนที่นาสังเกตวาในการทดสอบ
Ha: ผลการตรวจจาก ทั้ง 2 Media ตางกัน สมมติฐานนั้น ผูวิจัยพยายามที่จะใหพบคา p นอยๆ เพื่อ
กําหนดใหระดับนัยสําคัญ = 0.05 จะไดมีโอกาสปฏิเสธ Ho (เมื่อ Ho ถูกตอง) ซึ่งทําไดโดยให
b−c ขนาดของตัวอยาง (n) มากๆ เพราะถาตัวอยางมีขนาด
จากสูตร z =
b+c ใหญมากจะสงผลให SE เล็กลง ในการคํานวณคาสถิติ (t,
b, c = จํานวนคูที่ใหผลไมสอดคลอง Z) จึงทําใหการทดสอบมีโอกาสที่จะปฏิเสธ Ho มากขึ้น
กันในที่นี้ คือ 12 และ 2 แมวาความแตกตางนั้นจะนอย แตถาจํานวนตัวอยางมาก
b+c 12 + 2 ก็มีโอกาสปฏิเสธ Ho ได ดวยเหตุนี้การบอกนัยสําคัญทาง
ตรวจสอบ 2 = 2
= 7 มากกวา 5 ตรงตามขอสมมติ สถิติควรตองพิจารณารวมไปกับนัยสําคัญทางคลินิกเสมอ
12 − 2 ความสํ า คั ญ ทางคลิ นิ ก มี คุ ณ ค า ที่ จ ะนํ า ไปใช ต อ ไป
ดังนั้น Z = = 2.67 ดังตัวอยางตอไปนี้
12 + 2
คา Z จากการคํานวณมากกวา 1.96 จึงปฏิเสธ Ho
ตัวอยางที่ 16.13 จากการทดลองทํา Clinical trial เพื่อดู
สรุป มีความแตกตางกันในผลการตรวจระหว าง media
ผลของยาลดความดันโลหิต 2 ชนิดในคนไข 2 กลุม
ทั้งสองอยางมีนัยสําคัญทางสถิติ (p < 0.05)
กรณีที่ กรณีที่
หมายเหตุ : การทดสอบนี้ใหผลเชนเดียวกับ Mc Nemar’s 1 2
test ซึ่งจะกลาวในหัวขอ 16.6 การทดสอบไคสแควร จํานวนคนไขกลุมละ 500 10
คาเฉลี่ยความดันโลหิตที่ลดลง
16.5 นัยสําคัญทางสถิติและนัยสําคัญทางคลินิก (มม.ปรอท)
(Statistical significance and Clinical กลุมที่ 1 30 17
significance) กลุมที่ 2 32 30
p-value 0.04 0.06
Gardner และ Altman (1986) ไดเสนอแนะวา
สรุปความแตกตางอยางมีนัยสําคัญ
การรายงานผลการทดสอบสมมติ ฐ านเพีย งเฉพาะว า มี
ทางสถิติ มี ไมมี
หรือไมมีนัยสํ าคัญทางสถิตินั้นยัง ไมเพียงพอ ผูวิ จัยควร ทางคลินิก ไมมี มี
ร า ย ง า น ค า p-value ด ว ย สํ า ห รั บ ก า ร ป ร ะ ม า ณ
คาพารามิเตอรใหมีคาชวงความเชื่อมั่น (CI) ควบคูไปดวย กรณีที่ 1 สรุปวา ยา 2 ชนิด ใหผลตางกันอยางมีนัยสําคัญ
เสมอ ทั้ ง นี้ เ พื่ อ ให ผู อ า นสามารถพิ จ ารณาได ว า ข อ มู ล ที่ ทางสถิติ (p<.05) แตในทางคลินิกแลวไมมีความ
เสนอนั้นมีความนาเชื่อถือเพียงใด แตกตางกันเลย เพราะสามารถลดไดตางกันเพียง
โดยทั่ ว ไปการทดสอบสมมติ ฐ านแบบ 2 หาง 2 mm. เทานั้น แตเนื่องจากคนไขมากถึงกลุมละ
( two tailed hypothesis testing) แ ล ะ ก า ร ป ร ะ ม า ณ 500 ราย จึงทําใหมีนัยสําคัญทางสถิติ
คาพารามิเตอรที่ 95% CI มีความสอดคลองกันดังตัวอยาง กรณีที่ 2 สรุ ป ว า ยา 2 ชนิ ด ให ผ ลไม ต า งกั น อย า งมี
ที่ 16.3 ซึ่งทดสอบผลตางของคาเฉลี่ย ถาคํานวณคา นัยสําคัญทางสถิติ (p>.05) แตเมื่อพิจารณาทาง
ผลตางที่ 95% CI จะพบวา 95% CI ของ μ1–μ2 = –1.88 คลินิกจะเห็นวา ยา 2 ชนิด ลดไดตางกันถึง 13
ถึง 49.88 ชวงของผลตางเฉลี่ยคลุม 0 แสดงวามีโอกาสที่ มม.ปรอท จึงถือวามีความสําคัญมาก ดังนั้นการ
คาเฉลี่ยของทั้ง 2 กลุม ไมตางกัน ซึ่งผลการทดสอบที่ สรุปผลนั้นควรพิจารณาผลทางคลินิกไปดวย ซึ่ง
Ha : μ1 –μ2 ≠ 0 ไดคา p = 0.0681 ซึ่งมากกวา 0.05 ผูวิจัยจะเปนผูตัดสินใจไดวาในเรื่องนั้นๆ ควรมี
จึงสรุปวาคาเฉลี่ยของทั้ง 2 กลุมไมตางกัน ขอบเขตเพียงใดที่จะตัดสิน
f 241 e
สถิติในการวิจัย
16.6 การทดสอบไคสแควร (Chi-Square test) ดังตัวอยางการกําหนดขอบเขต
การทดสอบไคสแควรเปนการทดสอบทางสถิติ
สําหรับขอมูลที่เป นเชิงจําแนกลักษณะคือเปนชนิดกลุม
(Categorical data) ซึ่งไดมาจากการนับจํานวนความถี่
สวนสเกลในการวัดอาจวัดในรูปของ nominal scale หรือ
ordinal scale การทดสอบนี้มักจะใชกับขอมูลทางระบาด
วิทยา, ทางสังคมศาสตร ฯลฯ การแจกแจงของไคสแควร
(X2) จะมาจากการแจกแจงแบบปกติ โดยที่คา X2 ก็คือ Z2 ดั ง นั้ น ถ า ค า X2 จากการคํ า นวณได ม ากกว า
นั่นเอง แตโคงของการแจกแจงไมเปนรูประฆังคว่ําแบบโคง 3.84 ที่ df = 1 แสดงวาคา p-value นอยกวา 0.05 ปฏิเสธ
ปกติ ถาค า ของชั้น แหงความเปนอิสระ (Degree of Ho สรุปวาการแจกแจงของคาสังเกตในแตละกลุมตางไป
freedom หรือ df) มากขึ้น การแจกแจงจะมีลักษณะแบบ จากทฤษฎี การเปดตารางคา X2 จะทําใหทราบคา
ปกติ p-value โดยประมาณวามากหรือนอยกวาคา α โดยดู
ในที่นี้จะกลาวถึงการนําการทดสอบไคสแควรไป จากรูป แตถาใชโปรแกรมทางสถิติวิเคราะหจะทราบคา p
ใชในรูปแบบตางๆ กัน 3 รูปแบบคือ ที่แทจริงและใชเปรียบเทียบกับคา α ไดเลย
ก. Test for Goodness of Fit
ข. Test for Homogeneity ตัวอยางที่ 16.14 จากตารางขางลางนี้แสดงจํานวนผูปวย
ค. Test for Association ดวยไขหวัดใหญที่โรงพยาบาลรายงานในแตละวันภายใน
ก. Test for Goodness of Fit เปนการทดสอบ 1 สัปดาห จงทดสอบสมมติฐานวาจํานวนผูปวยดวยโรคนี้
เพื่อดูวาคาสังเกต (Observation) ที่ไดมาในแตละกลุมนั้น มี ก ารเกิ ด เท า ๆ กั น ทุ ก วั น โดยแจกแจงแบบ Uniform
มีการแจกแจงไปตามที่คาดไวหรือไม เชน จํานวนคนไขใน distribution ในสัปดาห
แต ละวั น ของสั ป ดาห ห นึ่ง , จํา นวนผลผลิ ต ที่ไ ดใ นแต ล ะ วัน จํานวนผูปวย (Oi)
ลักษณะที่เปนไปได (ตามหลักพันธุศาสตร) ฯลฯ การ จันทร 38
ทดสอบนี้ใชหลักการวาคาสังเกตนั้นตางไป จากคา อังคาร 31
คาดหวังตามทฤษฎีหรือไม พุธ 40
ให Oi = คาสังเกตในแตละกลุม (Observed พฤหัส 39
value) ศุกร 40
Ei = คาคาดหวังตามทฤษฎีในแตละกลุม เสาร 44
(Expected value) อาทิตย 48
(Oi − Ei )2 รวม 280
สูตร X = ∑ E
2
i
วิธีทํา
สมมติฐาน
การกําหนดขอบเขตของคา X2 จะขึ้นอยูกับระดับนัยสําคัญ
Ho : จํานวนผูปวยในแตละวันเกิดขึ้นเทาๆ กัน
(α) และคาของ df เพื่อนําไปเปดตาราง
Ha : จํานวนผูปวยในแตละวันเกิดขึ้นไมเทากัน
df = จํานวนกลุม - 1
นั่นคือ จํานวนผูปวยที่คาดวาจะเกิด (Ei) ในแตละวัน
การตั้งสมมติฐาน
1
Ho : การแจกแจงในแตละกลุมไมตางไปจากทฤษฎี = 7 × 280
Ha : การแจกแจงในแตละกลุมตางไปจากทฤษฎี = 40 ราย
f 242 e
สถิติในการวิจัย
แทนคาสูตร X2 = (38 −4040) + − − − + (48 −4040)
2 2
ขนาดของตารางจะเปน r x c
df = (r - 1) ( c - 1 )
= 4 + 81 + 0 + 40
1 + 0 + 16 + 64
คา Oij = คาสังเกตที่แจงนับไดในแตละเซลลนั้น
166
= 40 คือความถี่นั่นเอง
= 4.15 n = ขนาดของตัวอยาง
df = 7–1 = 6 Ri,Ci = จํานวนความถี่ทั้งหมดในแตละแถว
เปดตารางคา X2 ที่ α = 0.05 และ df = 6 ไดคา และแตละคอลัมน
X2 = 12.59 Eij = คาคาดหวังที่จะเกิดในแตละเซลลโดย
จากการคํานวณ ไดคา X2 = 4.15 ซึ่งนอยกวาจาก คํานวณไดจาก RiCj/n
ตาราง นั่นคือ p > 0.05 สูตรที่ใชคํานวณทั่วไป
สรุปวาไมสามารถปฏิเสธ Ho ดังนั้นจํานวนผูปวย (Oij − E ij ) 2
X2 = ∑ Eij
ไขหวัดใหญในแตละวันเกิดขึ้นเทาๆ กันตลอดสัปดาห จาก
ตั ว อย า งข า งต น จะเห็ น ว า เป น การแจกแจงความถี่ ข อง ตัวอยางที่ 16.15 ผูวิจัยไดศึกษาถึงความรุนแรงของโรค
ตัวแปรเดียว ดังนั้นสิ่งที่สนใจคือการแจกแจงการเกิด หนึ่ ง ในแต ล ะกลุ ม เลื อ ด โดยได ข อ มู ล จากคนไข จํ า นวน
เหตุการณในแตละระดับของตัวแปรนั้นถามีตัวแปรอื่นมา 1500 คน จําแนกตามตารางดังนี้
เกี่ยวของอีกก็จะมีการทดสอบวาตัวแปรทั้งสองเกี่ยวของ
กันหรือไม ชนิดของกลุมเลือด
ข. Test for Homogeneity เปนการทดสอบเพื่อ ความรุนแรงของโรค A B AB O รวม
ดู ว า การแจกแจงในแต ล ะกลุ ม ของตั ว แปรนั้ น มี ค วาม ไมรุนแรง 543 211 90 476 1320
แตกตางกันหรือไมโดยสามารถนําการแบงชั้นตางๆ ในแต เล็กนอย 44 22 8 31 105
ละตั ว แปรมาสร า งเป น ตารางการณ จ ร (Contingency มาก 28 9 7 31 75
table) แล ว แจงนั บ ค า สั ง เกตที่ ส อดคล อ งกั บ ระดั บ ของ รวม 615 242 105 539 1500
ตัวแปรนั้น
ที่ระดับนัยสําคัญ 0.05 จงทดสอบสมมติฐานวากลุมเลือด
ตัวแปรที่ 2 ตัวแปรที่ 1 ทั้ง 4 กลุม มีระดับความรุนแรงของโรคตางกันหรือไม
1 2 3 -------------- c รวม วิธีทํา
1 O11 O12 O13 ------------- O1c R1 สมมติฐาน Ho : กลุมเลือดแตละกลุมมีระดับความ
2 O21 O22 O23 ------------- O2c R2 รุนแรงของโรคไมตางกัน
3 O31 O32 O33 ------------- O3c R3 Ha : กลุมเลือดแตละกลุมมีระดับความ
| | | | | | รุนแรงของโรคตางกัน
| | | | | |
| | | | | | คํานวณคาคาดหวัง E ของแตละเซลล
r Or1 Or2 Or3 ------------- Orc Rr 1320 × 615
E 11 = 1500 = 541.2
รวม C1 C2 C3 ------------- Cc n
ถาให ตัวแปรที่ 1 แบงเปน c กลุม ( c คอลัมน ) คา Eij ในเซลลอื่น ๆก็คํานวณทํานอง
ตัวแปรที่ 2 แบงเปน r กลุม (r แถว ) เดียวกันจํานวนเซลลทั้งหมด = 3 × 4 = 12
f 243 e
สถิติในการวิจัย
(O − E) 2
สัดสวนดังนั้นการทดสอบไคสแควรจะบอกไดแตเพียงวา
สูตรที่ใชคือ X2 = ∑ E
ตัวแปรทั้ง 2 มีความสัมพันธกันหรือไมตามสมมติฐานแต
ดังนั้น X2 = (543 − 5412) 2
+−−−+
(31 − 26.9) 2
541.2 26.9 ไมสามารถบอกถึงระดับของความสัมพันธ (Strength of
= 5.12 association) ได
df = ( 3–1 )( 4–1 ) = 6 ตัวอยางแสดงความสัมพันธระหวางการเกิดโรค
จากตารางคา X2 ที่ α = 0.05 เทากับ 12.59 และการไดรับปจจัย
ดังนั้นไมสามารถปฏิเสธ Ho ได
สรุ ป กลุ ม เลื อ ดแต ล ะกลุ ม มี ร ะดั บ ความรุ น แรงของโรค ปจจัย เปนโรค ไมเปนโรค รวม
ไมตางกันอยางมีนัยสําคัญทางสถิติ (p >0.05 ) ไดรับ a b e
ไมไดรับ c d f
ข อ ควรระวั ง ในการทดสอบไคสแควร ควรคํ า นึ ง ถึ ง รวม g h n
ขนาดของคาคาดหวัง โดยมีขอกําหนดดังนี้
1) คาคาดหวังไมควรจะต่ํากวา 1 เพราะจะทําให สูตร X2 สําหรับขนาด 2 x 2 โดยวิธีลัดคือ
2
คา X มีคามากขึ้นและโอกาสที่จะปฏิเสธ Hoก็มีมากขึ้น (ad − bc) 2
n
2) คาคาดหวังไมควรต่ํากวา 5 แตถาต่ํากวา 5 ก็ X2 = e ⋅ f ⋅ g ⋅ h
ไมควรใหเกิน 20% ของจํานวนเซลล เชน ตารางขนาด 3 โดยการปรับดวยวิธี Continuity Correction
× 2 ซึ่งมี 6 ชองตาราง คาคาดหวังต่ํากวา 5 ควรมีไดเพียง ( ad − bc − n / 2)2 n
2
1 ชองตาราง การแกไขทําไดโดยจัดกลุมของระดับในตัว X = e ⋅ f ⋅ g ⋅h
แปรใหนอยลงโดยผูวิจัยเปนผูกําหนดวาควรจะรวมกลุมใด ผลลั พ ธ ที่ ไ ด โ ดยวิ ธี ลั ด จะให ค า ใกล เ คี ย งหรื อ
ในกรณีตารางขนาด 2 × 2 ถามีคาคาดหวังคาใดคาหนึ่ง เทากับสูตรทั่วไปขางตน
ต่ํากวา 5 ก็เสนอใหใช Fisher’s exact probability test
3) ถ า ขนาดตั ว อย า งมี จํ า นวนน อ ย การใช การตั้งสมมติฐานทางสถิติ
ไคสแควรทดสอบควรมีการปรับคา X2 ซึ่งเรียกวา Yates’ Ho : ปจจัยนั้นไมมีความสัมพันธกับการเกิดโรค
Correction โดยใชคา 1/2 ไปลบจากผลตางของ |O–E| Ha : ปจจัยนั้นมีความสัมพันธกับการเกิดโรค
แตถาจํานวนตัวอยางมีมาก คา X2 ที่ปรับและไม ปรับก็มี การปรับคา X2 นั้น ถาตัวอยางมีขนาดใหญพอคา X2 ชนิด
คาใกลเคียงกัน ปรับและไมปรับก็มีคาใกลเคียงกันแตถาขนาดตัวอยางมี
( O − E − 1/ 2)2 จํานวนนอยคา X2 ชนิดปรับจะมีคานอยลงทําใหโอกาสที่
Corrected X2 = ∑ E จะปฏิเสธ Ho ก็ยากขึ้น ดังนั้นถาขนาดตัวอยางมีจํานวน
ค . Test for Association เ ป น ก า ร ท ด ส อ บ นอยควรใชคา X2 ที่ปรับแลวในการสรุปผล ซึ่งโดยทั่วไปถา
ความสัมพันธของตัวแปรบอกลักษณะ ซึ่งสวนมากในทาง นอยกวา 40 ก็จะใชคาที่ปรับ
การแพทยมักจะใชทดสอบดูความสัมพันธระหวางปจจัย
นั้นๆ กับการเกิดโรค โดยขนาดของตารางมักจะเปนขนาด ตัวอยางที่ 16.16 ในการศึกษาเชิงวิเคราะหชนิดยอนหลัง
2 × 2 หรืออาจจะมากกวา 2 × 2 ก็ได โดยมีกลุมศึกษา (Case) และกลุมควบคุม (Control) และ
ในกรณีที่เปนตาราง 2×2 การทดสอบแบบ สอบถามปจจัยที่ไดรับในอดีตพบวาผูปวยดวยมะเร็งปอด
ไคสแควรจะใหผลเชนเดียวกับการทดสอบความแตกตาง และคนปกติ ป ระวั ติ ก ารสู บ บุ ห รี่ ดั ง ตารางข า งล า งนี้
ของสัดสวน แตไมสามารถประมาณชวงของความแตกตาง จงทดสอบวาการสูบบุหรี่มีความสัมพันธกับการเกิดมะเร็ง
(P1–P2) ได เช น เดี ย วกั บ การทดสอบความแตกต า งของ ปอดหรือไม
f 244 e
สถิติในการวิจัย
การสูบบุหรี่ Case Control รวม สายตาหรือไม ไดผลดังตารางขางลางนี้ จงทดสอบวาเด็ก
สูบ 100 60 160 ทั้ง 2 กลุม มีความผิดปกติทางสายตาตางกันหรือไม
ไมสูบ 25 215 240
รวม 125 275 400 สายตา พูดไมชัด ปกติ รวม
ผิดปกติ 1 5 6
วิธีทํา ปกติ 8 2 10
Ho : การสูบบุหรี่ไมมีความสัมพันธกับการเกิดมะเร็งปอด รวม 9 7 16
Ha : การสูบบุหรี่มีความสัมพันธกับการเกิดมะเร็งปอด
2 (100 × 215 − 60 × 25)2 × 400 วิธีทํา
X =
160 × 240 × 125 × 275 Ho:อัตราความผิดปกติทางสายตาในเด็กทั้ง 2 กลุมไมตางกัน
= 121.2 Ha :อัตราความผิดปกติทางสายตาในเด็กทั้ง 2 กลุมตางกัน
คา X2 ที่ df = 1, α = 0.05 จากตาราง X2 = 3.84
ดังนั้นปฏิเสธ Ho คํานวณคา P จากตารางเดิมและคา P จากตารางที่ลด
สรุป การสูบบุหรี่มีความสัมพันธกับการเกิดมะเร็งปอด เซลลต่ําสุดคือ 1 ลง มาเปน 0 โดยที่คาผลรวมในแถว และ
(p<0.05 ) คอลัมนยังคงเดิม
จะเห็นวาแมวาคา X2 จะมีคามากหรือนอยก็ตาม 6!10!9!7!
P1 = = 0.02360
เราเพียงแตสรุปไดวาการสูบบุหรี่มีความสัมพันธกับการ 16!1!5!8!2!
เกิดมะเร็งปอด แตเราไมสามารถบอกไดวาผูที่สูบบุหรี่จะมี 6!10!9!7!
โอกาสเสี่ยงเปนกี่เทาของการเปนมะเร็งปอด ดังนั้นจะตอง P0 = = 0.00087
16!0!6!9!1!
คํานวณหาคาการเสี่ยงในรูปของ Relative Risk หรือ
Odds Ratio ตามความเหมาะสมตอไป c 5 b 6
16.6.1 Fisher’s exact test ใชทดสอบในกรณีที่ 8 2 9 1
คาคาดหวังนอยกวา 5 ในตารางขนาด 2 x 2 สวนจํานวน
ตั ว อย า งจะมี ข นาดเท า ใดก็ ไ ด ก ารทดสอบวิ ธี นี้ จ ะให ค า คา P = P1 + P0 = 0.02360 + 0.00087 = 0.02447
ความนาจะเปนคือคา p-value นั่นเองแลวเปรียบเทียบ กับ คา p<0.05 ดังนั้นปฏิเสธHo สรุปวาเด็กทั้ง 2 กลุมมีอัตรา
ระดับ นัยสําคัญ (α) เพื่อสรุปผลการคํานวณคา p ความผิดปกติดานสายตาตางกันอยางมีนัยสําคัญทางสถิติ
คอนขางจะยุงยาก แตมีโปรแกรมสําเร็จรูปทางสถิติหลาย (p<.05)
โปรแกรมคํานวณไวให เชน STATA, SPSS
e!f!g!h! 16.6.2 Mc Nemar’s test เปนการทดสอบดู
คา p ที่ไดจากการคํานวณ = n!a!b!c!d! ความสั ม พั น ธ ห รื อ ความแตกต า งในตั ว อย า ง 2 ชุ ด ที่
โดยคา p ที่ไดจากตารางจะมีการคํานวณในหลายกรณี เกี่ยวของกัน โดยผลการวัดที่สนใจจะออกมาเปน Binary
เมื่ อ ค า ต่ํ า สุ ด ของเซลล นั้ น ลดลงไปจนเท า กั บ 0 แต ค า data ตัวอยางที่เกี่ยวของกันในลักษณะเปนคูนั้นมีชื่อเรียก
ผลรวมในแถวและคอลัมนคงเดิมแลว p จะเทากับผลรวม อีกอยางหนึ่งวา Marginal Chi-square มีหลักการวา
คา p ในแตละกรณี ดังตัวอยางตอไปนี้ จะตองมีความคลายกันภายในคู (Homogeneity within
ตัวอยางที่ 16.17 ไดทําการศึกษาในเด็กที่พูดไมชัดและ pairs) และมีความแตกตางกันระหวางคู (Heterogeneity
เด็กปกติจํานวน 16 คน เพื่อดูวามีความผิดปกติทาง between pairs) โดยแบงเปนกรณีตางๆ ดังนี้
f 245 e
สถิติในการวิจัย
1. Self pairing การจับคูในตัวเองเชนการวัดผล ทั้งหมดที่ศึกษากลุมละ 18 ราย การวัดผลดูจากอาการวาดี
กอนและหลังหรือการวัดในตําแหนงซาย-ขวา ขึ้นหรือคงเดิมไดผลดังตาราง
2. Natural pairing การจับคูที่ธรรมชาติกําหนด
เชน การศึกษาในฝาแฝด (Twin ) จงทดสอบสมมติฐานวายา A และยา B ใหผลตางกัน
3. Artificial pairing การจับคูใหโดยผูวิจัยเลือก หรือไม
ตามลั ก ษณะที่ เ หมื อ นกั น ด ว ยป จ จั ย ที่ คิ ด ว า จะมี ส ว น
เกี่ยวของ โดยการทํา Matching ยา A
รวม
ตัวอยางการทดลองดูผลกอนและหลังในตัวอยางขนาด n ดีขึ้น คงเดิม
โดยผลจะวัดเปน 2 อยาง คือ + และ - เมื่อจัดลงในตาราง ดีขึ้น 1 9 10
2 x 2 จะไดดังนี้ ยา B
หลัง คงเดิม 3 5 8
+ - รวม 4 14 18
+ a b
กอน วิธีทํา
จากตารางจะเห็นวาขอมูลทั้ง 2 กลุม เกี่ยวของ
- c d
กันจึงจัดเปน 18 คู คูที่ใหผลไมสอดคลองกันคือ มี 9 คู ที่
ผลจากยา A คงเดิมผลจากยา B ดีขึ้น และ 3 คูที่ผลจาก
จะเห็นวา จํานวนความถี่ในแตละเซลลแจกแจงผลไดดังนี้ ยา A ดีขึ้นผลจากยา B คงเดิม
กอน หลัง จํานวนคู สมมติฐาน Ho : ยา A และยา B ใหผลไมตางกัน
+ + A Ha: ยา A และยา B ใหผลตางกัน
+ - B 2 ( 9 − 3 − 1)2
corrected X = 9+3
- + C
= 2.08
- - d
จากตาราง คา X2 ที่ df = 1, α = 0.05 เทากับ 3.84
คา X2 จากการคํานวณนอยกวาจากตาราง
คาที่สนใจ คือ คา b, c ซึ่งเปนจํานวนคูที่ใหผลไมสอดคลอง
ดังนั้นไมสามารถปฏิเสธ Ho นั่นคือ ยา A และยา
กัน
B ใหผลในการรักษาไมตางกัน
2
(b − c)2
สูตร X = b+c
การทดสอบแบบไคสแควร ยั ง มี วิ ธี อื่ น ๆ อี ก
( b − c − 1)2
2
Continuity correction X = b+c แลวแตกรณี เชน Chi-square for trend ใชเมื่อระดับของ
สมมติฐาน Ho : ผลการวัดกอนและหลังไมตางกัน ตัวแปรเปนลําดับมาตรา (Ordinal scale) และ Mantel-
Ha : ผลการวัดกอนและหลังตางกัน Haenzsel Chi-square ใชวิเคราะหเพื่อปรับตัวแปรกวน
(Confounding factor) เพื่อขจัดอคติชนิด Confounding
ตัวอยางที่ 16.18 ในการเปรียบเทียบเพื่อดูผลการรักษา bias
ดวยยา A และยา B ในผูปวยโรคหนึ่งซึ่งแบงเปน 2 กลุม
และจับคู (Matching) ใหมีลักษณะเหมือนกันในเรื่องของ
อายุ, เพศ และปจจัยอื่นๆ ที่คิดวาเกี่ยวของจํานวนคน
f 246 e
สถิติในการวิจัย
16.7 การวิเคราะหความแปรปรวน (Analysis ดู ค วามแตกต า งในกรณี นี้ จํ า เป น ต อ งวิ เ คราะห ค วาม
of Variances) แปรปรวน ของทั้ง 5 กลุม ไปพรอมกันดวยวิธี One-way
การวิเคราะหความแปรปรวน (Analysis of ANOVA ในที่นี้จะกลาวถึงสูตรที่ใชกอน จากนั้นจะแสดง
Variance) นิยมเรียกโดยใชคํายอวา ANOVA เปนวิธีการ การใชโปรแกรมสําเร็จรูปในการวิเคราะห ซึ่งมีหลายชนิด
วิเคราะหเพื่อดูวาความผันแปรในแตละกลุมขอมูลมีความ เชน SPSS, SAS, STATA, etc. โดยการนําเสนอผลการ
แตกตางในดานคาเฉลี่ยและความแปรปรวนอยางไร กรณี วิเคราะหดวยคอมพิวเตอร และวิธีการสรุปผลการวิเคราะห
ของขอมูลมี 2 กลุม การทดสอบสามารถใช t-test ซึ่งเปน ตอไป
กําหนดให Xij = คาสังเกตตัวที่ i จาก treatment ที่ j
รู ป แบบไม ซั บ ซ อ น แต ก รณี ข องข อ มู ล ที่ มี จํ า นวนกลุ ม
มากกวานั้น จําเปนตองใชการวิเคราะหแบบ ANOVA ใน โดย i = ลําดับที่ในแตละกลุม
รูปแบบปกติซึ่งใช F-test ขอมูลที่จะวิเคราะหดวยวิธีนี้ เปน j = ลําดับของ treatment นั้นๆ
ขอมูลเชิงปริมาณ และมีขอตกลงเบื้องตน (Assumption)
ดังนี้ ดังแสดงในตารางตอไป
i. ขอมูลตองมีลักษณะแจกแจงแบบปกติ(ถาไม
เปนแบบปกติตองใชวิธีของ Nonparametric Statistics) Treatment
ii. ขอมูลแตละชุดตองเปนอิสระจากกัน 1 2 3-------------------k
iii. มีความแปรปรวนของประชากรเทากัน (σ2 X11 X12 X13-------------------X1k
เทากันทุกกลุม) X21 X22 X23-------------------X2k
ตัวอยางที่ตองมีการวิเคราะห ANOVA ไดแก การ X31 X32 X33-------------------X3k
วิจัยแบบทดลองทางคลินิก (Clinical trial) ซึ่งมีการจัดสรร | | | |
กลุมตางๆ แบบสุม (Randomization) กลุมตางๆ จะไดรับ | | | |
ปจจัย (factor) หรือวิธีการรักษา (treatment) ที่แตกตางกัน | | | |
เชน การใหยารัก ษาเปรี ยบเทียบสี่ชนิด หรือสี่รูป แบบ ใน Xn11 Xn22 Xn33-----------------Xnkk
กลุมคนไขที่ปวยดวยโรคหนึ่ง เพื่อดูผลการรักษาวามีความ Total T1 T2 T3-------------------T
แตกตางกันหรือไม ชนิดของการวิเคราะหที่จะกลาวตอไป Mean X1 X2 X 3 ---------------- X
จะขอกลาวเพียง 2 ชนิด ดังนี้
16.7.1 One-way ANOVA เป น วิ ธี ที่ ง า ยเพื่ อ ให T = ผลรวมของคาสังเกตในแตละ treatment
i
ศึกษาความผันแปรของกลุมขอมูลในระนาบเดียว เชนการ Xj = คาเฉลี่ยแตละ treatment
วิเคราะหวา มีความแตกตาง ของ treatment แตละชนิด n = n1 + n2 -------nk
หรื อ ไม การวิ เ คราะห แ บบระนาบเดี ย วนี้ เ หมาะสมกั บ
รู ป แบบการวิ จั ย ทดลองที่ มี ก ารจั ด สรรกลุ ม แบบสุ ม โดย หลักการคํานวณเพื่อนําไปสรางตาราง ANOVA
สมบูรณทุกมิติ (Completely randomized design, CRD) Source of Variation df SS MS F-ratio
เชน การศึกษาหนึ่งมี 5 treatments ตองการดูวามีความ
Between groups k-l SSB MSB MSB = F
แตกตางกันหรือไม ถาใชวิธีการเปรียบเทียบครั้งละคูแบบ
Within groups n-k SSW MSW MSW
t-test นั้นจะตองทําถึง 10 คู (5C2) ทําใหโอกาสที่จะไม
Total n-l SST
สามารถปฏิเสธ Ho เทากับ (0.95)10 หรือโอกาสปฏิเสธ Ho
คือ 1 – (0.95)10 = .4013 ซึ่งมีคาสูงมาก และคา t ที่ไดแต
ละคาไมเปนอิสระกัน จึงนําไปสูการสรุปที่ไมถูกตองได การ
f 247 e
สถิติในการวิจัย
หลักการคํานวณใชหลักการเดียวกับการหาคา ชนิ ด มี ค วามแตกต า งในเรื่ อ งของค า เฉลี่ ย ระยะเวลาที่
ความแปรปรวนในตัวอยางเพียงแตคํานวณแตละสวน เชน ตอบสนองอยางมีนัยสําคัญทางสถิติที่ .05 หรือไม
ผลรวมกําลังสอง (Sum square, SS) และ Mean square,
MS) โดยคํานวณจาก SS/df นั่นเอง ขั้นตอนการคํานวณมี ชนิดของยา
ดังนี้ I II III
Correction term (CT) = กําลังสองของผลรวม 16 6 8
2
ทั้งหมด / n = TN 14 7 10
SST = ผลรวมแตละคายกกําลังสอง - CT 14 7 9
13 8 10
= ∑∑ X2ij – CT
13 4 6
SSB = ผลรวมแตละ treatment (T) ยกกําลังสอง
12 8 7
จํานวนตัวอยางในแตละ treatment
2 12 9 10
T12 T22 T32 ...Tj
= n + n + n + n − CT 17 6 9
1 2 3 j
17 8 11
SSW (Sum square within) หรือ SSE (Sum 17 6 11
square error) = SST – SSB คา F ที่ไดเปนอัตราสวน 19 4 9
ระหวาง MSB (ความแปรปรวนระหวางกลุม) นั่นเอง 14 9 10
MSW (ความแปรปรวนภายในกลุม) 15 5 9
โดยมี df ที่ k–1 และ n–k 20 5 5
คาเฉลี่ย 15.21 6.57 8.86
สมมติฐาน Ho : คาเฉลี่ยของประชากรในและกลุมเทากัน
μ1 = μ2 = μ3 = ..................μk วิธีทํา
Ha : คาเฉลี่ยของประชากรตางกันอยางนอย 1คู สมมติฐาน Ho : คาเฉลี่ยของระยะเวลาตอบสนองในยา
μi ≠ μj แตละชนิดไมตางกัน
μ1 = μ2 = μ3
การสรุปผล ถาคา F ที่คํานวณไดมากกวาคา F จากตาราง Ha : μi ≠ μj อยางนอย 1 คู
แสดงวาปฏิเสธ Ho นั่นคือ คาเฉลี่ยตางกันอยางนอย 1 คู
ก็จะมีวิธีการตางๆ ทดสอบดูวาคูใดบางที่ตางกัน วิธีที่ใช ผลการวิเคราะหดวย SPSS ไดผลดังนี้
กันทั่วไปไดแก LSD (Least Significant Difference), ไปเลือกเมนู Compare Means, One-way ANOVA (จะไม
Duncan’s new multiple range test, Turkey HSD และ กลาวถึงรายละเอียดการใชโปรแกรม) ไดผลดังนี้ ผลการ
Scheffe แตละวิธีจะมีขอดี ขอเสียตางกันไปจะไมกลาวใน ทดสอบ c พบวาความแปรปรวนในประชากรแตละกลุม
ที่นี้ ไมตางกัน (p = .142)
ANOVA
time
Sum of Squares df Mean Square F Sig.
Between Groups 561.571 2 280.786 67.806 .000
Within Groups 161.500 39 4.141 d e
Total 723.071 41
f 249 e
สถิติในการวิจัย
16.7.2 Two-way ANOVA จากการวิเคราะห 16.8 สหสัมพันธและความถดถอย (Correlation
แบบระนาบเดี ย วข า งต น นั้ น จะมี ค วามแตกต า งเฉพาะ and Regression )
ปจจัยที่ไดรับเทานั้นโดยหนวยตางๆที่ศึกษาในกลุมที่ไดรับ ในการวิเคราะหความสัมพันธระหวางตัวแปร 2
ป จ จั ย เ ดี ย ว กั น นั้ น จ ะ ต อ ง มี ค ว า ม ค ล า ย กั น ตั ว ที่ เ ป น ขอ มู ล ชนิ ดจํ า นวนแบบต อ เนื่อ งและวัด ในคนๆ
(Homogeneous) แต ถ า ในกลุ ม เดี ย วกั น ยั ง มี ค วาม เดียวกัน ทําไดสองแบบ คือแบบสหสัมพันธ (Correlation)
แตกตางกันอีก เชนเพศตางกัน,กลุมอายุตางกัน จะตอง และแบบ วิเคราะหความถดถอย (Regression) กรณีไม
พิจารณาถึงความแตกตางตรงนี้ดวย ความแตกตางเหลานี้ สามารถระบุ ตั ว แปรใดเป น ตั ว แปรอิ ส ระ (ตั ว แปรต น )
จะเรียกวา Block ดังนั้นการจัดหนวยทดลองใหไดรับปจจัย ตัวแปรใดเปนตัวแปรผลลัพธ (ตัวแปรตาม) เชน อายุ และ
นั้นๆ จะถูกวางแผนใหจัดสรรในรูปแบบของ Randomized ความดันโลหิต การวิเคราะหความสัมพันธ ทําไดในแบบ
Complete Block design (RCB) การจัดดวยวิธีนี้ เพื่อ สหสัมพันธ วิเคราะหไดเพียงวา อายุ และ ความดันโลหิต
ขจัดความคลาดเคลื่อนอันเกิดจากความแตกตางกันของ มีความสัมพันธกันในทิศทางใด ระดับความสัมพันธมาก
block และการจัด block ที่เหมาะสมนั้น ขึ้นอยูกับผูวิจัย หรือนอย กรณีที่ทราบไดวาตัวแปรใดเปนตัวแปรอิสระตัว
และการจัดใหมีประสิทธิภาพนั้นควรใหมีความเหมือนกัน แปรใดเปนตัวแปรตาม ผูวิจัยสามารถใชการวิเคราะห
ภายใน block นั้นๆ การวิเคราะห ชนิดนี้จึงเปนแบบสอง ความถดถอยได เชน ถาทราบวาอายุ เปนตัวแปรอิสระ
ระนาบ ขอตกลงเบื้องตนมีขอกําหนดตางๆ เชนเดียวกับ ผูวิจัยทํานายคาความดันโลหิตซึ่งเปนตัวแปรตามได โดย
แ บ บ ร ะ น า บ เ ดี ย ว แ ล ะ มี ข อ กํ า ห น ด เ พิ่ ม คื อ ไ ม มี การสร า งสมการหรื อ รู ป แบบทํ า นายแบบฟ ง ก ชั่ น ทาง
interaction กันระหวาง treatment และ block โดยสรุป พีชคณิต
ตารางการวิเคราะหความแปรปรวนชนิด 2 ระนาบ มีดังนี้ 16.8.1 สหสัมพันธ (Correlation)
เมื่อเก็บขอมูลในแตละรายซึ่งไดมาเปนคูๆ แลว
Source of df SS MS F-ratio ถาใหเปน (Xi, Yi), i = 1, 2 , 3, ........... n เปนคาสังเกต
variation จํานวน n ราย จงคํานวณคาสัมประสิทธิ์ สหสัมพันธ
Treatments k-1 SSTr SSTr/(k-1) MSTr/MSE (Correlation Coefficient) ไดดังนี้
Blocks n-1 SSBl SSBl/(n-1) MSBl/MSE ∑(x − x )(y − y )
Residual (n-1)(k-1) SSE SSE/(n-1)(k-1) r = หรือ
∑(x − x )2 ∑(y − y )2
Total kn-1
∑ xy − ( ∑ x)( ∑ y) / n
r ระดับของความสัมพันธ
>0.8 ถึง 1.0 มาก
>0.5 ถึง 0.8 ปานกลาง
>0.2 ถึง 0.5 นอย
0 ถึง 0.2 ไมควรสนใจ
Model Summary
Model R c Adjusted R Std. Error of the
R Square Square Estimate
1 .883a .780 .762 9.331
a. Predictors : (Constant), age
ANOVAb
Model Sum of Squaes df Mean Square F Sig.
1 Regression 3701.963 1 3701.963 42.515 .000a
Residual 1044.894 12 87.075
Total 4746.857 13
a. Predictors : (Constant), age
b. Dependent Variable : sbp
f 252 e
สถิติในการวิจัย
a
Coefficients
Unstandardized Coefficients Standardized
Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 89.309 6.965 12.822 .000
Age 1.024 .157 .883 6.520 .000
a. Dependent Variable : sbp
f 253 e
สถิติในการวิจัย
เอกสารอางอิง
1. เติมศรี ชํานิจารกิจ สถิติประยุกตทางการแพทย โรงพิมพจุฬาลงกรณมหาวิทยาลัย กรุงเทพฯ 2540.
2. ทัสสนี นุชประยูร และเติมศรี ชํานิจารกิจ บรรณาธิการ สถิติในวิจัยทางการแพทย: โอเอสพริ้นติ้งสเฮาส, กรุงเทพฯ
2541.
3. Altman D.G. : Practical Statistics for Medical Research. Chapman & Hall 1996.
4. Armitage P. & Berry G. Statistical Methods in Medical Research 3rd edition. Blackwell Scientific Publication
Oxford, 1994.
5. Campbell M.J. & Machin D. Medical Statistics: A Commonsense Approach. John Wiley & Sons Ltd.
England 1991.
6. Colton T. Statistics in Medicine: Little, Brown and Company Boston 1974.
7. Daniel, WW Biostatistics: A Foundation for Analysis in the Health Sciences, 8th edition, Wiley, New
York, 2005.
8. Gardner, MJ & Altman, DG Confidence intervals rather than P values: estimation rather than hypothesis
testing. British Medical Journal 1986;292:746-750.
9. Lemeshow S, David W, Hosmer Jr, Klor J and Lwanga SK. Adequacy of sample size in Health studies
John Wiley & Sons 1990.
10. Levy P.S. & Lemeshow S. Sampling for Health Professionals Lifetime Learning publications, Belmont, CA,
1984.
11. Pagano M. & Gauvreau K. Principles of Biostatistics. Duxbury Press, Belmont, CA 1993.
12. Schlesselman JJ. Case-Control Studies: Design, Conduct, Analysis Oxford University Press 1982.
f 254 e
สถิติในการวิจัย