You are on page 1of 31

บทที่ 16

สถิติในการวิจัย
สมรัตน เลิศมหาฤทธิ์

16.1 บทนํา
ปจจุบันนี้ สถิติถูกนํามาใชอยางแพรหลายในงานตางๆ หลายสาขา
เชน ธุรกิจ สังคมศาสตร ระบาดวิทยา การแพทย และสาธารณสุข ฯลฯ
ในทางการแพทยนั้น สถิติถูกนํามาใชในงานโรงพยาบาล, การตรวจสอบ,
การจัดสรรทรัพยากร และดานอื่นๆ
การทํ า วิ จั ย จํ า เป น ต อ งใช ส ถิ ติ ม าช ว ยตั้ ง แต เ ริ่ ม ต น ได แ ก การ
คํา นวณขนาดตัว อย า งที่ เ หมาะสม กระบวนการสุ ม กระบวนการจั ด สรร
หลั ง จากเก็ บ ข อ มู ล ได สถิ ติ เ ป น เครื่ อ งมื อ สํ า คั ญ ที่ ใ ช ใ นการวิ เ คราะห
จนกระทั่งสุดทายคือการรายงานผลและการตีพิมพก็มีการแสดงผลทางสถิติ
เพื่อแสดงถึงความนาเชื่อถือของผลการวิจัย และการนําไปใช ดังนั้น ถาการ
ใชสถิติไมถูกตอง ก็จะทําใหผลที่นําเสนอนั้นไมถูกตอง เมื่อผูอานนําไปใชก็
จะผิดพลาดได

16.2 ขอมูล (Data)


ขอมูลแบงอยางกวางๆ ไดเปน 2 กลุม คือ ขอมูลเชิงลักษณะ
(Categorical data) หรือขอมูลเชิงคุณภาพ (Qualitative data) และขอมูล
เชิงจํานวน (Numerical data) หรือขอมูลเชิงปริมาณ (Quantitative data)
ขอมูลเชิงลักษณะ (Categorical data) จําแนกตอไปไดเปน ชนิด
สองคุณลักษณะ และ ชนิดมากกวาสองคุณลักษณะ
ขอมูลชนิดสองคุณลักษณะ เชน เพศชาย หรือหญิง, เปนโรคหรือไม
เปนโรค ขอมูลชนิดนี้อาจมีชื่อเรียกไดหลายอยาง ไดแก Binary data,
Dichotomous data, yes/no data, Attribute data และ 0-1 data (ในที่มี
การใชตัวเลข 0 และ 1 ใชแทนคาลักษณะของขอมูล)
16.1 บทนํา ขอมูลชนิดมากกวาสองคุณลักษณะ มีสองแบบ ถาตางกันเพียง
16.2 ขอมูล
ลักษณะที่เห็นเรียกวา Nominal data เชน หมูเลือด A, B, AB, O แตถา
16.3 การประมาณคาพารามิเตอร
ลักษณะที่เห็นนั้นสามารถบอกความแตกตางเปนลําดับเรียกวา Ordinal
16.4 การทดสอบสมมติฐาน
16.5 นัยสําคัญทางสถิติ และนัยสําคัญทาง data เชน ระดับความเจ็บปวด นอย, ปานกลาง, มาก ขอมูลแบบหลังนี้อาจ
คลินิก ลดคุณลักษณะลงใหเหลือเพียง 2 กลุมลักษณะก็ได เชน ความเจ็บปวดจาก
16.6 การทดสอบไคสแควร เดิมวัด 3 ระดับสามารถวัดเพียง 2 ระดับคือ ปวด/ไมปวด การทําเชนนี้อาจมี
16.7 การวิเคราะหความแปรปรวน ความจําเปนในการวิเคราะหและการนําเสนอในบางกรณี แตมีผลใหสูญเสีย
16.8 สหสัมพันธและความถดถอย รายละเอียดของขอมูลนั้นได
 
ขอมูลเชิงจํานวน (Numerical data) จําแนก บันทึกผิดพลาดไปบางคา มัธยฐานอาจไมถูกกระทบ หรือ
ออกไดเปน ขอมูลไมตอเนื่อง (Discrete data) และ กรณีที่ขอมูลมีคาสูงหรือต่ําเกินไปจะไมทําใหคามัธยฐาน
ขอมูลตอเนื่อง (Continuous data) เปลี่ยนแปลง จึงมีความเหมาะสมกับขอมูลที่มีความ
ขอมูลไมตอเนื่อง เปนขอมูลใชนับและคาที่ไดจะ แตกต า งของค า มากๆ ป จ จุ บั น งานวิ จั ย ต า งๆ มี ก ารใช
ไมมีความตอเนื่อง เชน จํานวนคนไขที่ตรวจที่แผนกผูปวย มัธยฐานแพรหลาย บางครั้ง นําเสนอคูกับคาเฉลี่ย
นอก, จํานวนครั้งการเตนของหัวใจ ค. ฐานนิยม (Mode) เปนการบอกคาที่มีความถี่
ขอมูลตอเนื่อง เปนขอมูลที่ไดจากการวัดคาไม มากที่สุดหรือพบไดบอยที่สุด กรณีที่มีคาเกิดขึ้นบอยพอๆ
สามารถแยกไดเด็ดขาด แมจะแสดงจํานวนเต็ม เชน กัน 2 คา จะเรียกวา bimodal ฐานนิยมเหมาะกับขอมูล
น้ําหนัก, สวนสูง, ความดันโลหิต ขอมูลชนิดตอเนื่องนี้มี ชนิดจําแนกกลุม
กําลังในการวิเคราะหทางสถิติมากกวาชนิดอื่น ๆ
การวัดในระดับตางๆ และชนิดของขอมูลมี ตัวอยางที่ 16.1 จากขอมูลระยะเวลา (วัน) ที่อยูใน
ความสําคัญในการวิเคราะห แสดงไดตามแผนผังตอไปนี้ โรงพยาบาลของคนไข จํานวน 12 ราย มีดังนี้
3, 3, 4, 5, 7, 7, 7, 9, 10, 11, 12, 18
จงบอกจํานวนวันโดยเฉลี่ยที่คนไขอยูโรงพยาบาล

การคํานวณ
คาเฉลี่ย = 3+3+.................+18) / 12 =8
7+7
คามัธยฐาน = =7
2
คาฐานนิยม = 7 =7
16.2.1 การพรรณนาขอมูล(Describing data)
สิ่งที่ควรตองมีในการพรรณนา คือ แนวโนมเขาสู วิเ คราะห เนื่ อ งจากข อ มู ล มีค า แตกต า งกั น มาก วิ ธีบ อก
ส ว นกลาง และความผั น แปรของข อ มู ล ซึ่ ง มี วิ ธี ใ นการ แนวโนมเขาสูสวนกลางที่เหมาะสมจึงควรใช มัธยฐาน
คํานวณหลายวิธี ดังนี้
ตอบ จํานวนวันที่คนไข อยูโรงพยาบาล คือ 7 วันโดยเฉลี่ย
i. วิธีบอกแนวโนมเขาสูสวนกลาง (measures of
central tendency) วิธีที่นิยมใชและรูจักกัน คือ ii. วิธีบอกความผันแปร (measures of variability) มีวิธี
ก. คาเฉลี่ย (Mean) หรือคาเฉลี่ยเลขคณิต ตางๆ ที่ใชไดแก
(arithmatic mean) ซึ่งไดจากการรวมทุกๆ คาของขอมูล ก. พิสัย (Range) หมายถึง คาสูงสุด ถึงคา
แลวหารดวยจํานวนตัวอยาง วิธีนี้มีขอดีคือ คาทุกคาไดถูก ต่ํา สุด เปน วิธีบ อกความผัน แปรที่ครา ว คือไมมีก าร
นํามาใช และคาเฉลี่ยสามารถนําไปใชในการทดสอบ กลั่นกรองคาตางๆในขอมูลนั้น ไมนิยมใชมากนัก
สมมติ ฐ านต อ ไปได แต ค า เฉลี่ ย ก็ มี ข อ ไม ดี คื อ ถู ก ข. เปอรเซนไทล (Percentile) หมายถึงคาของ
กระทบกระเทือนไดงาย จากขอมูลบางอันที่มีคาสูงหรือต่ํา ขอมูลที่จํานวนต่ํากวาคานั้นวามีกี่เปอรเซ็นต เชน P20 ของ
เกินไป ทําใหคาเฉลี่ยสูงหรือต่ํากวาความเปนจริงได น้ําหนักตัวของนักเรียนชั้นประถมแหงหนึ่งเทากับ 28 กก.
ข. มัธยฐาน (Median) เปนคาที่อยูในตําแหนง หมายความวามีจํานวนนักเรียน 20% ที่มีน้ําหนักต่ํากวา
ตรงกลางของข อ มู ล เมื่ อ นํ า ข อ มู ล ทั้ ง หมดมาเรี ย งกั น 28 กก. การบอกเปนเปอรเซ็นตไตล คือการแบงจํานวนของ
ตามลําดับคาจากมากไปนอย ขอดีของวิธีนี้คือ ถามีการ ขอมูลทั้งหมดเปน 100 สวน ถาแบงจํานวนทั้งหมดของ
f 225 e
สถิติในการวิจัย
 
ขอมูลเปน 10 สวน จะเรียกวา เดไซล (Decile) และถา ตําแหนง สวนคา SD ใหมีคาทศนิยมมากกวาคาเฉลี่ยอยู 1
แบงเปน 4 สวน จะเรียกวา ควอไทล (Quartile) วิธีที่นิยม ตําแหนง
ในการบอกความผันแปรของขอมูลซึ่งใชคูกับมัธยฐาน คือ ข. ตาราง (tables)
Inter-quartile range หรือคือ คาระหวาง P25 และ P75 หรือ การนําเสนอในรูปตารางใหแสดงกลุมที่ตองการ
Q3-Q1 จําแนกอยูในแนวตั้ง (column) ตัวแปรตางๆ ใหแสดงใน
ค . ค า ค ว า ม แ ป ร ป ร ว น (Variance) แ ล ะ แนวนอน (row) ถาจํานวนคาสังเกตไมมากไมจําเปนตอง
คาเบี่ยงเบนมาตรฐาน (Standard deviation, SD) คํานวณรอยละ ควรใหเสนอเปนจํานวนที่แทจริง เนื่องจาก
คาแปรปรวน (Variance) คือผลรวมของความตางของ การนําเสนอในรูปรอยละ อาจทําใหเขา ใจผิดวา จํานวน
ขอมูลแตละอันจากคาเฉลี่ย ดังสูตร ตัวอยางมีมาก

Variance =
∑ (X − X )
i
2
ลักษณะของตารางที่ดี ไดแก
n−1 - ควรบอกผูอานถึงเรื่องนั้นๆ ใหชัดเจน
โดย Xi = คาที่สังเกต, X = คาเฉลี่ย, - คาทั้งหมด หรือจํานวนคาสังเกต (n) ทั้งหมด
n = จํานวนคาสังเกต ควรระบุไวในตาราง
- ถามีการแสดงรอยละ ควรบอกใหชัดเจนถึงที่มา
คา เบี่ ย งเบนมาตรฐาน (SD) คื อ รากที่ส องของค า ความ ของคารอยละ เชน รอยละตามแถว (row percentage)
แปรปรวน ( Variance ) หรือรอยละตามคอลัมน (column percentage) เพื่อให
∑ (X i − X ) 2 ผูอานไดแปลผลถูกตอง
SD =
n−1 - ควรระบุหนวยการวัดใหชัดเจน อาจระบุไวที่หัว
โดย Xi = คาที่สังเกต, X = คาเฉลี่ย, ตาราง
n = จํานวนคาสังเกต - ตารางควรเสนอผลอยางชัดเจน และควร
หลีกเลี่ยงตารางที่ซับซอนเกินไป เพราะจะทําใหการแปล
คา SD นิยมใชมากกวา ผลผิดพลาดและเกิดความสับสน
เหตุผลที่ไมนิยมใชคาแปรปรวน เนื่องจากหนวย
เปนกําลังสอง จึงตองถอดรากที่สอง (ซึ่งคือ SD) เพื่อให ในกรณีที่ขอมูลเปนชนิดจํานวนและตองมีการจัด
หนวยเหมือนกับขอมูล จึงจะนําไปใชในการวิเคราะหตอไป กลุ ม หรื อ การแบ ง ชั้ น เพื่ อ การนํ า เสนอในรู ป ตารางเป น
ได จํานวนนับแยกตามชั้น มีขอแนะนํา ดังนี้
- จํานวนชั้นที่จัดแบง ควรจะอยูระหวาง 10-20
16.2.2 การนําเสนอขอมูล (Data presentation) ชั้น ถามีจํานวนชั้นนอยเกินไป จะทําใหชวงของชั้นกวาง
ก. ในรูปของจํานวน (numerical presentation) มากอาจขาดรายละเอียดของขอมูล แตถามีจํานวนชั้นมาก
ไม ค วรนํ า เสนอข อ มู ล ในรู ป ของค า เฉลี่ ย เพี ย ง
ไปก็อาจไมพบขอมูลในบางชั้น
อยางเดียว แตควรมีคาที่บอกความผันแปรควบคูไปดวย
- ขีดแบงของแตละชั้นตองสอดคลองกับคาของ
โดยทั่วไปจะแสดงคา SD ในวงเล็บ ไมแนะนําการเขียนใน
ขอมูลดิบ
รูปแบบ mean + SD เชน คาเฉลี่ยความดันโลหิตเปน
- ชวงกวางของชั้น ถาเทาๆ กันจะสะดวกในการ
102.3 (SD 11.9) มม.ปรอท ไมแนะนําใหเขียนวา 102.3
คํานวณขั้นตอไป
+ 11.9 มม.ปรอท สําหรับตัวเลขหลังจุดทศนิยม แนะนํา
- ชวงกวางแตละชั้น จะตองแยกจากกันแทจริง
เสนอค า เฉลี่ ย ที่ มี ค า ทศนิ ย มมากกว า ข อ มู ล ดิ บ อยู 1
- ควรหลีกเลี่ยงการจัดชั้นที่เปนชวงเปด

f 226 e
สถิติในการวิจัย
 
- ในกรณีจัดชั้นไวกอนแลว ถาไมสามารถหา ข . ต ร ว จ ส อ บ ท า ง ต ร ร ก วิ ท ย า (logical
ขอมูลดิบไดก็อาจใชจุดกลางชั้น (mid point) แทน check) เปนการตรวจดูวาตัวแปรที่เกี่ยวของกันนั้นมีความ
ค. กราฟ (graphs) สมเหตุสมผลหรือไม เชน การคํานวณจํานวนครั้งของการ
ปจจุบัน มีโปรแกรมสําเร็จรูป ตางๆ สํา หรับ การ ตั้งครรภซึ่งจะมีคําตอบเฉพาะผูหญิง ดังนั้นขอมูลนี้ใน
นําเสนอขอมูลเปนรูปกราฟหรือแผนภูมิ ซึ่งทําไดสวยงาม กลุ ม เพศชายไม ค วรมี การเตรี ย มก อ นการวิ เ คราะห
แตผูวิจัยควรทราบถึงชนิดของกราฟหรือแผนภูมิที่เลือกใช สามารถให ร หั ส กลุ ม ที่ ไ ม เ ข า ข า ยเพื่ อ แยกออกจากการ
โดยดูจากลักษณะของขอมูล กลาวคือ วิเคราะห จะไดทําการวิเคราะหเฉพาะรหัสกลุมที่มีความ
สําหรับขอมูลเชิงปริมาณ:ฮิสโตแกรม, Frequency เปนไปไดเทานั้น
polygon, Box-plot ค. การตรวจสอบวันเวลา (dates) ในการ
สําหรับขอมูลเชิงคุณภาพ: แผนภูมิแทง, แผนภูมิ วิ เ คราะห บ างอย า ง เช น การวิ เ คราะห ก ารมี ชี วิ ต รอด
วงกลม, แผนภูมิรูปภาพ (Survival analysis) ขอมูลที่บันทึกเกี่ยวกับเวลาทั้งหมดมี
สําหรับแสดงความสัมพันธระหวางตัวแปร 2 ตัว: ความสําคัญ มาก ถามีการลงตัวเลขผิด ผลที่ไดจากการ
Scatter diagrams คํ า นวณก็ ผิ ด พลาด ดั ง นั้ น จึ ง ควรตรวจทานตั ว เลขที่
เกี่ยวของกับเวลาอีกครั้ง ใหแนใจวาบันทึกไดตรง บางครั้ง
16.2.3 การเตรี ย มการก อ นการวิ เ คราะห อาจตรวจสอบคราวๆ เชน ดูเวลาที่เริ่มเปนโรคและเวลาที่
ขอมูล (preparing to analyze data) เสี ย ชี วิ ต ของคนไข แ ต ล ะคน มี ลํ า ดั บ ของเวลาถู ก ต อ ง
การตรวจสอบขอมูลมีความสําคัญมาก ควรทํา หรือไม เปนตน
กอนที่จะมีการวิเคราะหเสมอ แนวทางในการตรวจสอบมี ง. ขอมูลที่สูญหาย (missing data) ในการ
ดังนี้ ตรวจขอมูลกอนการวิเคราะหนั้น มักพบวามีบางตัวแปรที่
ก. ตรวจสอบชว งของข อมูล (range check) ไมสามารถเก็บขอมูลไดครบ ซึ่งอาจเปนไปไดวาผูตอบ
เปนการตรวจดูความเปนไปไดของคาที่บันทึก กรณีของ
แบบสอบถามไม อ ยากเป ด เผยข อ มู ล ในส ว นนี้ หรื อ
ข อ มู ล บอกลั ก ษณะ เช น หมู เ ลื อ ด ถ า มี ก ารบั น ทึ ก ที่
ผูสัมภาษณไมสามารถสํารวจขอมูลสวนนี้ไดครบ เมื่อมี
นอกเหนือจาก A, B, O และ AB แสดงวาเปนขอมูลที่
ขอมูลขาด ผูวิจัยอาจตัดสินใจแยกขอมูลชุดที่ไมครบออก
บันทึกผิดพลาด กรณีขอมูลบอกปริมาณ ใหดูคาต่ําสุดและ
ตางหากจากการวิเคราะห หรืออาจแกไขโดยการประมาณ
คาสูงสุดวามีโอกาสเปนไปไดหรือไม เชน อายุของมารดา
คาสําหรับขอมูลที่ขาดหายไป โดยวิธีใชคาเฉลี่ยของขอมูล
เมื่อมีบุตรคนแรก ชวงอายุที่เปนไปไดคือ 14 ถึง 45 ป ถามี
ที่มีอยูแทนลงไป การแกไขโดยใสคาเฉลี่ยมีความจําเปนใน
คาต่ําเกินไปหรือสูงเกินไปจากชวงนี้ ซึ่งเรียกวา Outliers
การวิ เ คราะห บ างอย า ง เช น การวิ เ คราะห เ ชิ ง พหุ
ตองตรวจสอบดูวาการเก็บขอมูลมีความผิดพลาดหรือไม
(Multivariate analysis) ตัวอยางของขอมูลที่มักขาดไป
การตรวจสอบนี้ ยังมีประโยชน เพื่อพิจารณาแยก
เชน รายได อายุ เปนตน ซึ่งมักประมาณคาโดยใสคาเฉลี่ย
คาบางคาที่ตางจากกลุมมากๆ ออกมากอนการวิเคราะห
กรณีข องขอ มู ลที่ข าดเปน วัน เดือ นป ใหใ สค า โดยใชวั น
เช น ในกรณี ข องผลตรวจทางห อ งปฏิ บั ติ ก าร เพราะถ า
กึ่งกลางของเดือน คือวันที่ 15 และเดือนกึ่งกลางของป คือ
นําเขารวมในการวิเคราะหอาจทําใหคาเฉลี่ยที่ไดเปลี่ยนไป
เดือนที่ 6 หรือ 7
มาก การตรวจสอบทําใหผูวิจัยไดทราบลักษณะของขอมูล
และตัดสินใจวาควรจะนําคาของขอมูลที่เปน Outlier เขา 16.2.4 การวิเคราะหขอมูล (Data analysis)
มาสูการวิเคราะหหรือไม หรืออาจทําการวิเคราะหทั้งแบบ ชนิ ด ของสถิ ติ นิ ย มแบ ง เป น สถิ ติ เ ชิ ง พรรณนา
ที่ใชและไมใช Outlier ของขอมูลนั้นแลวดูผลเปรียบเทียบ (descriptive statistics) และสถิติเชิงอนุมาน (inferential
กัน statistics)

f 227 e
สถิติในการวิจัย
 
สถิ ติ เ ชิ ง พรรณนาใช สํ า หรั บ การวิ จั ย รู ป แบบ ตรวจสอบการแจกแจงของขอ มู ลวา เปน ไปตามเงื่ อ นไข
เชิงสํารวจและพรรณนา ซึ่งไมมีการทดสอบสมมติฐาน สมมติ (Assumption) หรือไม เชน มีการแจกแจงแบบปกติ
สถิ ติ เ ชิ ง อนุ ม านใช สํ า หรั บ การวิ จั ย รู ป แบบเชิ ง หรือไม ถาไมเปนไปตามเงื่อนไขสมมติ อาจตองมีการ
วิเคราะหและเชิงทดลอง ที่ตองมีการทดสอบสมมุตติฐาน แปลงขอมูลเชน ใช logarism เปลี่ยนลักษณะของการ แจก
เพื่อตอบคําถามวิจัย แจงใหเปนแบบปกติกอน จึงทําการวิเคราะหตอไป
การอนุ ม าน คื อ การอ า งสรุ ป ผลที่ ไ ด จ าก 3. ขั้นตอนการวิเคราะหทางสถิติ (Statistical
การศึกษาตัวอยาง เปนลักษณะของประชากรเปาหมาย analysis) ขั้นตอนนี้เปนการวิเคราะหผลโดยใชโปรแกรมที่
ถ า ตั ว อย า งที่ สุ ม มานั้ น ไม เ ป น ตั ว แทนที่ ดี ข องประชากร เหมาะสม โดยทั่วไป โปรแกรมสําหรับขอมูลเชิงลักษณะ
ย อ มจะนํ า ไปสู ก ารสรุ ป ที่ ผิ ด พลาด ถึ ง แม ว า จะใช วิ ธี และขอมูลเชิงจํานวนจะแตกตางกัน และโปรแกรมสําหรับ
วิเคราะหอยางถูกตองก็ตาม นอกจากนี้ ความนาเชื่อถือ วิเคราะหการแจกแจงขอมูลแบบปกติ (bell shape) และ
ของผลการอนุมานยังขึ้นอยูกับปจจัย 2 อยาง คือ จํานวน การแจกแจงข อ มู ล ที่ มี ก ารเบ ข องกราฟ (skew) จะไม
ตัวอยาง และ ธรรมชาติความผันแปรมากหรือนอย ใน เหมือนกัน ดังนั้น นักวิจัยจึงควรรูกอนวา ขอมูลเปนชนิดใด
ประชากรที่ศึกษา และการแจกแจงขอมูลเปนแบบปกติหรือไม
ถาการศึกษาใชจํานวนตัวอยางมาก การอนุมาน โปรแกรมการวิเคราะหอาจแยกตามการใชงานได
จะมีความนาเชื่อถือมากขึ้น ขณะเดียวกัน ถาคุณลักษณะ เปน 3 กลุมใหญ ดังนี้
ในประชากรศึกษามีความผันแปรนอ ย การอนุมานจะมี ก. การประมาณค า พารามิ เ ตอร (Parameter
ความนาเชื่อถือมากขึ้น estimation)
การวิเคราะหสําหรับสถิติเชิงพรรณนาและสถิติ ข. การทดสอบสมมติฐาน (Hypothesis testing)
เชิงอนุมานใชกระบวนการวิเคราะหอันเดียวกัน เพียงแต - การทดสอบสําหรับขอมูลชนิดปริมาณ
สถิติเชิงพรรณนาไมตองมีการพิสูจนสมมติฐานหรือการดู - การทดสอบสําหรับขอมูลชนิดกลุม
ความแตกตางกันอยางมีนัยสําคัญทางสถิติเหมือนในสถิติ - การทดสอบโดยการวิเคราะหความแปรปรวน
เชิงอนุมาน โดยทั่วไปกระบวนการในการวิเคราะหมีสาม ค. การดูความสัมพันธของตัวแปรและการทํานาย
ขั้นตอน ดังนี้ คาตัวแปร (Correlation and Regression)
1. ขั้ น ต อ น ก า ร จั ด ก า ร ข อ มู ล เ พื่ อ ก า ร
วิเคราะห (Data management) เปนขั้นตอนที่ทํากอนจะ 16.3 การประมาณคาพารามิเตอร (Parameter
เริ่ ม วิ เ คราะห โดยมี ก ารลงรหั ส และใส ค า ข อ มู ล ใน estimation)
คอมพิวเตอร ในขั้นตอนนี้ควรมีนักสถิติดูแลใกลชิดรวมกับ ค า พารามิ เ ตอร (Parameter) คื อ ค า ที่ บ อก
ผูที่จัดการขอมูล ซึ่งประกอบดวย คนลงรหัส, คนปอน ลักษณะของประชากร สวนคาสถิติ (Statistics) คือคาที่
ขอ มูลเขา คอมพิว เตอรแ ละโปรแกรมเมอร ทั้ ง นี้เพื่อ การ บอกลักษณะของตัวอยางการใชสัญลักษณจะตางกัน ดังนี้
เตรียมขอมูลใหพรอมสําหรับการวิเคราะหดวยโปรแกรม
สําเร็จรูปทางสถิติ ตอไป คาที่วัด Parameter Statistics
2. ขั้ น ตอนการวิ เ คราะห เ ชิ ง สํ า รวจข อ มู ล
(Exploratory data analysis) ขั้นตอนนี้จะเริ่มวิเคราะห คาเฉลี่ย μ X
โดยตรวจดู ผ ลเบื้ อ งต น ที่ เ ป น ไปได โดยอาจทํ า การหา คาความแปรปรวน σ2 S2
คาความถี่, รอยละ, คาเฉลี่ย เปนตน ถาคาใดมีคาสูงหรือ คาเบี่ยงเบน σ S
ต่ําจนผิดปกติจากกลุม หรือที่เรียกวา Outlier จะได มาตรฐาน
พิจารณาวาควรนําเขาไปวิเคราะหหรือไม นอกจากนี้ จะได คาสัดสวน P p
f 228 e
สถิติในการวิจัย
 
ลักษณะ ประชากรกลุม ประชากรสองกลุม คา SE จึงแตกตางจาก SD กลาวคือ SD เปน
การวัด เดียว การบอกความผั น แปรของข อ มู ล จากตั ว อย า งว า การ
คาเฉลี่ย ประมาณค า เฉลี่ ย ประมาณผลตางของ กระจายเปนอยางไร ขณะที่ SE จะบอกถึงความผันแปร
ของความดั น โลหิ ต ค า เฉลี่ ย ความดั น ของคาสถิติตางๆ (เชน Sample means) ซึ่งคา SE มีความ
ในประชากรเขตเมือง โลหิ ต ระหว า งคนใน เกี่ยวของกับ SD และ n โดยสูตรดังนี้
เขตเมืองและชนบท SE = SD / n
คาสัดสวน ประมาณค า สั ด ส ว น ประมาณผลตางของ การประมาณคาพารามิเตอรนิยมการประมาณ
หรือ ของความเครี ย ดใน สัดสว นความเครียด แบบเปนชวง (Interval estimation) โดยประเมินวาจะมี
รอยละ ประชากรเขตเมือง ระหว า งคนในเขต โอกาสเท า ใดที่ ค า พารามิ เ ตอร จ ะตกอยู ใ นช ว งนั้ น การ
เมืองและชนบท รายงานผลจะบอกคา 1 คา รวมกับชวงของคาตามรอยละ
ของความเชื่อมั่น (Confidence Intervals หรือ CI) เชน
การประมาณคาพารามิเตอร คือ การใชสถิติใน ความดันโลหิตโดยเฉลี่ยในประชากรเทากับ 135 (130.5,
การคาดคะเนผลที่ เ ป น ของประชากร (ค า เฉลี่ ย และค า 139.5) มม.ปรอท หมายความวาถาสุมตัวอยาง 100 ครั้ง
ความแปรปรวน) จากการศึกษาในตัวอยางที่สุมออกมา จะมี 95 ครั้งที่คาเฉลี่ยจะมีคาเทากับ 130.5 ถึง 139.5 มม.
เนื่องจากผลการศึกษาที่นักวิจัยไดจากการเก็บขอมูลจะ ปรอท
เปนลักษณะของตัวอยาง (ยังไมใชลักษณะของประชากร) คา Parameter = คา Statistics + k × SE
ซึ่งแทจริงแลว เกิดขึ้นจากเราสุมมาหนึ่งแบบ คาเฉลี่ยของ โดยที่ k คื อ ค า สั ม ประสิ ท ธิ์ ค วามเชื่ อ มั่ น (Reliability
ตัวอยาง (Sample mean, X ) ที่คํานวณได มาจาก coefficient) ซึ่งไดแกคา t หรือ Z
การศึกษาครั้งเดียวที่ใชจํานวน n ชิ้น สุมออกมาจาก การคํานวณชวงของความเชื่อมั่น (Calculating confidence
ประชากรที่มีจํานวน N ชิ้น ดังนั้น หากมีการสุมใหมโดยใช Intervals)
จํานวน n ชิ้นอีกครั้งเพื่อทําการคํานวณคาเฉลี่ยของ 16.3.1 การประมาณค า พารามิ เ ตอร จ าก
ตัวอยางครั้งใหม ก็จะไดคาเฉลี่ยอีกคาหนึ่ง ( X2 ) ซึ่งมักไม คาเฉลี่ยของตัวอยาง (Mean estimation)
เทากันพอดีกับคาเฉลี่ยคาแรก ( X1 ) ถาเราทําการสุมมาก i ตัวอยางชุดเดียว (One sample)
σ
ครั้ ง ขึ้ น อี ก ในที่ สุ ด เราจะได ค า เฉลี่ ย ของตั ว อย า ง มี ค า คาเฉลี่ยของประชากร (μ) = X ± Ζ
n
ตางๆ คือ X1 , X2 , X3 ....................... Xn ถานําคาเฉลี่ย X = คาเฉลี่ยของตัวอยาง
ของตัวอยางทั้งหลายเหลา นี้มาดูการแจกแจง จะพบวา
σ = คา SD ในประชากร
เปนรูปแบบการแจกแจงปกติ (Normal distribution) และ
n = จํานวนตัวอยาง
มีคุณสมบัติดังนี้ คือ
Z = คาปกติมาตรฐานซึ่งขึ้นกับการกําหนด
ก. คาเฉลี่ยของ Sample means ( μ X ) มีคา
ชวงความเชื่อมั่น
เทากับคาเฉลี่ยของประชากร (μ) โดยที่ 90 % CI, Z = + 1.64
ข. คาเบี่ยงเบนมาตรฐาน ของ Sample means 95 % CI, Z = + 1.96
( σ X ) มีคาเทากับ σ / n 99 % CI, Z = + 2.58
คาเบี่ยงเบนของ Sample means หรือคือชวงที่
แตในทางปฏิบัติแลวคา σ มักจะไมทราบ ดังนั้น
เปนไปไดของคา μ เรียกวา Standard error ของ mean จะใช SD ในตัวอยางแทน และใชคา t แทนคา Z ซึ่งคา t ก็
อันเปนที่มาของชื่อ Standard Error (SE) นั่นเอง ไดจากการเปดตารางแจกแจงคา t โดยกําหนดให degree

f 229 e
สถิติในการวิจัย
 
of freedom (df) เปน n-1 ดังนั้นการประมาณคา μ จะ กลุมที่ไมเกี่ยวของกัน เชน การดูผลของการรักษาดวยยา ก
เปนดังนี้ และ ยา ข
μ = X ±t
S กําหนดให X1 , X2 = คาเฉลี่ยของตัวอยางชุดที่ 1 และ 2
n S1, S2 = SD ของตัวอยางชุดที่ 1 และ 2
ถ า ขนาดของตั ว อย า งมี จํ า นวนมากพอ (อาจ
n1, n2 = ขนาดตัวอยางชุดที่ 1 และ 2
กลาวไดวามากกวา 30) การแจกแจงคา t ก็จะเขาใกล
μ1, μ2 = คาเฉลี่ยของประชากรชุดที่ 1 และ 2
คา Z ก็อาจใชคา Z แทนได

ในทางทางปฏิบัตินั้นไมอาจทราบคาของความ
ตัวอยางที่ 16.2 จากการสุมตัวอยางประชากรปกติ 100
แปรปรวนของประชากร (σ2 ) ในแตละกลุมจึงอาจมีการ
คน พบวาคาเฉลี่ยของอัตราการเตนของหัวใจเทากับ 85
ทดสอบวา σ2 ของทั้ง 2 กลุมเทากันหรือไม โดยใช F-test
ครั้ง/นาที และ SD เทากับ 10.2 ครั้ง/นาที จงประมาณ
แตในที่นี้จะกําหนดให σ2 เทากันทั้ง 2 กลุม ( σ12 = σ22 )
ค า เฉลี่ ย ของอั ต ราการเต น ของหั ว ใจประชากรทั่ ว ไปที่
ดังนั้นคา SE ของผลตางเฉลี่ยสามารถคํานวณไดจาก
95 % CI
(n1 − 1)S12 + (n2 − 1)S 22
การคํานวณ Sp2 (Pooled variance) =
n1 + n2 − 2
X = 85, SD = 10.2, n = 100
1 1
ที่ 95 % CI, Z = 1.96 SE ของ X1 - X2 = Sp +
n1 n2
(10.2)
ดังนั้น μ = 85 ± 1.96
100 ดังนั้น CI ของ μ1 - μ2 = ( X1 - X2 ) + ( t หรือ Z) SE
= 85 + 2.0
คา t จากตารางเปดที่ df = n1 + n2 - 2 แตถาตัวอยางมี
= 83.0, 87.0
ขนาดใหญพอ (กลุมละ 30 ขึ้นไป) ก็ใชคา Z ได
ตอบ
คาเฉลี่ยของอัตราการเตนของหัวใจในประชากรอยู ตัวอยางที่ 16.3 จากการวัดระดับ serum amylase ใน
ในชวง 83 ถึง 87 ครั้ง /นาที ประชากร 2 กลุม ไดคาเฉลี่ยและ SD ดังตาราง (มีหนวย
ตอ 100 ml)
จากตัวอยางขางตน จะเห็นวาชวงของการประมาณ Subjects n X S
จะขึ้นอยูกับ Hospitalised 22 120 40
1. ขนาดตัวอยาง (n) ถามีคามากชวงการประมาณ Healthy 15 96 35
จะแคบลงและมีความแมนยํามากขึ้น
2. คาความผันแปรในที่นี้คือคา (SD)(2) ถามีคามาก คํานวณ
จะทําใหชวงการประมาณกวางขึ้นความแมนยํา 1 1
คา SE ของ X1 - X2 = Sp +
ก็นอยลง 15 22
Sp2 = (22 − 1)(40) + (15 − 1)(35)
2 2
ii ตัวอยางสองชุด (Two samples) เปนการ
ประมาณคาผลตา งของค าเฉลี่ยจากตัว อยา ง 2 ชุด 22 + 15 − 2
= 1450
ซึ่งแบงเปน 2 กรณี คือ
iia ตัวอยางที่เปนอิสระกัน (Independent Sp = 38.08
samples) หมายถึงตัวอยาง 2 ชุดนี้มาจากประชากร 2

f 230 e
สถิติในการวิจัย
 
แทนคาใน SE ของ X1 - X2 จะได = 12.75 ตัว อย า งที่ 16.4 จากการศึ ก ษาผลของยาคุ มกํ า เนิด ใน
คา t ที่ 95 % CI, df = 35 มีคา 2.03 ผูหญิง 9 คน โดยชั่งน้ําหนักกอนและหลังใหยา 3 เดือน
ดังนั้น 95% CI ของ μ1-μ2 = (120-96) + 2.03(12.75) ไดผลดังตาราง จงประมาณวาที่ 95% CI คาความ
= -1.88 ถึง 49.88 แตกตางของน้ําหนักตัวโดยเฉลี่ยเปนเทาไร
ตอบ
สามารถสรุปไดวาที่ความเชื่อมั่น 95 % ความแตกตางของ น้ําหนัก
ระดับ Serum amylase ในคน 2 กลุมอยูระหวาง -1.88 คนที่ กอน หลัง ผลตาง (di)
ถึง 49.88 ซึ่งชวงนี้ครอบคลุม 0 ดวย จึงชี้ใหเห็นวาไมมี 1 120 123 +3
ความแตกตางกันระหวางคาเฉลี่ยของระดับ Serum 2 141 143 +2
amylase ในคน 2 กลุมนี้ จะเห็นวาคาประมาณนี้จะให 3 130 140 +10
ผลสรุ ป เหมื อ นกั บ การทดสอบสมมติ ฐ านแบบสองทาง 4 150 145 -5
(Two-tailed test) ซึ่งจะกลาวในเรื่องการทดสอบ 5 135 140 +5
สมมติฐานตอไป 6 140 143 +3
7 120 118 -2
iib ตั ว อ ย า ง ที่ มี ค ว า ม เ กี่ ย ว ข อ ง กั น 8 140 141 +1
(Dependent samples) ในกรณีที่ตัวอยาง 2 ชุด มีความ 9 130 132 +2
เกี่ ย วข อ งกั น ได แ ก การวั ด ก อ นและหลั ง การทดลอง,
คํานวณ
การศึกษาแบบ matched pair, การศึกษาแบบ Cross-
∑ di 19
over design ความแตกต า งของข อ มู ล ที่ วั ด ได นี้ จ ะเป น คาเฉลี่ยของผลตาง ( d ) = = = 2.11
n 9
ความแตกตางในแตละคาสังเกต ดังนั้น การวิเคราะหจะนํา ∑(di − d)2
Sd = =
ผลตางที่เปลี่ยนแปลงในแตละคาสังเกตมาทําการคํานวณ n−1
เชน การดูผลการเปลี่ยนแปลงน้ําหนักตัวในผูหญิงกอน 4.197
และหลังการรับประทานยาคุมกําเนิดเปนเวลา 3 เดือน 4.197
คา SE ของ d = = 1.40
หรือในกรณีที่ขอมูลวัดจากคนละกลุมกันแตทั้ง 2 9
คา t ที่ df = 9 - 1 = 8 มีคา 2.31
กลุมมีการจัดใหเหมือนกันเปนคูๆ (Matched pairs) ตาม
ดังนั้น 95 % CI ของคาเฉลี่ยของผลตาง
ป จ จั ย ที่ คิ ด ว า จะมี ส ว นเกี่ ย วข อ งก็ จ ะถื อ ว า ข อ มู ล ทั้ ง
= 2.11 ± (2.31 × 1.40)
2 ชุดเกี่ยวของกัน แมแตการศึกษาในฝาแฝด, สวนของ
= - 1.12 ถึง 5.34
อวัยวะที่มี 2 สวน เชน ตาซาย/ขวา, ไตซาย/ขวา เปนตน
Sd ตอบ
CI ของคาผลตาง ( d ) = d ± t. สรุปไดวามีความเชื่อมั่น 95% ที่คาเฉลี่ยน้ําหนัก
n
โดยที่ d = คาเฉลี่ยของผลตางในแตละคู ตั ว ที่ เ ปลี่ ย นแปลงในผู ห ญิ ง หลั ง จากรั บ ประทานยา
Sd = คา SD ของผลตาง คุมกําเนิด 3 เดือน มีคาตั้งแต น้ําหนักลดลง 1.12 ปอนด
n = จํานวนคูของขอมูล จนถึงน้ําหนักเพิ่มขึ้น 5.34 ปอนด นอกจากนี้ชวงที่ไดยัง
t = คา t ที่ระดับความเชื่อมั่น ดวย df = n-1 คลุม 0 ดังนั้นน้ําหนักตัวกอนและหลังรับประทานยาไมมี
ขอสมมติ (Assumption) ในที่นี้ คือ การแจกแจงของ ความแตกตางกัน
ผลตางในแตละคูจะตองแจกแจงเปนแบบปกติ

f 231 e
สถิติในการวิจัย
 
16.3.2 การประมาณคาพารามิเตอรจากคา การประมาณคาผลตางของสัดสวนในตัวอยาง 2 ชุด
สัดสวนของตัวอยาง (Proportion estimation) ในกรณีที่ โดยใชสูตร
ตั ว วั ด เป น แบบ Binary หรื อ Dichotomous ค า ที่ จ ะใช p1 (1 − p1 ) p 2 (1 − p 2 )
P1 - P2 = (p1 - p2) ± Z +
สรุปผลจะเปนรูปแบบสัดสวนหรือรอยละ n1 n2
i ตัวอยางชุดเดียว โดยทดสอบคา np และ n(1-p) ในแตละชุดมากกวา 5
ให p เปนคาสัดสวนของตัวอยาง = จํานวนตัวอยางที่สนใจ
จํานวนตัวอยางทั้งหมด ตั ว อย า งที่ 16.6 ในการศึ ก ษาเปรี ย บเที ย บผลของการ
เชน สัดสวนของนักศึกษาที่สูบบุหรี่ รักษาอาการปวดหลังเรื้อรังดวยการใหยาและการผาตัด
= จํานวนนักศึกษาที่สูบบุหรี่ พบวาในคนไขที่ไดรับการผาตัด100 ราย หายจากการปวด
จํานวนนักศึกษาทั้งหมด หลัง 80 ราย ขณะที่คนไขไดรับยา 100 ราย เชนกัน
SE ของ p =
p(1 − P) หายเพียง 50 ราย จงประมาณวาที่ 90% CI ผลตางของ
n สัดสวนที่หายจากการปวดหลังในคนไขที่ไดรับการรักษา
โดยการผาตัดและรับประทานยาเปนเทาไร
เนื่องจากการวัดผลเปนเพียงเหตุการณ 2 อยาง คือ ใช/ คํานวณ
ไมใช ดังนั้นการแจกแจงเปนแบบทวินาม (Binomial นั่นคือประมาณคา P1 - P2 ที่ 90 % CI นั่นเอง
distribution) แตเมื่อ n มีจํานวนมากจนคา np และ n (1- p1 = 0.8, p2 = 0.5
p) มากกวา 5 ก็สามารถประมาณใหเปนการแจกแจงแบบ n1 = 100, n2 = 100
ปกติได โดยการประมาณคาจะเปนดังนี้
p(1 − P)
P = p±Z ทดสอบคา np และ n(1-p) ในแตละกลุมมากกวา 5
n
ดังนั้น 90 % CI ของ P1 - P2
ตัวอยางที่ 16.5 จงประมาณคาที่ 95% CI ของสัดสวน 0.8 × 0.2 0.5 × 0.5
= (0.8 - 0.5) ± 1.64 +
100 100
การสูบบุหรี่ในนักศึกษาชาย ซึ่งสุมตัวอยางมา 50 คน
= 0.3 ± 0.11
พบวาสูบบุหรี่ 15 คน
= 0.19, 0.41
คํานวณ
ตอบ
15
p = = 0.30 สรุ ป ว า ที่ ระดับ ความเชื่ อ มั่น 90% สัด สว นที่ จ ะ
50
np = 15 > 5 และ n(1-p) = 35 จึงใชการ หายจากการปวดหลั ง ด ว ยวิ ธี ก ารผ า ตั ด สู ง กว า การ
แจกแจงแบบปกติได ดังนั้นที่ 95 % CI ของ P = 0.30 ± รับประทานยาอยูระหวาง 0.19 และ 0.41 หรือ 19% ถึง
(.3)(1 − .3) 41% และความแตกตางนี้มีนัยสําคัญทางสถิติดวยเพราะ
1.96 = 0.17, 0.43
50 ไมคลุม 0 อยูในชวงนั้น
ตอบ จะเห็ น ว า การประมาณค า parameter ทํ า ให
สรุปวา มีความเชื่อมั่นได 95% ที่สัดสวนการสูบบุหรี่ใน ทราบถึงลักษณะของประชากรโดยใชผลจากตัวอยาง ใน
นักศึกษาชายมีคาอยูระหวาง 0.17 และ 0.43 หรือ 17% ป จ จุ บั น วารสารทางการแพทย จ ะกํ า หนดให ก ารเสนอ
ถึง 43% ผลงานตองรายงานคาประมาณที่ชวงความเชื่อมั่นไวดวย
ii ตั ว อย า งสองชุ ด ในที่ นี้ จ ะกล า วถึ ง เฉพาะ โดยนิยมใชที่ 95% CI
ตัวอยาง 2 ชุด ที่ไมเกี่ยวของกัน (Independent samples)

f 232 e
สถิติในการวิจัย
 
16.4 การทดสอบสมมติฐาน (Hypothesis testing) การตั้งในลักษณะนี้ จะเห็นวาระบุเพียงแตวาแตกตางกัน
การทดสอบสมมติฐานในการวิจัยนั้น หมายถึง แตไมทราบวาคนกลุมไหนจะมีคาเฉลี่ยความดันโลหิตสูง
การทดสอบเพื่อตอบคําถามของการวิจัยวาเปนไปตามที่ตั้ง กวา การตั้งแบบนี้เรียกวา ตั้งแบบสองหาง คือ Two-
ไวหรือไม โดยคําถามการวิจัยจะนําไปสูการตั้งสมมติฐาน tailed test แตถาตั้งแบบเจาะจงอยางใดอยางหนึ่งคือ Ha
การวิจัย และมีการทดสอบสมมติฐานทางสถิติตอไป ดัง : คาเฉลี่ยความดันโลหิตในผูสูงอายุเขตเมืองสูงกวาเขต
ตัวอยางคําถามในการวิจัย: คาเฉลี่ยของความดันโลหิตใน ชนบท
ผู สู ง อายุ เ ขตเมื อ งต า งกั บ คนในเขตชนบทหรื อ ไม ?
สมมติฐานการวิจัย ซึ่งจะนําไปสูการทดสอบทางสถิติจะ μ1 >μ2 หรือ μ1 – μ2 > 0
เปนดังนี้ การตั้งแบบเจาะจงลงไป เรียกวา ตั้งแบบหางเดียว คือ
“คาเฉลี่ยของความดันโลหิตในผูสูงอายุเขตเมือง One-tailed test ซึ่งจะทําใหไดคําตอบที่เฉพาะลงไป แต
และเขตชนบท ไมแตกตางกัน” ดังนั้นจะนําไปสูการ การตั้งแบบนี้จะทําไดยากเพราะกอนที่จะวิเคราะหขอมูล
ทดสอบทางสถิติตอไป เพื่อพิสูจนสมมติฐานขางตนวาเปน นั้น ตองตั้งสมมติฐานกอนจึงยากที่จะกําหนดลงไปใน
จริงหรือไม การทดสอบสมมติฐานนี้อาจเรียกอีกชื่อหนึ่งวา ทิศทางใดทิศทางหนึ่ง การตั้งแบบสองหางจึงนิยมมากกวา
การทดสอบนัยสําคัญ (Significance test) ก็ได แบบหางเดียว แตถามีหลักฐานเพียงพอที่จะสงสัยวากลุม
หนึ่งดีกวาอีกกลุมหนึ่งก็ควรตั้งแบบหางเดียว
ขั้นตอนในการทดสอบสมมติฐาน (Step taken in
hypothesis testing) ขั้ น ต อ น ที่ ส อง :ก า ร ตั้ ง ร ะดั บนั ยสํ าคั ญ
ขั้ น ตอนแรก: การตั้ง สมมติฐ าน สมมติฐ าน (Significance level) ในการสรุปผลการทดสอบนั้นจะสรุป
ทางสถิติแบงออกเปน 2 ชนิด คือ ตามขอมูลที่ไดมา ดังนั้นจะตองมีความผิดพลาดเกิดขึ้นได
ก. สมมติฐานวาง (Null hypothesis) ใชตัว แตถาความผิดพลาดนั้นไมเกินจากที่กําหนดไวก็ถือวาผลที่
ย อ ว า Ho หมายถึ ง สมมติ ฐ านที่ ตั้ ง ขึ้ น โดยให ไ ม มี ค วาม ไดเปนความแตกตางที่เกิดขึ้นจริง ไมใชเปนการบังเอิญ
แตกตางระหวางสิ่งที่ตองการเปรียบเทียบ ดังตัวอยาง ความผิดพลาดแบงออกเปน 2 ชนิด คือ
Ho : คาเฉลี่ยความดันโลหิตในผูสูงอายุเขตเมืองไมตาง ก. Type I error เปนความผิดพลาดที่เกิดขึ้น
กับเขตชนบท เมื่อปฏิเสธ(Reject) Ho เมื่อ Ho นั้นถูกตอง ดังเชน Ho ที่ตั้ง
โดยเขียนในรูปของเครื่องหมายทางสถิติคือ ไววาคาเฉลี่ยความดันโลหิตของคน 2 กลุมไมตางกันนั้นถา
μ1 = μ 2 หรือ μ1 – μ2 = 0 ถูกตองแลวแตเราปฏิเสธ คือไมยอมรับ เชนนั้น ความ
จะเห็ น ว า การตั้ ง สมมติ ฐ านทางสถิ ติ จ ะใช ตั ว ผิดพลาดก็เกิดขึ้น ดังนั้น Type I error ก็คือระดับนัยสําคัญ
พารามิเตอร ทั้งนี้เพราะวาผลการทดสอบจะนําไปสรุปเปน ซึ่งใชสัญลักษณ α (Alpha)
ของประชากร ข. Type II error เป น ความคลาดเคลื่ อ นที่
ข. สมมติฐานแยง(Alternative hypothesis) เกิดขึ้นเนื่องจากไมปฏิเสธ Ho ทั้งๆที่ Ho นั้นผิดหมายความ
ใชตัวยอวา Ha หมายถึง สมมติฐานที่ตั้งขึ้นตรงกันขามกับ วาจริงๆแลวความดันโลหิตเฉลี่ยในคน 2 กลุมนั้นตางกัน
Ho ทั้งนี้เพื่อคนหาคําตอบใหไดวามีความแตกตางจริง (Ha ถูกตองนั่นเอง) แตสรุปผลวาไมตางกัน (ยอมรับ Ho)
หรื อ ไม ข อ มูล ที่ มี อ ยู เ พี ย งพอหรื อ ไม ที่ จ ะสนั บ สนุ น ความผิดพลาดชนิดนี้ใชสัญลักษณ β (ฺBeta) ดังสรุปใน
สมมติฐานแยง ดังตัวอยาง ตารางขางลางนี้
Ha : คาเฉลี่ยความดันโลหิตในผูสูงอายุ เขตเมืองตางกับ
เขตชนบท
μ1 ≠ μ2 หรือ μ1 – μ2 ≠ 0
f 233 e
สถิติในการวิจัย
 
ความดันโลหิตเฉลี่ยของ 2 กุลม (Proportion) แตถาเก็บเปนเชิงปริมาณการวัดจะออกมา
การตัดสิน ไมตางกัน ตางกัน ในรูปของคาเฉลี่ย (Mean) โดยทั้งนี้ขึ้นอยูกับสมมติฐาน ที่
(Ho true) (Ho false, Ha true) กําหนดไวนั่นเอง
ปฏิเสธ Ho Type I error Power ข. ขอตกลงเบื้องตน (Assumption) การ
(Reject Ho) (α) (1–β) วิเคราะหเพื่ออนุมานทางสถิตินั้น จะมีความถูกตองเมื่อ
ไมปฏิเสธ Ho ถูกตอง Type II error ข อ มู ล นั้ น เ ป น ไ ปตามข อ ตกลงเบื้ องต นที่ กํ า ห น ด
(Do not (1–α) (β) ขอกําหนดที่ควรพิจารณาไดแก
reject Ho) - ขอมูลนั้นมีการแจกแจงแบบปกติ (Normal
distribution)
โอกาสที่ ตัด สิ น ว า ปฏิเ สธ Ho เมื่อ Ho ผิด นั้น จะ - ตั ว อ ย า ง ที่ ไ ด เ ป น ตั ว อ ย า ง ที่ สุ ม ม า
เทากับ 1–β ซึ่งเรียกวา อํานาจของการทดสอบทาง (Random samples)
สถิติ (Power of the statistical test) การตั้งระดับนัย - ทราบค า ความแปรปรวนของประชากร
สําคัญโดยทั่วไปจะนิยมใชคา α ที่ 0.05 หมายความวาจะ หรือไม (Population variance) ซึ่งในทาง
ยอมใหสรุปผิดไดไมเกิน 5 ครั้ง ใน 100 ครั้ง หรือยอมใหผิด ปฏิ บั ติ เ รามั ก จะไม ท ราบและจะใช ข อง
ไดเพียง 1 ใน 20 นั้นเอง แตถาตองการใหมีนัยสําคัญสูง ตัวอยาง คือ S2 (Sample variance) แทน
กวานี้ก็ให α นอยลงมาได เชน α=0.01 หรือตั้งคา α ไว
มากกวานี้คือ α=0.10 ซึ่งในทางสังคมศาสตรนิยมตั้งคา วิธีการทดสอบคาเฉลี่ย และคาสัดสวน สําหรับ
ตรงคานี้เพราะการวิจัยไมไดเกี่ยวของกับสิ่งมีชีวิต ตัวอยาง ชุดเดียว และ สองชุด ไดแก Z-test และ t-test
การตัดสินวาจะปฏิเสธ Ho หรือไมนั้น จะดูจาก (การเลื อ กใช วิ ธี ก ารต า งๆ และเงื่ อ นไขจะกล า วในการ
คา p-value ซึ่งหมายถึง โอกาสที่จะเกิดผิดพลาดในการที่ ทดสอบ) โดยมี สู ต รของการคํ า นวณค า สถิ ติ ที่ ท ดสอบ
จะปฏิเสธ Ho ในขณะที่ Ho ถูกตอง ตัวอยางเชน ในความ โดยทั่วไปคือ
เปนจริงแลวความดันโลหิตเฉลี่ยของทั้ง 2 กลุมไมตางกัน Test statistic = Observed value – Hypothesised value
Standard error
(Ho ถูกตอง) แตไปสรุปวาตางกัน ดังนั้นถาคา p นอยกวา
Test statistic หมายถึง คา Z และ คา t
α ที่ตั้งไว ก็แสดงวามีขอมูลเพียงพอที่จะปฏิเสธ Ho และ
Observed value หมายถึง คาสถิติของตัวอยาง เชน X , p
ยอมรับ Ha วาคาเฉลี่ยทั้ง 2 กลุมตางกันอยางมีนัยสําคัญ
Hypothesised value หมายถึงคาที่กําหนดไวใน Ho เชน
ทางสถิติ แตถาคา p มากกวา α ก็จะไมสามารถปฏิเสธ
μo สําหรับกลุมเดียวถาเปน 2 กลุม
Ho แสดงวาคาเฉลี่ยทั้ง 2 กลุม ไมตางกัน (รายละเอียดจะ
มักจะเปน 0 เชน μ1 – μ2 = 0
กลาวในขั้นตอนที่ 4 และ 5)
Standard error หมายถึง คา SE ของ mean หรือ
proportion ดังไดกลาวแลวในเรื่อง
ขั้ น ตอนที่ ส าม: การเลื อ กวิ ธี ก ารทางสถิ ติ
การประมาณคา
(Statistical test) การเลือกใชวิธีการทดสอบนั้นจะคํานึงถึง
ตัววัดเปนหลักโดยคาที่วัดจะขึ้นอยูกับลักษณะของขอมูลที่
ขั้นตอนที่สี่ : คํานวณคาสถิติ และ p-value
เก็บมานอกจากนี้ยังตองคํานึงถึงขอสมมติ (Assumption)
เมื่อเลือกใชวิธีใดๆ แลวอาจคํานวณโดยใชเครื่องคิดเลข
ที่กําหนดดังจะกลาวตอไปนี้
โดยแทนคาลงไปในสูตร แตถางานวิจัยใหญๆที่มีขอมูล
ก. ขอมูล (Data) ถาขอมูลที่เก็บมาเปน
จํานวนมากตองใชโปรแกรมทางสถิติชวยในการวิเคราะห
เชิ ง คุ ณ ภาพการวั ด จะออกมาในรู ป ของค า สั ด ส ว น
เชน SPSS, SAS, STATA etc โดยเครื่องจะคํานวณคา
f 234 e
สถิติในการวิจัย
 
p-value ให แตสิ่งที่ควรคํานึงถึงคือการเลือกวิธีทดสอบ จากตารางใช สู ต รสํ า หรั บ การทดสอบค า เฉลี่ ย ของ
เพราะถาเลือกวิธีการผิดผลการวิเคราะหที่ไดก็ผิด ตัวอยางชุดเดียว
X − μo
t =
ขั้นตอนที่หา : การสรุปผล เมื่อไดคา p แลวทํา S/ n
การเปรียบเทียบกับ α ที่กําหนดไววาจะปฏิเสธ Ho 96 − 120
= = - 2.66
35 / 15
หรือไมปฏิเสธ Ho (จะไมสรุปวายอมรับเพียงแตสรุปวาไมมี
หลักฐานเพียงพอที่จะปฏิเสธ Ho) กอนที่จะกลาวถึงการ
เปดตารางคา t ที่ df = 14 ไดแก t = 2.14 คา
ดําเนินการทดสอบสมมติฐานเพื่อทดสอบคาเฉลี่ย และ
p-value ไดแก พื้นที่ที่อยูมากกวาคา t = 2.66 และนอย
สัดสวนในตัวอยางชุดเดียวและสองชุด จะสรุปการเลือกใช
กวาคา t = -2.66 ดังรูป ซึ่งจากรูปคา p-value ทั้ง 2 ขาง
วิธีการ สูตรตางๆ และเงื่อนไขไวในตารางดังนี้
รว มกั นแ ล วน อ ย ก ว า 0.05 ถ า คํ า น ว ณ ค า p ด ว ย
16.4.1 การทดสอบคาเฉลี่ย
คอมพิวเตอรจะไดคา p เทากับ 0.0186
i ตั ว อย า งชุ ด เดี ย ว เพื่ อ ดู ว า ค า เฉลี่ ย ของ
นั่นคือ ปฏิเสธ H0 สรุปวาคาเฉลี่ยของ serum
ตัวอย างที่สุมมานั้น มีความแตกตางไปจากคาเฉลี่ยของ
amylase ตางจากของประชากรที่เทากับ 120 units/100
ประชากรหรือไม
ml อยางมีนัยสําคัญทางสถิติ (p = 0.0186 หรือ p <
ให X = คาเฉลี่ยของตัวอยาง
n = จํานวนตัวอยาง 0.05) หรือจะกลาวอีกอยางหนึ่งวาถาคา μ = 120 (Ho
ถูกตอง) แลวโอกาสที่จะปฏิเสธ Ho ขณะที่ Ho ถูกตองมีได
μo = คาเฉลี่ยของประชากร
ไมเกิน 0.05 จากขอมูลที่ไดพบวาโอกาสที่จะปฏิเสธ Ho มี
สมมติฐาน Ho : μ = μ0
เพียง 0.0186 ซึ่งไมเกินไปจาก α ที่ตั้งไวจึงสรุปวาคา
Ha : μ ≠ μ0 สําหรับ Two-tailed test
เฉลี่ยที่ไดตางไปจากของประชากรจริง
μ<μ0หรือ μ>μ0 สําหรับ One-tailed test

ตัวอยางที่ 16.7 ผูวิจัยไดเก็บรวบรวมขอมูล จากตัวอยาง


15 ราย ซึ่งเปนคนที่มีสุขภาพดีคาเฉลี่ยของ Serum
amylase และ SD เปน 96 และ 35 units/100 ml
ตามลําดับ จงทดสอบวาคาเฉลี่ยที่ไดนี้ตางไปจากคาเฉลี่ย
ของประชากร ซึ่งเทากับ 120 units/100 ml หรือไม
วิธีทํา
สมมติฐาน Ho : คาเฉลี่ยของ serum amylase ใน
ประชากรที่ สุ ม ตั ว อย า งมานั้ น
เทากับ 120 units/100ml. หรือ μ
= 120
Ha : คาเฉลี่ยของ Serum amylase ใน
ประชากรที่ สุ ม ตั ว อย า งมานั้ น ไม
เทากับ 120 units/100 ml. หรือ μ
≠ 120 (two-tailed test)
ระดับนัยสําคัญ α ตั้งไว 0.05 หรือ 5%

f 235 e
สถิติในการวิจัย
 
สรุปการเลือกใชชนิดของการทดสอบและเงื่อนไข
Population Parameter Sample Statistic Assumptions Test Statistic
1. Mean
1.1 Single mean 1. ประชากรแจกแจงแบบปกติ X − μ0
t=
μ X 2. ตัวอยางเชิงสุม S/ n
โดยที่ μ0 คือคาเฉลี่ยใน Ho
คา t ที่ df = n - 1

1.2 Difference in X1 − X2 1. ประชากร 2 กลุม X1 − X2


t=
two means แจกแจงแบบปกติ 1 1
Sp +
μ1 - μ2 n1 n2
2. ความแปรปรวนของ
2
ประชากร 2 กลุมเทากัน Pooled variance (S p )
(σ12 = σ 22 ) (n1 − 1)S12 + (n2 − 1)S 22
=
3. ตัวอยาง 2 ชุด เปนอิสระกัน n1 + n2 − 2
(Independent samples) S1, S2 = SD. ของตัวอยาง
df = n1 + n2 - 2

1.3 Mean of d 1. ตัวอยาง 2 ชุด เกี่ยวของกัน d


t=
difference in each (Dependent samples) Sd / n
observation 2. ผลตาง ในแตละคาสังเกต d = คาเฉลี่ยของผลตาง
D (di) แจกแจงแบบปกติ SD = SD ของผลตาง
n = จํานวนคู
df = n – 1
2. Proportion
2.1 Single proportion p 1. คาสังเกตมาจากการสุม p − po
Z=
Po 2. n มีจํานวนมากพอที่ทําให Po (1 − Po )
nPo และ n(1-Po) มากกวา 5 n
P = สัดสวนในตัวอยาง
PO = สัดสวนใน Ho

2.2 Difference in two P1 , P 2 n1 P1 , n1 (1 – P1) p1 − p 2


Z=
proportion (P1 - P2) และ n2 P2 , n2 (1 – P2) p1 (1 − p1 ) p 2 (1 − p 2 )
+
for independent มากกวา 5 n1 n2
samples p1 = สัดสวนในตัวอยางชุด 1
P2 = สัดสวนในตัวอยางชุด 2

2.3 Difference in two b−c b+c b−c


>5 Z=
proportions n 2 b+c
(P1 - P2) b,c = จํานวนคูที่ไมสอดคลองกัน
for dependent samples
(Mc Nemar’s Test)
(ใหผลทํานองเดียวกับ Chi-square test ชนิด 2×2)

f 236 e
สถิติในการวิจัย
 
iia ตัวอยาง 2 ชุด เปนอิสระกัน เปนการ วิธีทํา
ทดสอบวาคาเฉลี่ยของตัวอยาง 2 ชุดนั้น มาจากประชากร สมมติฐาน Ho : คาเฉลี่ย Serum amylase ในประชากร
ที่มีคาเฉลี่ยตางกันหรือไม สวนใหญจะไมทราบคาความ ทั้ง 2 กลุม ไมตางกัน
แปรปรวนของประชากร (σ2 ) ดัง นั้น จึ ง ใชค าสถิติ t μ1 = μ2
ทดสอบและกํ า หนดให ค วามแปรปรวนของประชากร Ha : คาเฉลี่ย Serum amylase ในประชากรทั้ง 2
เ ท า กั น (σ12 = σ22 ) ห รื อ ถ า จ ะ ท ด ส อ บ ว า ค า ค ว า ม กลุมตางกัน
แปรปรวนเทากันหรือไมเทากันก็ใช F-test แตยังไม μ1 ≠ μ2
กลาวถึงในตอนนี้ จึงตั้งขอสมมติใหเทากันกอน และใชสูตร กําหนดให ระดับนัยสําคัญ (α) = 0.05
ดังในตาราง
การคํานวณ คา t คํานวณไดจากสูตรดังตารางโดย
ตัวอยางที่ 16.8 จากคา Serum amylase ของคนปกติ กําหนดให
และคนไขในโรงพยาบาลเปรียบเทียบความแตกตางของ X1 , X2 = 96 และ 120
ค า เฉลี่ ย ว า มาจากประชากรที่ มี ค า เฉลี่ ย เท า กั น หรื อ ไม
S1, S2 = 35 และ 40
โดยมีขอมูลดังนี้
n1 , n 2 = 15 และ 22
ตัวอยาง n X SD
ในที่ นี้ จ ะแสดงผลการวิ เ คราะห ด ว ยโปรแกรมสํ า เร็ จ รู ป
คนปกติ 15 96 35
STATA ซึ่งผลที่ไดเขาใจงาย แตถาคํานวณโดยใชสูตรก็
คนไข 22 120 40
ไดผลเชนเดียวกัน

ตัวอยางผลการวิเคราะหดวยโปรแกรม STATA
คําสั่ง ttesti 15 96 35 22 120 40
Two-sample t test with equal variances
--------------------------------------------------------------------------------------------=====-------------------------
------------+----------------------------------------------------------------------------------------------------------------
x| 15 96 9.036961 35 76.61765 115.3824
y| 22 120 8.528029 40 102.265 137.735
------------+----------------------------------------------------------------------------------------------------------------
Combined | 37 110.2703 6.477456 39.40082 97.13338 123.4072
------------+----------------------------------------------------------------------------------------------------------------
diff | -24 12.75052 -49.88493 1.884932 d
------------------------------------------------------------------------------------------------------------------------------
diff = mean(x) – mean(y) t = -1.8823
Ho : diff = 0 degrees of freedom = 35

Ha: diff<0 Ha: diff !=0 c Ha: diff>0


Pr(T<t) = 0.0341 Pr(|T|>|t|) = 0.0681 Pr(T>t) = 0.9659

f 237 e
สถิติในการวิจัย
 
จากผลการวิเคราะห คา p-value ไดจากผล วิธีทํา
หมายเลข c การทดสอบเปนแบบสองหางที่แสดงวา Ha: สมมติฐาน Ho : คาเฉลี่ยของระดับโคเลสเตอรอลกอน
diff !≠ 0 (ไมเทากับ 0), Pr > | t | = 0.0681 หมายความ และหลังเขาโปรแกรมไมตางกัน
วาคาของพื้นที่ที่มากกวาคา t (1.88) และพื้นที่ที่นอยกวา D =0
คา t (- 1.88) มีคาเทากับ 0.0681 ซึ่งมากกวา 0.05 จึงไม Ha : โปรแกรมนี้ชวยใหระดับโคเลสเตอรอลลดลง
สามารถปฏิเสธ Ho สรุปวาคาเฉลี่ยของ Serum amylase D > 0 ( D = Before – After)
ของประชากร 2 กลุมนี้ไมมีความแตกตางกัน (p=0.0681)
และที่ 95% CI ของผลตางอยูระหวาง -49.88 ถึง 1.88 ผลการวิเคราะห ดวยโปรแกรม SPSS
คลุม 0 ดวยในผลหมายเลข d แสดงขอมูลจํานวน 12 ราย โดยวัดกอน (before) และ
iib ตัวอยาง 2 ชุดมีความเกี่ยวของกัน เปน หลัง (after) การทดลอง
การทดสอบความแตกตางระหวางคาที่ไดจากขอมูล 2 ชุด before after ผลตาง (กอน–หลัง)
ซึ่งอาจจะเปนคาที่วัดจากคนคนเดียวกันแตดูผลกอนและ 1. 201 200 +1
หลัง (Before/After) หรือดูผลของยาตางชนิดกันโดยจัดให 2. 231 236 –5
ตัวอยาง 2 ชุด มีความคลายกันมากที่สุดคือเปน Matched 3. 221 216 +5
pairs หรือการศึกษาในรูปตางๆ ที่เกี่ยวของกัน สวนใหญ 4. 260 233 +27
จะเปนการวิจัยเชิงทดลอง 5. 228 224 +4
6. 237 216 +21
ตั ว อย า งที่ 16.9 จากการศึ ก ษาผลของโปรแกรม diet- 7. 326 296 +30
exercise เพื่ อ ดู ว า ระดั บ โคเลสเตอรอลนั้ น ลดลงหรื อ ไม 8. 235 195 +40
โดยศึกษาในคนทั้งหมด 12 ราย วัดระดับโคเลสเตอรอล 9. 240 207 +33
กอนเขาโปรแกรมและหลังโปรแกรมวัดอีกครั้งหนึ่ง ถามี 10. 267 247 +20
การควบคุ มตัว แปรอื่ น ๆ ที่จ ะส ง ผลต อ การเปลี่ย นแปลง 11. 284 210 +74
ระดับโคเลสเตอรอล แลวจงทดสอบวาโปรแกรมนี้ชวยลด 12. 201 209 –8
ระดับโคเลสเตอรอลจริงหรือไม

ผลการวิเคราะหดวยโปรแกรม SPSS โดยใชคําสั่งจากเมนู Compare Means, Paired-Sample T Test ไดผลดังนี้

Paired Samples Test


Paired Difference
95% Confidence Interval
Std. Std.Error of the Difference Sig.
Mean Deviation Mean Lower Upper t df (2-tailed)
Pair 1 before-after 20.167 23.131 6.677 5.470 34.864 3.020 11 .012
c d e

f 238 e
สถิติในการวิจัย
 
จากผลการวิเคราะหขอมูลดวยโปรแกรม SPSS กําหนดใหระดับนัยสําคัญที่ α=0.05 คา Z = 1.96
ไดผลดังขางบนนี้ที่หมายเลข c คือคาเฉลี่ยของผลตาง จะเห็นวาคา |Z| ที่คํานวณไดมากกวาคา Z ที่
= 20.167 ที่หมายเลข d คือชวงของผลตางที่ 95% CI กําหนดดังนั้น p < 0.05
อยูระหวาง 5.47 ถึง 34.86 ซึ่งไมคลุม 0 ดังนั้นคาเฉลี่ย สรุปวา จากขอมูลนี้การใชเข็มขัดนิรภัยของประชากรที่สุม
ของโคเลสเตอรอลจึงตางกันจริง เมื่อดูผลการทดสอบ ตัวอยางมาไมเทากับ 50% ( p < 0.05)
สมมติฐาน หมายเลข e ที่ Sig. คือ p=.012 ซึ่งนอยกวา iia ตัวอยาง 2 ชุดเปนอิสระกัน เปนการ
.05 จึ ง ปฏิ เ สธ Ho สรุ ป ว า โปรแกรมนี้ ช ว ยให ร ะดั บ ทดสอบความแตกตางของสัดสวนในตัวอยาง 2 ชุด วามา
โคเลสเตอรอลกอนและหลังตางกันอยางมีนัยสําคัญทาง จากประชากรที่มีสัดสวนตางกันหรือไม
สถิติ (p < 0.05) แตการศึกษานี้ทดสอบแบบหางเดียว คา
p จึงเทากับ 0.012/2 คือ .006 สรุปวาระดับโคเลสเตอรอล ตัวอยางที่ 16.11 ในการศึกษาเพื่อเปรียบเทียบผลของยา
ลดลงจริง ใหมที่รักษาโรค Migraineกับ ยามาตรฐานที่ใชอยูกอนโดย
ศึกษาในผูปวยกลุมละ 100 รายที่ใชยาแตละชนิด พบวา
16.4.2 การทดสอบความแตกตางของสัดสวน กลุมที่ใชยาเดิมมีอาการดีขึ้น 78 ราย ผูที่ใชยาใหมอาการ
i ตัวอยางชุดเดียว เปนการทดสอบคาสัดสวน ดีขึ้น 90 ราย จากขอมูลนี้พอจะสรุปไดหรือไมวา ยาใหม
ในตัวอยางวาตางไปจากประชากรที่กําหนดไวหรือไม ใหผลดีกวายามาตรฐาน
ตัวอยางที่ 16.10 จากการสํารวจผูที่ขับรถยนต จํานวน วิธีทํา
300 ราย พบวาใชเข็มขัดนิรภัยสม่ําเสมอ 123 คน จาก สมมติฐาน Ho : ยาใหมใหผลไมตางไปจากยาเดิม
ขอมูลที่สํารวจนี้พอจะสรุปไดหรือไมวาสัดสวน ในการใช P1 = P2 หรือ P1 − P2 = 0
เข็มขัดนิรภัยของผูขับรถยนตนั้นไมเทากับ 0.50 Ha : ยาใหมใหผลดีกวายาเดิม
วิธีทาํ P1 > P2 หรือ P1 − P2 > 0
สมมติฐาน
ดังนั้น Ho จะเปน P1 − P2 < 0
Ho : สัดสวนในการใชเข็มขัดนิรภัยของประชากร
90
ที่ขับรถยนตเทากับ 0.50 p1 = 100 = 0.9
P = 0.50 78
p2 = 100 = 0.78
Ha : สัดสวนในการใชเข็มขัดนิรภัยของประชากร
0.9 − 0.78
ที่ขับรถยนต ไมเทากับ 0.5 แทนคาสูตร Z =
0.9 × 0.1 0.78 × 0.22
P ≠ 0.50 100 + 100
ตรวจสอบคา nP = 300 × 0.50 = 150 มากกวา 5 = 2.35
p −P
จึงใชสูตร Z = P(1− P) เมื่อเทียบกับคา Z ที่ระดับนัยสําคัญ 0.05 แลว
n คา Z จากการคํานวณได 2.35 มากกวา Z = 1.96 จึงตก
123 อยูในเขตปฏิเสธ Ho สรุปวา ยาใหมชวยใหอาการดีขึ้น
p = = 0.41
300 มากกวายาเดิมอยางมีนัยสําคัญทางสถิติ (p < 0.05)
ศึกษาผลการวิเคราะหโดยใชโปรแกรม STATA
0.41 − 0.5
แทนคา Z = 0.5 × 0.5 = - 3.12
300

f 239 e
สถิติในการวิจัย
 
คําสั่ง prtesti 100 90 100 78, count
Two-sample test of proportion x : Number of obs = 100
y : Number of obs = 100
---------------------------------------------------------------------------------------------------------------------
Variable | Mean Std. Err. z P>|z| [95% Conf. Interval]
----------+---------------------------------------------------------------------------------------------------------
x| .9 .03 .8412011 .9587989
y| .78 .0414246 .6988092 .8611908
----------+---------------------------------------------------------------------------------------------------------
diff | .12 .0511468 .019754 .220246 c
| under Ho: .0518456 2.31 0.021
---------------------------------------------------------------------------------------------------------------------
diff = prop(x) – popo (y) z = 2.3146
Ho: diff = 0
Ha: diff < 0 Ha: diff ! = 0 Ha: diff > 0 d
Pr (Z<z) = 0.9897 Pr(|Z|<|z|) = 0.0203 Pr(Z>z) = 0.0103

จากผลการวิเคราะห คาชวงความเชื่อมั่น 95% ตัวอยางที่ 16.12 ผลการตรวจเชื้อ TB จากเสมหะ 50


CI ของผลตางสัดสวนที่มีอาการดีขึ้น ระหวางยา 2 ตัว specimens โดยแตละ culture จะถูกแบงเปน 2 media
เท า กั บ 0.0197 ถึ ง 0.2202 ในผลหมายเลข c หรื อ ต า งกั น คื อ A, B เพื่ อ เปรี ย บเที ย บดู ว า media ทั้ ง 2
เท า กับ 1.97% ถึง 22.0% ไมคลุม 0 จึง สรุป วา สามารถตรวจพบเชื้อตางกันหรือไม ขอมูลจากการทดสอบ
ผลการรักษาตางกันอยางมีนัยสําคัญทางสถิติ แตผลการ ดังขางลาง
ทดสอบสมมติฐานเปนแบบหางเดียวจึงดูที่หมายเลข d Medium
คือ Ha:diff>0 คา p=0.0103 จึงสรุปวายาใหมใหผลดีกวา Type A B No. of Sputum
ยามาตรฐานอยางมีนัยสําคัญทางสถิติ (p<.05) 1 + + 20
2 + - 12
iib ตัวอยาง 2 ชุด เกี่ยวของกัน ขอมูลบางชุด 3 - + 2
ที่มาจากหนวยศึกษาเดียวกัน เมื่อเก็บขอมูลไดขอมูลทั้ง 4 - - 16
2 ชุด ที่มีความเกี่ยวของกัน ถาหนวยศึกษาคนละหนวยกัน
แตไดจับคูใหเหมือนกันแลว ผลที่วัดออกมาก็ยัง เกี่ยวของ จากขอมูลจะนํามาแจกแจงลงในตาราง 2 × 2 ไดดังนี้
กั น หลั ก การต า งๆ ทํ า นองเดี ย วกั บ การทดสอบความ Medium B
แตกตางคาเฉลี่ย สําหรับตัวอยาง 2 ชุด ที่เกี่ยวของกัน + - รวม
เพียงแตการวัดจะออกมาในรูปของ binary outcome เชน + 20 12 32
a b
รอด / ตาย, หาย / ไมหาย ดังนั้นจึงวัดออกมาในรูปของ Medium
A c d
สัดสวน
- 2 16 18
รวม 22 28 50

f 240 e
สถิติในการวิจัย
 
Ho: ผลการตรวจจาก Medium A และ B ไมตางกัน อยางไรก็ตามเปนที่นาสังเกตวาในการทดสอบ
Ha: ผลการตรวจจาก ทั้ง 2 Media ตางกัน สมมติฐานนั้น ผูวิจัยพยายามที่จะใหพบคา p นอยๆ เพื่อ
กําหนดใหระดับนัยสําคัญ = 0.05 จะไดมีโอกาสปฏิเสธ Ho (เมื่อ Ho ถูกตอง) ซึ่งทําไดโดยให
b−c ขนาดของตัวอยาง (n) มากๆ เพราะถาตัวอยางมีขนาด
จากสูตร z =
b+c ใหญมากจะสงผลให SE เล็กลง ในการคํานวณคาสถิติ (t,
b, c = จํานวนคูที่ใหผลไมสอดคลอง Z) จึงทําใหการทดสอบมีโอกาสที่จะปฏิเสธ Ho มากขึ้น
กันในที่นี้ คือ 12 และ 2 แมวาความแตกตางนั้นจะนอย แตถาจํานวนตัวอยางมาก
b+c 12 + 2 ก็มีโอกาสปฏิเสธ Ho ได ดวยเหตุนี้การบอกนัยสําคัญทาง
ตรวจสอบ 2 = 2
= 7 มากกวา 5 ตรงตามขอสมมติ สถิติควรตองพิจารณารวมไปกับนัยสําคัญทางคลินิกเสมอ
12 − 2 ความสํ า คั ญ ทางคลิ นิ ก มี คุ ณ ค า ที่ จ ะนํ า ไปใช ต อ ไป
ดังนั้น Z = = 2.67 ดังตัวอยางตอไปนี้
12 + 2
คา Z จากการคํานวณมากกวา 1.96 จึงปฏิเสธ Ho
ตัวอยางที่ 16.13 จากการทดลองทํา Clinical trial เพื่อดู
สรุป มีความแตกตางกันในผลการตรวจระหว าง media
ผลของยาลดความดันโลหิต 2 ชนิดในคนไข 2 กลุม
ทั้งสองอยางมีนัยสําคัญทางสถิติ (p < 0.05)
กรณีที่ กรณีที่
หมายเหตุ : การทดสอบนี้ใหผลเชนเดียวกับ Mc Nemar’s 1 2
test ซึ่งจะกลาวในหัวขอ 16.6 การทดสอบไคสแควร จํานวนคนไขกลุมละ 500 10
คาเฉลี่ยความดันโลหิตที่ลดลง
16.5 นัยสําคัญทางสถิติและนัยสําคัญทางคลินิก (มม.ปรอท)
(Statistical significance and Clinical กลุมที่ 1 30 17
significance) กลุมที่ 2 32 30
p-value 0.04 0.06
Gardner และ Altman (1986) ไดเสนอแนะวา
สรุปความแตกตางอยางมีนัยสําคัญ
การรายงานผลการทดสอบสมมติ ฐ านเพีย งเฉพาะว า มี
ทางสถิติ มี ไมมี
หรือไมมีนัยสํ าคัญทางสถิตินั้นยัง ไมเพียงพอ ผูวิ จัยควร ทางคลินิก ไมมี มี
ร า ย ง า น ค า p-value ด ว ย สํ า ห รั บ ก า ร ป ร ะ ม า ณ
คาพารามิเตอรใหมีคาชวงความเชื่อมั่น (CI) ควบคูไปดวย กรณีที่ 1 สรุปวา ยา 2 ชนิด ใหผลตางกันอยางมีนัยสําคัญ
เสมอ ทั้ ง นี้ เ พื่ อ ให ผู อ า นสามารถพิ จ ารณาได ว า ข อ มู ล ที่ ทางสถิติ (p<.05) แตในทางคลินิกแลวไมมีความ
เสนอนั้นมีความนาเชื่อถือเพียงใด แตกตางกันเลย เพราะสามารถลดไดตางกันเพียง
โดยทั่ ว ไปการทดสอบสมมติ ฐ านแบบ 2 หาง 2 mm. เทานั้น แตเนื่องจากคนไขมากถึงกลุมละ
( two tailed hypothesis testing) แ ล ะ ก า ร ป ร ะ ม า ณ 500 ราย จึงทําใหมีนัยสําคัญทางสถิติ
คาพารามิเตอรที่ 95% CI มีความสอดคลองกันดังตัวอยาง กรณีที่ 2 สรุ ป ว า ยา 2 ชนิ ด ให ผ ลไม ต า งกั น อย า งมี
ที่ 16.3 ซึ่งทดสอบผลตางของคาเฉลี่ย ถาคํานวณคา นัยสําคัญทางสถิติ (p>.05) แตเมื่อพิจารณาทาง
ผลตางที่ 95% CI จะพบวา 95% CI ของ μ1–μ2 = –1.88 คลินิกจะเห็นวา ยา 2 ชนิด ลดไดตางกันถึง 13
ถึง 49.88 ชวงของผลตางเฉลี่ยคลุม 0 แสดงวามีโอกาสที่ มม.ปรอท จึงถือวามีความสําคัญมาก ดังนั้นการ
คาเฉลี่ยของทั้ง 2 กลุม ไมตางกัน ซึ่งผลการทดสอบที่ สรุปผลนั้นควรพิจารณาผลทางคลินิกไปดวย ซึ่ง
Ha : μ1 –μ2 ≠ 0 ไดคา p = 0.0681 ซึ่งมากกวา 0.05 ผูวิจัยจะเปนผูตัดสินใจไดวาในเรื่องนั้นๆ ควรมี
จึงสรุปวาคาเฉลี่ยของทั้ง 2 กลุมไมตางกัน ขอบเขตเพียงใดที่จะตัดสิน

f 241 e
สถิติในการวิจัย
 
16.6 การทดสอบไคสแควร (Chi-Square test) ดังตัวอยางการกําหนดขอบเขต
การทดสอบไคสแควรเปนการทดสอบทางสถิติ
สําหรับขอมูลที่เป นเชิงจําแนกลักษณะคือเปนชนิดกลุม
(Categorical data) ซึ่งไดมาจากการนับจํานวนความถี่
สวนสเกลในการวัดอาจวัดในรูปของ nominal scale หรือ
ordinal scale การทดสอบนี้มักจะใชกับขอมูลทางระบาด
วิทยา, ทางสังคมศาสตร ฯลฯ การแจกแจงของไคสแควร
(X2) จะมาจากการแจกแจงแบบปกติ โดยที่คา X2 ก็คือ Z2 ดั ง นั้ น ถ า ค า X2 จากการคํ า นวณได ม ากกว า
นั่นเอง แตโคงของการแจกแจงไมเปนรูประฆังคว่ําแบบโคง 3.84 ที่ df = 1 แสดงวาคา p-value นอยกวา 0.05 ปฏิเสธ
ปกติ ถาค า ของชั้น แหงความเปนอิสระ (Degree of Ho สรุปวาการแจกแจงของคาสังเกตในแตละกลุมตางไป
freedom หรือ df) มากขึ้น การแจกแจงจะมีลักษณะแบบ จากทฤษฎี การเปดตารางคา X2 จะทําใหทราบคา
ปกติ p-value โดยประมาณวามากหรือนอยกวาคา α โดยดู
ในที่นี้จะกลาวถึงการนําการทดสอบไคสแควรไป จากรูป แตถาใชโปรแกรมทางสถิติวิเคราะหจะทราบคา p
ใชในรูปแบบตางๆ กัน 3 รูปแบบคือ ที่แทจริงและใชเปรียบเทียบกับคา α ไดเลย
ก. Test for Goodness of Fit
ข. Test for Homogeneity ตัวอยางที่ 16.14 จากตารางขางลางนี้แสดงจํานวนผูปวย
ค. Test for Association ดวยไขหวัดใหญที่โรงพยาบาลรายงานในแตละวันภายใน
ก. Test for Goodness of Fit เปนการทดสอบ 1 สัปดาห จงทดสอบสมมติฐานวาจํานวนผูปวยดวยโรคนี้
เพื่อดูวาคาสังเกต (Observation) ที่ไดมาในแตละกลุมนั้น มี ก ารเกิ ด เท า ๆ กั น ทุ ก วั น โดยแจกแจงแบบ Uniform
มีการแจกแจงไปตามที่คาดไวหรือไม เชน จํานวนคนไขใน distribution ในสัปดาห
แต ละวั น ของสั ป ดาห ห นึ่ง , จํา นวนผลผลิ ต ที่ไ ดใ นแต ล ะ วัน จํานวนผูปวย (Oi)
ลักษณะที่เปนไปได (ตามหลักพันธุศาสตร) ฯลฯ การ จันทร 38
ทดสอบนี้ใชหลักการวาคาสังเกตนั้นตางไป จากคา อังคาร 31
คาดหวังตามทฤษฎีหรือไม พุธ 40
ให Oi = คาสังเกตในแตละกลุม (Observed พฤหัส 39
value) ศุกร 40
Ei = คาคาดหวังตามทฤษฎีในแตละกลุม เสาร 44
(Expected value) อาทิตย 48
(Oi − Ei )2 รวม 280
สูตร X = ∑ E
2
i
วิธีทํา
สมมติฐาน
การกําหนดขอบเขตของคา X2 จะขึ้นอยูกับระดับนัยสําคัญ
Ho : จํานวนผูปวยในแตละวันเกิดขึ้นเทาๆ กัน
(α) และคาของ df เพื่อนําไปเปดตาราง
Ha : จํานวนผูปวยในแตละวันเกิดขึ้นไมเทากัน
df = จํานวนกลุม - 1
นั่นคือ จํานวนผูปวยที่คาดวาจะเกิด (Ei) ในแตละวัน
การตั้งสมมติฐาน
1
Ho : การแจกแจงในแตละกลุมไมตางไปจากทฤษฎี = 7 × 280
Ha : การแจกแจงในแตละกลุมตางไปจากทฤษฎี = 40 ราย
f 242 e
สถิติในการวิจัย
 
แทนคาสูตร X2 = (38 −4040) + − − − + (48 −4040)
2 2
ขนาดของตารางจะเปน r x c
df = (r - 1) ( c - 1 )
= 4 + 81 + 0 + 40
1 + 0 + 16 + 64
คา Oij = คาสังเกตที่แจงนับไดในแตละเซลลนั้น
166
= 40 คือความถี่นั่นเอง
= 4.15 n = ขนาดของตัวอยาง
df = 7–1 = 6 Ri,Ci = จํานวนความถี่ทั้งหมดในแตละแถว
เปดตารางคา X2 ที่ α = 0.05 และ df = 6 ไดคา และแตละคอลัมน
X2 = 12.59 Eij = คาคาดหวังที่จะเกิดในแตละเซลลโดย
จากการคํานวณ ไดคา X2 = 4.15 ซึ่งนอยกวาจาก คํานวณไดจาก RiCj/n
ตาราง นั่นคือ p > 0.05 สูตรที่ใชคํานวณทั่วไป
สรุปวาไมสามารถปฏิเสธ Ho ดังนั้นจํานวนผูปวย (Oij − E ij ) 2
X2 = ∑ Eij
ไขหวัดใหญในแตละวันเกิดขึ้นเทาๆ กันตลอดสัปดาห จาก
ตั ว อย า งข า งต น จะเห็ น ว า เป น การแจกแจงความถี่ ข อง ตัวอยางที่ 16.15 ผูวิจัยไดศึกษาถึงความรุนแรงของโรค
ตัวแปรเดียว ดังนั้นสิ่งที่สนใจคือการแจกแจงการเกิด หนึ่ ง ในแต ล ะกลุ ม เลื อ ด โดยได ข อ มู ล จากคนไข จํ า นวน
เหตุการณในแตละระดับของตัวแปรนั้นถามีตัวแปรอื่นมา 1500 คน จําแนกตามตารางดังนี้
เกี่ยวของอีกก็จะมีการทดสอบวาตัวแปรทั้งสองเกี่ยวของ
กันหรือไม ชนิดของกลุมเลือด
ข. Test for Homogeneity เปนการทดสอบเพื่อ ความรุนแรงของโรค A B AB O รวม
ดู ว า การแจกแจงในแต ล ะกลุ ม ของตั ว แปรนั้ น มี ค วาม ไมรุนแรง 543 211 90 476 1320
แตกตางกันหรือไมโดยสามารถนําการแบงชั้นตางๆ ในแต เล็กนอย 44 22 8 31 105
ละตั ว แปรมาสร า งเป น ตารางการณ จ ร (Contingency มาก 28 9 7 31 75
table) แล ว แจงนั บ ค า สั ง เกตที่ ส อดคล อ งกั บ ระดั บ ของ รวม 615 242 105 539 1500
ตัวแปรนั้น
ที่ระดับนัยสําคัญ 0.05 จงทดสอบสมมติฐานวากลุมเลือด
ตัวแปรที่ 2 ตัวแปรที่ 1 ทั้ง 4 กลุม มีระดับความรุนแรงของโรคตางกันหรือไม
1 2 3 -------------- c รวม วิธีทํา
1 O11 O12 O13 ------------- O1c R1 สมมติฐาน Ho : กลุมเลือดแตละกลุมมีระดับความ
2 O21 O22 O23 ------------- O2c R2 รุนแรงของโรคไมตางกัน
3 O31 O32 O33 ------------- O3c R3 Ha : กลุมเลือดแตละกลุมมีระดับความ
| | | | | | รุนแรงของโรคตางกัน
| | | | | |
| | | | | | คํานวณคาคาดหวัง E ของแตละเซลล
r Or1 Or2 Or3 ------------- Orc Rr 1320 × 615
E 11 = 1500 = 541.2
รวม C1 C2 C3 ------------- Cc n
ถาให ตัวแปรที่ 1 แบงเปน c กลุม ( c คอลัมน ) คา Eij ในเซลลอื่น ๆก็คํานวณทํานอง
ตัวแปรที่ 2 แบงเปน r กลุม (r แถว ) เดียวกันจํานวนเซลลทั้งหมด = 3 × 4 = 12

f 243 e
สถิติในการวิจัย
 
(O − E) 2
สัดสวนดังนั้นการทดสอบไคสแควรจะบอกไดแตเพียงวา
สูตรที่ใชคือ X2 = ∑ E
ตัวแปรทั้ง 2 มีความสัมพันธกันหรือไมตามสมมติฐานแต
ดังนั้น X2 = (543 − 5412) 2
+−−−+
(31 − 26.9) 2
541.2 26.9 ไมสามารถบอกถึงระดับของความสัมพันธ (Strength of
= 5.12 association) ได
df = ( 3–1 )( 4–1 ) = 6 ตัวอยางแสดงความสัมพันธระหวางการเกิดโรค
จากตารางคา X2 ที่ α = 0.05 เทากับ 12.59 และการไดรับปจจัย
ดังนั้นไมสามารถปฏิเสธ Ho ได
สรุ ป กลุ ม เลื อ ดแต ล ะกลุ ม มี ร ะดั บ ความรุ น แรงของโรค ปจจัย เปนโรค ไมเปนโรค รวม
ไมตางกันอยางมีนัยสําคัญทางสถิติ (p >0.05 ) ไดรับ a b e
ไมไดรับ c d f
ข อ ควรระวั ง ในการทดสอบไคสแควร ควรคํ า นึ ง ถึ ง รวม g h n
ขนาดของคาคาดหวัง โดยมีขอกําหนดดังนี้
1) คาคาดหวังไมควรจะต่ํากวา 1 เพราะจะทําให สูตร X2 สําหรับขนาด 2 x 2 โดยวิธีลัดคือ
2
คา X มีคามากขึ้นและโอกาสที่จะปฏิเสธ Hoก็มีมากขึ้น (ad − bc) 2
n
2) คาคาดหวังไมควรต่ํากวา 5 แตถาต่ํากวา 5 ก็ X2 = e ⋅ f ⋅ g ⋅ h
ไมควรใหเกิน 20% ของจํานวนเซลล เชน ตารางขนาด 3 โดยการปรับดวยวิธี Continuity Correction
× 2 ซึ่งมี 6 ชองตาราง คาคาดหวังต่ํากวา 5 ควรมีไดเพียง ( ad − bc − n / 2)2 n
2
1 ชองตาราง การแกไขทําไดโดยจัดกลุมของระดับในตัว X = e ⋅ f ⋅ g ⋅h
แปรใหนอยลงโดยผูวิจัยเปนผูกําหนดวาควรจะรวมกลุมใด ผลลั พ ธ ที่ ไ ด โ ดยวิ ธี ลั ด จะให ค า ใกล เ คี ย งหรื อ
ในกรณีตารางขนาด 2 × 2 ถามีคาคาดหวังคาใดคาหนึ่ง เทากับสูตรทั่วไปขางตน
ต่ํากวา 5 ก็เสนอใหใช Fisher’s exact probability test
3) ถ า ขนาดตั ว อย า งมี จํ า นวนน อ ย การใช การตั้งสมมติฐานทางสถิติ
ไคสแควรทดสอบควรมีการปรับคา X2 ซึ่งเรียกวา Yates’ Ho : ปจจัยนั้นไมมีความสัมพันธกับการเกิดโรค
Correction โดยใชคา 1/2 ไปลบจากผลตางของ |O–E| Ha : ปจจัยนั้นมีความสัมพันธกับการเกิดโรค
แตถาจํานวนตัวอยางมีมาก คา X2 ที่ปรับและไม ปรับก็มี การปรับคา X2 นั้น ถาตัวอยางมีขนาดใหญพอคา X2 ชนิด
คาใกลเคียงกัน ปรับและไมปรับก็มีคาใกลเคียงกันแตถาขนาดตัวอยางมี
( O − E − 1/ 2)2 จํานวนนอยคา X2 ชนิดปรับจะมีคานอยลงทําใหโอกาสที่
Corrected X2 = ∑ E จะปฏิเสธ Ho ก็ยากขึ้น ดังนั้นถาขนาดตัวอยางมีจํานวน
ค . Test for Association เ ป น ก า ร ท ด ส อ บ นอยควรใชคา X2 ที่ปรับแลวในการสรุปผล ซึ่งโดยทั่วไปถา
ความสัมพันธของตัวแปรบอกลักษณะ ซึ่งสวนมากในทาง นอยกวา 40 ก็จะใชคาที่ปรับ
การแพทยมักจะใชทดสอบดูความสัมพันธระหวางปจจัย
นั้นๆ กับการเกิดโรค โดยขนาดของตารางมักจะเปนขนาด ตัวอยางที่ 16.16 ในการศึกษาเชิงวิเคราะหชนิดยอนหลัง
2 × 2 หรืออาจจะมากกวา 2 × 2 ก็ได โดยมีกลุมศึกษา (Case) และกลุมควบคุม (Control) และ
ในกรณีที่เปนตาราง 2×2 การทดสอบแบบ สอบถามปจจัยที่ไดรับในอดีตพบวาผูปวยดวยมะเร็งปอด
ไคสแควรจะใหผลเชนเดียวกับการทดสอบความแตกตาง และคนปกติ ป ระวั ติ ก ารสู บ บุ ห รี่ ดั ง ตารางข า งล า งนี้
ของสัดสวน แตไมสามารถประมาณชวงของความแตกตาง จงทดสอบวาการสูบบุหรี่มีความสัมพันธกับการเกิดมะเร็ง
(P1–P2) ได เช น เดี ย วกั บ การทดสอบความแตกต า งของ ปอดหรือไม
f 244 e
สถิติในการวิจัย
 
การสูบบุหรี่ Case Control รวม สายตาหรือไม ไดผลดังตารางขางลางนี้ จงทดสอบวาเด็ก
สูบ 100 60 160 ทั้ง 2 กลุม มีความผิดปกติทางสายตาตางกันหรือไม
ไมสูบ 25 215 240
รวม 125 275 400 สายตา พูดไมชัด ปกติ รวม
ผิดปกติ 1 5 6
วิธีทํา ปกติ 8 2 10
Ho : การสูบบุหรี่ไมมีความสัมพันธกับการเกิดมะเร็งปอด รวม 9 7 16
Ha : การสูบบุหรี่มีความสัมพันธกับการเกิดมะเร็งปอด
2 (100 × 215 − 60 × 25)2 × 400 วิธีทํา
X =
160 × 240 × 125 × 275 Ho:อัตราความผิดปกติทางสายตาในเด็กทั้ง 2 กลุมไมตางกัน
= 121.2 Ha :อัตราความผิดปกติทางสายตาในเด็กทั้ง 2 กลุมตางกัน
คา X2 ที่ df = 1, α = 0.05 จากตาราง X2 = 3.84
ดังนั้นปฏิเสธ Ho คํานวณคา P จากตารางเดิมและคา P จากตารางที่ลด
สรุป การสูบบุหรี่มีความสัมพันธกับการเกิดมะเร็งปอด เซลลต่ําสุดคือ 1 ลง มาเปน 0 โดยที่คาผลรวมในแถว และ
(p<0.05 ) คอลัมนยังคงเดิม
จะเห็นวาแมวาคา X2 จะมีคามากหรือนอยก็ตาม 6!10!9!7!
P1 = = 0.02360
เราเพียงแตสรุปไดวาการสูบบุหรี่มีความสัมพันธกับการ 16!1!5!8!2!
เกิดมะเร็งปอด แตเราไมสามารถบอกไดวาผูที่สูบบุหรี่จะมี 6!10!9!7!
โอกาสเสี่ยงเปนกี่เทาของการเปนมะเร็งปอด ดังนั้นจะตอง P0 = = 0.00087
16!0!6!9!1!
คํานวณหาคาการเสี่ยงในรูปของ Relative Risk หรือ
Odds Ratio ตามความเหมาะสมตอไป c 5 b 6
16.6.1 Fisher’s exact test ใชทดสอบในกรณีที่ 8 2 9 1
คาคาดหวังนอยกวา 5 ในตารางขนาด 2 x 2 สวนจํานวน
ตั ว อย า งจะมี ข นาดเท า ใดก็ ไ ด ก ารทดสอบวิ ธี นี้ จ ะให ค า คา P = P1 + P0 = 0.02360 + 0.00087 = 0.02447
ความนาจะเปนคือคา p-value นั่นเองแลวเปรียบเทียบ กับ คา p<0.05 ดังนั้นปฏิเสธHo สรุปวาเด็กทั้ง 2 กลุมมีอัตรา
ระดับ นัยสําคัญ (α) เพื่อสรุปผลการคํานวณคา p ความผิดปกติดานสายตาตางกันอยางมีนัยสําคัญทางสถิติ
คอนขางจะยุงยาก แตมีโปรแกรมสําเร็จรูปทางสถิติหลาย (p<.05)
โปรแกรมคํานวณไวให เชน STATA, SPSS
e!f!g!h! 16.6.2 Mc Nemar’s test เปนการทดสอบดู
คา p ที่ไดจากการคํานวณ = n!a!b!c!d! ความสั ม พั น ธ ห รื อ ความแตกต า งในตั ว อย า ง 2 ชุ ด ที่
โดยคา p ที่ไดจากตารางจะมีการคํานวณในหลายกรณี เกี่ยวของกัน โดยผลการวัดที่สนใจจะออกมาเปน Binary
เมื่ อ ค า ต่ํ า สุ ด ของเซลล นั้ น ลดลงไปจนเท า กั บ 0 แต ค า data ตัวอยางที่เกี่ยวของกันในลักษณะเปนคูนั้นมีชื่อเรียก
ผลรวมในแถวและคอลัมนคงเดิมแลว p จะเทากับผลรวม อีกอยางหนึ่งวา Marginal Chi-square มีหลักการวา
คา p ในแตละกรณี ดังตัวอยางตอไปนี้ จะตองมีความคลายกันภายในคู (Homogeneity within
ตัวอยางที่ 16.17 ไดทําการศึกษาในเด็กที่พูดไมชัดและ pairs) และมีความแตกตางกันระหวางคู (Heterogeneity
เด็กปกติจํานวน 16 คน เพื่อดูวามีความผิดปกติทาง between pairs) โดยแบงเปนกรณีตางๆ ดังนี้

f 245 e
สถิติในการวิจัย
 
1. Self pairing การจับคูในตัวเองเชนการวัดผล ทั้งหมดที่ศึกษากลุมละ 18 ราย การวัดผลดูจากอาการวาดี
กอนและหลังหรือการวัดในตําแหนงซาย-ขวา ขึ้นหรือคงเดิมไดผลดังตาราง
2. Natural pairing การจับคูที่ธรรมชาติกําหนด
เชน การศึกษาในฝาแฝด (Twin ) จงทดสอบสมมติฐานวายา A และยา B ใหผลตางกัน
3. Artificial pairing การจับคูใหโดยผูวิจัยเลือก หรือไม
ตามลั ก ษณะที่ เ หมื อ นกั น ด ว ยป จ จั ย ที่ คิ ด ว า จะมี ส ว น
เกี่ยวของ โดยการทํา Matching ยา A
รวม
ตัวอยางการทดลองดูผลกอนและหลังในตัวอยางขนาด n ดีขึ้น คงเดิม
โดยผลจะวัดเปน 2 อยาง คือ + และ - เมื่อจัดลงในตาราง ดีขึ้น 1 9 10
2 x 2 จะไดดังนี้ ยา B
หลัง คงเดิม 3 5 8
+ - รวม 4 14 18
+ a b
กอน วิธีทํา
จากตารางจะเห็นวาขอมูลทั้ง 2 กลุม เกี่ยวของ
- c d
กันจึงจัดเปน 18 คู คูที่ใหผลไมสอดคลองกันคือ มี 9 คู ที่
ผลจากยา A คงเดิมผลจากยา B ดีขึ้น และ 3 คูที่ผลจาก
จะเห็นวา จํานวนความถี่ในแตละเซลลแจกแจงผลไดดังนี้ ยา A ดีขึ้นผลจากยา B คงเดิม
กอน หลัง จํานวนคู สมมติฐาน Ho : ยา A และยา B ใหผลไมตางกัน
+ + A Ha: ยา A และยา B ใหผลตางกัน
+ - B 2 ( 9 − 3 − 1)2
corrected X = 9+3
- + C
= 2.08
- - d
จากตาราง คา X2 ที่ df = 1, α = 0.05 เทากับ 3.84
คา X2 จากการคํานวณนอยกวาจากตาราง
คาที่สนใจ คือ คา b, c ซึ่งเปนจํานวนคูที่ใหผลไมสอดคลอง
ดังนั้นไมสามารถปฏิเสธ Ho นั่นคือ ยา A และยา
กัน
B ใหผลในการรักษาไมตางกัน
2
(b − c)2
สูตร X = b+c
การทดสอบแบบไคสแควร ยั ง มี วิ ธี อื่ น ๆ อี ก
( b − c − 1)2
2
Continuity correction X = b+c แลวแตกรณี เชน Chi-square for trend ใชเมื่อระดับของ
สมมติฐาน Ho : ผลการวัดกอนและหลังไมตางกัน ตัวแปรเปนลําดับมาตรา (Ordinal scale) และ Mantel-
Ha : ผลการวัดกอนและหลังตางกัน Haenzsel Chi-square ใชวิเคราะหเพื่อปรับตัวแปรกวน
(Confounding factor) เพื่อขจัดอคติชนิด Confounding
ตัวอยางที่ 16.18 ในการเปรียบเทียบเพื่อดูผลการรักษา bias
ดวยยา A และยา B ในผูปวยโรคหนึ่งซึ่งแบงเปน 2 กลุม
และจับคู (Matching) ใหมีลักษณะเหมือนกันในเรื่องของ
อายุ, เพศ และปจจัยอื่นๆ ที่คิดวาเกี่ยวของจํานวนคน
f 246 e
สถิติในการวิจัย
 
16.7 การวิเคราะหความแปรปรวน (Analysis ดู ค วามแตกต า งในกรณี นี้ จํ า เป น ต อ งวิ เ คราะห ค วาม
of Variances) แปรปรวน ของทั้ง 5 กลุม ไปพรอมกันดวยวิธี One-way
การวิเคราะหความแปรปรวน (Analysis of ANOVA ในที่นี้จะกลาวถึงสูตรที่ใชกอน จากนั้นจะแสดง
Variance) นิยมเรียกโดยใชคํายอวา ANOVA เปนวิธีการ การใชโปรแกรมสําเร็จรูปในการวิเคราะห ซึ่งมีหลายชนิด
วิเคราะหเพื่อดูวาความผันแปรในแตละกลุมขอมูลมีความ เชน SPSS, SAS, STATA, etc. โดยการนําเสนอผลการ
แตกตางในดานคาเฉลี่ยและความแปรปรวนอยางไร กรณี วิเคราะหดวยคอมพิวเตอร และวิธีการสรุปผลการวิเคราะห
ของขอมูลมี 2 กลุม การทดสอบสามารถใช t-test ซึ่งเปน ตอไป
กําหนดให Xij = คาสังเกตตัวที่ i จาก treatment ที่ j
รู ป แบบไม ซั บ ซ อ น แต ก รณี ข องข อ มู ล ที่ มี จํ า นวนกลุ ม
มากกวานั้น จําเปนตองใชการวิเคราะหแบบ ANOVA ใน โดย i = ลําดับที่ในแตละกลุม
รูปแบบปกติซึ่งใช F-test ขอมูลที่จะวิเคราะหดวยวิธีนี้ เปน j = ลําดับของ treatment นั้นๆ
ขอมูลเชิงปริมาณ และมีขอตกลงเบื้องตน (Assumption)
ดังนี้ ดังแสดงในตารางตอไป
i. ขอมูลตองมีลักษณะแจกแจงแบบปกติ(ถาไม
เปนแบบปกติตองใชวิธีของ Nonparametric Statistics) Treatment
ii. ขอมูลแตละชุดตองเปนอิสระจากกัน 1 2 3-------------------k
iii. มีความแปรปรวนของประชากรเทากัน (σ2 X11 X12 X13-------------------X1k
เทากันทุกกลุม) X21 X22 X23-------------------X2k
ตัวอยางที่ตองมีการวิเคราะห ANOVA ไดแก การ X31 X32 X33-------------------X3k
วิจัยแบบทดลองทางคลินิก (Clinical trial) ซึ่งมีการจัดสรร | | | |
กลุมตางๆ แบบสุม (Randomization) กลุมตางๆ จะไดรับ | | | |
ปจจัย (factor) หรือวิธีการรักษา (treatment) ที่แตกตางกัน | | | |
เชน การใหยารัก ษาเปรี ยบเทียบสี่ชนิด หรือสี่รูป แบบ ใน Xn11 Xn22 Xn33-----------------Xnkk
กลุมคนไขที่ปวยดวยโรคหนึ่ง เพื่อดูผลการรักษาวามีความ Total T1 T2 T3-------------------T
แตกตางกันหรือไม ชนิดของการวิเคราะหที่จะกลาวตอไป Mean X1 X2 X 3 ---------------- X
จะขอกลาวเพียง 2 ชนิด ดังนี้
16.7.1 One-way ANOVA เป น วิ ธี ที่ ง า ยเพื่ อ ให T = ผลรวมของคาสังเกตในแตละ treatment
i
ศึกษาความผันแปรของกลุมขอมูลในระนาบเดียว เชนการ Xj = คาเฉลี่ยแตละ treatment
วิเคราะหวา มีความแตกตาง ของ treatment แตละชนิด n = n1 + n2 -------nk
หรื อ ไม การวิ เ คราะห แ บบระนาบเดี ย วนี้ เ หมาะสมกั บ
รู ป แบบการวิ จั ย ทดลองที่ มี ก ารจั ด สรรกลุ ม แบบสุ ม โดย หลักการคํานวณเพื่อนําไปสรางตาราง ANOVA
สมบูรณทุกมิติ (Completely randomized design, CRD) Source of Variation df SS MS F-ratio
เชน การศึกษาหนึ่งมี 5 treatments ตองการดูวามีความ
Between groups k-l SSB MSB MSB = F
แตกตางกันหรือไม ถาใชวิธีการเปรียบเทียบครั้งละคูแบบ
Within groups n-k SSW MSW MSW
t-test นั้นจะตองทําถึง 10 คู (5C2) ทําใหโอกาสที่จะไม
Total n-l SST
สามารถปฏิเสธ Ho เทากับ (0.95)10 หรือโอกาสปฏิเสธ Ho
คือ 1 – (0.95)10 = .4013 ซึ่งมีคาสูงมาก และคา t ที่ไดแต
ละคาไมเปนอิสระกัน จึงนําไปสูการสรุปที่ไมถูกตองได การ
f 247 e
สถิติในการวิจัย
 
หลักการคํานวณใชหลักการเดียวกับการหาคา ชนิ ด มี ค วามแตกต า งในเรื่ อ งของค า เฉลี่ ย ระยะเวลาที่
ความแปรปรวนในตัวอยางเพียงแตคํานวณแตละสวน เชน ตอบสนองอยางมีนัยสําคัญทางสถิติที่ .05 หรือไม
ผลรวมกําลังสอง (Sum square, SS) และ Mean square,
MS) โดยคํานวณจาก SS/df นั่นเอง ขั้นตอนการคํานวณมี ชนิดของยา
ดังนี้ I II III
Correction term (CT) = กําลังสองของผลรวม 16 6 8
2
ทั้งหมด / n = TN 14 7 10
SST = ผลรวมแตละคายกกําลังสอง - CT 14 7 9
13 8 10
= ∑∑ X2ij – CT
13 4 6
SSB = ผลรวมแตละ treatment (T) ยกกําลังสอง
12 8 7
จํานวนตัวอยางในแตละ treatment
2 12 9 10
T12 T22 T32 ...Tj
= n + n + n + n − CT 17 6 9
1 2 3 j
17 8 11
SSW (Sum square within) หรือ SSE (Sum 17 6 11
square error) = SST – SSB คา F ที่ไดเปนอัตราสวน 19 4 9
ระหวาง MSB (ความแปรปรวนระหวางกลุม) นั่นเอง 14 9 10
MSW (ความแปรปรวนภายในกลุม) 15 5 9
โดยมี df ที่ k–1 และ n–k 20 5 5
คาเฉลี่ย 15.21 6.57 8.86
สมมติฐาน Ho : คาเฉลี่ยของประชากรในและกลุมเทากัน
μ1 = μ2 = μ3 = ..................μk วิธีทํา
Ha : คาเฉลี่ยของประชากรตางกันอยางนอย 1คู สมมติฐาน Ho : คาเฉลี่ยของระยะเวลาตอบสนองในยา
μi ≠ μj แตละชนิดไมตางกัน
μ1 = μ2 = μ3
การสรุปผล ถาคา F ที่คํานวณไดมากกวาคา F จากตาราง Ha : μi ≠ μj อยางนอย 1 คู
แสดงวาปฏิเสธ Ho นั่นคือ คาเฉลี่ยตางกันอยางนอย 1 คู
ก็จะมีวิธีการตางๆ ทดสอบดูวาคูใดบางที่ตางกัน วิธีที่ใช ผลการวิเคราะหดวย SPSS ไดผลดังนี้
กันทั่วไปไดแก LSD (Least Significant Difference), ไปเลือกเมนู Compare Means, One-way ANOVA (จะไม
Duncan’s new multiple range test, Turkey HSD และ กลาวถึงรายละเอียดการใชโปรแกรม) ไดผลดังนี้ ผลการ
Scheffe แตละวิธีจะมีขอดี ขอเสียตางกันไปจะไมกลาวใน ทดสอบ c พบวาความแปรปรวนในประชากรแตละกลุม
ที่นี้ ไมตางกัน (p = .142)

ตั ว อย า งที่ 16.19 จากการดู ผ ลของยากระตุ น ใน


สัตวทดลอง โดยจัดใหไดรับยาชนิดใดชนิดหนึ่งจาก 3 ชนิด
แล ว ดู ผ ลการตอบสนองว า จะตอบสนองในเวลาเท า ใด
(วินาที)ดังขอมูลขางลางนี้ จงทดสอบดูวาผลของยา แตละ
f 248 e
สถิติในการวิจัย
 
Test of Homogeneity of Variances
time
Levene Statistic df1 df2 Sig. c
2.053 2 39 .142

ANOVA
time
Sum of Squares df Mean Square F Sig.
Between Groups 561.571 2 280.786 67.806 .000
Within Groups 161.500 39 4.141 d e
Total 723.071 41

Post Hoc Tests


Multiple Comparisons
time
Tukey HSD f
(I) (J) Mean Difference 95% Confidence Interval
Std. Error Sig.
treatment treatment (I–J) Lower Bound Upper Bound
1 2 8.643* .769 .000 6.77 10.52
3 6.357* .769 .000 4.48 8.23
2 1 -8.643* .769 .000 -10.52 -6.77
3 -2.286* .769 .014 -4.16 -.41
3 1 -6.357* .769 .000 -8.23 -4.48
2 2.286* .769 .014 .41 4.16

ผลการวิเคราะหดวย โปรแกรม SPSS จากตาราง ใดบางที่ตางกันโดยวิธี Tukey HSD เปรียบเทียบความ


ANOVA แสดงคา F-Ratio ในหมายเลข d ได 67.8058 แตกตางทีละคู ผลดังหมายเลข f คูที่มีความแตกตางกัน
และคา Sig. ในหมายเลข e เทากับ 0.000 (คือคา อยางมีนัยสําคัญทางสถิติ ไดแกคูของยาชนิดที่ 1 และ 2,
p<.001) ซึ่งนอยกวาระดับนัยสําคัญ 0.05 จึงปฏิเสธ Ho ยาชนิดที่ 1 และ 3, ยาชนิดที่ 2 และ 3 นั่นคือมีความ
สรุปวามีความแตกตางกันอยางนอย 1 คู ระหวางคาเฉลี่ย แตกตางกันอยางมีนัยสําคัญทางสถิติทุกคู (p<.05)
ของเวลาที่ตอบสนองในยาแตละชนิด ผลการทดสอบวาคู

f 249 e
สถิติในการวิจัย
 
16.7.2 Two-way ANOVA จากการวิเคราะห 16.8 สหสัมพันธและความถดถอย (Correlation
แบบระนาบเดี ย วข า งต น นั้ น จะมี ค วามแตกต า งเฉพาะ and Regression )
ปจจัยที่ไดรับเทานั้นโดยหนวยตางๆที่ศึกษาในกลุมที่ไดรับ ในการวิเคราะหความสัมพันธระหวางตัวแปร 2
ป จ จั ย เ ดี ย ว กั น นั้ น จ ะ ต อ ง มี ค ว า ม ค ล า ย กั น ตั ว ที่ เ ป น ขอ มู ล ชนิ ดจํ า นวนแบบต อ เนื่อ งและวัด ในคนๆ
(Homogeneous) แต ถ า ในกลุ ม เดี ย วกั น ยั ง มี ค วาม เดียวกัน ทําไดสองแบบ คือแบบสหสัมพันธ (Correlation)
แตกตางกันอีก เชนเพศตางกัน,กลุมอายุตางกัน จะตอง และแบบ วิเคราะหความถดถอย (Regression) กรณีไม
พิจารณาถึงความแตกตางตรงนี้ดวย ความแตกตางเหลานี้ สามารถระบุ ตั ว แปรใดเป น ตั ว แปรอิ ส ระ (ตั ว แปรต น )
จะเรียกวา Block ดังนั้นการจัดหนวยทดลองใหไดรับปจจัย ตัวแปรใดเปนตัวแปรผลลัพธ (ตัวแปรตาม) เชน อายุ และ
นั้นๆ จะถูกวางแผนใหจัดสรรในรูปแบบของ Randomized ความดันโลหิต การวิเคราะหความสัมพันธ ทําไดในแบบ
Complete Block design (RCB) การจัดดวยวิธีนี้ เพื่อ สหสัมพันธ วิเคราะหไดเพียงวา อายุ และ ความดันโลหิต
ขจัดความคลาดเคลื่อนอันเกิดจากความแตกตางกันของ มีความสัมพันธกันในทิศทางใด ระดับความสัมพันธมาก
block และการจัด block ที่เหมาะสมนั้น ขึ้นอยูกับผูวิจัย หรือนอย กรณีที่ทราบไดวาตัวแปรใดเปนตัวแปรอิสระตัว
และการจัดใหมีประสิทธิภาพนั้นควรใหมีความเหมือนกัน แปรใดเปนตัวแปรตาม ผูวิจัยสามารถใชการวิเคราะห
ภายใน block นั้นๆ การวิเคราะห ชนิดนี้จึงเปนแบบสอง ความถดถอยได เชน ถาทราบวาอายุ เปนตัวแปรอิสระ
ระนาบ ขอตกลงเบื้องตนมีขอกําหนดตางๆ เชนเดียวกับ ผูวิจัยทํานายคาความดันโลหิตซึ่งเปนตัวแปรตามได โดย
แ บ บ ร ะ น า บ เ ดี ย ว แ ล ะ มี ข อ กํ า ห น ด เ พิ่ ม คื อ ไ ม มี การสร า งสมการหรื อ รู ป แบบทํ า นายแบบฟ ง ก ชั่ น ทาง
interaction กันระหวาง treatment และ block โดยสรุป พีชคณิต
ตารางการวิเคราะหความแปรปรวนชนิด 2 ระนาบ มีดังนี้ 16.8.1 สหสัมพันธ (Correlation)
เมื่อเก็บขอมูลในแตละรายซึ่งไดมาเปนคูๆ แลว
Source of df SS MS F-ratio ถาใหเปน (Xi, Yi), i = 1, 2 , 3, ........... n เปนคาสังเกต
variation จํานวน n ราย จงคํานวณคาสัมประสิทธิ์ สหสัมพันธ
Treatments k-1 SSTr SSTr/(k-1) MSTr/MSE (Correlation Coefficient) ไดดังนี้
Blocks n-1 SSBl SSBl/(n-1) MSBl/MSE ∑(x − x )(y − y )
Residual (n-1)(k-1) SSE SSE/(n-1)(k-1) r = หรือ
∑(x − x )2 ∑(y − y )2
Total kn-1
∑ xy − ( ∑ x)( ∑ y) / n

การสรุปผลจากคา F-ratio ใชหลักการเดียวกัน ( ∑ x)2 ( ∑ y)2


[∑ x −
2
][ ∑ y −
2
]
n n
กับชนิดการวิเคราะหระนาบเดียว
ในกรณีที่ขอมูลไมเปนไปตามขอตกลงเบื้องตนที่ r = the product moment correlation coefficient
กํ า หนดไว คื อ ไม แ จกแจงแบบปกติ ให ใ ช ส ถิ ติ แ บบ หรือ Pearson’s correlation coefficient
nonparamtric ในการวิเคราะห ซึ่งการวิเคราะหแบบ
ระนาบเดียวใหใชวิธีการของ Kruskal-Wallis test การ โดยมีขอสมมติวา ขอมูลแจกแจงแบบปกติ
วิเคราะหแบบสองระนาบใหใชวิธีการของ Friedman test คา r จะมีคาอยูระหวาง -1 กับ 1
นอกจากนี้ การวิเคราะหความแปรปรวนยังมีวิธีการอื่นๆ ถา r = 0 แสดงวา ตัวแปร X, Y ไมมี
ซึ่งแตกตางกันไป ตามรูปแบบการวิจัยและสาขาวิชา เชน ความสัมพันธกันเลย
ทางคลินิก ทางเกษตรทางการศึกษา เปนตน ถา r เขาใกล 1 แสดงวาถาคา X เพิ่มขึ้น Y ก็
เพิ่มขึ้นดวย
f 250 e
สถิติในการวิจัย
 
ถา r เขาใกล -1 แสดงวาถาคาใดคาหนึ่งลดลง ในที่นี้จะแสดงผลการวิเคราะหสหสัมพันธดวยโปรแกรม
หรือเพิ่มขึ้นอีกคาหนึ่งจะเพิ่มขึ้นหรือลดลงกลับกัน อยางไร SPSS
ก็ตามเครื่องหมาย + หรือ - เพียงแตแสดงใหเห็นทิศทาง
ของความสัมพันธเทานั้น เมื่อดูระดับของความสัมพันธวา
มีมากนอยแคไหนจะไมคํานึงถึงเครื่องหมาย สรุปไดดังนี้

r ระดับของความสัมพันธ
>0.8 ถึง 1.0 มาก
>0.5 ถึง 0.8 ปานกลาง
>0.2 ถึง 0.5 นอย
0 ถึง 0.2 ไมควรสนใจ

อยางไรก็ตาม การใหเกณฑขางตนไมใชเกณฑที่ ภาพที่ 16.1 Scatter Diagram แ ส ด ง ค ว า ม สั ม พั น ธ


บั ง คั บ ว า ต อ งเป น ไปตามนั้ น ในบางสาขาอาจมี ก าร ระหวาง อายุ และ SBP
ปรับเปลี่ยนไดตามความสําคัญของงานวิจัย
จากภาพที่ 16.1 จะเห็นวาตัวแปร AGE และ
ตัวอยางที่ 16.20 จากการวัดความดันโลหิต Systolic SBP มีความสัมพันธไปในทางบวก โดยเมื่ออายุมากขึ้น
(SBP) และสอบถามอายุในผูหญิงจํานวน 14 คน ดังแสดง คา SBP มีแนวโนมเพิ่มขึ้น เมื่อคํานวณคาสัมประสิทธิ์
ในตาราง จงวิเคราะหคาสหสัมพันธระหวางอายุและ SBP สหสัมพันธ (r) ดังผลขางลาง
วามีคามากนอยอยางไร Correlations
age sbp
อายุ (ป) SBP (mm.Hg) age Pearson Correlation 1 .883** c
23 128
Sig. (2-tailed) .000 d
24 116
27 106 N 14 14 e
29 123 sbp Pearson Correlation .883** 1
32 122 Sig. (2-tailed) .000
49 128 N 14 14
51 144 **. Correlation is significant at the 0.01 level (2-taile
57 153
63 155 คา r ดังแสดงในหมายเลข c มีคา .883 ซึ่งมีคา
73 176 คอนขางมากและมีนัยสําคัญ (P= .000 หรือ p< .001)
42 130 ดังแสดงในหมายเลข d นั่นคือคา r ตางไปจากที่ตั้ง Ho
30 125 ไววาเทากับ 0 คา N คือ 14 ในหมายเลข e ผลการ
25 110 วิเคราะหสรุปวาอายุมีความสัมพันธกับ SBP ในทางบวก
55 128 หมายความวาถาอายุมากขึ้น SBP ก็มาก ขึ้นดวยแตใน
ที่นี้จะไมบอกวาตัวแปรใดเปนตัวแปรอิสระตัวแปรใดเปน
f 251 e
สถิติในการวิจัย
 
ตั ว แ ป ร ต า ม แ ล ะ ไ ม ส า ม า ร ถ บ อ ก ข น า ด ข อ ง ก า ร b คื อ ค า สั ม ประสิ ท ธิ์ ค วามถดถอย
เปลี่ยนแปลงได ในขั้นตอนตอไปถากําหนดใหอายุเปนตัว (Regression coefficient)
แปรอิสระและดูวาจะสงผลอยางไร กับตัวแปรตาม คือ สมการที่เหมาะสมจะเปน Regression equation
SBP ก็ตองวิเคราะหความถดถอยตอไป สูตรในการคํานวณคา a และ b มีดังนี้
∑ xy − ∑ x ∑ y / n
16.8.2 ความถดถอยเชิ ง เส ง ตรง (Linear b=
∑ x 2 − (∑ x)2 / n
regression)
ในที่นี้จะกลาวถึงความถดถอยเชิงเสนตรงอยาง เนื่องจากสมการเสนตรงนี้จะผานจุด ( x , y )
งาย โดยมีตัวแปรตาม (Y) และตัวแปรอิสระ (X) เพียง ดังนั้น
ตัวเดียว การกําหนดสมการเสนตรงที่เหมาะสมคือเสนตรง
y = a + bx
ที่ทําใหผลตางระหวางคา Y จริง (Yi) กับคา Y ที่ทํานายได จึงหาคา a ไดจาก a = y − bx
(Yc) เมื่อยกกําลังสองแลวรวมกันจะมีคานอยที่สุด
นั่นคือ Minimize ∑(Yi - Yc)2 วิธีนี้เรียกวา Least ขอควรระวัง คือ ความสัมพันธในการวิเคราะหความ
Square Method ถดถอยนี้ไมสมมาตรกันดังนั้น regression ของตัวแปร y
กําหนดใหสมการเสนตรง Y = a + b x
บนตัวแปร x จะไมเหมือนกับ regression ของตัวแปร x
a คือคาคงที่ในสมการ (Constant)
บนตัวแปร y

ผลวิเคราะหความถดถอยดวยโปรแกรม SPSS ดังขางลางนี้

Model Summary
Model R c Adjusted R Std. Error of the
R Square Square Estimate
1 .883a .780 .762 9.331
a. Predictors : (Constant), age

ANOVAb
Model Sum of Squaes df Mean Square F Sig.
1 Regression 3701.963 1 3701.963 42.515 .000a
Residual 1044.894 12 87.075
Total 4746.857 13
a. Predictors : (Constant), age
b. Dependent Variable : sbp

f 252 e
สถิติในการวิจัย
 
a
Coefficients
Unstandardized Coefficients Standardized
Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 89.309 6.965 12.822 .000
Age 1.024 .157 .883 6.520 .000
a. Dependent Variable : sbp

คา R-square = .78 ในหมายเลข c หมายความวาการ ค. ความสัมพันธที่พบนั้นไมใชความสัมพันธเชิง


เปลี่ยนแปลงของคา SBP อันเนื่องมาจากการเปลี่ยนแปลง สาเหตุ (Causation)
ของอายุนั้นมีอยู 78% สวนที่เหลืออีก 22% อาจเนื่องมา ง. การนําผลไปใชทํานายควรทําในชวงที่ขอมูล
จากตัวแปรอื่น เชน BMI, ความเครียด เปนตน ผลการ นั้นกําหนด ถานําไปใชนอกชวงอาจไมถูกตอง เชน ถา
วิเคราะหในหมายเลข d Analysis of Variance นั้นเปน ตัวแปร x มากกวาหรือนอยกวาชวงที่นํามาศึกษาอาจไมมี
การทดสอบว า สมการที่ ไ ด เ ป น เส น ตรงที่ แ ท จ ริ ง หรื อ ไม ความสัมพันธเชิงเสนตรงก็ได
(Test for Linearity) ซึ่งคา F=42.51 (p-value = <.001) จ. การสรุปผลของความสัมพันธไมสามารถสรุปถึง
ก็จะปฏิเสธ Ho ที่ตั้งไววาความสัมพันธไมเปนเสนตรง ความสอดคลองกันได (Agreement)
แสดงวามีความสัมพันธเชิงเสนตรงจริง คาสัมประสิทธิ์
ความถดถอยในหมายเลข e มีคา 1.024 คา slope หรือ ที่ ก ล า วมาข า งต น เป น ความสั ม พั น ธ ที่ ศึ ก ษา
คา b นั่นเอง และมีนัยสําคัญทางสถิติ คือไมเทากับ 0 ระหวางตัวแปรเพียง 2 ตัว (Bivariate) แตในความเปนจริง
(ปฏิเสธ Ho : β = 0 และคาคงที่ (a) เทากับ 89.309 โดย แลวการเปลี่ยนแปลงของ SBP นั้นคงไมใชอธิบายดวยอายุ
คา p-value (Sig.) = 0.000 (p<.001) เขียนเปนสมการได เพียงตัวแปรเดียว นั่นคืออาจมีตัวแปรอื่นๆ รวมดวย ซึ่งตัว
ดังนี้ แปรอิสระเหลานี้อาจไดแก น้ําหนัก, สวนสูง, เพศ, ฯลฯ
Y = 89.3 + 1.024X ดังนั้นการวิเคราะหจึงไมมีเพียง x ตัวเดียว ตัวแปรอิสระจึง
หรือ SBP = 89.3 + 1.024 AGE มีมากกวา 1 ตัว จึงเรียกวา Multiple regression แตถาตัว
หมายความวา ถาคา x คืออายุเปลี่ยนไป (เพิ่มขึ้น) 1 ป แปรตาม y นั้นไมไดเปนตัวแปรชนิดตอเนื่อง อาจเปนตัว
คา SBP ก็จะเพิ่มขึ้น 1.024 หนวย (มม.ปรอท) และถา X = แปรชนิด Binary data เชน การเปน/ไมเปนโรค, รอด/ตาย
0 เสนตรงนี้จะตัดแกน y ที่ 89.11 เรียกวาคา y-intercept การวิเคราะหชนิดนี้จะเรียกวา Binary logistic regression
แตในความเปนจริงอายุไมมีเทากับ 0 ดังนั้นการนําเสนอ การวิเคราะหชนิดที่มีตัวแปรอิสระมากกวา 1 ตัวนี้ มีหลาย
กราฟเสนตรงจึงไมควรลากเสนตัดแกน Y ชนิดขึ้นอยูกับลักษณะของตัวแปรและวัตถุประสงค ซึ่ง
เรียกรวมกันวา การวิเคราะหตัวแปรเชิงพหุ (Multivariable
ขอควรระวัง analysis)
ก. ตองมีขอตกลงเบื้องตน (Assumption) วา
ขอมูลมีลักษณะแจกแจงแบบปกติ
ข. การวัดคาสังเกตแตละคู (x,y )จะตองทําใน
subject เดียวกัน

f 253 e
สถิติในการวิจัย
 
เอกสารอางอิง
1. เติมศรี ชํานิจารกิจ สถิติประยุกตทางการแพทย โรงพิมพจุฬาลงกรณมหาวิทยาลัย กรุงเทพฯ 2540.
2. ทัสสนี นุชประยูร และเติมศรี ชํานิจารกิจ บรรณาธิการ สถิติในวิจัยทางการแพทย: โอเอสพริ้นติ้งสเฮาส, กรุงเทพฯ
2541.
3. Altman D.G. : Practical Statistics for Medical Research. Chapman & Hall 1996.
4. Armitage P. & Berry G. Statistical Methods in Medical Research 3rd edition. Blackwell Scientific Publication
Oxford, 1994.
5. Campbell M.J. & Machin D. Medical Statistics: A Commonsense Approach. John Wiley & Sons Ltd.
England 1991.
6. Colton T. Statistics in Medicine: Little, Brown and Company Boston 1974.
7. Daniel, WW Biostatistics: A Foundation for Analysis in the Health Sciences, 8th edition, Wiley, New
York, 2005.
8. Gardner, MJ & Altman, DG Confidence intervals rather than P values: estimation rather than hypothesis
testing. British Medical Journal 1986;292:746-750.
9. Lemeshow S, David W, Hosmer Jr, Klor J and Lwanga SK. Adequacy of sample size in Health studies
John Wiley & Sons 1990.
10. Levy P.S. & Lemeshow S. Sampling for Health Professionals Lifetime Learning publications, Belmont, CA,
1984.
11. Pagano M. & Gauvreau K. Principles of Biostatistics. Duxbury Press, Belmont, CA 1993.
12. Schlesselman JJ. Case-Control Studies: Design, Conduct, Analysis Oxford University Press 1982.

f 254 e
สถิติในการวิจัย

You might also like