You are on page 1of 14

Câu 1: Bảng sau đây cho số liệu người chết về ung thư ở 3 nước Mỹ, Nhật và Anh.

Người chết được


Nước
Chỗ ung thu
Mỹ Nhật Anh
Ruột 11 5 5
Ngực 15 3 7
Dạ dày 3 22 3
Bộ phận khác 41 30 15
a) Hãy tính tần số lý thuyết của bảng số liệu trên. Có thể sử dụng tiêu chuẩn χ2 không?
b) Với mức ý nghĩa α = 1% hãy so sánh phân bố tỉ lệ chết về ung thư của ba nước trên.
BÀI LÀM
*Dạng bài:Bài toán kiểm định giả thuyết tỉ lệ, bài 2 mẫu.
*Phương pháp giải:
a) Tính tần số lý thuyết của bảng số liệu trền và trả lời câu hỏi có thể sử dụng tiêu chuẩn χ2 không:
Tính tổng số người chết theo bộ phận (theo hàng), tổng số ngưởi chết theo nước (theo cột) và tổng số
Tính tần số lý thuyết theo công thức γij = ni*mj/n trong đó γij là tần số lý thuyết, ni là số người chết th
Nếu γij ≤5 với mọi I,j thì kết luận có thể sử dụng tiêu chuẩn χ2 và ngược lại.
b) So sánh tỉ lệ chết về ung thư của ba nước trên:
Giả thuyết H: Phân bố tỉ lệ chết về ung thư của ba nước là như nhau.
Vì câu a xác định được rằng không sử dụng trực tiếp tiêu chuẩn χ2 nên ta gọp ruột và ngực thành mộ
Sử dụng bảng tra để xác định χ2α(a-1)(b-1) trong đó a là số cột và b là số hàng.
Tính tiêu chuẩn kiểm định theo công thức: xqs2 = Sij (nij - γij)2/n hoặc công thức χqs2 = [(S
So sánh nếu χ2α<χqs2 thì bác bỏ H và ngược lại
*Công cụ giải:
Tính tổng của hàng và cột bằng hàm SUM, khi có được các giá trị tổng hàng và cộng ta có thể tính đ
Bảng tần số thực nghiệm
Nước
Chỗ ung thu Tổng hàng
Mỹ Nhật Anh
Ruột 11 5 5 21
Ngực 15 3 7 25
Dạ dày 3 22 3 28
Bộ phận khác 41 30 15 86
Tổng cột 70 60 30 160
Bảng tần số lý thuyết
Nước
Chỗ ung thu
Mỹ Nhật Anh
Ruột 9.1875 7.875 3.9375
Ngực 10.9375 9.375 4.6875
Dạ dày 12.25 10.5 5.25
Bộ phận khác 37.625 32.25 16.125
Vì γ13 va γ23 < 5 nên không thể sử dụng tiêu chuẩn χ2
Ta gọp ruột và ngục vào một hàng thì ta được bảng số liệu:
Nước
Chỗ ung thư
Mỹ Nhật Anh
Ruột+Ngực 26 8 12
Dạ dày 3 22 3
Bộ phận khác 41 30 15
Bảng tần số thực nghiệm
Nước
Chỗ ung thư Tổng hàng
Mỹ Nhật Anh
Ruột+Ngực 26 8 12 46
Dạ dày 3 22 3 28
Bộ phận khác 41 30 15 86
Tổng cột 70 60 30 160
Bảng tần số lý thuyết
Nước
Chỗ ung thư
Mỹ Nhật Anh
Ruột+Ngực 20.125 17.25 8.625
Dạ dày 12.25 10.5 5.25
Bộ phận khác 37.625 32.25 16.125
Vì tất cả γij đều lớn hơn 5 nên ta sử dụng tiêu chuẩn χ2
Tra χ2(2-1)*(2-1) = χ20.014 = 13,28
Tính χqs2= 29.07828288
*Kết luận vì χqs2 > χ20.014 nên giả thuyết H bị bác bỏ suy ra phân bố tỉ lệ người chết về ung thư của b
Anh. Người chết được phân loại theo cơ quan bị ung thư.

iêu chuẩn χ2 không:


ớc (theo cột) và tổng số người chết về ung thư.
, ni là số người chết theo bộ phận mj là số người chết theo nước.

uột và ngực thành một để sử dụng tiêu chuẩn χ2 so sánh tỉ lệ giữa các nước.

c χqs2 = [(Sij(nij2/nimj)-1]*n

à cộng ta có thể tính được tần số lý thuyết γij.


chết về ung thư của ba nước Mỹ, Nhật và Anh là khác nhau.
Câu 2: Để thử nghiệm hiệu quả của một loại thuốc trừ sâu người ta áp dụng thử loại thuốc này đối vớ
Số lượng sâu bắt được trước và sau khi dùng loại thuốc trừ sau nói trên được cho ở bảng sau:
Thửa ruộng Trước khi phun thuốc Sau khi phun thuốc
1 109 100
2 68 52
3 82 70
4 104 91
5 93 77
Với độ tin cậy 95% hãy ước lượng số sâu trung bình trước và sau khi dùng thuốc. Với mức ý nghĩa 5
sâu này. Giả sử số lượng sâu tại mỗi thửa ruộng có phân phối chuẩn.
BÀI LÀM
Phần 1: Số sâu trung bình trước và sau khi dùng thuốc
*Dạng bài: Ước lượng giá trị trung bình.
*Phương pháp giải:
Tính số sâu trung bình trước và sau khi dùng thuốc ký hiệu là x và độ chênh lệch ɛ.
Khoảng ước lượng được tính theo công thức x-ɛ < a < x+ɛ.
*Công cụ giải: Mở Data Analysis chọn Descriptive Statistics.
*Bảng số liệu nhập vào:
Thửa ruộng Trước khi phun thuốc Sau khi phun thuốc
1 109 100
2 68 52
3 82 70
4 104 91
5 93 77
*Xuất hiện hôp thoại Descriptive Statistics xuất hiện:
Input Range: Phạm vi đầu vào (từ ô C19 đến ô D24).
Grouped By: Nhóm dữ liệu theo hàng hoặc theo cột (chọn hàng).
Labels in first row: Nhãn ở hàng đầu tiên (chọn).
Output Range: Phạm vi dữ liệu đầu ra (chọn ô B32).
Sumary statistics: chọn.
Confidence Level for Mean: chọn 95.
Trước khi phun thuốc Sau khi phun thuốc

Mean 91.2 Mean


Standard Error 7.43908596535893 Standard Error
Median 93 Median
Mode #N/A Mode
Standard Deviation 16.6343019090072 Standard Deviation
Sample Variance 276.700000000001 Sample Variance
Kurtosis -1.07582537702012 Kurtosis
Skewness -0.499987905148282 Skewness
Range 41 Range
Minimum 68 Minimum
Maximum 109 Maximum
Sum 456 Sum
Count 5 Count
Confidence Level(95 20.6542138156664 Confidence Level(95
Từ bảng được xuất ra ta có kết quả là:
*Kết luận:
Số sâu trung bình trước khi phun thuốc là: 91.2± 20.654
Số sâu trung bình sau khi phun thuốc là: 78 ±23.1796
Phần 2: Với mức ý nghĩa 5% hãy cho ý kiến về tác dụng của loại thuốc trừ sâu này.
*Dạng bài: Kiểm định giả thuyết về giá trị trung bình.
*Phương pháp giải:
Đặt ra giả thuyết H: Thuốc trừ sâu trên không có tác dụng hiệu quả.
Vì chưa biết phương sai tồng thể và có số lần thử ở 5 thửa ruộng nên n<30 vì vậy dựa vào bảng tra S
Nếu |Tqs| ≤ Tα(n-1) thì H đúng
Nếu |Tqs| ³ Tα(n-1) thì H sai
*Công cụ giải:
Sử dụng dữ liệu như ở phần 1
Mở Data Analysis chon t-Test: Paired Two Sample for Means.
*Bảng số liệu nhập vào: Hộp thoại Paired Two Sample for Means xuất hiện:
Variable 1 Range: chọn từ ô C19 đến C24
Variable 2 Range: chọn từ ô D19 đến D24
Lables: Nhãn (Chọn)
Alpha: Chọn 0.05
Output Range: Phạm vi xuất phát dữ liệu ra (ô B68)
t-Test: Paired Two Sample for Means

Trước khi phun thuốc Sau khi phun thuốc


Mean 91.2 78
Variance 276.700000000001 348.5
Observations 5 5
Pearson Correlation 0.992652211514269
Hypothesized Mean D 0
df 4
t Stat 10.0068941752415
P(T<=t) one-tail 0.000280253019986
t Critical one-tail 2.13184678632665
P(T<=t) two-tail 0.000560506039972
t Critical two-tail 2.77644510519779
*Kết luận:
Từ bảng số liệu xuất ra ta thấy:
|Tqs|=10.0069 > T40.05 = 2.1318 suy ra H là sai vậy thuốc trừ sâu trên có tác dụng hiệu quả
a áp dụng thử loại thuốc này đối với 5 thửa ruộng đang bị sâu phá hoại.
ói trên được cho ở bảng sau:

khi dùng thuốc. Với mức ý nghĩa 5% hãy cho ý kiến về tác dụng của loại thuốc trừ

à độ chênh lệch ɛ.

78
8.34865258589672
77
#N/A
18.6681547025945
348.5
-0.54964399589139
-0.3358514809332
48
52
100
390
5
23.1795756071098

thuốc trừ sâu này.

nên n<30 vì vậy dựa vào bảng tra Student mà kết luận:

xuất hiện:
ên có tác dụng hiệu quả
Câu 3: Một công ty nhỏ quan tâm tới việc phân tích hiệu quả của việc quảng cáo. Trong thời gian 5
X 5 8 10 15 22 5
Y 6 15 20 30 39 4
trong đó X là số tiền chi vào quảng cáo (đơn vị là trăm USD) còn Y là tổng doanh thu (đơn vị là ngh
quan và hệ số định của tập số liệu trên. Với mức ý nghĩa α = 5%, có kết luận gì về mối tương quan g
Tìm đường hồi quy tuyến tính của Y đối với X. Tính sai số tiêu chuẩn của đường hồi quy tuyến tính.
BÀI LÀM:
*Dạng bài: Bài toán kiểm định tương quan và hối quy.
*Phương pháp giải:
Phân tích tương quan tuyến tính: Đặt ra giả thuyết H: X và Y không tương quan tuyến tính.
Tính giá trị của T theo công thức:
𝑇=(𝑟√(𝑛−2))/√(1−𝑟^2 )

Dùng bảng phân phối Student mức α=0.05 với bậc tự do n-2=13: t13,0.025 = 2,160.
Nếu |T|<c thì chấp nhận H.
Và |T|≥c thì bác bỏ H.
*Công cụ giải:
Bảng số liệu:
X 5 8 10 15 22 5 8
Y 6 15 20 30 39 4 11
Kích hoạt công cụ thống kê Data Analysis. Sau đó vào Data, chọn Data Analysis và chọn Correlation
Hộp thoại Correlation xuất hiện:
Input Range: Phạm vi đầu vào (từ ô A19 đến ô P20).
Grouped By: Nhóm dữ liêu theo hàng hoặc theo cột (chọn hàng).
Labels in first column: Nhãn ỡ cột đầu tiên (chọn).
Output Range: Phạm vi dữ liệu xuất ra( chọn ô B27).
X Y
X 1
Y 0.9519971 1
*Kết luận:
Từ bảng số liệu xuất ra ta thấy:
Hệ số tương quan r= 0.9519971
Hệ số xác định r2 = 0.9062984
Gía trị T= 11.21330813 (Gia trị quan sát)
Ta thấy |T|= 11.21330813 > t13,0.025 = 2.160368656
Nên bác bỏ giả thuyết H suy ra X và Y tương quan tuyến tính.
áo. Trong thời gian 5 tháng công ty thu được kết quả sau
8 10 15 22 5 8 10 15 22
11 18 28 33 4 13 22 33 36
anh thu (đơn vị là nghìn USD). Tính tỷ số tương quan của Y đối với X, hệ số tương
về mối tương quan giữa X và Y (Có phi tuyến không? Có tuyến tính không?).
ng hồi quy tuyến tính.

n tuyến tính.

10 15 22 5 8 10 15 22
18 28 33 4 13 22 33 36
is và chọn Correlation
Câu 4: Sau đây là số liệu về số lượng một loại báo ngày bán được ở 5 quận nội thành:
Quận nội thành
Ngày khảo sát
Q1 Q2 Q3 Q4 Q5
Thứ hai 22 18 22 18 18
Thứ ba 21 18 22 18 19
Thứ tư 25 25 25 19 20
Thứ năm 24 24 18 20 22
Thứ sáu 28 19 15 22 25
Thứ bảy 30 22 28 25 25
Lượng báo bán được ở 5 quận có khác nhau thực sự không? Kượng báo bán ra có chịu tác động của
nội thành:

n ra có chịu tác động của yếu tố ngày trong tuần không? Chon α = 15%

You might also like