You are on page 1of 6

ĐTCK_TUD_Made02_HK2_2022-2023

27_PhamLeHoangTho_22685801

2023-05-24

Câ u 1 : Mộ t giả thuyết cho rằ ng “Chiều rộ ng trung bình cá nh hoa củ a loà i Iris versicolor là
khô ng bằ ng 1.5”. Từ dữ liệu Iris có trong phầ n mềm thố ng kê R, thự c hiện kiểm định so
sá nh mộ t mẫ u cho chiều rộ ng trung bình củ a cá nh hoa củ a loà i hoa Iris versicolor.
a) Gọ i μ là chiều rộ ng trung bình cá nh hoa củ a loà i Iris Versicolor. Ghi rõ cặ p giả thuyết
chính H1, và giả thuyết vô hiệu H0 trong phép kiểm định giả thuyết trên.
• Mô hình giả thuyết củ a kiểm định

b) Kết quả kiểm định giả thuyết dự a và o dữ liệu từ phầ n mềm thố ng kê R. - Bướ c 1: Load dữ
liệu và chuẩ n hó a
data("iris")
iris.versicolor=subset(iris[,1:4],iris$Species=="versicolor")

• Bướ c 2: Thự c hiện kiểm định dự a và o dữ liệu


t.test(iris.versicolor$Petal.Width,mu=1.5,alternative =
"two.sided",conf.level = 0.95)

##
## One Sample t-test
##
## data: iris.versicolor$Petal.Width
## t = -6.2217, df = 49, p-value = 1.064e-07
## alternative hypothesis: true mean is not equal to 1.5
## 95 percent confidence interval:
## 1.269799 1.382201
## sample estimates:
## mean of x
## 1.326
c) Nêu kết luậ n về cặ p giả thuyết trong phép kiểm định nó i trên vớ i mứ c ý nghĩa a =
0.05.
Kết luậ n p-value = 1.064*10-07 < 0.05, chấ p nhậ n giả thuyết H1-alternative hypothesis,
kiểm định có ý nghĩa thố ng kê.
Câ u 2 : Trong kiểm định so sá nh 2 mẫ u nhằ m kiểm tra có hay khô ng sự khá c biệt về chiều
rộ ng trung bình củ a cá nh hoa củ a loà i hoa Iris Versicolor và Iris Virginica,
a) Gọ i μ1 là chiều rộ ng trung bình cá nh hoa củ a loà i Iris versicolor, μ2 là chiều rộ ng
trung bình cá nh hoa củ a loà i Iris Virginica. Ghi rõ cặ p giả thuyết chính H1 và giả
thuyết vô hiệu H0 trong phép kiểm định so sá nh tương ứ ng vớ i kết quả trên.
• Mô hình giả thuyết củ a kiểm định

b) Kết quả kiểm định giả thuyết dự a và o dữ liệu từ phầ n mềm thố ng kê R. - Bướ c 1: Load dữ
liệu và chuẩ n hó a
data("iris")
iris.versicolor=subset(iris[,1:4],iris$Species=="versicolor")
iris.virginica=subset(iris[,1:4],iris$Species=="virginica")

• Thự c hiện kiểm định giả thuyết


t.test(iris.versicolor$Petal.Width,iris.virginica$Petal.Width,alternative =
"two.sided")

##
## Welch Two Sample t-test
##
## data: iris.versicolor$Petal.Width and iris.virginica$Petal.Width
## t = -14.625, df = 89.043, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -0.7951002 -0.6048998
## sample estimates:
## mean of x mean of y
## 1.326 2.026

c) Nêu kết luậ n về cặ p giả thuyết trong phép kiểm định nó i trên vớ i mứ c ý nghĩa a =
0.05.
Kết luậ n p-value = 2.2*10-16 < 0.05, chấ p nhậ n giả thuyết H1-alternative hypothesis, kiểm
định có ý nghĩa thố ng kê.
Câ u 3 : Mộ t giả thuyết cho rằ ng “Tỷ lệ bệnh nhâ n nữ viêm khớ p là thấ p hơn 65%”. Thự c
hiện kiểm định giả thuyết trên dự a và o dữ liệu đố i chứ ng là bộ dữ liệu Arthritis.
a) Gọ i p1 là tỷ lệ cá c bệnh nhâ n nữ viêm khớ p trong nghiên cứ u trên.Ghi rõ cặ p giả
thuyết chính H1và giả thuyết vô hiệu H0 trong phép kiểm định giả thuyết trên.
• Mô hình giả thuyết củ a kiểm định

b) Kết quả kiểm định giả thuyết dự a và o dữ liệu từ phầ n mềm thố ng kê R.
• Bướ c 1: Load dữ liệu và chuẩ n hó a
library(vcd)

## Loading required package: grid

data("Arthritis")
prop_Female <- sum(Arthritis$Sex == "Female") / nrow(Arthritis)

• Thự c hiện kiểm định giả thuyết


prop.test(x = sum(Arthritis$Sex == "Female"), n = nrow(Arthritis), p = 0.65,
alternative = "greater", conf.level = 0.95)

##
## 1-sample proportions test with continuity correction
##
## data: sum(Arthritis$Sex == "Female") out of nrow(Arthritis), null
probability 0.65
## X-squared = 0.79592, df = 1, p-value = 0.1862
## alternative hypothesis: true p is greater than 0.65
## 95 percent confidence interval:
## 0.6088465 1.0000000
## sample estimates:
## p
## 0.702381

c) Nêu kết luậ n về cặ p giả thuyết trong phép kiểm định nó i trên vớ i mứ c ý nghĩa a =
0.05.
Kết luậ n p-value = 0.1862 > 0.05, chưa đủ bằ ng chứ ng chấ p nhậ n giả thuyết H1.
Câ u 4 : Biến “Treatment” cho biết thô ng tin về phương phá p điều trị là giả dượ c hay theo
phương phá p điều trị mớ i (Placebo, Treated), biến “Improved” cho biết mứ c độ cả i thiện
sứ c khỏ e và bệnh thuyên giả m: khô ng có , mộ t ít, cả i thiện tố t (None, Some, Marked). Dữ liệu
từ mẫ u cho biết thô ng tin như sau: None Some Marked Placebo 29 7 7 Treated 13 7 21 Sử
dụ ng dữ liệu trên để kiểm định giả thuyết, “Tỷ lệ bệnh nhâ n cả i thiện tố t củ a nhó m dù ng
thuố c là lớ n hơn so vớ i nhó m bệnh nhâ n dù ng giả dượ c”.
a) Gọ i p1 là tỷ lệ cá c bệnh nhâ n có đá p ứ ng điều trị khi dù ng giả dượ c , p2 là tỷ lệ bệnh
nhâ n đá p ứ ng điều trị theo phương phá p mớ i củ a nghiên cứ u trên. Ghi rõ cặ p giả
thuyết chính (alternative) H1và giả thuyết đả o (null) H0 trong phép kiểm định so
sá nh tỷ lệ từ kết quả trên.
• Mô hình giả thuyết củ a kiểm định

b) Kết quả kiểm định giả thuyết dự a và o


dữ liệu từ phầ n mềm thố ng kê R.
prop.test(x = c(7, 21), n = c(43, 41), alternative = "less")

##
## 2-sample test for equality of proportions with continuity correction
##
## data: c(7, 21) out of c(43, 41)
## X-squared = 10.012, df = 1, p-value = 0.0007778
## alternative hypothesis: less
## 95 percent confidence interval:
## -1.0000000 -0.1672693
## sample estimates:
## prop 1 prop 2
## 0.1627907 0.5121951

c) Nêu kết luậ n về cặ p giả thuyết trong phép kiểm định nó i trên vớ i mứ c ý nghĩa a =
0.05.
Kết luậ n
p-value = 0.0007778 < 0.05, chấ p nhậ n giả thuyết H1-alternative hypothesis, kiểm định có ý
nghĩa thố ng kê.
Câ u 5: Phâ n tích tương quan trong nhó m Iris Virginica,
a) Tính ma trậ n hệ số tương quan Pearson giữ a cá c cặ p biến định lượ ng. Tìm cặ p biến
có hệ số tương quan lớ n nhấ t trong nhó m loà i hoa nà y.
data("iris")
iris.Virginica=subset(iris[,1:4],iris$Species=="virginica")
A=cor(iris.Virginica)
r.max=max(setdiff(A,1))
r.max

## [1] 0.8642247

which(A == r.max, arr.ind = TRUE)

## row col
## Petal.Length 3 1
## Sepal.Length 1 3

b) Vẽ đồ thị tá n xạ có đườ ng thẳ ng hồ i quy (Scarter plot) cho hai biến có hệ số tương
quan cao nhấ t trong ma trậ n hệ số tương quan trên.
library(ggplot2)
ggplot(data=iris.Virginica, aes(x=Petal.Length, y=Sepal.Length)) +
geom_point(col="black") +
geom_smooth(method="lm", col="pink")+
labs(x="Chiều dài của cánh hoa",y="Chiều dài của đài hoa",title = "Bieu do
tan xa va duong hoi quy",subtitle = "27_PhamLeHoangTho_22685801",caption =
"Pham Le Hoang Tho")

## `geom_smooth()` using formula = 'y ~ x'


c) Từ cặ p biến có hệ số tương quan lớ n nhấ t, chọ n mộ t biến là m biến phụ thuộ c và mộ t biến
là m biến độ c lậ p (thí sinh cầ n nêu rõ ). Trình bà y kết quả phâ n tích hồ i quy tuyến tính củ a
phầ n mềm thố ng kê R từ cặ p biến đã chọ n.
mohinhhoiquy=lm(iris.Virginica$Petal.Length~iris.Virginica$Sepal.Length)
mohinhhoiquy

##
## Call:
## lm(formula = iris.Virginica$Petal.Length ~ iris.Virginica$Sepal.Length)
##
## Coefficients:
## (Intercept) iris.Virginica$Sepal.Length
## 0.6105 0.7501

Phương trình hồ i quy thể hiện sự phụ thuộ c củ a Petal.Length và o Petal.Width:


Petal.Length= 0.7501 * Petal.Width + 0.6105
d) Kết luậ n phương trình hồ i quy tuyến tính củ a kết quả phâ n tích trên và cho biết tỷ lệ
phầ n tră m mô tả mứ c phù hợ p củ a mô hình hồ i quy so vớ i dữ liệu.
summary(mohinhhoiquy)

##
## Call:
## lm(formula = iris.Virginica$Petal.Length ~ iris.Virginica$Sepal.Length)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.68603 -0.21104 0.06399 0.18901 0.66402
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.61047 0.41711 1.464 0.15
## iris.Virginica$Sepal.Length 0.75008 0.06303 11.901 6.3e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.2805 on 48 degrees of freedom
## Multiple R-squared: 0.7469, Adjusted R-squared: 0.7416
## F-statistic: 141.6 on 1 and 48 DF, p-value: 6.298e-16

Phương trình hồ i quy tuyến tính củ a kết quả phâ n tích trên là Petal.Length= 0.7501 *
Petal.Width + 0.6105 Dự a và o kết quả phâ n tích cho thấ y mứ c độ phù hợ p củ a mô hình hồ i
quy so vớ i dữ liệu thu thậ p là 74.69%.

You might also like