You are on page 1of 52

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH

TRƯỜNG ĐẠI HỌC BÁCH KHOA

-------*-------

BÁO CÁO BÀI TẬP LỚN EXCEL


XÁC SUẤT THỐNG KÊ

Giảng viên hướng dẫn: Nguyễn Kiều Dung.

Nhóm thực hiện: Nhóm 03.

STT Họ Và Tên MSSV NHÓM Ngành học Ký tên tham dự


1 Nguyễn Minh Châu 171066 L07 Điện-Điện Tử
6
2 Nguyễn Huỳnh Đức 171107 L07 Điện-Điện Tử
2
3 Lê Duy Long 171200 L07 Điện-Điện Tử
9
4 Đào Văn Kiên 171183 L07 Điện-Điện Tử
8
5 Nguyễn Tăng Sỹ 171299 L07 Điện-Điện Tử
5
6 Tào Nguyễn Quang Thái 171313 L07 Điện-Điện Tử
3
7 Nguyễn Tấn Dũng Em 171109 L06 Điện-Điện Tử
8
Báo cáo Excel – Xác suất
thống kê

8 Trần Mạnh Khải 171174 L06 Điện-Điện Tử


0

MỤC LỤC

BÀI 1…………………………………………………………………………………3

BÀI 2…………………………………………………………………………………16

BÀI 3…………………………………………………………………………………20

BÀI 4…...................................................................................29

BÀI 5A……………………………………………………………………………….33

BÀI 5B……………………………………………………………………………….42

1
Báo cáo Excel – Xác suất
thống kê

BÀI 6..………………………………………………………………………………4

2
Báo cáo Excel – Xác suất
thống kê

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1) Thực hiện phương pháp phân tổ dữ liệu (A).
2) Vẽ biểu đồ histogram ( biểu đồ phân bố tần số), biểu đồ tích lũy tần số, biểu đồ
mật độ với dữ liệu (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với
độ tin cậy 95% với dữ liệu (A).
4) Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào
đó hay không.
Dạng bài: Thống kê mô tả
Dữ liệu (A): Khảo sát nhu cầu (về giá tiền) mua laptop của học sinh, sinh viên ta có
bảng số liệu: Tiền (triệu đồng)
20 30 15 10 20 18 21 17 25 20
19 13 10 16 15 12 15 20 50 12
10 15 25 13 10 20 16 6 12 10
10 12 30 30 70 9 9 10 20 8
20 30 14 25 10 13 20 10 25 10
14 10 25 13 15 10 15 15 8 10
12 50 13 15 15 8 20 13 11 25
20 17 25 30 20 20 30 25 15 10
11 15 15 17 20 20 15 20 14 10
12 60 14 15 15 10 10 30 10 18
5 16 5 50 15 15 25 5 5 10
15 15 14 100 15 18 10 13 14 20
30 13 50 20 13 16 30 60 20 15
5.5 10 15 15 25 20 20 12 10 18
20 15 17 24 12 20 10 10 8 10
Dữ liệu (B): Khảo sát nhu cầu mua laptop (về thương hiệu) ta có bảng số liệu:

3
Báo cáo Excel – Xác suất
thống kê

Hãng laptop Số sinh viên


Dell 62
Asus 26
HP 8
Macbook 31
Lenovo 6
Vaio 1
Acer 7
MSI 7
Razer 2

1) Thực hiện phương pháp phân tổ dữ liệu (A).


- Nhập dữ liệu vào Excel:

1
- Xác định số tổ cần chia k = (2 x n¿ 3
- Chọn ô A16 nhập vào biểu thức =(2*COUNT(A1:J14))^(1/3)
- Kết quả: 6.542133
- Chọn k = 7
(x max −x min )
- Xác định trị số khoảng cách h theo công thức h =
k
- Chọn ô A17 nhập vào biểu thức =(MAX(A4:J14) - MIN(A4:J14))/7
- Kết quả 13.57143
- Chọn h = 14
- Ta xác định các cận trên và cận dưới của các tổ lần lượt là:
4
Báo cáo Excel – Xác suất
thống kê

 Tổ 1: (Xmin ; Xmin + h) = (5;19)


 Tổ 2: (Xmin + h ; Xmin + h + h) = (19;33)
 Tổ 3: (Xmin + 2h; Xmin + 2h + h) = (33;47)
 Tổ 4: (Xmin + 3h ; Xmin + 3h + h) = (47;61)
 Tổ 5: (Xmin + 4h ; Xmin + 4h + h) = (61;75)
 Tổ 6: (Xmin + 5h ; Xmin + 5h + h) = (75;89)
 Tổ 7: (Xmin + 6h ; Xmin + 6h + h) = (89;103)
- Nhập vào các ô A20 đến A26 lần lượt các giá trị

Chọn chức năng Data -> Data Analysis -> Histogram


 Input Range: Địa chỉ tuyệt đối chứa dữ liệu
 Bin Range: Địa chỉ chứa bảng phân nhóm
 Output Option: Vị trí xuất kết quả
 Confidence Level for mean: Độ tin cậy trung bình
 Chọn Cumulative Percentage để tính tần số tích lũy nếu không Excel chỉ
tính tần số

- Kết quả

5
Báo cáo Excel – Xác suất
thống kê

- Chỉnh lại:

2) Vẽ biểu đồ histogram ( biểu đồ phân bố tần số), biểu đồ tích lũy tần số, biểu
đồ mật độ với dữ liệu (A).
- Vẽ đồ thị phân bố tần số
 Quét chọn bảng tần số A1:B8
 Chọn Insert -> Column

6
Báo cáo Excel – Xác suất
thống kê

Kết quả:

7
Báo cáo Excel – Xác suất
thống kê

- Biểu đồ tích lũy tần số:


 Quét chọn A1:A8 và C1:C8
 Insert -> Column
 Kết quả:

- Biểu đồ mật độ:


-

8
Báo cáo Excel – Xác suất
thống kê

3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 95% với dữ liệu (A).

- Nhập dữ liệu vào bảng tính theo dạng cột:

9
Báo cáo Excel – Xác suất
thống kê

- Chọn chức năng Data -> Data Analysis -> Descriptive Statistics
 Input Range: Địa chỉ tuyệt đối chứa dữ liệu
 Output options: Vị trí chứa kết quả
 Confidence Level for Mean: Độ tin cậy trung bình

- Kết quả:

10
Báo cáo Excel – Xác suất
thống kê

4) Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
- Nhập dữ liệu vào bảng tính

- Tính tỉ lệ:
Chọn C3: =B3/$B$12 kéo cho tất cả các ô

- Vẽ biểu đồ thể hiện nhu cầu sử dụng laptop (về hãng laptop) của sinh viên

11
Báo cáo Excel – Xác suất
thống kê

 Quét chọn cột số sinh viên: B3:B11


 Chọn Insert -> Column -> 2D-Column
- Kết quả:

5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào
đó hay không?
12
Báo cáo Excel – Xác suất
thống kê

Gọi X là nhu cầu sử dụng hãng laptop của sinh viên


Giả thiết kiểm định: H0: Mẫu phù hợp với phân phối chuẩn N(a,ϭ2)
H1: Mẫu không phù hợp với phân phối chuẩn
Tính các đặc trưng mẫu: n = 140; x́=18.5 ; s^ = 12.5678
x́ là ước lượng hợp lý cực đại cho a → a = 18.5

S^2 là ước lượng hợp lý cực đại cho ϭ2 → ϭ = 12.5678


Tra bảng Chi Bình Phương với k = 7 ; r = 2 → X20.05 (k-r-1) = 9.49
Miền bác bỏ Wα = (9,49; +∞)
Khoảng (α;β) ni ≡Oi Pi = P(α<X<β) n*pi ≡ Ei (Oi−E i)2
β−a ≡
= Φ( ¿– Ei
σ (ni −n p i)2
α −a
Φ( ¿ n pi
σ
(-∞-19) 95 0.515867 72.22138 43.1633587
(19-33) 37 0.359833 50.37662 42.13929837
(33-47) 0 0.11263 15.7682 15.7682
(47-61) 6 0.01131 1.5834 518.5718388
(61-75) 1 0.00036 0.0504 2775.778138
(75-89) 0 0 0 ∞
(89-+∞) 1 0 0 ∞
n=140 =1 Tổng: X2qs ∞

X2qs € Wα nên bác bỏ H0. Dữ liệu (A) không phù hợp với phân phối chuẩn

13
Báo cáo Excel – Xác suất
thống kê

Bài 2:
Một giám đốc doanh nghiệp quyết định gửi 8 nhân viên của mình đi dự một lớp tập huấn
về “Dịch vụ khách hàng”. Dưới đây là phản hồi của bộ phận chăm sóc khách hàng về các
nhân viên được cử đi tập huấn.

Tên nhân Số lần phàn nàn của khách hang


viên
3 tháng trước tập huấn 3 tháng sau tập huấn

A 3 3

B 5 4

C 12 10

D 8 6

E 6 6

F 5 3

G 7 3

H 9 4

Hãy nhận xét hiệu quả của quyết định trên với mức ý nghĩa 5%. Tìm thêm giá trị P trong
kiểm định.

BÀI LÀM
 Dạng bài: Kiểm định giả thuyết cho khác biệt của hai trung bình tổng thể, hai mẫu
không độc lập ( mẫu phối hợp từng cặp hay mẫu cặp ).
 Công cụ: t-test:Paired Two Sample for Means
 Cơ sở lý thuyết:

Để tiến hành phương pháp kiểm định này ta phải tìm di= X 1− X 2
di là chênh lệch của 2 biến x1 x2
Ta có thể gặp các giả thuyết
Giả thuyết 2 bên

14
Báo cáo Excel – Xác suất
thống kê

Giả thuyết bên trái

Giả thuyết bên phải

Giá trị kiểm định được tính theo công thức sau

d− μd
zd=
σd
√n
Trong đó:
n
∑ di
d= i =1
n
μd là trung bình của các chênh lêch được giả thuyết
σd là độ lệch chuẩn tổng thể của các chênh lệch

n là cỡ mẫu, hai cỡ mẫu phải bằng nhau.


Tuy nhiên tình huống biêt độ lệch chuẩn tổng thể chênh lêch không bao giờ xảy ra trong
thực tế, lúc đó nếu mẫu được chọn từ 1 tổng thể có phân phối bình thường thì ta có thể
thay thê giá trị z bằng t, trị kiểm đinh t có bậc tự do bằng n-1
d− μd
t tt =
sd
√n
Trong đó
15
Báo cáo Excel – Xác suất
thống kê

sd=
√ ∑ (d i −d )2
i=1
n−1
Quy tắc quyết định bác bỏ H 0

+ Nếu là kiểm định hai bên, ta bác bỏ H 0 khi t tt < -t α2 (n-1)

hoặc t tt > t α2 (n-1)

+ Nếu là kiểm định bên phải, ta bác bỏ H 0 khi t tt > t α (n-1)

+ Nếu là kiểm định bên trái, ta bác bỏ H 0 khi t tt < -t α (n-1)

 Thực hiện bài toán bằng Excel :


 Nhập dữ liệu vào bảng tính:

 Chọn menu: Tools/Data Analysis…/ t-test:Paired Two Sample for Means


 Chọn các mục như hình:

+ Input: địa chỉ tuyệt đối chứa dư liệu tương ứng của mẫu 1 và 2

+ Output options: vị trí xuất kết quả.

+ Apha: mức ý nghĩa 

16
Báo cáo Excel – Xác suất
thống kê

 Xuất kết quả ra trên Excel :

 Biện luận :

Gọi a 1; a 2 là số phàn nàn trung bình trước tập huấn và sau tập huấn
Giả thiết kiểm định H 0 : a 1=a2
H 1 : a 1 ≠ a2

Miền bác bỏ 2 phía

t tt= 3,1910 > t α = 2,3646 nên chấp nhận H 1


2

Vậy: quyết định trên đã có hiệu quả. P= 0.0153


Bài 3:

17
Báo cáo Excel – Xác suất
thống kê

I. Đề bài:
Sau đây là số liệu về một loại báo ngay bán được ở 5 quận nội thành, số liệu lấy ở một lý
bán lẻ:
Ngày khảo Các quận nội thành
sát
Thứ 2 Quận 1 Quận 2 Quận 3 Quận 4 Quận 5
Thứ 3 254;232 236;245 267;258 223;224 245;247
Thứ 4 245;235 212;246 256;276 213;219 234;251
Thứ 5 236;255 223;264 245;275 230;244 232;254
Thứ 6 235;209 197;223 243;234 213;223 224;242

Hãy so sánh lượng báo bán ra ở các ngay trong tuần và ở các quận. Có thể nói lượng báo
bán ra chịu yếu tố tác động là ngay trong tuần hay không ? Kết luận với mức ý nghĩa 5%.
II. Dạng bài:
Phân tích phương sai 2 nhân tố có lặp: phân tích nhằm đánh giá sự ảnh hưởng của hai
nhân tố ( hàng và cột) và sự tương tác giữa chúng tới các giá trị quan sát
Cơ sở lý thuyết:
*) Mẫu điều tra:

18
Báo cáo Excel – Xác suất
thống kê

19
Báo cáo Excel – Xác suất
thống kê

20
Báo cáo Excel – Xác suất
thống kê

III. Giải bài toán: Giả thiết kiểm định: H0:


+) Lượng báo bán ra các ngày trong tuần là như nhau.
+) Lượng báo bán ra ở các quận là như nhau.
+) Không có sự tương tác giữa các quận và các ngay trong tuần.
1. Tính trực tiếp:
Ngày Các quận nội thành
khảo T i∗¿
sát Quận 1 Quận 2 Quận 3 Quận 4 Quận 5

25 23 26 22 24
4 48 6 48 7 52 3 5
Thứ 2 447 492 2431
23 6 24 1 25 5 22 24
2 5 8 4 7
24 21 25 21 23
5 48 2 45 6 53 3 4
Thứ 3 432 485 2387
23 0 24 8 27 2 21 25
5 6 6 9 1
23 22 24 23 23
6 49 3 48 5 52 0 2
Thứ 4 474 486 2458
25 1 26 7 27 0 24 25
5 4 5 4 4
23 19 24 21 22
5 44 7 42 3 47 3 4
Thứ 5 436 466 2243
20 4 22 0 23 7 22 24
9 3 4 3 2
T ¿ j∗¿¿ 1901 1846 2054 1789 1929 T = 9519

21
Báo cáo Excel – Xác suất
thống kê

Nguồn SS df MS F

Yếu tố A (Ngày) 2750,275 3 916,76 FA= 4,5211

Yếu tố B(Quận) 4965,35 4 1241,34 FB =6,1218

Tương tác AB 965,85 12 80,4875 FAB =0,3969

Sai số 4055,5 20 202,775

Tổng 12736,975 39

Ta có:
+) FA = 4,5211 > F3; 20; 0,95 = 3.10 => Số lượng báo bán ra phụ thuộc vào ngày trong tuần
+) FB = 6,1218 > F4; 20; 0,95 = 2,87 => Số lượng báo bán ra phụ thuộc vào các quận
+) FAB = 0,3969 < F12; 20; 0,95 = 2,28 => Không có sự tương tác giữa các ngày trong tuần và
ở các quận

22
Báo cáo Excel – Xác suất
thống kê

2. Giải bằng EXCEL:


Các bước thực hiện:
Bước 1: Nhập dữ liệu vào bảng tính:

Bước 2: Vào Data/ Data Analysis chọn ANOVA: Two-Factor With Replication.
Nhập vào hộp thoại ANOVA: Two-Factor With Replication như sau:

23
Báo cáo Excel – Xác suất
thống kê

Kết quả:

24
Báo cáo Excel – Xác suất
thống kê

25
Báo cáo Excel – Xác suất
thống kê

Kết luận:
+) Yếu tố hàng (Ngày): F = 4,521062 > F3; 20; 0,95 = 3.098391 => Số lượng báo bán ra phụ
thuộc vào ngày trong tuần
+)Yếu tố cột (Quận): F= 6,121748 > F4; 20; 0,95 = 2,866081 => Số lượng báo bán ra phụ
thuộc vào các quận
+) Yếu tố tương tác: F = 0,39693 < F12; 20; 0,95 = 2,277581 => Không có sự tương tác (ảnh
hưởng) giữa các ngày trong tuần và ở các quận

26
Báo cáo Excel – Xác suất
thống kê

BÀI 4:

Bảng số liệu sau cho biết số lượng lao động có việc làm tại Việt Nam chia theo
khu vực kinh tế năm 2017:

Chia ra Nông, lâm, Công


Vùng nghiệp, nghiệp và Dịch vụ Tổng số
thuỷ sản xây dựng
Vùng I 21611.2 13604.0 18148.3 53363.5
Vùng II 21594.8 13666.4 18142.0 53403.2
Vùng III 21695.5 13803.1 18270.5 53769.1
Vùng IV 21486.1 13803.1 18270.5 53769.1
Tổng số 86387,6 54876,6 72831,3 214304,9

Với mức ý nghĩa  = 3%,có thể xem số lượng lao động có việc làm tại các
khu vực kinh tế có phụ thuộc vào các vùng?

Bài làm

1. Dạng toán: Kiểm định tính thống nhất


2. Cơ sở lý thuyết:

-Mục đích: Xét một tổng thể gồm 2 dấu hiện X, Y. Các dấu hiệu này có thể là dấu
hiệu định tính hoặc định lượng. Trong trường hợp bài toán nêu trên là cả 2 dấu hiệu
đều là dấu hiệu định tính.

- Lấy mẫu kích thước n ta có bảng số liệu như sau:

27
Báo cáo Excel – Xác suất
thống kê

X,Y y1 y2 … yh ni
x1 n11 n12 … n1 h n1
x2 n21 n22 … n2 h n2

… … … … … …
xk n k1 n k2 … n kh nk
mj m1 m2 … mh Σ=n

Trong đó:

- ni (i =1,k) – số lần X nhận xi

- mj (j =1,h) – số lần Y nhận yj

nij (i = 1,...,k ; j = 1,...,h) – số lần đồng thời X nhận xi và Y nhận yj

k k k k
ni   nij mi   nij ni    nij
j 1 i 1 i 1 j 1

Kiểm định giả thiết: H0: X và Y đồng nhất, với mức ý nghĩa α.

Tìm    [( k  1)( h  1)] từ bảng phân vị χ2 “khi bình phương”


2 2
-
Cách 1: Tính thống kê dựa vào các công thức sau:

k k ( nij   ij ) 2 ni m j
  
2
 ij 
0
i 1 j 1  ij n

Cách 2: Sử dụng hàm CHITEST trong Excel: CHITEST(nij,γij), với lưu ý số lượng các giá
trị của nij và γij phải bằng nhau.
 Kết luận
2 2
Nếu χ 0 < χ α → Chấp nhận giả thiết H0.

28
Báo cáo Excel – Xác suất
thống kê

Hoặc kết quả hàm CHITEST > α = 0.03 → Chấp nhận giả thiết H0.

3. Phương pháp giải trên Excel :

– Giả thuyết H0: Số lượng lao động theo khu vực kinh tế có quan hệ với các vùng

Đối giả thiết H1: Số lượng lao động theo khu vực kinh tế và các vùng kinh tế không
có quan hệ với nhau

– Nhập bảng số liệu như hình sau:

ni m j
 ij 
n
Tính tần số lý thuyết dựa vào công thức sau:

Chọn từ ô J5 đến ô H2, ta nhấn dấu ‘’=’’ và nhập tiếp biểu thức sau:’’ =D$6*$E5/$E$6’’

sau đó nhấn CTRL+ENTER.

Sau cùng ta được kết quả:

29
Báo cáo Excel – Xác suất
thống kê

Tính xác suất P(X>


2 ) bằng cách chọn ô H7và nhập biểu thức ‘’
=CHITEST(B2:D5,H2:J5)’’

Kết quả: P(X>


 2 ) = 0,833624 > α =0,03.

Kết Luận: chấp nhận giải thiết H0 . Vậy số lượng lao động theo khu vực kinh tế có
quan hệ với các vùng.

30
Báo cáo Excel – Xác suất
thống kê

Bài 5: a) Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô
hình hồi quy tuyến tính đơn. Thực hiện các yêu cầu sau trên Excel:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượng
đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.
3) Tìm sai số chuẩn của ước lượng.
b) Tìm một dữ liệu ngẫu nhiên k chiều (k >2) để sử dụng mô hình hồi quy tuyến tính đa
biến. Tìm các hệ số hồi quy tuyến tính mẫu và kết luận về sự thích hợp.

Bài làm

a) Bảng số liệu về số tiền mua laptop và dung lượng Ram (GB) mong muốn của học
sinh, sinh viên được chọn ngẫu nhiên trong một cuộc khảo sát.

Giá
tiền
30 15 25 14 17 100 25 12 25 15 60 20 11 8 10
(triệu
đồng)
Dung 16 8 16 16 8 16 8 4 16 8 16 8 16 4 8
lượng
(GB)

1) Hệ số tương quan giữa X và Y


 Cơ sở lý thuyết

31
Báo cáo Excel – Xác suất
thống kê

 Hệ số tương quan

∑ xi. yi+ ¿ ∑ xi. ∑ yi


R= 2 2
¿
√∑ ∑ √∑ ∑
xi 2
−( xi) . yi 2
−( yi)

 Nếu R ¿0 thì X,Y tương quan thuận.

 Nếu R ¿ 0 thì X,Y tương quan nghịch.

 Nếu R ¿0 thì X,Y không tương quan.

 Nếu|R| ¿ 1thì X,Y có quan hệ hàm bậc nhất.

 Nếu |R|→ 1 thì X, Y có tương quan chặt (tương quan mạnh).

 Nếu |R|→ 0 thì X, Y có tương quan không chặt (tương quan yếu).

 Hệ số tương quan dung trong việc đánh giá mức độ liên quan.

Giá trị|R| Mức độ


< 0.7 Nghèo Nàn
0.7-0.8 Khá
0.8-0.9 Tốt
<0.9 Xuất sắc

32
Báo cáo Excel – Xác suất
thống kê

 Thực hiện trên excel:


 Nhập dữ liệu
 Áp dụng “ Correlation” và chọn các thông số như sau.

33
Báo cáo Excel – Xác suất
thống kê

 R= 0.765894
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không?
Nếu có, hãy ước lượng đường hồi quy tuyến tính Y theo X.

 Cơ sở lý thuyết:
Giả sử (X1 , Y1 ); (X2 , Y2 ); . . .; (Xn , Yn ) là mẫu ñược thành lập từ tổng thể (X,Y) có
phân phối chuẩn hai chiều. Chúng ta muốn kiểm định các giả thiết liên quan đến các giá
trị khác nhau của hệ số tương quan tổng thể, ký hiệu ρ, dựa trên phân phối mẫu của hệ số
tương quan mẫu R.

Kiểm định giả thiết:


H0 : ρ = 0 đối với H1 : ρ ≠ 0 (hoặc ρ > 0 hoặc ρ < 0)
Người ta chứng minh được rằng với giả thiết H0 , phân phối mẫu của R đối xứng; từ đó,
thống kê

n−2
T= R
√ 1−R 2
~ Student (n − 2)

Trắc nghiệm t được dùng trong trường hợp này.

34
Báo cáo Excel – Xác suất
thống kê

 Thực hiện trên exel:

 Tính T : chọn ô B10 và nhập biểu thức =B7*SQRT(12-2)/SQRT(1-B7^2).


 Tính c: chọn ô B11 và nhập biểu thức =TINV(0.05,13) (c là phân vị mức
α/2=0.025 của phân bố Student với n-2=13 bậc tự do).

Vì |T| > c nên bác bỏ giả thiết H 0 .


Vậy: X và Y có tương quan tuyến tính.

 Ước lượng đường hồi quy tuyến tính Y theo X.


 Cơ sở lý thuyết:

Phương trình hồi quy tuyến tính:

¿ x = 0+bX ;
Y^ B

B0=Ý -B X́ ;

B=
∑ X i . Y i−¿ ∑ X i . Y i /N ¿
X i− X́

35
Báo cáo Excel – Xác suất
thống kê

 Kiểm định hệ số a, b:
+ Giả thiết H0 : β i =0
“Hệ số hồi quy không có ý nghĩa” .
+ Giả thiết H1 : β i#0
“Hệ số hồi quy có ý nghĩa ”.
|Bi −βi| 2 S2 B
t= ; S = =
√ S n2 n
∑ ( x i− X́) √ S n2
2

+ Biện luận t<t α ,n-2 : chấp nhận H0


 Kiểm định phương trình hồi quy:
+ Giả thiết H0 : β i =0
“Phương trình hồi quy tuyến tính không thích hợp”.
+ Giả thiết H1 : β i#0
“Phương trình hồi quy tuyến tính thích hợp”.
F=MSR/MSE

+Kết luận F<t; Fα ,(1,n-2) : chấp nhận H 0

 Thực hiện trên Excel:

 Kiểm định hệ số a, b:
+ Giả thiết H0 : β i =0
“Hệ số hồi quy không có ý nghĩa” .
+ Giả thiết H1 : β i#0
“Hệ số hồi quy có ý nghĩa ”.

 Nhập dữ liệu

36
Báo cáo Excel – Xác suất
thống kê

 Dùng chức năng Data/Data


Analysis/Regression.
 Lựa chọn các thông số như hình sau:

30 Line Fit Plot


25

20

15
16

10

0
5 10 15 20 25 30 35
30

Predicted 16

37
Báo cáo Excel – Xác suất
thống kê

2
0.31637 < t 0.05=¿ 2.201 (Hay PV =0.7577 > α =¿0.05: Hệ số tự do không có ý
nghĩa.)
=> Chấp nhận giả thiết H0
3.988124>t 0.05=¿ 2.201 (Hay 0.0018 <α =¿0.05: Hệ số của x thích hợp.)
=> Không chấp nhận giả thiết H0

(Cách tính t0,05 bằng Excel ta nhập biểu thức sau “=TINV(0.05,11)” kết quả ta thu
được t0,05 = 2.201)

 Kiểm định phương trình hồi quy:


+ Giả thiết H0 : β i =0
“Phương trình hồi quy tuyến tính không thích hợp”.
+ Giả thiết H1 : β i#0
“Phương trình hồi quy tuyến tính thích hợp”.

FS4 =0.0018 <α =¿ 0.05

38
Báo cáo Excel – Xác suất
thống kê

=> Không chấp nhận giả thiết H0

Kết luận: phương trình hồi quy tuyến tính không thích hợp.

3) TÌM SAI SỐ CHUẨN CỦA ƯỚC LƯỢNG.


Dùng kết quả từ bảng SUMMARY OUTPUT từ câu trên ta xác định được sai số.
chuẩn của ước lượng:
Đối với biến tự do: SE = 2.7931
Đối với biến X: SE = 0.1424

b) dữ liệu ngẫu nhiên k chiều (k >2)


Laptop đang dần trở thành một phần không thể trong cuộc sống thường ngày của các
bạn sinh siên, học sinh. Vậy việc sử dụng laptop có ảnh hưởng đến việc học tập của
các bạn sinh viên Khoa điện trường đại học Bách khoa TP HCM không?
Tiến hành khảo sát ngẫu nhiên 10 bạn khoa điện trường đại học Bách khoa TP HCM
về thời gian giải tri, học tập trên laptop và điểm trung bình tích lũy ta thu được kết
quả.

Bạn thứ Thời gian dùng laptop để Thời gian dùng laptop Điểm trung bình tích
giải trí để giải trí lũy
X1 (giờ) X2 (giờ) Y
1 2 2 7.35
2 2 1.5 6.91
3 2 5 8
4 0.5 2 6.8
5 3 3 7.64
6 3 2 7.1
7 3 1 6.71
8 1 3 7.45
9 2 3 7.29
10 2 1.5 6.91
39
Báo cáo Excel – Xác suất
thống kê

 Thực hành trên exel


 Kiểm tra tác động của số giờ giải trí trên laptop đến điểm trung bình tích lũy.
 Nhập dữ liệu

 Dùng chức năng Data/Data Analysis/Regression.


 Lựa chọn các thông số như hình sau:

40
Báo cáo Excel – Xác suất
thống kê

Hệ số R2=0.00352
Độ lệch chuẩn S=0.446171
Phương trình hồi quy :y=7.192188+0.028125x
 Kiểm định hệ số a, b:
41
Báo cáo Excel – Xác suất
thống kê

+ Giả thiết H0 : β i =0
“Hệ số hồi quy không có ý nghĩa” .
+ Giả thiết H1 : β i#0
“Hệ số hồi quy có ý nghĩa ”.
PV2 =3.84.10^-7<0.05 (Hệ số tự do không thích hợp)
=>Không chấp nhận giả thiết H0
PV =¿0.879495>0.05: (Hệ số của x thích hợp)
=>Không chấp nhận giả thiết H0
 Kiểm định phương trình hồi quy:
+ Giả thiết H0 : β i =0
“Phương trình hồi quy tuyến tính không thích hợp”.
+ Giả thiết H1 : β i#0
“Phương trình hồi quy tuyến tính thích hợp”.

FS4 =0.879495>0.05
=>Không chấp nhận giả thiết H0

Nên số giờ giải trí trên laptop ảnh hưởng tới điểm trung bình tích lũy.

 Thực hành trên exel


 Kiểm tra tác động của số giờ học trên laptop đến điểm trung bình tích lũy.
 Dùng chức năng Data/Data Analysis/Regression.
 Lựa chọn các thông số như hình sau:

42
Báo cáo Excel – Xác suất
thống kê

Hệ số R2=0.837847
Độ lệch chuẩn S=0.814682
Phương trình hồi quy :y=6.434091+0.326364X
 Kiểm định hệ số a, b:

43
Báo cáo Excel – Xác suất
thống kê

+ Giả thiết H0 : β i =0
“Hệ số hồi quy không có ý nghĩa” .
+ Giả thiết H1 : β i#0
“Hệ số hồi quy có ý nghĩa ”.

Pv 2=9.04×10−10<0.05: hệ số tự do có ý nghĩa
Pv =0.000535< 0.005: Hệ số của X có ý nghĩa
=> Không chấp nhận giả thiết h0.

 Kiểm định phương trình hồi quy:


+ Giả thiết H0 : β i =0
“Phương trình hồi quy tuyến tính không thích hợp”.
+ Giả thiết H1 : β i#0
“Phương trình hồi quy tuyến tính thích hợp”.

F s4 =0.000535< 0.05
 Không chấp nhân giả thiết H0
 Phương trình hồi quy có ý nghĩa

X Variable 1 Line Fit Plot


9
8
7
6
5 Y
4 Predicted Y
Y

3
2
1
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
X Variable 1

44
Báo cáo Excel – Xác suất
thống kê

Kết luận: phương trình hồi quy tuyến tính thích hợp.
Nghĩa là Y liên quan tuyến tính với X2
Nên số giờ học trên laptop ảnh hưởng tới điểm trung bình tích lũy.

 Từ đó có thể thấy số giờ giải trí và số giờ học trên laptop trên laptop ảnh
hưởng tới kết quả học tập của sinh viên khoa điện trường đại học Bách Khoa
TPHCM

45
Báo cáo Excel – Xác suất
thống kê

Bài 6: Tìm 1 ví dụ liên quan đến chuyên ngành học để minh họa cho một bài toán phân
tích phương sai. Yêu cầu:
+ Dạng bài toán PTPS: tùy chọn.
+ Trình bày cơ sở lý thuyết, nhớ lưu ý điều kiện để bài toán thực hiện được.
+ Trình bày lời giải theo 2 cách: tính trực tiếp theo công thức và ứng dụng Excel.
Ví dụ: Thí nghiệm đo độ lợi áp của mạch BJT khuếch đại ghép E chung có hồi tiếp
(hình bên dưới) ở các tần số khác nhau (tần số dãy giữa):

ta được bảng số liệu sau:

Tần số (Khz) 4 5 8

22,5 19,8 21

21,8 20 20,8

Độ lợi áp (V/V) 22,2 19,7 21,2

22,4 19,6 21,6

21,9 20,1 21,2

Xét xem với mức ý nghĩa 5%, độ lợi áp có khác nhau theo tần số hay không?

46
Báo cáo Excel – Xác suất
thống kê

*** Đây là dạng bài phân tích phương sai một nhân tố: phân tích ảnh hưởng của một
yếu tố nguyên nhân (dạng biến định tính định tính) đến một yếu tố kết quả (dạng biến
định lượng) đang nghiên cứu.
I. Cơ sở lý thuyết:

Trong đó:
+) SST: Tổng bình phương độ lệch

47
Báo cáo Excel – Xác suất
thống kê

+) SSA: Tổng bình phương độ lệch riêng của các nhóm so với x́ , đặc trưng cho sự khác
nhau giữa các nhóm
+) SSE: Đặc trưng cho sự khác nhau giữa các số liệu trong nội bộ nhóm

II. Giải quyết bài toán:


Giả thiết kiểm định:
H0: Độ lợi áp trung bình ở các tần số khác nhau là như nhau
H1: Độ lợi áp trung bình ở các tần số khác nhau là khác nhau
Với mức ý nghĩa 5% ta có: F2; 12; 0.95 = 3.88
1. Tính trực tiếp:

48
Báo cáo Excel – Xác suất
thống kê

Nguồn SS Df MS F F2; 12; 0.95

Yếu tố 13.5413 2 6.77 90.6656 3.88

Sai sô 0.896 12 0.07467

Tổng cộng 14.4373 15

Ta có: F > F2; 12; 0.95 nên bác bỏ H0 chấp nhận H1


Vậy độ lợi áp có sai khác theo tần số.

49
Báo cáo Excel – Xác suất
thống kê

2. Giải bằng EXCEL:


Các bước thực hiện:
Bước 1: Nhập dữ liệu vào bảng tính:

Bước 2: Chọn Data/Data Analysis/Anova Single Factor và nhập vào hộp thoại như hình:

50
Báo cáo Excel – Xác suất
thống kê

Và đây là kết quả:

Kết luận:
Ta thấy F = 90.6786 > F crit = 3.88529 , tức là độ lợi trung bình ở các tần số khác nhau là
khác nhau

51

You might also like