Professional Documents
Culture Documents
BTL XSTK
BTL XSTK
-------*-------
MỤC LỤC
BÀI 1…………………………………………………………………………………3
BÀI 2…………………………………………………………………………………16
BÀI 3…………………………………………………………………………………20
BÀI 4…...................................................................................29
BÀI 5A……………………………………………………………………………….33
BÀI 5B……………………………………………………………………………….42
1
Báo cáo Excel – Xác suất
thống kê
BÀI 6..………………………………………………………………………………4
2
Báo cáo Excel – Xác suất
thống kê
Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1) Thực hiện phương pháp phân tổ dữ liệu (A).
2) Vẽ biểu đồ histogram ( biểu đồ phân bố tần số), biểu đồ tích lũy tần số, biểu đồ
mật độ với dữ liệu (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với
độ tin cậy 95% với dữ liệu (A).
4) Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào
đó hay không.
Dạng bài: Thống kê mô tả
Dữ liệu (A): Khảo sát nhu cầu (về giá tiền) mua laptop của học sinh, sinh viên ta có
bảng số liệu: Tiền (triệu đồng)
20 30 15 10 20 18 21 17 25 20
19 13 10 16 15 12 15 20 50 12
10 15 25 13 10 20 16 6 12 10
10 12 30 30 70 9 9 10 20 8
20 30 14 25 10 13 20 10 25 10
14 10 25 13 15 10 15 15 8 10
12 50 13 15 15 8 20 13 11 25
20 17 25 30 20 20 30 25 15 10
11 15 15 17 20 20 15 20 14 10
12 60 14 15 15 10 10 30 10 18
5 16 5 50 15 15 25 5 5 10
15 15 14 100 15 18 10 13 14 20
30 13 50 20 13 16 30 60 20 15
5.5 10 15 15 25 20 20 12 10 18
20 15 17 24 12 20 10 10 8 10
Dữ liệu (B): Khảo sát nhu cầu mua laptop (về thương hiệu) ta có bảng số liệu:
3
Báo cáo Excel – Xác suất
thống kê
1
- Xác định số tổ cần chia k = (2 x n¿ 3
- Chọn ô A16 nhập vào biểu thức =(2*COUNT(A1:J14))^(1/3)
- Kết quả: 6.542133
- Chọn k = 7
(x max −x min )
- Xác định trị số khoảng cách h theo công thức h =
k
- Chọn ô A17 nhập vào biểu thức =(MAX(A4:J14) - MIN(A4:J14))/7
- Kết quả 13.57143
- Chọn h = 14
- Ta xác định các cận trên và cận dưới của các tổ lần lượt là:
4
Báo cáo Excel – Xác suất
thống kê
- Kết quả
5
Báo cáo Excel – Xác suất
thống kê
- Chỉnh lại:
2) Vẽ biểu đồ histogram ( biểu đồ phân bố tần số), biểu đồ tích lũy tần số, biểu
đồ mật độ với dữ liệu (A).
- Vẽ đồ thị phân bố tần số
Quét chọn bảng tần số A1:B8
Chọn Insert -> Column
6
Báo cáo Excel – Xác suất
thống kê
Kết quả:
7
Báo cáo Excel – Xác suất
thống kê
8
Báo cáo Excel – Xác suất
thống kê
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 95% với dữ liệu (A).
9
Báo cáo Excel – Xác suất
thống kê
- Chọn chức năng Data -> Data Analysis -> Descriptive Statistics
Input Range: Địa chỉ tuyệt đối chứa dữ liệu
Output options: Vị trí chứa kết quả
Confidence Level for Mean: Độ tin cậy trung bình
- Kết quả:
10
Báo cáo Excel – Xác suất
thống kê
4) Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
- Nhập dữ liệu vào bảng tính
- Tính tỉ lệ:
Chọn C3: =B3/$B$12 kéo cho tất cả các ô
- Vẽ biểu đồ thể hiện nhu cầu sử dụng laptop (về hãng laptop) của sinh viên
11
Báo cáo Excel – Xác suất
thống kê
5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào
đó hay không?
12
Báo cáo Excel – Xác suất
thống kê
X2qs € Wα nên bác bỏ H0. Dữ liệu (A) không phù hợp với phân phối chuẩn
13
Báo cáo Excel – Xác suất
thống kê
Bài 2:
Một giám đốc doanh nghiệp quyết định gửi 8 nhân viên của mình đi dự một lớp tập huấn
về “Dịch vụ khách hàng”. Dưới đây là phản hồi của bộ phận chăm sóc khách hàng về các
nhân viên được cử đi tập huấn.
A 3 3
B 5 4
C 12 10
D 8 6
E 6 6
F 5 3
G 7 3
H 9 4
Hãy nhận xét hiệu quả của quyết định trên với mức ý nghĩa 5%. Tìm thêm giá trị P trong
kiểm định.
BÀI LÀM
Dạng bài: Kiểm định giả thuyết cho khác biệt của hai trung bình tổng thể, hai mẫu
không độc lập ( mẫu phối hợp từng cặp hay mẫu cặp ).
Công cụ: t-test:Paired Two Sample for Means
Cơ sở lý thuyết:
Để tiến hành phương pháp kiểm định này ta phải tìm di= X 1− X 2
di là chênh lệch của 2 biến x1 x2
Ta có thể gặp các giả thuyết
Giả thuyết 2 bên
14
Báo cáo Excel – Xác suất
thống kê
Giá trị kiểm định được tính theo công thức sau
d− μd
zd=
σd
√n
Trong đó:
n
∑ di
d= i =1
n
μd là trung bình của các chênh lêch được giả thuyết
σd là độ lệch chuẩn tổng thể của các chênh lệch
sd=
√ ∑ (d i −d )2
i=1
n−1
Quy tắc quyết định bác bỏ H 0
+ Input: địa chỉ tuyệt đối chứa dư liệu tương ứng của mẫu 1 và 2
16
Báo cáo Excel – Xác suất
thống kê
Biện luận :
Gọi a 1; a 2 là số phàn nàn trung bình trước tập huấn và sau tập huấn
Giả thiết kiểm định H 0 : a 1=a2
H 1 : a 1 ≠ a2
17
Báo cáo Excel – Xác suất
thống kê
I. Đề bài:
Sau đây là số liệu về một loại báo ngay bán được ở 5 quận nội thành, số liệu lấy ở một lý
bán lẻ:
Ngày khảo Các quận nội thành
sát
Thứ 2 Quận 1 Quận 2 Quận 3 Quận 4 Quận 5
Thứ 3 254;232 236;245 267;258 223;224 245;247
Thứ 4 245;235 212;246 256;276 213;219 234;251
Thứ 5 236;255 223;264 245;275 230;244 232;254
Thứ 6 235;209 197;223 243;234 213;223 224;242
Hãy so sánh lượng báo bán ra ở các ngay trong tuần và ở các quận. Có thể nói lượng báo
bán ra chịu yếu tố tác động là ngay trong tuần hay không ? Kết luận với mức ý nghĩa 5%.
II. Dạng bài:
Phân tích phương sai 2 nhân tố có lặp: phân tích nhằm đánh giá sự ảnh hưởng của hai
nhân tố ( hàng và cột) và sự tương tác giữa chúng tới các giá trị quan sát
Cơ sở lý thuyết:
*) Mẫu điều tra:
18
Báo cáo Excel – Xác suất
thống kê
19
Báo cáo Excel – Xác suất
thống kê
20
Báo cáo Excel – Xác suất
thống kê
25 23 26 22 24
4 48 6 48 7 52 3 5
Thứ 2 447 492 2431
23 6 24 1 25 5 22 24
2 5 8 4 7
24 21 25 21 23
5 48 2 45 6 53 3 4
Thứ 3 432 485 2387
23 0 24 8 27 2 21 25
5 6 6 9 1
23 22 24 23 23
6 49 3 48 5 52 0 2
Thứ 4 474 486 2458
25 1 26 7 27 0 24 25
5 4 5 4 4
23 19 24 21 22
5 44 7 42 3 47 3 4
Thứ 5 436 466 2243
20 4 22 0 23 7 22 24
9 3 4 3 2
T ¿ j∗¿¿ 1901 1846 2054 1789 1929 T = 9519
21
Báo cáo Excel – Xác suất
thống kê
Nguồn SS df MS F
Tổng 12736,975 39
Ta có:
+) FA = 4,5211 > F3; 20; 0,95 = 3.10 => Số lượng báo bán ra phụ thuộc vào ngày trong tuần
+) FB = 6,1218 > F4; 20; 0,95 = 2,87 => Số lượng báo bán ra phụ thuộc vào các quận
+) FAB = 0,3969 < F12; 20; 0,95 = 2,28 => Không có sự tương tác giữa các ngày trong tuần và
ở các quận
22
Báo cáo Excel – Xác suất
thống kê
Bước 2: Vào Data/ Data Analysis chọn ANOVA: Two-Factor With Replication.
Nhập vào hộp thoại ANOVA: Two-Factor With Replication như sau:
23
Báo cáo Excel – Xác suất
thống kê
Kết quả:
24
Báo cáo Excel – Xác suất
thống kê
25
Báo cáo Excel – Xác suất
thống kê
Kết luận:
+) Yếu tố hàng (Ngày): F = 4,521062 > F3; 20; 0,95 = 3.098391 => Số lượng báo bán ra phụ
thuộc vào ngày trong tuần
+)Yếu tố cột (Quận): F= 6,121748 > F4; 20; 0,95 = 2,866081 => Số lượng báo bán ra phụ
thuộc vào các quận
+) Yếu tố tương tác: F = 0,39693 < F12; 20; 0,95 = 2,277581 => Không có sự tương tác (ảnh
hưởng) giữa các ngày trong tuần và ở các quận
26
Báo cáo Excel – Xác suất
thống kê
BÀI 4:
Bảng số liệu sau cho biết số lượng lao động có việc làm tại Việt Nam chia theo
khu vực kinh tế năm 2017:
Với mức ý nghĩa = 3%,có thể xem số lượng lao động có việc làm tại các
khu vực kinh tế có phụ thuộc vào các vùng?
Bài làm
-Mục đích: Xét một tổng thể gồm 2 dấu hiện X, Y. Các dấu hiệu này có thể là dấu
hiệu định tính hoặc định lượng. Trong trường hợp bài toán nêu trên là cả 2 dấu hiệu
đều là dấu hiệu định tính.
27
Báo cáo Excel – Xác suất
thống kê
X,Y y1 y2 … yh ni
x1 n11 n12 … n1 h n1
x2 n21 n22 … n2 h n2
… … … … … …
xk n k1 n k2 … n kh nk
mj m1 m2 … mh Σ=n
Trong đó:
k k k k
ni nij mi nij ni nij
j 1 i 1 i 1 j 1
Kiểm định giả thiết: H0: X và Y đồng nhất, với mức ý nghĩa α.
k k ( nij ij ) 2 ni m j
2
ij
0
i 1 j 1 ij n
Cách 2: Sử dụng hàm CHITEST trong Excel: CHITEST(nij,γij), với lưu ý số lượng các giá
trị của nij và γij phải bằng nhau.
Kết luận
2 2
Nếu χ 0 < χ α → Chấp nhận giả thiết H0.
28
Báo cáo Excel – Xác suất
thống kê
Hoặc kết quả hàm CHITEST > α = 0.03 → Chấp nhận giả thiết H0.
– Giả thuyết H0: Số lượng lao động theo khu vực kinh tế có quan hệ với các vùng
Đối giả thiết H1: Số lượng lao động theo khu vực kinh tế và các vùng kinh tế không
có quan hệ với nhau
ni m j
ij
n
Tính tần số lý thuyết dựa vào công thức sau:
Chọn từ ô J5 đến ô H2, ta nhấn dấu ‘’=’’ và nhập tiếp biểu thức sau:’’ =D$6*$E5/$E$6’’
29
Báo cáo Excel – Xác suất
thống kê
Kết Luận: chấp nhận giải thiết H0 . Vậy số lượng lao động theo khu vực kinh tế có
quan hệ với các vùng.
30
Báo cáo Excel – Xác suất
thống kê
Bài 5: a) Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô
hình hồi quy tuyến tính đơn. Thực hiện các yêu cầu sau trên Excel:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượng
đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.
3) Tìm sai số chuẩn của ước lượng.
b) Tìm một dữ liệu ngẫu nhiên k chiều (k >2) để sử dụng mô hình hồi quy tuyến tính đa
biến. Tìm các hệ số hồi quy tuyến tính mẫu và kết luận về sự thích hợp.
Bài làm
a) Bảng số liệu về số tiền mua laptop và dung lượng Ram (GB) mong muốn của học
sinh, sinh viên được chọn ngẫu nhiên trong một cuộc khảo sát.
Giá
tiền
30 15 25 14 17 100 25 12 25 15 60 20 11 8 10
(triệu
đồng)
Dung 16 8 16 16 8 16 8 4 16 8 16 8 16 4 8
lượng
(GB)
31
Báo cáo Excel – Xác suất
thống kê
Hệ số tương quan
Nếu |R|→ 0 thì X, Y có tương quan không chặt (tương quan yếu).
Hệ số tương quan dung trong việc đánh giá mức độ liên quan.
32
Báo cáo Excel – Xác suất
thống kê
33
Báo cáo Excel – Xác suất
thống kê
R= 0.765894
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không?
Nếu có, hãy ước lượng đường hồi quy tuyến tính Y theo X.
Cơ sở lý thuyết:
Giả sử (X1 , Y1 ); (X2 , Y2 ); . . .; (Xn , Yn ) là mẫu ñược thành lập từ tổng thể (X,Y) có
phân phối chuẩn hai chiều. Chúng ta muốn kiểm định các giả thiết liên quan đến các giá
trị khác nhau của hệ số tương quan tổng thể, ký hiệu ρ, dựa trên phân phối mẫu của hệ số
tương quan mẫu R.
n−2
T= R
√ 1−R 2
~ Student (n − 2)
34
Báo cáo Excel – Xác suất
thống kê
¿ x = 0+bX ;
Y^ B
B0=Ý -B X́ ;
B=
∑ X i . Y i−¿ ∑ X i . Y i /N ¿
X i− X́
35
Báo cáo Excel – Xác suất
thống kê
Kiểm định hệ số a, b:
+ Giả thiết H0 : β i =0
“Hệ số hồi quy không có ý nghĩa” .
+ Giả thiết H1 : β i#0
“Hệ số hồi quy có ý nghĩa ”.
|Bi −βi| 2 S2 B
t= ; S = =
√ S n2 n
∑ ( x i− X́) √ S n2
2
Kiểm định hệ số a, b:
+ Giả thiết H0 : β i =0
“Hệ số hồi quy không có ý nghĩa” .
+ Giả thiết H1 : β i#0
“Hệ số hồi quy có ý nghĩa ”.
Nhập dữ liệu
36
Báo cáo Excel – Xác suất
thống kê
20
15
16
10
0
5 10 15 20 25 30 35
30
Predicted 16
37
Báo cáo Excel – Xác suất
thống kê
2
0.31637 < t 0.05=¿ 2.201 (Hay PV =0.7577 > α =¿0.05: Hệ số tự do không có ý
nghĩa.)
=> Chấp nhận giả thiết H0
3.988124>t 0.05=¿ 2.201 (Hay 0.0018 <α =¿0.05: Hệ số của x thích hợp.)
=> Không chấp nhận giả thiết H0
(Cách tính t0,05 bằng Excel ta nhập biểu thức sau “=TINV(0.05,11)” kết quả ta thu
được t0,05 = 2.201)
38
Báo cáo Excel – Xác suất
thống kê
Kết luận: phương trình hồi quy tuyến tính không thích hợp.
Bạn thứ Thời gian dùng laptop để Thời gian dùng laptop Điểm trung bình tích
giải trí để giải trí lũy
X1 (giờ) X2 (giờ) Y
1 2 2 7.35
2 2 1.5 6.91
3 2 5 8
4 0.5 2 6.8
5 3 3 7.64
6 3 2 7.1
7 3 1 6.71
8 1 3 7.45
9 2 3 7.29
10 2 1.5 6.91
39
Báo cáo Excel – Xác suất
thống kê
40
Báo cáo Excel – Xác suất
thống kê
Hệ số R2=0.00352
Độ lệch chuẩn S=0.446171
Phương trình hồi quy :y=7.192188+0.028125x
Kiểm định hệ số a, b:
41
Báo cáo Excel – Xác suất
thống kê
+ Giả thiết H0 : β i =0
“Hệ số hồi quy không có ý nghĩa” .
+ Giả thiết H1 : β i#0
“Hệ số hồi quy có ý nghĩa ”.
PV2 =3.84.10^-7<0.05 (Hệ số tự do không thích hợp)
=>Không chấp nhận giả thiết H0
PV =¿0.879495>0.05: (Hệ số của x thích hợp)
=>Không chấp nhận giả thiết H0
Kiểm định phương trình hồi quy:
+ Giả thiết H0 : β i =0
“Phương trình hồi quy tuyến tính không thích hợp”.
+ Giả thiết H1 : β i#0
“Phương trình hồi quy tuyến tính thích hợp”.
FS4 =0.879495>0.05
=>Không chấp nhận giả thiết H0
Nên số giờ giải trí trên laptop ảnh hưởng tới điểm trung bình tích lũy.
42
Báo cáo Excel – Xác suất
thống kê
Hệ số R2=0.837847
Độ lệch chuẩn S=0.814682
Phương trình hồi quy :y=6.434091+0.326364X
Kiểm định hệ số a, b:
43
Báo cáo Excel – Xác suất
thống kê
+ Giả thiết H0 : β i =0
“Hệ số hồi quy không có ý nghĩa” .
+ Giả thiết H1 : β i#0
“Hệ số hồi quy có ý nghĩa ”.
Pv 2=9.04×10−10<0.05: hệ số tự do có ý nghĩa
Pv =0.000535< 0.005: Hệ số của X có ý nghĩa
=> Không chấp nhận giả thiết h0.
F s4 =0.000535< 0.05
Không chấp nhân giả thiết H0
Phương trình hồi quy có ý nghĩa
3
2
1
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
X Variable 1
44
Báo cáo Excel – Xác suất
thống kê
Kết luận: phương trình hồi quy tuyến tính thích hợp.
Nghĩa là Y liên quan tuyến tính với X2
Nên số giờ học trên laptop ảnh hưởng tới điểm trung bình tích lũy.
Từ đó có thể thấy số giờ giải trí và số giờ học trên laptop trên laptop ảnh
hưởng tới kết quả học tập của sinh viên khoa điện trường đại học Bách Khoa
TPHCM
45
Báo cáo Excel – Xác suất
thống kê
Bài 6: Tìm 1 ví dụ liên quan đến chuyên ngành học để minh họa cho một bài toán phân
tích phương sai. Yêu cầu:
+ Dạng bài toán PTPS: tùy chọn.
+ Trình bày cơ sở lý thuyết, nhớ lưu ý điều kiện để bài toán thực hiện được.
+ Trình bày lời giải theo 2 cách: tính trực tiếp theo công thức và ứng dụng Excel.
Ví dụ: Thí nghiệm đo độ lợi áp của mạch BJT khuếch đại ghép E chung có hồi tiếp
(hình bên dưới) ở các tần số khác nhau (tần số dãy giữa):
Tần số (Khz) 4 5 8
22,5 19,8 21
21,8 20 20,8
Xét xem với mức ý nghĩa 5%, độ lợi áp có khác nhau theo tần số hay không?
46
Báo cáo Excel – Xác suất
thống kê
*** Đây là dạng bài phân tích phương sai một nhân tố: phân tích ảnh hưởng của một
yếu tố nguyên nhân (dạng biến định tính định tính) đến một yếu tố kết quả (dạng biến
định lượng) đang nghiên cứu.
I. Cơ sở lý thuyết:
Trong đó:
+) SST: Tổng bình phương độ lệch
47
Báo cáo Excel – Xác suất
thống kê
+) SSA: Tổng bình phương độ lệch riêng của các nhóm so với x́ , đặc trưng cho sự khác
nhau giữa các nhóm
+) SSE: Đặc trưng cho sự khác nhau giữa các số liệu trong nội bộ nhóm
48
Báo cáo Excel – Xác suất
thống kê
49
Báo cáo Excel – Xác suất
thống kê
Bước 2: Chọn Data/Data Analysis/Anova Single Factor và nhập vào hộp thoại như hình:
50
Báo cáo Excel – Xác suất
thống kê
Kết luận:
Ta thấy F = 90.6786 > F crit = 3.88529 , tức là độ lợi trung bình ở các tần số khác nhau là
khác nhau
51