Professional Documents
Culture Documents
C03104 NMTK Chuong 3 Phan Phoi Tan So Va Bieu Do
C03104 NMTK Chuong 3 Phan Phoi Tan So Va Bieu Do
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 1 / 104
Nội dung
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 2 / 104
3.1. Tổ chức dữ liệu cho một biến
Ví dụ 1
Sau đây là các dữ liệu về tuổi của 50 người giàu nhất thế giới
(nguồn: Forbes Magazine)
45 46 64 57 85 92 51 71 54 48
27 66 76 55 69 54 44 54 75 46
61 68 78 61 83 88 45 89 67 56
81 58 55 62 38 55 56 64 81 38
49 68 91 56 68 46 47 83 71 62
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 3 / 104
3.1. Tổ chức dữ liệu cho một biến
Ví dụ 2
Sau đây là dữ liệu về nhóm máu của 25 quân nhân
A B B AB O
O O B AB B
B B O A O
A O O O AB
AB A O B A
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 4 / 104
3.1. Tổ chức dữ liệu cho một biến
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 5 / 104
3.1. Tổ chức dữ liệu cho một biến
Hướng giải quyết: tổ chức các dữ liệu trên thành một phân
phối tần số (frequency distribution).
Về cơ bản, mỗi phân phối tần số bao gồm các lớp/tổ
(classes) và các tần số (frequencies) tương ứng.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 6 / 104
3.1. Tổ chức dữ liệu cho một biến
Tuổi Số người
27–35 1
36–44 3
45–53 9
54–62 15
63–71 10
72–80 3
81–89 7
90–98 2
Tổng: 50
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 7 / 104
3.1. Tổ chức dữ liệu cho một biến
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 8 / 104
3.1.1. Phân phối tần số phân loại (Categorical
frequency distributions)
Là kiểu phân phối tần số được dùng để tổ chức các dữ liệu của
biến định tính (dữ liệu mức định danh hoặc mức thứ bậc).
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 9 / 104
3.1.1. Phân phối tần số phân loại
Ví dụ 3
Xét lại ví dụ 2, hãy lập phân phối tần số phân loại cho tập dữ
liệu trên.
Ví dụ 4
Coca-Cola, Diet Coke, Dr. Pepper, Pepsi và Sprite là năm loại
nước giải khát phổ biến tại một cửa hàng tiện lợi. Hãy lập phân
phối tần số phân loại cho tập dữ liệu về các loại nước ngọt
trong một mẫu gồm 50 lần mua.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 10 / 104
3.1.1. Phân phối tần số phân loại
Ví dụ 4
Coca-Cola Diet Coke Pepsi Diet Coke Coca-Cola
Coca-Cola Dr. Pepper Diet Coke Pepsi Pepsi
Coca-Cola Dr. Pepper Sprite Coca-Cola Diet Coke
Coca-Cola Coca-Cola Sprite Coca-Cola Diet Coke
Coca-Cola Diet Coke Coca-Cola Sprite Pepsi
Coca-Cola Coca-Cola Coca-Cola Pepsi Coca-Cola
Sprite Dr. Pepper Pepsi Diet Coke Pepsi
Coca-Cola Coca-Cola Coca-Cola Pepsi Dr. Pepper
Coca-Cola Diet Coke Pepsi Pepsi Pepsi
Pepsi Coca-Cola Dr. Pepper Pepsi Sprite
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 11 / 104
3.1.2. Phân phối tần số ghép nhóm (Grouped
frequency distributions)
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 12 / 104
3.1.2. Phân phối tần số ghép nhóm
Ví dụ 5
Sau đây là phân phối tần số ghép nhóm của mức đường huyết tính
(mg/dL) cho 50 sinh viên đại học được chọn ngẫu nhiên:
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 13 / 104
3.1.2. Phân phối tần số ghép nhóm
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 14 / 104
3.1.2. Phân phối tần số ghép nhóm
Độ rộng lớp (class width) của một lớp được xác định theo
một trong các cách sau:
⋆ Hiệu của biên trên và biên dưới của lớp đang xét.
⋆ Hiệu của cận dưới của lớp kế tiếp và cận dưới của lớp
đang xét.
⋆ Hiệu của cận trên của lớp kế tiếp và cận trên của lớp
đang xét.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 15 / 104
3.1.2. Phân phối tần số ghép nhóm
Trung điểm (midpoint) của một lớp được xác định theo một
trong hai cách sau:
⋆ lấy trung bình cộng của cận dưới và cận trên của lớp đó.
⋆ lấy trung bình cộng của biên dưới và biên trên của lớp
đó.
Trung điểm của một lớp biểu thị vị trí trung tâm của lớp đó.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 16 / 104
3.1.2. Phân phối tần số ghép nhóm
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 17 / 104
3.1.2. Phân phối tần số ghép nhóm
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 18 / 104
3.1.2. Phân phối tần số ghép nhóm
Ví dụ 6
Số tầng của 30 tòa nhà cao nhất thế giới được liệt kê dưới đây:
88 88 110 88 80 69 102 78 70 55
79 85 80 100 60 90 77 55 75 55
54 60 75 64 105 56 71 70 65 72
Hãy lập phân phối tần số ghép nhóm, với 5 nhóm cho tập dữ
liệu trên.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 19 / 104
3.1.2. Phân phối tần số ghép nhóm
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 20 / 104
3.1.2. Phân phối tần số ghép nhóm
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 21 / 104
3.1.2. Phân phối tần số ghép nhóm
Ví dụ 7
Phân phối tần số tích lũy
Tuổi Số người Tần số tích lũy
27–35 1 1
36–44 3 4
45–53 9 13
54–62 15 28
63–71 10 38
72–80 3 41
81–89 7 48
90–98 2 50
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 22 / 104
3.1.3. Phân phối tần số mở-đóng (Open-ended
frequency distributions)
Phân phối tần số trong đó có một nhóm mà cận dưới (hoặc cận
trên) không xác định.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 23 / 104
3.1.4. Phân phối tần số không ghép nhóm
(Ungrouped frequency distributions)
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 24 / 104
3.1.4. Phân phối tần số không ghép nhóm
Ví dụ 8
Tập dữ liệu sau đây biểu thị số dặm chạy được trên mỗi gallon
(mpg) nhiên liệu của 30 chiếc xe thể thao chạy trong thành phố.
Hãy lập một phân phối tần số cho tập dữ liệu này.
12 17 12 14 16 18 16 18 12 16
17 15 15 16 12 15 16 16 12 14
15 12 15 15 19 13 16 18 16 14
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 25 / 104
3.1.4. Phân phối tần số không ghép nhóm
Ví dụ 8
Nhóm Tần số
12 6
13 1
14 3
15 6
16 8
17 2
18 3
19 1
Tổng: 30
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 26 / 104
3.1.4 Phân phối tần số không ghép nhóm
Ví dụ 9
Dữ liệu sau đây về số giờ mà 30 sinh viên đại học cho biết họ
ngủ mỗi đêm. Hãy lập một phân phối tần số.
8 6 6 8 5 7 7 8 7 6
6 7 9 7 7 6 8 10 6 7
6 7 8 7 7 8 7 8 9 8
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 27 / 104
Bài tập
Sinh viên làm các bài tập 9 – 26 trang 51, 52, 53, Tài liệu
[1] (A. G. Bluman, [2017], Elementary statistics: a step by
step approach, 10th ed., McGraw-Hill, New York).
Sinh viên làm các bài tập 1 – 6 trang 101, 102, Tài liệu [1]
(A. G. Bluman, [2017], Elementary statistics: a step by step
approach, 10th ed., McGraw-Hill, New York).
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 28 / 104
3.2. Biểu đồ tần số, đa giác tần số, vòm cung
Sau khi tổ chức dữ liệu thành một phân phối tần số, chúng
ta có thể biểu diễn chúng thành dạng biểu đồ.
Các biểu đồ (graph) là các hình vẽ hoặc các đường nét hình
học với những màu sắc thích hợp để trình bày các dữ liệu
thống kê, nhằm truyền tải các dữ liệu dưới dạng hình ảnh
đến người xem.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 29 / 104
3.2. Biểu đồ tần số, đa giác tần số, vòm cung
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 30 / 104
3.2.1. Biểu đồ tần số (Frequency histogram)
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 31 / 104
3.2.1. Biểu đồ tần số
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 32 / 104
3.2.1. Biểu đồ tần số
Ví dụ 10
Các dữ liệu dưới đây biểu thị mức nhiệt độ cao (◦ F) ở 50 bang của
nước Mỹ. (Nguồn: The World Almanac and Book of Facts.)
112 100 127 120 134 118 105 110 109 112
110 118 117 116 118 122 114 114 105 109
107 112 114 115 118 117 118 122 106 110
116 108 110 121 113 120 119 111 104 111
120 113 120 117 105 110 118 112 114 114
Hãy lập một phân phối tần số ghép lớp gồm 7 lớp cho tập dữ liệu này
và sau đó vẽ biểu đồ tần số.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 33 / 104
3.2.1. Biểu đồ tần số
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 34 / 104
3.2.2. Biểu đồ tần suất (Relative frequency
histogram)
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 35 / 104
3.2.2. Biểu đồ tần suất
Ví dụ 11
Vẽ biểu đồ tần số tương đối (tần suất) cho phân phối được hiển thị
trong bảng phân phối tần số ghép nhóm về độ tuổi (tại thời điểm viết
bài này) của các thống đốc của 50 tiểu bang của Hoa Kỳ.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 36 / 104
3.2.2. Biểu đồ tần suất
Tuổi Ranh giới lớp Tần số Tần số tích lũy Tần suất
43-47 42.5–47.5 4 4 0.08
48-52 47.5–52.5 4 8 0.08
53-57 52.5–57.5 11 19 0.22
58-62 57.5–62.5 14 33 0.28
63-67 62.5–67.5 9 42 0.18
68-72 67.5–72.5 5 47 0.1
73-77 72.5–77.5 3 50 0.06
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 37 / 104
3.2.2. Biểu đồ tần suất
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 38 / 104
3.2.3 Đa giác tần số
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 39 / 104
3.2.3 Đa giác tần số
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 40 / 104
3.2.3 Đa giác tần số
Nối các điểm này bằng các đoạn thẳng. Từ điểm đầu, ta vẽ
đường thẳng quay đến vị trí trên trục x mà có khả năng là
trung điểm trước của trung điểm lớp đầu tiên. Từ điểm cuối,
ta vẽ đường thẳng quay đến vị trí trên trục x mà có khả
năng là trung điểm kế tiếp của trung điểm lớp cuối cùng.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 41 / 104
3.2.3 Đa giác tần số
Ví dụ 12
Xét lại ví dụ 10 là dữ liệu biểu thị mức nhiệt độ cao (◦ F) ở 50
bang của nước Mỹ. (Nguồn: The World Almanac and Book of
Facts.) Hãy lập một phân phối tần số ghép lớp gồm 7 lớp cho
tập dữ liệu này và sau đó vẽ đa giác tần số.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 42 / 104
3.2.3 Đa giác tần số
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 43 / 104
3.2.4 Vòm cong/Biểu đồ tần số tích lũy
Là loại biểu đồ biểu diễn các tần số tích lũy cho các nhóm
trong một phân phối tần số ghép nhóm.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 44 / 104
3.2.4 Vòm cong/Biểu đồ tần số tích lũy
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 45 / 104
3.2.4 Vòm cong/Biểu đồ tần số tích lũy
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 46 / 104
3.2.4 Vòm cong/Biểu đồ tần số tích lũy
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 47 / 104
3.2.4 Vòm cong/Biểu đồ tần số tích lũy
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 48 / 104
3.2.5 Các hình dạng phân phối
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 49 / 104
3.2.5 Các hình dạng phân phối
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 50 / 104
3.2.5 Các hình dạng phân phối
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 51 / 104
3.2.5 Các hình dạng phân phối
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 52 / 104
Bài tập
Sinh viên làm các bài tập 1 – 18 trang 65, 66, 67 Tài liệu
[1] (A. G. Bluman, [2017], Elementary statistics: a step by
step approach, 10th ed., McGraw-Hill, New York).
Sinh viên làm các bài tập 7 – 12 trang 102, Tài liệu [1] (A.
G. Bluman, [2017], Elementary statistics: a step by step
approach, 10th ed., McGraw-Hill, New York).
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 53 / 104
3.3. Các loại biểu đồ khác
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 54 / 104
3.3.1. Biểu đồ thanh (Bar Graphs)
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 55 / 104
3.3.1. Biểu đồ thanh
Ví dụ 13
Bảng số liệu dưới đây về số tiền trung bình mà sinh viên đại học
năm thứ nhất chi tiêu. Vẽ biểu đồ thanh ngang và dọc cho dữ
liệu. (Nguồn: The National Retail Federation)
Electronics $728
Dorm decor 344
Clothing 141
Shoes 72
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 56 / 104
3.3.1. Biểu đồ thanh
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 57 / 104
3.3.1. Biểu đồ thanh
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 58 / 104
3.3.1. Biểu đồ thanh
Ví dụ 14
Bảng số liệu dưới đây mô tả số lượng sinh viên đang theo học
các hệ đào tạo trong Trường Đại học A. Hãy vẽ biểu đồ thanh
đứng và biểu đồ thanh ngang cho dữ liệu này.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 59 / 104
3.3.1. Biểu đồ thanh
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 60 / 104
3.3.1. Biểu đồ thanh
Ví dụ 15
Bảng số liệu dưới đây mô tả số lượng (triệu người) người trưởng
thành chưa từng kết hôn ở Hoa Kỳ. (Nguồn: U.S. Census
Bureau.)
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 61 / 104
3.3.1. Biểu đồ thanh
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 62 / 104
3.3.2. Biểu đồ Pareto (Pareto chart)
Biểu đồ Pareto được sử dụng để biểu thị một phân phối tần
số phân loại.
Các tần số được mô tả bằng chiều cao của các thanh đứng,
mà được sắp xếp theo thứ tự từ cao đến thấp.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 63 / 104
3.3.2. Biểu đồ Pareto
Ví dụ 16
Bảng số liệu dưới đây mô tả số giờ trung bình mà một người đi làm
dành cho tình trạng tắc nghẽn giao thông mỗi năm trong một mẫu
khảo sát tại một số thành phố ở Mỹ. Hãy vẽ biểu đồ Pareto cho dữ
liệu này. (Nguồn: 2015 Urban Mobility Scorecard)
City Hours
Atlanta 52
Boston 64
Chicago 61
New York 74
Washington, D. C. 82
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 64 / 104
3.3.2. Biểu đồ Pareto
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 65 / 104
3.3.2. Biểu đồ Pareto
Ví dụ 17
Bảng số liệu dưới đây mô tả số lượng người vô gia cư trong một mẫu
khảo sát tại một số thành phố ở Mỹ. Hãy vẽ biểu đồ Pareto cho dữ
liệu này.
Thành phố Số lượng
Atlanta 6832
Baltimore 2904
Chicago 6680
ST.Louis 1485
Washington 5518
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 66 / 104
3.3.3. Biểu đồ chuỗi thời gian (Time series graph)
Biểu đồ chuỗi thời gian được dùng cho dữ liệu được thu
thập trong một khoảng thời gian.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 67 / 104
3.3.3. Biểu đồ chuỗi thời gian
Ví dụ 18
Dữ liệu cho thấy chi phí trung bình (triệu đô la) của một quảng
cáo truyền hình dài 30 giây trong chương trình Giải thưởng Học
viện. Vẽ và phân tích biểu đồ chuỗi thời gian cho dữ liệu.
(Nguồn: Kantar Media, USA TODAY RESEARCH)
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 68 / 104
3.3.3. Biểu đồ chuỗi thời gian
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 69 / 104
3.3.3. Biểu đồ chuỗi thời gian
Ngoài ra, hai hoặc nhiều tập dữ liệu có thể được so sánh trên
cùng một biểu đồ được gọi là biểu đồ chuỗi thời gian phức hợp
(a compound time series graph).
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 70 / 104
3.3.3. Biểu đồ chuỗi thời gian
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 71 / 104
3.3.3. Biểu đồ chuỗi thời gian
Ví dụ 19
Tại Hoa Kỳ, thiệt hại (triệu USD) từ việc đốt phá nhà thờ trong
các năm từ 2001 đến 2005 được thể hiện trong bảng sau. Vẽ
biểu đồ chuỗi thời gian cho tập dữ liệu. (Nguồn: Cục Phòng
cháy chữa cháy Hoa Kỳ.)
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 72 / 104
3.3.4. Biểu đồ tròn (Pie graph)
Là một hình tròn được chia thành các phần nhỏ tương ứng
theo tần suất của mỗi nhóm trong phân phối.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 73 / 104
3.3.4. Biểu đồ tròn
Bước 1: Chuyển đổi tần số của mỗi lớp thành một phần tỷ
lệ của hình tròn. Công thức chuyển đổi:
Tần số
Độ = × 360◦ .
Tổng tần số
Bước 2: Chuyển đổi mỗi tần số qua tỷ lệ phần trăm. Công
thức chuyển đổi:
Tần số
%= × 100.
Tổng tần số
Bước 3: Vẽ biểu đồ, sử dụng các số liệu ở Bước 1 và dán
nhãn cho từng phần bằng tên và tỷ lệ phần trăm theo Bước
2.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 74 / 104
3.3.4. Biểu đồ tròn
Ví dụ 20
Phân phối tần số dưới đầy mô tả số lượng (pounds) của mỗi loại
đồ ăn nhẹ được ăn trong trận Super Bowl. Hãy vẽ biểu đồ hình
tròn cho dữ liệu. (Nguồn: USA TODAY Weekend.)
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 75 / 104
3.3.4. Biểu đồ tròn
Bước 1:
Potato chips 11.2
30 · 360◦ = 134◦ .
Tortilla chips 8.2
30 · 360◦ = 98◦ .
Pretzels 4.3
30 · 360◦ = 52◦ .
Popcorn 3.8
30 · 360◦ = 46◦ .
Snack nuts 2.5
30 · 360◦ = 30◦ .
Total 360◦
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 76 / 104
3.3.4. Biểu đồ tròn
Bước 2:
11.2
Potato chips 30 · 100 = 37.3%.
8.2
Tortilla chips 30 · 100 = 27.3%.
4.3
Pretzels 30 · 100 = 14.3%.
3.8
Popcorn 30 · 100 = 12.7%.
2.5
Snack nuts 30 · 100 = 8.3%.
Total 99.9%
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 77 / 104
3.3.4. Biểu đồ tròn
Bước 3:
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 78 / 104
3.3.5. Biểu đồ thân và lá (Stem and leaf plot)
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 79 / 104
3.3.5. Biểu đồ thân và lá
Bước 1: Tách mỗi quan sát thành một thân bao gồm tất
cả trừ chữ số cuối cùng (ngoài cùng bên phải) và một lá,
chữ số cuối cùng. Phần thân có thể có nhiều chữ số nếu
cần, nhưng mỗi lá chỉ chứa một chữ số duy nhất.
Bước 2: Viết phần thân theo một cột dọc với phần nhỏ
nhất ở trên cùng và kẻ một đường thẳng đứng ở bên phải
cột này.
Bước 3: Viết từng lá vào hàng bên phải thân của nó, theo
thứ tự tăng dần từ thân.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 80 / 104
3.3.5. Biểu đồ thân và lá
Ví dụ 21
Ví dụ: Hãy vẽ biểu đồ thân và lá cho tập dữ liệu sau: Tại một
trung tâm xét nghiệm ngoại trú, số lượng tâm đồ mỗi ngày
trong 20 ngày là:
25 31 20 32 13 14 43 02 57 23
36 32 33 32 44 32 52 44 51 45
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 81 / 104
3.3.5. Biểu đồ thân và lá
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 82 / 104
3.3.5. Biểu đồ thân và lá
Ví dụ 22
Tập dữ liệu dưới đây biểu thị điểm môn toán của 25 bạn học sinh
(thang điểm 100). Hãy vẽ biểu đồ thân và lá cho tập dữ liệu.
93 88 64 75 84 66 70 92 71 73
65 95 78 83 79 81 78 65 84 87
63 88 71 61 77
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 83 / 104
3.3.5. Biểu đồ thân và lá
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 84 / 104
3.3.5. Biểu đồ thân và lá
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 85 / 104
Bài tập
Sinh viên làm các bài tập 1 – 28 trang 90 – 93, Tài liệu [1]
(A. G. Bluman, [2017], Elementary statistics: a step by step
approach, 10th ed., McGraw-Hill, New York).
Sinh viên làm các bài tập 13 – 26 trang 102, 103, Tài liệu
[1] (A. G. Bluman, [2017], Elementary statistics: a step by
step approach, 10th ed., McGraw-Hill, New York).
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 86 / 104
3.4. Tổ chức dữ liệu cho hai biến
Bảng chéo là một bảng tóm tắt dữ liệu cho hai biến.
Hai biến khảo sát thường là:
hai biến phân loại;
hai biến định lượng nhưng đã được phân nhóm hoặc
thuộc nhóm rời rạc;
một biến phân loại và biến kia là biến định lượng.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 87 / 104
3.4. Tổ chức dữ liệu cho hai biến
Biến X
Biến Y
X1 X2 ··· Xj ···
Y1 f11 f12 ... f1j ···
Y2 f21 f22 ... f2j ···
... ... ... ... ... ···
Yi fi1 fi2 ... fij ···
... ... ... ... ... ···
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 88 / 104
3.4. Tổ chức dữ liệu cho hai biến
Trong đó:
Cột tiêu đề ghi các giá trị Yi của biến Y .
Dòng tiêu đề ghi các giá trị Xj của biến X .
Ô dòng thứ i và cột thứ j ghi số phần tử fij .
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 89 / 104
3.4. Tổ chức dữ liệu cho hai biến
Ví dụ 23
Bảng chéo sau đây thống kê số lượng sinh viên trong một mẫu
khảo sát của một trường đại học A về việc ở ký túc xá (KTX)
hay ở ngoài KTX.
Sinh viên
Nơi sống Năm I Năm II Năm II Năm IV Tổng
Ở 100 48 8 1 157
Không 37 42 90 62 213
Tổng 137 90 98 63 388
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 90 / 104
3.4. Tổ chức dữ liệu cho hai biến
Ví dụ 24
Bảng chéo đánh giá chất lượng và giá bữa ăn cho 300 nhà hàng
ở Los Angeles.
Giá
Đánh giá $10–19 $20–29 $30–39 $40–49 Tổng
Good 42 40 2 0 84
Very Good 34 64 46 6 150
Excellent 2 14 28 22 66
Tổng 78 118 76 28 300
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 91 / 104
3.4. Tổ chức dữ liệu cho hai biến
Ví dụ 25
Phần trăm theo hàng cho mỗi mục đánh giá chất lượng.
Giá
Đánh giá $10–19 $20–29 $30–39 $40–49 Tổng
Good 50.0% 47.6% 2.4% 0% 100%
Very Good 22.7% 42.7% 30.6% 4.0% 100%
Excellent 3.0% 21.2% 42.4% 33.4% 100%
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 92 / 104
3.5. Biểu đồ cho hai biến
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 93 / 104
3.5. Biểu đồ cho hai biến
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 94 / 104
3.5.1. Biểu đồ tán xạ và đường xu hướng
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 95 / 104
3.5.1. Biểu đồ tán xạ và đường xu hướng
Ví dụ 26
Số liệu thống kê dưới đây về doanh số (DS) trong 10 tuần tại
một cửa hàng điện tử và số lần quảng cáo sản phẩm của các
cửa hàng này. Hãy vẽ biểu đồ tán xạ và đường xu hướng cho tập
dữ liệu.
Tuần 1 2 3 4 5 6 7 8 9 10
QC 2 5 1 3 4 1 5 3 4 2
DS($100) 50 57 41 54 54 38 63 48 59 6
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 96 / 104
3.5.1. Biểu đồ tán xạ và đường xu hướng
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 97 / 104
3.5.1. Biểu đồ tán xạ và đường xu hướng
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 98 / 104
3.5.2. Biểu đồ thanh xếp chồng và xếp cạnh
Dùng để trình bày dữ liệu định tính hay biến định lượng đã
được phân nhóm.
Biểu đồ thanh xếp chồng là một biểu đồ thanh trong đó mỗi
thanh được chia thành các đoạn hình chữ nhật có màu sắc
khác nhau hiển thị tần suất tương đối của mỗi loại.
Biểu đồ thanh xếp cạnh tương tự như biểu đồ thanh xếp
chồng, ngoại trừ việc đặt các thanh cạnh nhau thay vì xếp
chồng lên nhau và chiều cao mỗi thanh ứng với tần số của
lớp tương ứng.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 99 / 104
3.5.2. Biểu đồ thanh xếp chồng và xếp cạnh
Ví dụ 27
Bảng chéo đánh giá chất lượng và giá bữa ăn cho 300 nhà hàng
ở Los Angeles.
Giá
Đánh giá $10–19 $20–29 $30–39 $40–49 Tổng
Good 42 40 2 0 84
Very Good 34 64 46 6 150
Excellent 2 14 28 22 66
Tổng 78 118 76 28 300
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 100 / 104
3.5.2. Biểu đồ thanh xếp chồng và xếp cạnh
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 101 / 104
3.5.2. Biểu đồ thanh xếp chồng và xếp cạnh
Ví dụ 28
Bảng chéo đánh giá chất lượng và giá bữa ăn cho 300 nhà hàng
ở Los Angeles.
Giá
Đánh giá $10–19 $20–29 $30–39 $40–49
Good 53.8% 33.9% 2.6% 0%
Very Good 43.6% 54.2% 60.5% 21.4%
Excellent 2.6% 11.9% 36.9% 78.6%
Tổng 100% 100% 100% 100%
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 102 / 104
3.5.2. Biểu đồ thanh xếp chồng và xếp cạnh
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 103 / 104
Bài tập
Sinh viên làm các bài tập 27 – 31 trang 61, 62, 63, Tài liệu
[2]. D. R. Anderson, D. J. Sweeney, T. A. Williams, J. D.
Camm and J. J. Cochran, [2020], Statistics for business &
economics, 14th ed., Cengage Learning.
Sinh viên làm các bài tập 36 – 39, 41 – 43 trang 69, 70, 71,
Tài liệu [2]. D. R. Anderson, D. J. Sweeney, T. A. Williams,
J. D. Camm and J. J. Cochran, [2020], Statistics for
business & economics, 14th ed., Cengage Learning.
Th.S Bùi Thùy Trang (TDTU) C03104 – NHẬP MÔN THỐNG KÊ Ngày 19 tháng 7 năm 2023 104 / 104