You are on page 1of 34

ĐẠI HỌC DUY TÂN

CHƯƠNG 2: PHÂN BỐ TẦN


SỐ VÀ ĐỒ THỊ
Người trình bày: Nguyễn Quang Thi
(nguyenquangthi2004@gmail.com)
Thời gian: 120 phút
Người chịu trách nhiệm: Nguyễn Tấn Huy
(tanhuy2000@gmail.com)
www.duytan.edu.vn
google doodle quốc khánh Việt Nam 2021 :)

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
tour du lịch 2/9/2021 (mùa covid-19 năm 2021)

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
MỤC LỤC
2.1 Tổ chức dữ liệu
2.2 Nhật đồ, đa giác tần số, hình cung
2.2.1 Nhật đồ
2.2.2 Đa giác tần số
2.2.3 Biểu đồ hình cung
2.2.4 Biểu đồ tần số tương đối
2.2.5 Các dạng phân phối

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
2.1 Tổ chức dữ liệu

a. Đối với biến định tính: Ta lập bảng phân bố tần số phân loại
(categorical frequency distribution)
Dạng bảng phân bố tần số phân loại được trình bày như sau:

Lớp (Class) Ghi dấu (Tally) Tần số Phần trăm


(Frequency) (Percent)
///….

Trong đó: Là một giá trị xuất hiện trong dữ liệu thu được

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
Ví dụ 1: Một cuộc khảo sát về nhóm máu của một nhóm 30 sinh
viên bất kỳ thu được dữ liệu được cho dưới đây:
O O A A O B
AB O O A AB B
O O O A O O
A B B B O AB
O O O A A O

a. Hãy lập bảng phân bố tần số phân loại cho dữ liệu trên.
b. Dựa vào kết quả của câu a, hãy ước tính số người thuộc nhóm
máu O trong tất cả 25000 sinh viên của một trường đại học A.

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
Lời giải:
a.
Lớp Ghi dấu Tần số Phần trăm
Class Tally Frequency Percent
A /////,// 7 23.3
AB /// 3 10.0
B ///// 5 16.7
O /////,/////,///// 15 50.0
Total 30 100.0

b. Số người thuộc nhóm máu O trong tất cả 25000 sinh viên là:
25000 × 50% = 12500.

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
b. Đối với biến định lượng
i. Phân bố tần số không ghép lớp: có dạng như sau

Lớp giới Lớp cận biên Ghi dấu Tần số (f) Phần trăm
hạn (Class Boundary) (Tally) (frequency) (Percent)
(Class
Limit)
///….

Trong đó: đvđl là đơn vị đo lường dữ liệu hay nói cách khác nó là độ
chia nhỏ nhất của dữ liệu.

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
Ví dụ 2: Một thống kê về độ tuổi của 35 sinh viên ngẫu nhiên trong
một lớp học thu được dữ liệu sau:
18 18 19 18 19 20 20
18 18 18 19 18 19 18
18 19 20 21 22 19 19
18 18 18 20 19 18 18
19 20 18 19 18 20 22
a. Hãy lập phân bối tần số không ghép lớp cho dữ liệu thu được trên.
b. Dựa vào kết quả của câu a, hãy ước tính số sinh viên có độ tuổi
18 trong 1000 sinh viên.

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
Lời giải:
a.

b. Số sinh viên có độ tuổi 18 trong 1000 sinh viên là:


1000 × 45.7% = 457.

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
ii. Phân bố tần số ghép lớp: Được sử dụng trong trường hợp số
lượng lớp đơn nhiều và tần số của mỗi lớp nhỏ.
Dạng phân bố tần số ghép được như sau:
Lớp giới hạn Lớp cận biên Ghi dấu Tần số (f) Phần trăm
(Class Limit) (Class Boundary) (Tally) (frequenc (Percent)
y)
///….

Vấn đề đặt ra là: cần bao nhiêu lớp? Mỗi lớp phải được xác định như
thế nào cho hợp lý?

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
Cách xác định lớp giới hạn cho phân bố tần số ghép lớp

Bước 1: Tìm giá trị lớn nhất (H), giá trị nhỏ nhất (L)
Bước 2: Xác định phạm vi dữ liệu (Range): � = � − �
Bước 3: Chọn số lớp thích hợp (NC)
Bước 4: Tính độ rộng của mỗi lớp (Width): � = �/�� +1,

trong đó �/�� là phần nguyên của
��
Bước 5: Xác định lớp giới hạn:
§ Các cận dưới (Lower Limit), kí hiệu LL và được xác định
��1 = �, ��� = ���−1 + �, với � ≥ 2
§ Các cận trên (Upper Limit), kí hiệu UL và được xác định
��� = ��� + � − 1.
ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
Ví dụ 3: Số tầng của 30 tòa nhà cao nhất thế giới được liệt
kê dưới đây:
88 88 110 88 80 69 102 78 70 55

79 85 80 100 60 90 77 55 75 55

54 60 75 64 105 56 71 70 65 72

Hãy xây dựng một phân bố tần số ghép lớp với 7 lớp.

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
Lời giải:
§ � = 110, � = 54
§ � = � − � = 56
§ �� = 7
§ W = 56/7 + 1 = 9
Lớp giới hạn Lớp cận biên Tần số Phần trăm
54 – 62 53.5 – 62.5 7 23.33
63 – 71 62.5 – 71.5 6 20.00
72 – 80 71.5 – 80.5 8 26.67
81 – 89 80.5 – 89.5 4 13.33
90 – 98 89.5 – 98.5 1 3.33
99 – 107 98.5 – 107.5 3 10.00
108 – 116 107.5 – 116.5 1 3.33

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
Ví dụ 4: Một cuộc khảo sát về chiều cao của 27 sinh viên
ngẫu nhiên thu được dữ liệu như sau (đơn vị mét)
1.70 1.62 1.55 1.51 1.54 1.67 1.65 1.63 1.66
1.71 1.73 1.65 1.63 1.60 1.57 1.59 1.52 1.54
1.59 1.57 1.55 1.70 1.58 1.66 1.60 1.73 1.69

Hãy lập phân bố tần số ghép lớp với 5 lớp.

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
Lời giải:
§ � = 1.51, � = 1.73
§ � = � − � = 0.22
§ �� = 5
§ � = 0.22/5 + 0.01 = 0.054, chọn � = 0.06

Lớp giới hạn Lớp cận biên Tần số Phần trăm


1.51 – 1.56 1.505 – 1.565 6 22.2
1.57 – 1.62 1.565 – 1.625 8 30.6
1.63 – 1.68 1.625 – 1.685 7 26.9
1.69 – 1.74 1.685 – 1.745 6 22.2
1.75 – 1.80 1.745 – 1.805 0 0.0

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
Câu hỏi:
1. Nêu một vài lý do cần phải tổ chức dữ liệu dưới dạng
phân bố tần số.
2. Phân tích rõ lý do khi nào dùng phân bố tần số phân
loại? Phân bố tần số không ghép lớp? Phân bố tần số
ghép lớp?

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
2.2 Nhật đồ, đa giác tần số, hình cung

2.2.1 Nhật đồ (histogram)


Nhật đồ là một biểu đồ biểu thị dữ liệu bằng cách sử dụng các
thanh dọc chạm sát vào nhau (trừ khi tần số của một lớp bằng 0),
chiều cao của mỗi thanh biểu thị tần số của mỗi lớp, mỗi thanh dọc
trải rộng từ cận biên dưới đến cận biên trên của mỗi lớp và mỗi
trung điểm của mỗi lớp rơi vào chính điểm giữa của thanh dọc.

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
Ví dụ 5: Nhật đồ biểu diễn cho nhiệt độ cao kỷ lục (tính
bằng độ F) của 50 tiểu bang

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
2.2.2 Đa giác tần số (frequency polygon)
Đa giác tần số là một biểu đồ hiển thị dữ liệu bằng cách sử
dụng các đường nối các điểm được vẽ ra cho các tần số
trung điểm của các lớp. Chiều cao của các điểm biểu thị tần
số trung điểm của các lớp.

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
Ví dụ 6: Đa giác tần số biểu diễn cho nhiệt độ cao kỷ lục
(tính bằng độ F) của 50 tiểu bang

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
2.2.3 Biểu đồ hình cung (ogives)
Để biểu thị cho phân bố tần số tích lũy ta thường sử
dụng biểu đồ hình cung.

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
Ví dụ 7: Biểu đồ hình cung
biểu diễn cho nhiệt độ cao kỷ
lục (tính bằng độ F) của 50
tiểu bang.

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
2.2.4 Biểu đồ tần số tương đối
Nhật đồ, đa giác tần số và hình cung được xây dựng bằng cách sử
dụng các tần số của dữ liệu thô. Những phân phối này có thể được
chuyển đổi sang phân phối bằng cách sử dụng tỷ lệ thay vì tần số
của dữ liệu thô. Các biểu đồ của phân phối kiểu này được gọi là biểu
đồ tần số tương đối (relative frequency graphs).
Biểu đồ tần số tương đối thay vì sử dụng tần số thì sử dụng tỷ lệ giá
trị dữ liệu rơi vào một lớp nhất định, điều này quan trọng hơn số
lượng thực tế của giá trị dữ liệu rơi vào lớp đó.

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
2.2.5 Các dạng phân phối
Khi mô tả dữ liệu thì điều quan trọng là nhận ra dạng của các giá trị
phân phối. Trong các chương sau bạn sẽ thấy rằng dạng của một phân
phối cũng xác định các phương pháp thống kê thích hợp được sử
dụng để phân tích dữ liệu đó.
Một phân phối có thể có nhiều dạng và một trong những phương pháp
phân tích phân phối là vẽ nhật đồ hoặc đa giác tần số.

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
Một số dạng phân phối

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
Một số dạng phân phối (tiếp theo)

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
hoy đi nha :v

§ Đầu tiên ta nói về lịch sử của từ “Hoy”. Từ “Hoy” bắt nguồn từ bộ
truyện tranh chế “Hoy đi nha” của tác giả 9x . Bộ
truyện này như một đứa con tình thần của anh với mục đích làm cho
vui.
§ Hoy đi nha => Thôi đi nha nhầm mục đích cảnh báo không nên chọc
phá họ nữa. Hoy về đây => Thôi về đây. Câu thông báo đi về của một
ai đó.
§ Ngủ trưa hoy => Ngủ trưa thôi.

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
Mean, Median, Mode, Range, Outlier

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
Mean, Median, Mode, Range, Outlier

ĐẠI HỌC DUY TÂN – DUY TAN UNIVERSITY www.duytan.edu.vn www .dtu.edu.vn www.duet.vn
ĐẠI HỌC DUY TÂN

www.duytan.edu.vn

You might also like