You are on page 1of 30

Thống kê kinh doanh

GV:Th.s PHAN NGỌC YẾN


CHƯƠNG 4: TÓM TẮT DỮ LIỆU BẰNG CÁC
ĐẠI LƯỢNG THỐNG KÊ MÔ TẢ(tt)

CÁC ĐẠI LƯỢNG ĐO LƯỜNG MỨC ĐỘ PHÂN


TÁN CỦA DỮ LIỆU(tt)
TỨ PHÂN VỊ
CHUẨN HÓA DỮ LIỆU
CÁC ĐẶC TRƯNG CỦA TỔNG THỂ VÀ MẪU
Các đại lượng đo lường mức độ phân tán của tập dữ liệu
Tứ phân vị, phân vị, khoảng biến thiên
Tứ phân vị
Tứ phân vị, là chỉ tiêu đo lường độ phân tán chứ không phải chỉ tiêu đo lường
khuynh hướng tập trung.
Cách xác định tứ phân vị (đối với dữ liệu không phân nhóm) (bảng + không
bảng dạng 1+2) (nếu lẻ)
𝐧 𝟏
- 𝟏: Tứ phân vị thứ nhất là lượng biến đứng ở vị trí thứ
𝟒
𝟐 𝐧 𝟏 𝐧 𝟏
- 𝟐 : Tứ phân vị thứ hai chính là số trung vị, đứng ở vị trí .
𝟒 𝟐
𝟑 𝐧 𝟏
- 𝟑: Tứ phân vị thứ ba là lượng biến đứng ở vị trí thứ .
𝟒
Nếu n lẻ và không chia hết cho 4 thì tứ phân vị được xác định bằng
cách thêm vào. (sắp dữ liệu từ nhỏ đến lớn)
Chẳng hạn, với (đơn vị), ta có . Do đó,
tứ phân vị thứ nhất bằng lượng biến ở vị trí thứ ba cộng với 1/4 giá trị
chêch lệch giữa lượng biến ở vị trí thứ ba và thứ tư.

Còn tứ phân vị thứ ba bằng lượng biến ở vị trí thứ chín cộng với 3/4 giá trị
chênh lệch giữa lượng biến ở vị trí thứ chín và thứ mười.
Các đại lượng đo lường mức độ phân tán của tập dữ liệu
Tứ phân vị, phân vị, khoảng biến thiên
Tứ phân vị
Tứ phân vị, là chỉ tiêu đo lường độ phân tán chứ không phải chỉ tiêu đo lường
khuynh hướng tập trung.
Cách xác định tứ phân vị (đối với dữ liệu không phân nhóm) (bảng + không
bảng dạng 1+2) (n chẵn)
𝒙𝒏 𝒙𝒏 𝟐
𝟐
𝟐: Trung vị theo công thức 𝟐
𝟐
- 𝟏 : Tứ phân vị thứ nhất là lượng biến đứng ở vị trí trung vị của tập dữ liệu
phía trên mà ko tính trung vị
- 𝟑 : Tứ phân vị thứ ba là lượng biến đứng ở vị trí tập dữ liệu phía dưới mà
ko tính trung vị
Dạng 1: Dữ liệu rời rạc, không có bảng tần số, không phân nhóm
Ví dụ 10. Cho dãy số: 0.9 1.2 1.4 1.5 1.8 2.0 2.4 2.7
3.1 3.3 3.8 (đã sắp thứ tự rồi)
có số phần tử là nên
.
Do đó tứ phân vị thứ nhất là số ở vị trí thứ ba trong dãy số trên,
trung vị là số ở vị trí thứ sáu, tứ phân vị thứ ba là số ở vị trí
thứ chín. Vậy .
Ví dụ 11. Cho dãy số: 1800, 1900, 2000, 2100, 2200, 2500, 2700,
2800 (sắp xếp từ nhỏ đến lớn) có số phần tử là
Dạng 2: Đối với dữ liệu có bảng tần số, không phân nhóm
Ví dụ 12: Tính tứ phân vị (nhớ sắp xếp dữ liệu từ nhỏ đến lớn)
đánh chỉ số: số bắt đầu +tần số -1
Giá trị x 5.7 6.0 7.1 8 8.4

Tần số 3 3 3 6 4
(1+3-1) 4+3-1 7+3-1 10+6-1 (16+4-1)
(1->3) (4->6) (7->9) (10->15) (16->19)

, . Do đó
: ở vị trí thứ 5; ở vị trí thứ 10; ở vị trí thứ 15
Ví dụ 13: Tính tứ phân vị của dữ liệu cho bởi bảng sau:
Giá trị x 5 6 8 9 11 12 13
Tần số n 10 12 15 17 8 5 6
1+10-1 (11+12- 23+15-1 38+17-1 55+8-1 63+5-1 68+6-1
1->10 1
11->22 23->37 38->54 55->62 63->67 68->73
Tổng tần số
Dạng 3: Đối với dữ liệu phân nhóm có khoảng cách (phân nhóm)
Bước 1: kẻ cột tần số cộng dồn (Tính tần số tích lũy),
tính (nếu n chẵn)
Bước 2: tính tứ phân vị
𝒏
𝑺𝑸 𝟏 𝟏
𝟐: tính trung vị (Me)
𝟒
𝟏 𝑸𝟏 𝒎𝒊𝒏 𝑸𝟏 𝒏𝑸𝟏

𝑸𝟑 𝟏
𝟑 𝑸𝟑𝒎𝒊𝒏 𝑸𝟑
𝑸𝟑
trong đó là cận dưới của nhóm chứa ; là khoảng cách của
nhóm chứa ; là tần số tích luỹ của nhóm đứng trước nhóm chứa ;
là tần số của nhóm chứa .
Ví dụ 14. Tính các tứ phân vị của bảng dữ liệu sau đây
Tứ phân vị thứ nhất chứa trong nhóm có tần số tích luỹ bằng ; tứ phân vị thứ
ba chứa trong nhóm có tần số tích luỹ bằng .
Doanh thu (triệu đồng) Số cửa hàng ( 𝒊 ) Tần số cộng dồn
(tích luỹ) ( 𝒊 )
200 – 400 8 8
400 – 500 12 12+8=20
500 – 600 25 8+12+25=45
600 – 800 25 8+12+25+25=70
800 – 1000 9 8+12+25+25+9=79
Tổng N=79
.
;

𝟐: trung vị
Phân vị
Cho là bộ giá trị quan sát được sắp thứ tự
tăng dần. Phân vị thứ là giá trị của có nhiều nhất là
các giá trị đo lường là thấp hơn giá trị của và ít
nhất là là cao hơn giá trị của
Bài toán: Tính toán phân vị thứ
Bước 1: sắp xếp dữ liệu tăng dần (từ nhỏ đến lớn)
Bước 2: tính chỉ số :
Bước 3: ta xét
 Nếu không nguyên, làm tròn đến đến số nguyên tiếp
theo.
 Nếu nguyên, phân vị thứ là trung bình của các giá
trị ở vị trí thứ và là
Dạng 1: Dữ liệu không có bảng tần số (không có trọng số)
Ví dụ 15: Cho bảng sau:
a) Phân vị thứ 85 ở vị thứ thứ mấy và là giá trị nào?
b) Phân vị thứ 50 (trung vị) ở vị trí thứ mấy và là giá trị nào?

3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925

a) , làm tròn đến số nguyên thứ 11


Vị trí của phân vị thứ 85 là số nguyên đứng thứ 11, là giá trị 3730
b)
Vị trí của phân vị thứ 50 là số nguyên thứ 6 và thứ 7, giá trị là
(trung vị)
Dạng 2: Dữ liệu được tóm tắt bằng bảng tần số.
Ví dụ 16: Tính phân vị thứ 55, 80 của dữ liệu cho bởi bảng sau:
Giá trị x 5 6 8 9 11 12 13
Tần số n 10 12 15 17 8 5 8
1+10-1 11+12-1 23+15-1 38+17-1 55+8-1 63+5-1 68+8-1
1->10 11->22
23->37 38->54 55->62 63->67 68->75
Tổng tần số

Phân vị thứ 55, là vị trí thứ 42,


Tính chỉ số

Phân vị thứ 80 là:


Biểu đồ hộp và râu
Biểu đồ hộp và râu thể hiện thông tin: giá trị cực đại, giá
trị cực tiểu, 3 tứ phân vị và đôi khi cả các quan sát ngoại lệ
Lập biểu đồ hộp và râu mô tả tập dữ liệu qua các bước (dùng
cho dạng 1,2,3)
Bước 1: Sắp xếp tập dữ liệu theo thứ tự tăng dần
Bước 2: Tính toán giá trị của các tứ phân vị, độ trải giữa

Bước 3: Vẽ hộp với bề rộng bằng độ trải dài


Bước 4: Vẽ đường thẳng nằm trong hộp đi qua giá trị trung gian
Bước 5: Tính toán giá trị cực đại và cực tiểu
Giá trị cực tiểu
Giá trị cực đại
Bước 6: Vẽ hai râu
Ví dụ 11: Cho dãy số: 1800, 1900, 2000, 2100, 2200, 2500, 2700,
2800
Dạng 1 ta vẽ biểu đồ hộp và râu ở ví dụ 11
Bước 1: 1800, 1900, 2000, 2100, 2200, 2500, 2700, 2800
Bước 2:nên

Độ trải giữa
Bước 3: Vẽ hộp với bề rộng bằng độ trải giữa
Bước 4: Vẽ đường thẳng nằm trong hộp đi qua giá trị trung vị
Bước 5: Tính toán giá trị cực đại và cực tiểu:
Tính toán giá trị cực đại và cực tiểu:
Giá trị cực tiểu
Giá trị cực đại

Bước 6: Vẽ hai râu


Ví dụ 22: ta vẽ biểu đồ hộp và râu ở ví dụ 12
Bước 1:
Doanh thu (triệu đồng) Số cửa hàng ( 𝒊 ) Tần số tích luỹ ( 𝒊 )
200 – 400 8 8
400 – 500 12 20
500 – 600 25 45
600 – 800 25 70
800 – 1000 9 79
Tổng 79
Tứ phân vị thứ nhất chứa trong nhóm có tần số tích luỹ bằng ;

tứ phân vị thứ ba chứa trong nhóm có tần số tích luỹ bằng .


Bước 2:

Độ trải giữa
Bước 3: Vẽ hộp với bề rộng bằng độ trải giữa
Bước 4: Vẽ đường thẳng nằm trong hộp đi qua giá trị
trung vị
Bước 5: Tính toán giá trị cực đại và cực tiểu:
Giá trị cực tiểu

Giá trị cực đại

Bước 6: Vẽ hai râu


4.2.5 Chuẩn hóa dữ liệu
 Biếnđổi giá trị (không cùng thang đo) thành dữ liệu ở một thang
chuẩn
 Giá trị dữ liệu đã chuẩn hóa sẽ cho biết một giá trị quan sát trong tập
dữ liệu gốc, lệch khỏi trung bình của nó mấy lần độ lệch chuẩn
Công thức tính giá trị chuẩn hóa (giá trị ) cho dữ liệu tổng thể

Trong đó: : giá trị dữ liệu gốc


: trung bình tổng thể
: độ lệch chuẩn tổng thể
Công thức tính giá trị chuẩn hóa (giá trị ) cho dữ
liệu mẫu

Trong đó: : giá trị dữ liệu gốc


: trung bình mẫu
: độ lệch chuẩn mẫu hiệu chỉnh
Ví dụ 24: Một học sinh có điểm thi môn toán là 8.9 (thang điểm 10) và
môn Anh văn là 89 (thang điểm 100). Biết rằng điểm trung bình và độ
lệch chuẩn của điểm lần lượt được tính (cho tập dữ liệu là điểm của tất cả
học sinh trong lớp) như sau: Anh văn và Toán
.
Giá trị chuẩn hóa:

Giá trị chuẩn hóa của điểm thi môn toán cho thấy điểm của học sinh này
cao hơn trung bình tới 2 độ lệch chuẩn trong khi điểm chuẩn hóa môn
Anh cho thấy điểm của em chỉ cao hơn trung bình 1,4 lần độ lệch chuẩn.
Như vậy học sinh này học khá môn toán hơn môn Anh so với các học
sinh cùng lớp.
Ví dụ 25: Hãy xét một mẫu gồm giá trị đo lường:
3 2 0 15 2 3 4 0 1 3
Thoạt nhìn bạn có thể thấy giá trị đo lường là một giá trị dị
biệt. Hãy tính giá trị cho giá trị quan sát này, hãy trình bày các kết
luận.
Giải
Trung bình mẫu:
Độ lệch chuẩn mẫu:
Giá trị
. . .
;
. . .

Giá trị cho thấy đây là giá trị cao hơn trung bình 2,71 lần
so với độ lệch chuẩn cho thấy đây là giá trị đột biến.
4.2.6 Các đặc trưng của tổng thể và mẫu
Đặc trưng mẫu là tên gọi chung cho các đại lượng (như trung bình, tỉ
lệ, phương sai, độ lệch chuẩn hiệu chỉnh...) tính được trên tập dữ
liệu của mẫu được chọn từ tổng thể chung. Giá trị của các đại lượng
này thay đổi tùy theo mẫu được chọn.

Đặc trưng tổng thể là tên gọi chung cho các đại lượng (như trung bình,
tỉ lệ, phương sai, độ lệch chuẩn...) tính được trên tập dữ liệu của
toàn bộ tổng thể. Vì tổng thể là không thay đổi nên giá trị của các
thông số tính được cũng không thay đổi. Hay nói cách khác, tham số của
tổng thể nếu thu thập được dữ liệu trên toàn bộ các đơn vị sẽ là một con
số xác định

You might also like