Professional Documents
Culture Documents
THỐNG KÊ MÔ TẢ
: Số trung bình
: Tổng giá trị của tất cả các lượng biến quan sát
n : Số quan sát
(2.2)
Trong đó:
: Số trung bình
: Tổng giá trị của mỗi lượng biến xi tương ứng với mõi tần số fi.
7
: Tổng tần số
kg
Chú ý: công thức (2.2) cũng được dùng cho trường hợp nếu các chỉ tiêu không phải là số
cố định mà là nằm trong khoảng nào đó (trường hợp dãy số có khoảng cách tổ) thì lượng
biến xi của mỗi tổ sẽ là trị số giữa của tổ đó. Nếu dãy số có tổ mở như tổ 3 trong ví dụ dưới
đây (> 2.000), muốn tìm trị số giữa trước hết phải xác định khoảng cách tổ của tổ mở bằng
cách lấy khoảng cách giống như tổ 2 (tổ gần tổ mở nhất), sau đó lấy khoảng cách tổ cộng
với giới hạn dưới của tổ này để có giá trị giới hạn trên rồi tính trị số giữa.
Ví dụ:
Tổ Tiền lương (xi) Điểm giữa (xi) Số công nhân (fi)
1 500 – 1.000 750 6
2 1.000 – 2.000 1.500 3
3 > 2.000 2.500 2
đồng
ΣDoanh số bán
đồng/sphẩm
8
Ta có: (2.3)
Nếu Mi bằng nhau (doanh số bán ở bốn thị trường bằng nhau) thì công thức (2.3) trở thành:
(2.4)
Ví dụ: Có 3 công nhân sản xuất cùng một thời gian như nhau. Công nhân 1 làm ra một sản
phẩm mất 3 phút, công nhân 2 mất 4 phút và công nhân 3 mất 5 phút. Vậy thời gian trung
bình làm ra một sản phẩm của 3 công nhân là:
phút
lần
(2.6)
9
Trong đó:
XMe(min) là giới hạn dưới của tổ chứa số trung vị.
KMe là khoảng cách tổ chứa số trung vị.
là tổng các tần số
SMe-1 là tần số cộng dồn trước tổ chứa số trung vị.
fMe là tần số của tổ chứa số trung vị.
Chú ý: Muốn xác định tổ chứa trung vị, lấy tổng tần số chia hai (∑f i/2), so sánh giá trị này
với giá trị của cột tần số tích lũy. Giá trị (∑fi/2) thuộc vào tổ nào thì tổ đó chứa trung vị.
2.1.3 Tứ phân vị (Quartiles)
Tứ phân vị chia dãy số lượng biến thành 4 phần, mỗi phần có số quan sát bằng
nhau. Cũng giống như trung vị, trước khi tính tứ phân vị dãy số được sắp xếp theo thứ tự
tăng dần hoặc giảm dần.
Trường hợp dãy số không có khoảng cách tổ thì:
Tứ phân vị đầu tiên là lượng biến đứng ở vị trí thứ (n + 1)/4
Tứ phân vị thứ 2 chính là số trung vị (Me)
Tứ phân vị thứ 3 là lượng biến đứng ở vị trí thứ 3[(n + 1)/4]
Trường hợp dãy số có khoảng cách tổ:
Tứ phân vị thứ 1:
(2.7)
Tứ phân vị thứ 3:
(2.8)
Trong đó:
XT1 & T3(min) Giới hạn dưới của tổ chứa tứ phân vị thứ nhất và thứ ba.
KT1 & T3 Khoảng cách tổ chứa phân vị thứ nhất và thứ ba
∑fi Tổng các tần số
ST1(T3) – 1 Tần số cộng dồn trước tổ chứa phân vị
FT1(T3) Tần số chứa tứ phân vị
Trong thực tế, tứ phân vị được sử dụng khi ta muốn biết mức đạt được cao nhất hay
thấp nhất của ¼ số đơn vị trong dãy số tăng dần hoặc giảm dần. Ngoài ra, còn có thể so
sánh với số trung vị để đánh giá mức độ chênh lệch trong một tổng thể từ đó đánh giá khả
năng tiềm tàng có thể khai thác được.
2.1.4 Mốt (Mode):
Mốt là giá trị của quan sát có tần số xuất hiện cao nhất trong tổng thể hay một dãy
số phân phối.
Ví dụ: Năng suất lao động của 60 công nhân nhà máy X như sau:
10
=> Mo = 18, nghĩa là năng suất 18 SP/công nhân/ngày là số có tấn số cao nhất (20 công
nhân). Trường hợp dãy số có khoảng cách tổ đều nhau thì Mốt được tính như sau:
(2.9)
Trong đó:
XMo(min) Giới hạn dưới của tổ chứa
fMo Tần số của tổ chứa Mốt
fMo-1 Tần số của tổ đứng trước tổ chứa Mốt
fMo+1 Tần số của tổ đứng sau tổ chứa Mốt.
KMo Khoảng cách tổ của tổ chứa Mốt.
Chú ý: Tổ chứa mốt là tổ có tần số lớn nhất
Mốt thường được sử dụng trong việc nghiên cứu để sản xuất quần áo, giày dép, nón mũ,…
nhằm đáp ứng thị hiếu của khách hàng để đạt doanh thu tối đa trong một thời kỳ đó.
Có thể so sánh vị trí của số trung bình, trung vị và mốt trong các dạng phân phối như
sau:
Phân phối đối xứng (Symmetrical distribution):
f(x)
f(x)
Mo Mo
x
11
Phân phối chệch bên trái (left-skewed distribution)
fx)
Me Mo x
Trong đó:
Xmax : Lượng biến lớn nhất
Xmin : Lượng biến nhỏ nhất
Khoảng cách R càng nhỏ thì tổng thể càng đồng đều và vì vậy số trung bình đại
diện càng cao. R có nhiều ứng dụng trong thức tế như khảo sát sự biến thiên về kích thước,
trọng lượng, bán kính chi tiết sản phẩm cũng như so sánh thu nhập hay mức sống của hai
vùng khác nhau. Nhược điểm của R là chỉ chú ý đến lượng biến lớn nhất và nhỏ nhất .
Ví dụ: Tiền lương 2 tổ công nhân như sau (1000đồng):
Tổ 1: 400 500 600 700 800 =>
Tổ 2: 580 590 600 610 620 =>
R2 = 620 – 580 = 40
Mặc dù tiền lương trung bình của hai tổ bằng nhau và bằng 600.000 đồng, khoảng biến
động R2 nhỏ hơn chứng tỏ số trung bình của tổ 2 đại diện tốt hơn về tiền lương.
2.2.2 Độ lệch tuyệt đối trung bình : (Deviations from the mean)
Độ lệch tuyệt đối trung bình là số trung bình số học của tổng các độ lệch tuyệt đối
giữa các lượng biến và số trung bình số học của các lượng biến đó.
(2.10)
Càng nhỏ, chứng tỏ độ lệch càng ít và vì vậy số trung bình đại diện càng cao,
12
So với khoảng biến động (R), có chú ý đến tất cả các lượng biến nhưng không
chú ý đến dấu của các độ lệch.
2.2.3 Phương sai: (Variance)
Phương là trung bình của các độ lệch giữa các lượng biến và số trung bình số học
của các lượng biến đó.
Phương sai của tổng thể ( )
(2.12)
(2.17)
(2.18)
Nếu phân phối tương đối đồng đều thì độ lệch chuẩn được tính: = 1,25
2.2.5 Hệ số biến thiên (CV - Coefficient of variation)
13
Hệ số biến thiên là số tương đối tính được bằng cách so sánh độ lệch tuyệt đối trung bình
(hoặc độ lệch chuẩn) với số trung bình số học của các biến quan sát.
Hoặc
Hệ số biến động có thể dùng để so sánh biến động giữa các nhóm số liệu quan sát có đơn
vị tính khác nhau. Hệ số biến động không có đơn vị đo lường và được biểu diễn dưới dạng
%. Tùy theo ngành và các loại sản phẩm khác nhau mà có hệ số biến động phù hợp.
k =
Số tổ
Trong đó Xmax và Xmin: trị lớn nhất và nhỏ nhất của dãy số phân phối
Bước 3: Xác định giới hạn trên và giới hạn dưới của mỗi tổ (Class boundaries)
Một cách tổng quát, giới hạn dưới của tổ đầu tiên sẽ là trị nhỏ nhất của dãy số, sau
đó lấy giới hạn dưới cộng với khoảng cách tổ (k) sẽ được giá trị của giới hạn trên, lần lượt
như vậy cho đến tổ cuối cùng. Giới hạn trên của tổ cuối cùng thường là trị lớn nhất của dãy
số phân phối.
Trong thực tế, giới hạn dưới của tổ đầu tiên thấp hơn trị nhỏ nhất của dãy số một
giá trị bằng:
Ví dụ: Số liệu về số công nhân nghỉ việc trong 106 ngày ở một công ty may ở trong bảng
sau. Phân phối tần số được thực hiện theo các bước:
1. Số tổ = [(2) x Số quan sát (n)]0,3333 = (2 x 106)0,3333 = 5,96 6 tổ
2. Khoảng cách tổ: k = = = 6,1
Số tổ
Trong ví dụ này ta có thể chọn khoảng cách tổ bằng 6 hoặc bằng 7, vấn đề ở đây là biết xác
định giới hạn dưới của tổ đầu tiên.
14
3. Giới hạn dưới của tổ thứ nhất: Ta có thể chọn tùy ý khoảng cách tổ bằng 6 hoặc bằng 7
và một trong hai cách xác định sau đây:
Với k = 7 ta có:
V = [(Số tổ x k) - (Xmax - Xmin)]/2 = [(6 x 7) - (158 - 121)]/2 = 2,5
=> Giới hạn dưới của tổ thứ nhất = 121 - 2,5 = 118,5
Với k = 6 có thể chọn giới hạn dưới của tổ thứ nhất đúng bằng trị nhỏ nhất của
dãy số hoặc tính V như trên. Kết quả được trình bày như trong bảng 2.1:
146 141 139 140 145 141 142 131 142 140 144 140
138 139 147 139 141 137 141 132 143 143 148 141
140 140 141 143 134 146 134 142 133 149 145 141
140 143 143 149 136 141 143 143 141 140 145 142
138 136 138 144 136 145 143 137 142 146 138 142
140 148 140 140 139 139 144 138 146 153 150 148
148 142 133 140 141 145 148 139 136 141 144 138
140 139 158 135 132 148 142 142 145 121 153 148
129 143 148 138 149 146 141 145 144 137
Bảng 2.1: Phân phối tần số về số công nhân nghỉ việc trong 106 ngày
Phân phối Phân phối Trị số giữa Tỉ trọng
tần số với tần số với trường hợp Tần số trong tổng
k=6 k=7 k=7 tần số (%)
121 - 127 118,5 - 125,5 122 1 0,9
128 - 134 125,5 - 132,5 129 7 6,6
135 - 141 132,5 - 139,5 136 39 36,8
142 - 148 139,5 - 146,5 143 53 50,0
149 - 155 146,5 - 153,5 150 5 4,8
>155 153,5 157 1 0,9
Tổng cộng 106 100,0
Chú ý: Trị số giữa của mỗi tổ = (giới hạn dưới + giới hạn trên)/2
Phân phối tần số cũng có thể được trình bày trên biểu đồ cột như sau:
Tần số
60
50
40
30
20
10
0
122 129 136 143 147 157
15
quan sát mà giá trị của nó ít hơn một giá trị cho sẵn nào đó. Chẳng hạn như một quản trị
gia muốn quan tâm có bao nhiêu công ty trong ngành của mình mà doanh thu dưới 100
triệu đồng/tháng, hoặc ở thành phố B có bao nhiêu hộ có thu nhập dưới 2 triệu đồng/tháng.
Cách tính cột tần số tích lũy: tần số tích lũy của tổ thứ nhất chính là tần số của
chính nó; tần số tích lũy của tổ thứ hai sẽ bao gồm cả tần số của tổ thứ nhất và thứ hai; tần
số tích lũy của tổ thứ ba sẽ bao gồm tần số của chính nó và cả tần số của hai tổ thứ nhất và
thứ hai. Tương tự như vậy ta có tần số của tổ cuối cùng sẽ đúng bằng tổng số quan sát. Trở
lại ví dụ về số công nhân nghỉ việc trong công ty may thì tần số tích lũy được tính như
bảng dưới đây:
Bảng 2.2: Phân phối tần số tích lũy về số công nhân nghỉ việc trong 106 ngày
Phân phối Phân phối Trị số giữa Tần số Tần số
tần số với k = 6 tần số với k = 7 của tổ tích lũy
119 - 125 118,5 - 125,5 122 1 1
126 - 132 125,5 - 132,5 129 7 8
133 - 139 132,5 - 139,5 136 39 47
140 - 146 139,5 - 146,5 143 53 100
147 - 153 146,5 - 153,5 150 5 105
154 - 160 153,5 - 160,5 157 1 106
Nếu muốn biết có bao nhiêu ngày trong 106 ngày có số công nhân nghỉ việc trung
bình dưới 150 người, nhìn vào cột tần số tích lũy bảng trên ta thấy chỉ tiêu này là 100.
16
Đơn vị tính: Có ba dạng của biều bảng thống kê tương ứng với ba vị trí của đơn
vị tính trong bảng.
Ví dụ 1: Giá trị xuất khẩu (ngàn USD) của công ty AG qua 3 năm như sau:
Thị trường 1999 2000 2001
Mỹ 1034 2567 5890
Hongkong 103 124 245
Thái Lan 256 256 120
Indonesia 354 34 36
Tổng cộng 1747 2980 6291
Nếu đơn vị tính theo từng chỉ tiêu trong cột, đơn vị tính được đặt dưới chỉ tiêu của mỗi cột.
Ví dụ: Tình hình chăn nuôi của một nông trại trong năm 2001 như sau:
Số lượng Trọng Giá bán Tổng thu Tỷ trọng
(con) lượng (kg) (đồng/kg) (đồng) (%)
Heo
Bò
Trâu
Dê
Nếu đơn vị tính theo từng chỉ tiêu trong hàng, đơn vị tính sẽ được đặt sau chỉ tiêu
của mỗi hàng hay được đặt thành một cột riêng biệt tương ứng cới chỉ tiêu hàng.
Ví dụ: Tình hình tiêu dùng của nông hộ qua 3 năm 99-01
Tên hàng Đ.vị tính 1999 2000 2001
Xăng Lít
Thịt Kg
Gạo Kg
Xe đạp Chiếc
Trên đây là một số biểu bảng tương đối tổng quát và đơn giản, tùy theo nhu cầu
thực tế có thể linh hoạt sắp xếp các chỉ tiêu hàng, cột. Ngoài ra, cũng cần chú ý rằng trong
một bảng thống kê ta có thể đặt số tổng cộng ở vị trí đầu (nếu ta muốn nhấn mạnh số tổng
cộng đó) hoặc vị trí cuối (nếu muốn nhấn mạnh chi tiết diễn giải của nó).
Trong thực tế, khi phân tích tình hình hoạt động kinh doanh của doanh nghiệp qua
thời gian, ta có thể sử dụng biểu bảng tổng hợp trong đó thể hiện cả số tuyệt đối và tương
đối kết quả kinh doanh qua các năm. Trong trường hợp này ta có thể sử dụng đơn vị tính
chung cho cả biểu bảng.
Ví dụ: Kết quả kinh doanh của công ty X qua hai năm 2000-2001
Doanh thu Lợi nhuận % (+, -)
Mặt hàng
2000 2001 2000 2001
1.
2.
3.
4.
Trong phân tích, ngoài việc phân tích tăng hoặc giảm về số tuyệt đối còn thể hiện
bằng số tương đối (tỷ trọng hoặc tỷ lệ tăng giảm qua thời gian), phân tích lý do vì sao chỉ
tiêu đó tăng giảm qua các năm và dự báo ảnh hưởng của sự thay đổi đó ảnh hưởng đến
hoạt động của công ty trong tương lai như thế nào. Nếu công ty có nhiều mặt hàng, tập
trung phân tích các mặt hàng hay các chỉ tiêu có tỷ trọng cao.
17
2.4.2 Biểu đồ thống kê:
Đồ thị thống kê là các hình vẽ hoặc đường nét hình học để miêu tả tính chất quy
ước các dử liệu thống kê. Phương pháp đồ thị được ứng dụng rộng rãi trong mọi công tác
nghiên cứu kinh tế xã hội, nhằm mục đích trù tượng hóa các vấn đề sau:
Sự phát triển của hiện tượng qua thời gian.
Kết cấu và biến động kết cấu của hiện tượng.
Trình độ phát triển của hiện tượng
Sự so sánh giữa các mức độ hiện tượng.
Mối liên hiện của các hiện tượng
Tình hình thực hiện kế hoạch.
Tùy theo nội dung cần phản ảnh và trường hợp cụ thể để lựa chọn các hình thức
biểu hiện phù hợp như: biểu đồ hình cột, hình thanh, hình bánh, đường gấp khúc…
18