Professional Documents
Culture Documents
GT Ly Thuyet Thong Ke P.1 PDF
GT Ly Thuyet Thong Ke P.1 PDF
GIÁO TRÌNH
LÝ THUYẾT THỐNG KÊ VÀ PHÂN
TÍCH DỰ BÁO
chuyên ngành khôi kinh tế. Môn học đã được xuất bản
thành giáo trình nhiều lần. Lần này “G iá o trìn h Lý
thu yết T h ôn g k ê và P h â n tích d ự b á o ” được biên
soạn trên cơ sỏ tiếp thu những nội dung và kinh nghiệm
giảng dạy môn Lý thuyết Thống kê trong nhiều năm
qua và yêu cầu ứng dụng trong quản lý kinh tế theo xu
thê hội nhập.
Học viện Tài chính và tập thể tác giả chân thành
cảm ơn các nhà khoa học: PGS.TS. Nguyễn Thị Mùi;
PGS.TS. Tăng Văn Khiên; PGS.TS. Trần Thị Kim Thu;
PGS.TS. Nguyễn Văn Dần; PGS.TS. Trần Xuân Hải;
TS. Lý Minh Khải; TS. Phạm Thị Thắng đã có nhiều ý
kiến đóng góp quý báu trong quá trình biên soạn,
nghiệm thu và hoàn chỉnh góp phần nâng cao chất
lượng khoa học của giáo trình này.
4
Chương 1
6
lý nhà nước, quản lý kinh doanh đi vào nghiên cứu lý
luận và phương pháp thu thập tính toán số liệu thống
kê. Các tài liệu sách báo về thống kê bắt đầu được xuất
bản. ở một sô' trường học đã bắt đầu giảng dạy thông
kê. Năm 1660, nhà kinh tê học người Đức Công - rinh
(H.conhring, 1606 - 1681) đã giảng phương pháp nghiên
cứu hiện tượng xã hội dựa vào số liệu điều tra cụ thể tại
trường dại học Helmstet. Sau đó ít lâu, một số tác phẩm
có tính chất phân tích thống kê đầu tiên ra đòi, như
cuốn “sô" học chính trị” xuất bản năm 1682 của Uy-li-
am Pet- ty (Uy-li-am Pet-ty 1623 - 1687) một nhà kinh
tê học người Anh. Trong cuốn sách này tác giả đã dùng
phương pháp độc đáo để nghiên cứu các hiện tượng xã
hội qua các con sô" tổng hợp và so sánh. Các Mác đã
mệnh danh cho Uy- li- am Pet-ty là người sáng lập ra
môn thống kê học. Giữa thê kỷ XVIII (năm 1759) một
giáo sư đại học người Đức, A-Khen-Van (G.achenwall
1719 - 1772) lần đầu tiên dùng danh từ “Statistik” (một
thuật ngữ gốc La-tinh “Status”, có nghĩa là nhà nước
hoặc trạng thái của hiện tượng) - sau này người ta dịch
là “thống kê” - để chỉ phương pháp nghiên cứu nói trên.
3.1. Cơ sở lý luận
Muôn dùng thổng kê để nhiên cứu mặt lượng
trong mốì liên hệ với mặt chất của hiện tượng và quá
trinh kinh tế - xã hội, trước hết phải dựa trên cơ sở
nhận thức đầy đủ bản chất và quy luật phát triển của
hiện tượng và quá trình đó. Ví dụ: khi nghiên cứu thống
kô tình hình nhân khẩu của một nước, phải dựa trên cơ
sở nhận thức đầy đủ lý luận về dân tộc, về các quy luật
nhân khẩu... muôn thông kê tổng sản phẩm quốc dân
(GDP) ta cần hiểu tổng sản phẩm quốc dân là gì? tổng
sản phẩm quốíc dân tính bằng bao nhiêu phương pháp
và do bao nhiêu nhân tố tạo thành...? Như vậy, có nghĩa
là thông kê học phải lấy chủ nghĩa Mác - Lênin và kinh
tế học làm cơ sở lý luận.
Chủ nghĩa Mác - Lênin nói chung, kinh tê chính
trị học và chủ nghĩa duy vật lịch sử nói riêng, nghiên
cứu bản chất và những quy luật chung nhất, cơ bản
nhất về sự phát triển của xã hội. Đó là những môn khoa
học có khả năng giải thích rõ ràng và đầy đủ nhất các
khái niệm, các phạm trù kinh tê - xã hội, vạch rõ các
mối liên hệ ràng buộc và tác động qua lại giữa các hiện
tượng. Do đó, khi nghiên cứu bất kỳ hiện tượng kinh tê -
xã hội nào cũng phải dựa trên cơ sở nhận thức đầy đủ
bản chất và quy luật phát triển của hiện tượng, tức là
phải vận dụng lý luận về các khái niệm, các phạm trù,
các quy luật do chủ nghĩa duy vật lịch sử và kinh tế học
đã vạch ra. Đây là nguyên lý có tầm quan trọng bậc
nhâ't, quyết định tính chất khoa học và chính xác của
thông kê học. Tuy nhiên trong nền kinh tế thị trường
hiện nay đã xuất hiện nhiều chỉ tiêu kinh tế khá mới mẻ
mà lý luận chủ nghĩa Mác - Lênin chưa đề cập tói, như:
Tổng sản phẩm quốc gia, tổng sản phẩm quốic dân, giá
trị gia tăng... do vậy nếu chỉ dựa vào lý luận chủ nghĩa
Mác - Lênin thôi chưa đủ mà thông kê học còn phải dựa
vào kinh tế học thị trường như kinh tế vi mô, kinh tế vĩ
mô làm nền tảng khoa học cho mình.
Trong hàng loạt tác phẩm của mình, mỗi lần
dùng các phương pháp và số liệu thống kê để nghiên cứu
các hiện tượng kinh tế - xã hội ở Anh, Đức, Nga. Mác,
Ăng-ghen, Lênin đều tiến hành phân tích lý luận trên
giác độ kinh tế, chính trị một cách sâu sắc, coi đó là tiền
đề, là cơ sỏ cho việc phân tích thông kê. Mác đã chỉ rõ:
16
“chỉ SiU khi hiếu rõ những điểu kiện tạo ra tỷ suất lợi
nhuậi, thì mới có thể nhờ vào thông kê mà thực sự
phân ích được tỷ suất tiền công ở các thời kỳ khác nhau
và trrtig những nưốc khác nhau". Lênin cũng khẳng
định: Thông kê phải làm nổi bật được những quan hệ
kinh ế - xã hội do sự phân tích toàn diện xác lập ra, chứ
không nên thông kê để mà thông kê”.
Đôi tượng của thông kê học bao giờ cũng gắn liền
với thíi gian và địa điểm cụ thể. Điều đó đòi hỏi khi
nghiêi cứu thống kê tình hình kinh tế - xã hội nước ta,
không thể chỉ dựa vào lý luận chung của chủ nghĩa duy
vật lịh sử và kinh tê học, mà còn phải dựa vào các
đườn£ lối, chính sách của Đảng và Nhà nước, vì đó là
sản piẩm của việc kết hợp lý luận của chủ nghĩa Mác-
Lôninvào thực tiễn cách mạng Việt Nam. Nếu không,
nhữnị kết luận rút ra được sẽ không có ý nghĩa thực
tiễn đ)i với nước ta.
Như vậy, thực chất của việc xác định tổng thể
thống kê là xác định các đơn vị tổng thể. Đơn vị tổng thể
là xuất phát điểm của quá trình nghiên cứu thông kê, vì
nó chứa đựng những thông tin ban đầu cần cho quá
trình nghiên cứu.
Khi xác định tổng thể có thể gặp trường hợp các
đơn vị tổng thể không trực tiếp quan sát hoặc nhận biết
được, ta gọi đó là tổng th ể tiềm ẩn. Khi nghiên cứu các
hiện tượng xã hội ta thường gặp các tổng thể này (Ví dụ:
Tổng thể những người đồng ý (ủng hộ) một vấn đê nào
đó, tổng thể những người ưa thích nghệ thuật cải
lương...).
tính chất hay loại hình của đơn vị tổng thể, không có
biểu hiện trực tiếp bằng các con sô. Ví dụ các tiêu thức
như: giới tính, nghê nghiệp, tình trạng hôn nhân, dân
tộc, tôn giáo... là các tiêu thức thuộc tính.
Các tiêu thức thuộc tính hoặc tiêu thức sô" lượng
chỉ có hai biểu hiện không trùng nhau trên một đơn vị
tổng thể, được gọi là tiêu thức thay phiên. Ví dụ, tiêu
thức fiới tính là tiêu thức thay phiên vì chỉ có hai biểu
hiện li nam và nữ. Đối với tiêu thức có nhiều biểu hiện
ta có hể chuyển thành tiêu thức thay phiên bằng cách
rút gcn thành hai biểu hiện. Ví dụ: thành phần kinh tế
chia thành quốc doanh và ngoài quốc doanh; sô" công
nhân :ủa các doanh nghiệp chia thành nhỏ hơn 500 và
lớn hm hoặc bằng 500.
27
Chương 2
chính xác, đầy đủ, kịp thời trong hoạt động thống k ể ’ -
khoản 1, điều 4, chương 1- Luật thông kê.
Trung thực, được đặt ra cho cả cán bộ điều tra và
đối tượng điều tra. Yêu cầu này đòi hỏi người thu thập
thông tin (cán bộ điều tra) phải tuyệt đối trung thực, ghi
chép đúng như những điều đã được nghe, được thấy.
Ngay cả việc đặt câu hỏi cũng phải hết sức khách quan,
không áp đặt ý định chủ quan, thậm chí không được đưa
ra các gợi ý có thể gây ảnh hưởng đối với người trả lòi...
nhằm giúp thu được những thông tin trung thực. Đối với
đôi tượng điều tra (ngưòi cung cấp thông tin), yêu cầu
này đòi hỏi họ phải cung cấp những thông tin xác thực,
không được che dấu và khai man thông tin.
chủ q-iản nhận báo cáo, chữ ký của ngưòi lập báo cáo,
của tìủ truỏng đơn vị báo cáo... Và phần trình bày chỉ
tiêu, iêu thức và sô" liệu tổng hợp, tính toán theo yêu
cầu cia báo cáo. Ví dụ báo cáo tài chính, báo cáo kết quả
sản xiất kinh doanh, báo cáo tổng mức bán lẻ...
1.3.2. Đ iều tra th ô n g k ê (điều tra chuyên môn):
Là hìih thức điều tra thu thập tài liệu thống kê về hiện
tượng kinh tế - xã hội một cách không thường xuyên,
khôrự liên tục theo một kế hoạch, một phương án và
phươig pháp điều tra quy định riêng phù hợp với mỗi
cuộc liều tra cụ thể.
Ví dụ: Các cuộc điều tra nhu cầu nhà ở và hàng
tiêu cùng.
Điều tra chuyên môn là hình thức phổ biến trong
nền Hnh tế thị trường, chiếm tỉ trọng lốn trong tổng sô"
cạc CIỘC điều tra hàng năm.
34
là x e n cu ộ c đ iều t r a n h ằ m tìm h iểu v ấ n đ ề gì p h ụ c v ụ
c h o y:u c ầ u n g h i ê n c ứ u n à o .
phải tiều tra tất cả các khía cạnh của hiện tượng mà chỉ
cần dều tra những khía cạnh phục vụ yêu cầu nghiên
cứu cx thể.
Việc xác định mục đích điều tra có tác dụng định
hướní cho toàn bộ quá trình điều tra. Nó liên quan đến
xác đnh đối tượng, đơn vị và nội dung điều tra. Muôn
xác ậnh mục đích điều tra phải căn cứ vào yêu cầu
quản lý và chỉ đạo thường xuyên về kinh tế - xã hội của
Đảngvà Nhà nước.
Thứ h a i: X ác đ in h đ ố i tượng đ iê u tr a và đ ơ n
vị đ ỉa i tra
Đối tượng điều tra là tổng thể các đơn vị của hiện
tượnị nghiên cứu cần thu thập tài liệu.
cung cấp những dữ liệu cần thiết cho quá trình nghiên
cứu. Đồng thòi đơn vị điều tra là căn cứ để tiến hành
t ổ n g hợp, p h â n t í c h v à d ự b á o t h ố n g k ê .
Khi xác định đơn vị điều tra phải căn cứ vào mục
đích điều tra và đối tượng điều tra. Đơn vị điều tra có thể
là từng doanh nghiệp, từng cửa hàng, từng trường học...
nhưng cũng có thể là từng công nhân, từng học sinh...
Cũng có khi trong một cuộc điều tra có thể có
nhiều loại đơn vị điều tra để đáp ứng những yêu cầu
nghiên cứu khác nhau. Ví dụ trong tống điều tra dân số
thường dùng 2 loại đơn vị điều tra là từng ngưòi dân và
từng hộ gia đình.
Thứ b a : N ội d u n g đ iê u tra
Nội dung điều tra là mục lục các tiêu thức cần
thu thập tài liệu trên các đơn vị điều tra.
Xac định nội dung điều tra phải căn cứ vào mục
đích điều tra, đồng thời phải tính đến khả năng về nhân
lực, thòi gian, chi phí... Tuy nhiên, để phù hợp với nhu
cầu thực tê và khả năng cho phép nội dung điều tra chỉ
nên bao gồm những tiêu thức quan trọng nhất, có quan
bệ với nhau, bổ sung cho nhau và có liên quan trực tiếp
đên mục đích điều tra.
Mỗi tiêu thức trong nội dung điều tra phải được
diễn đạt thành câu hỏi ngắn gọn, cụ thể, rõ ràng để cả
người điều tra và người được điều tra đều hiểu thông
nhất.
37
Thứ tư: X á c đ ịn h th ờ i đ iểm , th ờ i kỳ đ iề u tra
Thời điểm điều tra: Là mổc thời gian được quy
định để ghi chép thống nhất tài liệu của tất cả các đơn
vị điều tra. Xác định thời điểm điều tra là xác định cụ
thể mốc thời gian để thống nhất đăng ký dữ liệu trên
các đơn vị tổng thể.
Khi xác định thời điểm điều tra phải căn cứ vào
tính chất mỗi loại hiện tượng, đồng thồi phải đảm bảo
thuận tiện cho việc đăng ký dữ liệu và tính các chỉ tiêu
từ dữ liệu điều tra. Ví dụ điều tra thị trường áo mưa
không thể tiến hành trong mùa khô vì lúc đó cả ngưòi
bán và người mua đều không quan tâm để tham gia
cung cấp thông tin tốt được.
Thời kỳ điều tra: Là khoảng thòi gian được xác
định để thông nhất đăng ký dữ liệu của các đơn vị điều
tra trong suốt khoảng thời gian đó (ngày, tuần, 10 ngày,
3 tháng hay 1 năm...). Ví dụ: điều tra sô" lượng sản phẩm
làm ra của 1 kỳ nào đó, mức lương bình quân trong 1
tháng, sô" lần scí người đi siêu thị trong vòng 1 tuần
qua...
Thời kỳ điều tra có thể dài hay ngắn phụ thuộc
vào mục đích nghiên cứu.
Thời hạn điều tra dài hay ngắn tùy thuộc vào qui
mồ, tính chất phức tạp của hiện tượng, vào nội dung
nghiên cứu, lực lượng tham gia điều tra. Nhưng thòi
hạn điều tra không nên quá dài vì sẽ không đảm bảo
được yêu cầu kịp thời của tài liệu điều tra.
Thứ n ăm : B iể u đ iê u tra và b ả n g i ả i th íc h
c á c h g h i b iểu
Biểu điều tra (còn gọi là phiếu điều tra, bản câu
hỏi) là loại bản in sẵn theo mẫu quy định trong kế
hoạch điều tra, được sử dụng thông nhất để ghi dữ liệu
của đơn vị điều tra.
+ Bô" trí lực lượng điều tra và phân chia khu vực
điều tra.
Loại điều tra này thường được tiến hành đối với
hiện ^ượng không cần điếu tra thường xuyên (ít biến
động, biến động chậm), các hiện tượng cần theo dõi
thườig xuyên nhưng có chi phí điều tra lớn (điều tra
dân ố, điều tra nông nghiệp, tài sản cô"định...) hoặc các
41
hiện tượng không xảy ra thường xuyên (điều tra dữ
kiện).
Tài liệu điều tra chỉ phản ánh trạng thái của hiện
tượng tại một thời điểm điều tra. Các cuộc điều tra
không thường xuyên có thể được tiến hành theo một
định kỳ nhất định (3 tháng, 6 tháng, 1 năm, 2 năm, 5
năm...) hoặc không theo định kỳ khi nào cần thì tiến
hành điều tra.
Ví dụ: Khi cần nắm bắt nhanh tình hình tiêu thụ
xe máy ta chỉ cần khảo sát và thu thập dữ liệu tại vài
đ ịa đ iể m t r u n g t â m m u a b án xe m áy chủ yếu.
1.5.2. T hu th ậ p g iá n tiếp
Phương pháp này chủ yếu thu thập tài liệu qua
bản viết của đơn vị điều tra, qua điện thoại, qua chứng
từ sổ sách văn bản sẵn có.
Thu thập gián tiếp ít tôn kém hơn thu thập trực
tiếp, nhưng kết quả thu thập chậm, chất lượng tài liệu
thưòng không cao, khó phát hiện sai sót, khó sửa chữa
bổ sung sai sót.
dung tổng hợp, mà phải chọn lọc để nội dung tổng hợp
vừa đáp ứng mục đích nhiên cứu.
Tổng hợp từng cấp là tổ chức tổng hợp các tài liệu
điều tra theo từng bước, từng cấp từ dưới lên theo một
k ế h o ạ c h đã v ạ ch sẵ n .
Kiểm tra tài liệu dùng vào tổng hợp là một việc
làm không thể bỏ qua được. Chất lượng và kết quả tổng
hợp phụ thuộc vào chất lượng các tài liệu dùng vào tổng
50
hợp. Kiểm tra tài liệu trước khi tiến hành chỉnh lý - hệ
thống hoá nhằm mục đích đảm bảo tính chính xác của
tài liệu điều tra ban đầu, phục vụ cho việc tính toán
đúng các chỉ tiêu phân tích sau này.
Chất lượng các tài liệu ảnh hưởng đến chất lượng
của phân tích và dự báo. Do đó, khi lựa chọn các tài liệu
cần thiết phải tiến hành đánh giá chúng trên các mặt
sau:
- Tài liệu thu thập được có đảm bảo các yêu cầu
chính xác, kịp thòi và đầy đủ hay không? Phương pháp
thu thập tài liệu có khoa học hay không? Trong điều tra
chọn mẫu cần đánh giá tính chất đại biểu của số mẫu
được chọn để điều tra thực tế v.v...
54
- Các tài liệu có được phân tổ, chỉnh lý và hệ
thống hoá khoa học hay không? Có đáp ứng yêu cầu và
mục đích của phân tích hay không?
- Các chỉ tiêu được tính t o á n theo phương p h á p
nào? có nhất trí với phương pháp của thông kê hay
không? Các tài liệu có đảm bảo tích chất so sánh được
với nhau hay không? v.v.
Khi đánh giá tài liệu phải kết hợp chặt chẽ giữa
lý luận và thực tiễn; phải so sánh - đôi chiếu các chỉ tiêu
với nhau và phải liên hệ với tình hình thực thế.
+ Xác định các phương pháp, các chỉ tiêu phân
tích và dự báo.
Thống kê học sử dụng nhiều phương pháp để
phân tích và dự báo như: phương pháp tính các chỉ tiêu
tương đối, tuyệt đối và bình quân; phương pháp dãy số
biến động; phương pháp chỉ số;... Thống kê học cũng
vận dụng cả một sô" phương pháp của toán học như:
phương pháp tương quan, hồi quy, phân tích phương
sai, ngoại suy... Mỗi phương pháp đều có đặc điểm ý
nghĩa và tác dụng khác nhau. Do đó, lựa chọn các
phương pháp phân tích và dự báo cho từng trường hợp
cụ thể, cần phải chú ý các điểm sau:
55
- Phải h i ể u rõ ưu, nhược đ i ể m và điều kiện vận
' • • •
Mỗi chỉ tiêu phản ánh một mặt của hiện tượng
nghiên cứu. So sánh, đối chiếu chỉ tiêu với nhau sẽ thấy
được đặc điểm, bản chất, xu hướng phát triển và tính
quy luật của hiện tượng được nghiên cứu. So sánh, đối
chiếu chỉ tiêu được quán triệt trong các phương pháp
phân tích và dự báo thông kê.
Khi so sánh, đối chiếu các chỉ tiêu cần chú ý đảm
bảo tính chất có thể so sánh được. Nếu tính chất này bị
56
vi phạn thì phải tiến hành chỉnh lý, tính toán nhằm
làm cho chúng trở thành so sánh được.
57
Chương 3
PHÂN TỔ THỐNG KẺ
Khi tiến hành phân tổ, các tiêu thức có liên quan
với nhau được chia thành hai loại: Tiêu thức nguyên
nhân (là tiêu thức gây ảnh hưởng) và tiêu thức kết quả
(là tiêu thức bị ảnh hưởng, phụ thuộc vào tiêu thức
nguyên nhân).
Phương pháp phân tổ thống kê để giải quyết
nhiệm vụ này gọi là phân tô liên hệ. Phần này sẽ được
trình bày ở mục 4.
Tiêu thức bản chất là tiêu thức nói lên được bản
chất của hiện tượng nghiên cứu, phản ánh đặc trưng cơ
bản của hiện tượng trong điều kiện thời gian và địa
điểm cụ thể.
Bản chất của mỗi hiện tượng cụ thể được phản
ánh qua nhiều tiêu thức khác nhau, do vậy phải tuỳ
theo mục đích nghiên cứu mà dùng lý luận để chọn ra
các tiêu thức bản chất nhất. Ví dụ, khi phân tổ các
doanh nghiệp thuộc ngành sản xuất công nghiệp nào đó,
để nghiên cứu đơn vị tiên tiến và lạc hậu, thì các tiêu
thức: giá thành, năng suất lao động, lợi nhuận là những
tiêu thức bản chất, còn các tiêu thức: sô" lượng công
nhân, giá trị sản xuất, giá trị thiết bị không phải là tiêu
thức bản chất. Ngược lại, để nghiên cứu quy mô của
doanh nghiệp thì tiêu thức bản chất có thể là: sô" lượng
công nhân, giá trị sản xuất, giá trị thiết bị và tài sản cô"
định v.v...
Tiêu thức thuộc tính phản ánh các tính chất của
đơn vị tổng thể, không biểu hiện trực tiếp bằng các con
sô", ví dụ như: giói tính, dân tộc, tình trạng hôn nhân,
nghề nghiệp, nơi cư trú v.v...
quan trong tự nhiên, xã hội. Nếu các loại hình tương đối
ít, ta có thể coi mỗi loại hình là một tổ. Vì vậy có bao
nhiêu loại hình sẽ phân làm bấy nhiêu tổ. Chẳng hạn
phân tổ nhân khẩu theo giới tính, ta sẽ được hai tổ: nam
và nữ, hoặc phân tổ cơ cấu lao động nông thôn theo
trình độ học vấn theo tài liệu sau:
Bảng 3.1: Cơ câu lao động nông thôn theo
trìn h độ học vấn, giai đoạn 1996 - 2005
(Đơn vị %)
Thời gian 1996 2000 2005
T rình đ ộ học van'
Chưa biết chữ 6,57 4,79 4,95
Chưa TN tiểu hoc •
22,63 18,48 15,15
Tốt nghiệp tiểu học 28,87 30,95 31,59
Tốt nghiệp THCS 32,74 34,59 34,61
Tốt nghiệp THPT 9,19 11,18 13,71
Chung 100,00 100,00 100,00
(Nguồn: Tổng cục Thông kê; Bộ L ao động Thương
binh và xã hội)
Trường hợp sô' loại hình thực tế có nhiều, có khi
tói hàng trăm hàng nghìn, nếu cứ coi mỗi loại hình là
một tổ thì sô" tổ sẽ quá nhiều, không khái quát chung
được. Mặt khác, giữa các loại hình chưa chắc đã có sự
khác nhau rõ rệt về chất. Do đó, phải giải quyết bằng
cách ghép các loại hình nhỏ vào cùng một tổ, theo
nguyên tắc: các loại hình đó phải giống nhau (hoặc gần
giống nhau) về tính chất, giá trị sử dụng hay ý nghĩa
kinh tế.
Vận tải, kho bãi, thông tin liên 11,00 9,53 10,98
lạc
70
Hoạt động khoa học và công nghệ 71,38 83,16 117,28
Các hoạt động kinh doanh tài 171,42 139,70 62,99
sản và dich vu tư vấn
♦ *
72
Việc phân tổ trên rất đơn giản, vì lượng biến của
tiêu thức phân tổ (sô" máy dệt) chỉ thay đổi trong phạm
vi hẹp (từ 11 đến 16 máy). Khi người công nhân đứng
thêm được một máy biểu hiện chất lượng công tác của
họ đã thay đổi. Vì vậy có thể căn cứ vào mỗi lượng biến
để thành lập một tổ.
Trường hợp lượng biến của tiêu thức biến thiên
lớn, nếu căn cứ vào mỗi lượng biến để hình thành một tổ
thì sô" tổ sẽ quá nhiều, đồng thời không nói rõ sự khác
nhau về chất giữa các tổ. Trong trường hợp này cần chú
ý tới mối liên hệ giữa lượng và chất trong phân tổ, nghĩa
là phải xem sự thay đổi về lượng đến mức độ nào thì
chất của hiện tượng sẽ thay đổi và làm nảy sinh ra một
tổ khác. Như vậy, mỗi tổ sẽ bao gồm một phạm vi lượng
biến, có hai giới hạn: giới hạn dưới và giới hạn trên. Giới
hạn dưới là lượng biến nhỏ nhất của tổ để làm cho tổ đó
được hình thành. Giới hạn trên là lượng biến lớn nhất
của tổ, nếu vượt quá giới hạn này thì chất lượng thay
đổi và chuyển sang tổ khác. Trị số chênh lệch giữa hai
giới hạn này gọi là trị số khoảng cách tổ.
73
Việc phân tổ như vậy gọi là phân t ổ có khoảng
cách tổ. Ta có ví dụ sau đây:
n
Trong đó:
h - Trị sô" khoảng cách tổ.
Xmax - Lượng biến lớn nhất của tiêu thức phân tổ.
Xmin - Lượng biến nhỏ nhất của tiêu thức phân tổ.
X,
x2 f2
x3 f3
• • • • • •
xn fn
77
Sô" lượng các đơn vị hay tần sô của mỗi tổ được
xác định bằng cách đếm s ố đơn vị (sô" quan sát) rơi vào
giới hạn của tổ đó. Trường hợp số quan sát ít, ta có thể
đếm bằng cách sử dụng ký hiệu gạch, mỗi một gạch
tượng trưng cho một quan sát. Nếu như sô quan sát lớn
chúng ta thường không thể đếm bằng tay mà phải sử
dụng các chương trình máy tính phổ biến như Excel hay
chương trình thông kê chuyên dụng như SP SS for
Windows để tiến hành phân tổ và xác định tần số của
mỗi tổ sau khi ta đã nhập đầy đủ các sô" liệu vào máy.
Muôn xác định chỉ tiêu giải thích cần căn cứ vào
mục đích nghiên cứu và nhiệm vụ của phân tổ để chọn
ra các chỉ tiêu có liên hệ với nhau và bố sung cho nhau.
Mặt khác, cần chú ý tới môi liên hệ nhất định giữa tiêu
thức phân tổ với chỉ tiêu giải thích. Các chỉ tiêu giải
thích có ý nghĩa trong việc so sánh với nhau cần được bố
trí gần nhau. Ví dụ, ta có bảng sau:
78
Bảng 3.5: Kết quả diều tra các doanh nghiệp
ngành dệt may trong khu vực A năm 2007
Loại SỐ Sô' công Giá tri Năng suất
•
a ị Về hỉnh thức
Các sô" liệu được ghi vào các ô của bảng, mỗi con
sô" phản ánh một đặc trưng về mặt lượng của hiện tượng
nghiên cứu.
80
b ị Vê nội dung
Bảng thông kê gồm hai phần: Phần chủ đề và
phần giải thích.
Phần chủ đề, còn gọi là phần chủ từ, nêu lên tổng
thể hiện tượng được trình bày trong bảng thống kê.
Tổng thể này được phân thành các bộ phận, nó giải
thích đốì tượng nghiên cứu là những đơn vị nào, những
loại hình gì. Có khi phần chủ đề là các địa phương hoặc
thời gian nghiên cứu khác nhau của hiện tượng nào đó.
Phần giải thích, còn gọi là phần tân từ, gồm các
chỉ tiêu giải thích các đặc điểm của đối tượng nghiên
cứu, nghĩa là giải thích phần chủ đề của bảng.
Phần chủ đề thường được đặt ở vị trí bên trái của
bảng, còn phần giải thích ở phía trên của bảng. Cũng có
trường hợp người ta thay đổi vị trí của hai phần cho nhau.
Cấu thành của bảng thông kê có thể khái quát
như sau:
B ả n g ...: T ê n b ả n g th ô n g kê (tiêu đê chung)
Đơn vị tính:...
♦
giải thích
Các chỉ tiêu giải thích (tên cột)
Phần chủ đe
A 1 2 3 • • •
n
Tên chủ đề (tên hàng)
Tổng sô"
81
3.1.2. Các loai bảng thông kê
Căn cứ vào kết cấu của phần chủ đề, có thể chia
làm ba loại bảng thông kê: giản đdn, phân tổ và kết hợp.
- ĐỒ thị liên hệ
• »
- Đồ thị so sánh
- Bản đồ thống kê
80,65
80
77,65, - ^
78
76
74,26
74 w w 73.56 .__ : 75,42
72
TÌÍL3
70
68
66
^ ^ ^ / £ Ạ <ệ Ạ ề
(Nguồn: Bộ L ao động - Thương binh và Xã hội)
3.2.3. N h ữ n g yêu cầu ch u n g đối với viềc xây
d ự n g đồ thỉ thống kê
- Lựa chọn loại đồ thị cho phù hợp với nội dung,
tính chât các sô" liệu cần diễn đạt. Mỗi loại đồ thị có khả
năng diễn tả nhiều khía cạnh, cho nên cần cân nhắc
87
chọn loại đồ thị diễn tả phù hợp nhất, dễ quan sát nhất.
Ví dụ biểu đồ hình cột và biểu đồ diện tích hình tròn
• • •
đều có thể biểu hiện kết cấu, sự phát triển qua thời gian
của hiện tượng. Song nếu biểu hiện kết cấu thì thường
dùng loại hình tròn hơn vì loại này biểu hiện rõ nhất kết
cấu và biến động kết cấu của hiện tượng. Còn khi cần
biểu hiện sự phát triển của hiện tượng thường dùng
biểu đồ hình cột.
- Phải ghi các sô" liệu, đơn vị tính, thời giai, không
gian của hiện tượng nghiên cứu sao cho thích hợp với
từng loại đồ thị cụ thể. Đặc biệt phải giải thích rõ ràng
các ký hiệu, màu sắc quy ước được dùng trong đồ :hị.
88
4 . P H Â N TỔ L IÊ N H Ệ
2 3 4 2 3 4 2 3 4
Cộng 100 25 50 25 64.650 14.250 32.250 18.150 646,50 570 645 726
5. PHÂN TỔ LẠI
92
phân ìbiìt được các loại hình kinh tê - xã hội, chưa hợp
lý, chưa phản ánh đúng tình hình thực tế.
93
Bảng 3.10: Phân tổ công nhân theo tuổi
nghề
Công ty A Công ty B
Dưới 2 16 10 Dưới 1 6 3
2 - dưới 5 19 15 1 - dưới 2 9 7
5 - dưới 10 28 28 2 - dưới 5 20 16
10 - dưới 15 22 25 5 - dưới 8 22 22
15 - dưối 20 11 15 8 - dưới 10 18 20
Trên 20 4 7 10 - dưới 15 12 14
15 - dưới 20 8 11
Trên 20 5 7
Dưới 5 35 25 35 26
5 - dưới 10 28 28 40 42
10 - dưới 15 22 25 12 14
15 - dưới 20 11 15 8 11
Trên 20 4 7 5 7
8 + 26 + 16 = 50 (%)
97
Việc phân tổ lại trong thống kê, dù theo một
trong hai cách vừa nêu đều không thể cho sô liệu hoàn
toàn chính xác theo thực tế, song phương pháp phân tổ
lại có tác dụng rất lớn trong thống kê, cho nén nó được
áp dụng khá phổ biến, nhất là khi nghiên cứu sử dụng
các tài liệu thông kê cũ.
- Định nghĩa biến thứ hai (ví dụ: biến giói tính):
nhấp chuột vào ô thứ 2 của cột thứ nhất (Name) ta đánh
gioitinh và nhấp chuột vào ô thứ 2 của cột thứ 2 (Type)
98
thì có ciữ Numeric. Vì giới tính là tiêu thức thuộc tính
nên lại ìhấp chute vào ô vuông có dấu chấm chem, nằm
cạnh clữ Numeric, khi đó hộp thoại hiện ra, ta nhấp
chuột vào String, rồi nhấp chuột vào OK (nếu là tiêu
thức sốlượng (ví dụ: số công nhân) thì ta giữ nguyên ở
chữ Nuneric).
*1S
A gioitinh
Nhấp chuột vào ns, nhấp chuột vào hình tam giác
(mũi tên) nằm trong hình vuông nhỏ ở giữa, NS sẽ nhảy
sang hình vuông bên phải. Sau đó nhấp chuột vào OK.
đợi một lúc ta sẽ có kết quả (cột 1, Ns được sắp xếp theo
thú tự :ừ thấp đến cao, cột thứ 2 cho biết có bao nhiêu
người đạt mức năng suất tương ứng, cột thứ 3 cho biết %
số ngươi đạt mức NS tương ứng, cột thứ 4 giống cột 3,
cột 5 % tích lũy của sô" người đạt mức ns.
6.5.1. Vẽ đ ồ th ị h ỉn h cộ t
102
Chương 4
KINH TẾ - XÃ HỘI
106
Tuy nhiên, do giá cả hàng hóa luôn luôn thay đổi,
đơn vị tiền tệ trở nên không có tính chất có thể so sánh
được qua thời gian. Để khắc phục nhược điểm này người
ta thường sử dụng giá cô" định ở một thời kỳ nào đó (do
Nhà nước quy định).
- SỔ" tuyệt đốì thời kỳ, phản ánh quy mô, khối
lượng của hiện tượng trong suốt thời gian nghiên cứu.
Ví dụ: Tổng sản phẩm trong nước của Việt Nam năm
2001 là 484.492 tỷ đồng; Sô" lượng sản phẩm do doanh
nghiệp X sản xuất ra trong năm 2002 là 65.000 sản
phẩm v.v...
- Scf tuyệt đốì thời điểm, phản ánh quy mô, khối
lượng của hiện tượng nghiên cứu vào một thời điểm
nhất định. V í dụ: Dân sô" thành phô" Hà Nội điều tra vào
0 giờ ngày 1 tháng 4 năm 1999 là 2.672.125 ngưòi, đó là
số tuyệt đối thời điểm. Nhiều chỉ tiêu khác như số đầu
lợn có vào ngày 1-7; sô"nguyên, vật liệu tồn kho vào cuối
tháng v.v... đều được biểu hiện bằng số tuyệt đối thời
điểm.
107
Sô" tuyệt đối thời điểm chỉ phản ánh tình hình của
hiện tượng kinh tế - xã hội vào một thời điểm nhất định
còn trước hoặc sau thời điểm đó, trạng thái của hiện
tượng đã thay đổi khác. Do vậy, muốn có số tuyệt đối
thòi điểm chính xác phải quy định thời điểm hợp lý và tổ
chức điều tra kịp thòi.
- Trong phân tích thông kê, các sô" tương đối được
sử dụng rộng rãi để nêu lên kết cấu, quan hệ so sánh,
tốc độ phát triển, trình độ phổ biến... của hiện tượng
nghiên cứu trong điều kiện thòi gian và không gian cụ
thể.
Cũng như các số tuyệt đôi, các sô" tương đối trong
thống kê nói lên mặt lượng trong quan hệ mật thiết vối
mặt chất của hiện tựơng nghiên cứu. Tuy nhiên, trong
khi các số tuyệt đối chỉ mới khái quát được về quy mô,
khối lượng của hiện tượng, thì các sô" tương đối cho phép
phân tích các đặc điểm của hiện tương; nghiên cứu các
hiện tượng đó trong mối quan hệ so sánh với nhau. Ví
dụ: Sản lượng lương thực (quy thóc) của nước ta năm
2002 là: 36.379,7 nghìn tấn. Muôn phân tích xem sản
lượng đó tăng (hay giảm) đã thỏa mãn nhu cầu của
109
nhân dân hay chưa? sả n lượng đó nhiều hay ít?... phải
so sánh với sản lượng của năm trước, với tổng sô" dân
v.v...
Trong trường hợp cần phải giữ bí mật sô" tuyệt đốì
người ta có thể sử dụng số tương đối để biểu hiện tình
hình thực tế của hiện tượng.
2.2. Đặc điểm và hình thức biểu hiện số
tương đối
y0
Trong đó:
T: Số tương đối động thái
= 4$n = lần 89
5,378
Trong thực tế, loại sô' tương đốì động thái này
được gọi là tốc độ phát triển hay chỉ sô" phát triển.
21.525
t . = — — ---- = 1,05 hay 105%
nk 20.500
2.3.2.2. Sô'tương đôi hoàn thành k ế hoạch
Là tỷ lệ so sánh giữa mức thực tế đạt được trong
kỳ nghiên cứu vối mức kê hoạch đặt ra cùng kỳ của một
chỉ tiêu nào đó.
Trong đó: #
114
Cũng theo ví dụ trên sản lượng thép thực tê
doanh nghiệp đạt được năm 2003 là 22,386 tấn.
Số tương đôi động thái bằng tích của sô" tương đốì
nhiệm vụ kế hoạch và sô' tương đôi hoàn thành kế
hoạch.
_YL - Y.
1 kh v Y11
Y10 1Y0 1KYll
115
Sô" tương đối hoàn thành kê hoạch bằng tỷ sô" giữa
sô" tương đốì động thái với sô tương đốì nhiệm vụ kế
hoạch.
Y1 I _ 1YI . 1 Y
KH
Y KH Y
*0 Y
10
Y. Y . 11
1 KH _ _J_Ị_ Y
Y1 0 1Y0 Y.
KH
Trong đó:
d- Sô" tương đôi kết cấu
116
Yb - Trị sô' tuyệt đối từng bộ phận
Y t - Trị sô" tuyệt đôì của tổng thể.
Mật độ
_1 A A/
dân số
Sô" tương đối thường là kết quả so sánh của hai sô"
tuyết đối. Số tương đối tính ra có thể rất khác nhau tùy
thuộc vào việc lựa chọn gổc so sánh. Có khi sồ" tương đốì
tính ra rất lớn nhưng ý nghĩa của nó không đáng kể, vì
trị số tuyệt đối tương ứng với nó rất nhỏ. Ngược lại, có
khi s ố tương đối tính ra rất nhỏ nhưng lại có ý nghĩa
119
quan trọng, vì trị số tuyệt đối tương ứng của nó có quy
mô đáng kể. Vì vậy, khi nghiên cứu thống kê nếu vận
dụng kết hợp cả sô" tương đối và sô" tuyệt đối thì sẽ nhận
thức được sâu sắc và chính xác đặc điểm của hiện tượng
cả về qui mô và mức độ hơn kém v.v...
3. SỐ BÌNH QUÂN
Sô" bình quân cộng được tính bằng cách đem tổng
các ^ượng biến của tiêu thức chia cho tổng số đơn vị tổng
thể 'tổng các tần số). Có các trường hợp tính toán sau:
ỷ Xi
x = + +~ + (4-1)
n n
Trong đó:
X : S ố bình quân
- 50 + 51 + 53 + 55 + 60 + 63 + 67 „
X = ---------------------- —----------------------- = 5 7sp
124
3.2.1.2. S ố bình quăn cộng gia quyền
Trong trường hợp mỗi lượng biến có thể gặp nhiều
lần, nghĩa là có tần sô' khác nhau. Muốn tính số bình
quân cộng, trước hết phải nhân từng lượng biến (X,) với
tần sô (fj) tương ứng rồi cộng lại và đem chia cho tổng
các tần sô' (tổng sô' đơn vị tổng thể). Lúc này tần số (fị)
còn được gọi là quyền sô" vì nó ảnh hưởng quan trọng
đến trị số của sô" bình quân.
(4.2)
i=l
Trong đó:
125
Bảng 4.1
N SLĐ (S P ) Sô công nhân S ả n lượng
X, Ft
40 23 120
43 5 215
45 10 450
49 6 294
55 7 385
Cộng 30 1464
V _= —
X !-464
—— =_ 48,8sp
o
30
+ Khi mọi quyền (f,) bằng nhau thì công thức sô'
bình quân cộng gia quyền trở thành công thức sô" bình
quân cộng giản đơn.
n n
_ ẳ x .f . t x .
^ - 'r - "Lj (Với tất cả í bằng nhau)
V f.
i=l
126
+ Trường hợp tài liệu phân tổ có khoảng cách tổ
thì ta phải lấy trị số giữa của mỗi tổ để làm đại diện cho
lượng biến của tổ đó:
rp „ J _
~
„ . V
X max + X min
lr ị sô giưa: Aj —-------------------
Ix .fi
X = n
(4.3)
p ,
i=1
+ Trường hợp quyền sô" cho dưới dạng tỷ trọng (di)
biểu hiện tỷ trọng của mỗi tổ chiếm trong tổng thể thì
lúc này số bình quân cộng gia quyền có dạng sau:
X = £ x jd j (4.4)
i=1
Trong đó: d| = ~ ~ —
li=l fi
+ Trường hợp tính scí bình quân chung từ các số
bình quân tổ (như tính năng suất lao động bình quân
của doanh nghiệp trên cơ sở năng suất lao động bình
quân của từng loại công nhân, phân xưởng...) thì số"bình
quân cộng chung sẽ là scí bình quân cộng gia quyền của
127
các sô" bình quân tổ, trong đó quyền sô" là sô" đơn vị mỗi
tố.
É x if i
Ta có: X = --------- (4.5)
5i=l f'
Trong đó:
3.2.2. S ô b in h q u â n đ iề u h o à
<M, = X,xQ
Công thức tính:
128
y .M i
V Mị + M 2 +... + M n •_!
x= K Ì 7 7 7 ^ =t K ( 4 ' 6 )
X, x2 x„ ^x,
Trong đó:
ỸM j
X = -ố— = —ĩMi— = _ ! L _ (4.7)
ny n 1 n 1 x 7
ỷ Mi m.y_L Ỳ±' V V
Á—à Y
1=1 i=l A i i—
1A
Công thức:
Trong đó:
n: số lượng biến
X : số bình quân
X = V X ,x X 2x ...x X n = / n x i (4.8)
n : Ký hiệu tích
X = ự l , 0 5 x 1 , 0 2 x 1 , 0 3 x 1 , 0 4 x 1 , 0 6 = 1,04 = 1 0 4 %
131
Bảng 4.3
Năm
2000 2001 2002 2003 2004 2005
Chỉ t i ê u '-^ - ^
1/ Doanh thu 20.000 21.000 21.500 22.200 23.000 24.400
(triệu)
2/ Tốc độ phát
triển liên hoàn - 1,05 1,02 1,03 1,04 1,06
(lần)
3.2.3.2. S ố bình quân nhân g ia quyền
Khi các lượng biến (Xj) có các tần sô" (f;) khác nhau
ta có công thức sô" bình quân nhân gia quyền.
Mốt vẫn được xác định theo công thức trên (4.10)
nhưng việc xác định tổ chức mốt không căn cứ vào tần
số mà căn cứ vào mật độ phân phôi (tỷ sô" giữa tần sô" với
trị sô" khoảng cách tổ tương ứng). Mốt sẽ nằm ở tổ nào có
mật độ phân phối lớn nhất.
Bảng 4.6
NSLĐ (kg) Sô công Khoảng Mât
• đô•
Xi nhân cách tổ phân phôi
(người) fj h, (f,: hi)
200-250 40 50 0,8
600-650 25 50 0,5
135
Xác định Mốt?
170 + 180 t _c _
M e = ------ X------= 175 sp
2
Bảng 4.7
NSLĐ (kg) Sô cô n g n hân T ầ n số
(Xi) (người)(fị) tíc h lũy
200-250 20 20
250-300 40 60
300-350 70 130
400-450 50 280
450-500 30 310
Cộng 310
- - 130
Me = 350 + 50 - 2-------------=
. 362 ,5
100
Trong đó:
R: khoảng biến thiên
Xmax: lượng biến lớn nhất của tiêu thức nghiên cứu
R,= 80 - 40 = 40 kg
R2= 62 - 58 = 4 kg
143
Trong đó:
Ệ (X ,-X )’
ô2 = —------------- (không có quyền số) (4.16)
n
X, X,
íxf
(X .-X )2 xr X (Xr X ) 2
40 -20 400 58 -2 4
50 -10 100 59 -1 1
60 0 0 60 0 0
70 +10 100 61 +1 1
80 +20 400 62 +2 4
Cộng 1.000 10
145
Thay vào công thức (4.16) ta có:
2
ỏ; > ồ2
5, = y ị ỏ Ị = y /ĨÕ Õ = 14,14 sp
ô2 = = 4 Ĩ = 1,414 sp
HTXA: X A = 4 0 ta / h a; ô A = 1 0 t a
H TX B : x 7 = 3 0 t a / h a ; ÔB = 9 t a
VB= — xioo = 3 0 %
8 30
- Analyze/Descriptive Statistics/Frequencies
150
Chương 5
Yêu cầu quan trọng của điều tra chọn mẫu là các
tài liệu điều tra trên các đơn vị mẫu phải có khả năng
dùng để suy rộng thành các đặc điểm của toàn bộ tổng
thể nghiên cứu. Chính yêu cầu này là điểm phân biệt
điều tra chọn mẫu với các loại điều tra không toàn bộ
khác.
sô" đơn vị của tổng thể. Vì thê so với điều tra toàn bộ,
điểu tra chọn mẫu có các ưu điểm chủ yếu sau đây:
153
thường quyết định dùng điều tra chọn mẫu vì những ưu
điểm của nó.
- Khi tổng thể nghiên cứu không cho phép điều
tra toàn bộ đó là khi tổng thể quá lớn hoặc khó xác định
được (Ví dụ: điều tra về sô" trẻ em mối sinh, điều tra về ý
kiến khách hàng... hoặc điều tra vê' chất lượng sản
phẩm đồ hộp, thòi gian thắp sáng của bóng đèn...).
154
- Điều tra chọn mẫu được ứng dụng rộng rãi trong
nhiều ngành kinh tê quốc dân. Trong sản xuất công
nghiệp có thể dùng điều tra chọn mẫu để kiểm nghiệm
chất lượng sản phẩm, nghiên cứu tình hình năng suất
lao động và tiền lương công nhân, tình hình sử dụng
thòi gian lao động, thiết bị sản xuất và nguyên vật
liệu... Trong nông nghiệp có thể dùng điều tra chọn
mẫu để nghiên cứu tỉ suất nảy mầm của hạt giống, điều
tra năng suất, sản lượng cây trồng, chất lượng đàn gia
súc. Trong thương nghiệp điều tra chọn mẫu để kiểm
tra chất lượng hàng hoá, điều tra giá cả thị trường...
2.1.2. Chọn
• một
• lần và chọn
• n hiều lần
2.1.3. S a i s ổ c h ọ n m ẫ u
Trong điều tra chọn mẫu việc điều tra chỉ thực
hiện trên một sô" ít đơn vị, nhưng kết quả thu được lại
157
được tính toán suy rộng cho toàn bộ tổng thể nên có sai
số là điều khó tránh khỏi.
- Sai sô" chọn mẫu ngẫu nhiên xảy ra khi các đơn
vị tổng thể mẫu được chọn một cách ngẫu nhiên. Do đó
nói chung khái niệm “sai sô" chọn mẫu” thường được
hiểu là sai sô" ngẫu nhiên. Sai sô" này tồn tại ngay trong
bản thân cuộc điều tra chọn mẫu. Một cuộc điều tra
• I ề •
chọn
• mẫu dù có được• tổ chức khoa học,
• 7 chu đáo đến đâu,'
thì việc lấy ra một tổng thể mẫu có kết cấu giống như
kết cấu của tổng thể chung là điều khó thực hiện mà chỉ
cần có một sự khác nhau nhỏ về kết cấu giữa 2 tổng thể
này thì đã phát sinh sai sô" chọn mẫu.
Ví dụ: Từ một công ty có 4000 công nhân (tổng
thể chung) có thể chọn ngẫu nhiên 200 công nhân (tổng
thể mẫu). Tài liệu phân tổ theo năng suất lao động của
công nhân trong tổng thể chung và tổng thể mẫu như
sau:
158
Phân tổ công Số công nhân Sô công nhân
nhân theo của tổng thê của tổng thể
năng suất lao chung N; mẫu Iii
động (tân) (người) (người)
35-45 640 28
45-55 940 40
55-65 1500 84
65-75 820 40
75-85 100 8
4000 200
Từ tài liệu trên sau khi tính thêm trị sô" giữa của
năng suất lao động công nhân từng tổ ta tính được các
chỉ tiêu của tổng thể chung:
x = ^ = ™ = 5 7 (tấ „ )
£N j 4000
8 , . I ( X . - S ) ’ .Ni = 4gỌỌg
^T n , 4000
Các chỉ tiêu tương tự của tổng thể mẫu tính được
là:
_ 11.600_ _ Q ,
X= — = = 58 (tân)
In , 200
M: Sô" công nhân đạt NSLĐ tiên tiến của tổng thể
chung
161
T hứ h a i, sai số chọn mẫu phụ thuộc vào trình độ
đồng đều của tổng thể nghiên cứu, mà chỉ tièu thường
dùng để đánh giá là phương sai (52). Nếu (ỗ2 càng lớn
thì sai sô' chọn mẫu càng lớn và ngược lại.
2.1.4. S a i s ô b ìn h q u â n ch on m ẫ u và p h ạ m vi
s a i s ố ch ọ n m ẫ u
Cứ ứng với mỗi 1 cách chọn mẫu thì sô" lỉỢng mẫu
được hình thành là rất lớn (k mẫu). Nếu sô" đín vị tổng
thể mẫu cô" định, thì trên mỗi mẫu sẽ có một sai sô" chọn
mẫu. Như vậy sẽ có k giá trị sai sô' chọn mẫu. Từ đó cần
phải xác định một trị số sai sô" chọn mẫu đại ciện cho k
giá trị sai sô" chọn mẫu. Đó chính là sai số tình quân
chọn mẫu.
«
Sai sô" bình quân chọn mẫu được tính theo các
công thức sau đây:
P£
M i - ệ )
V n N n
Trong đó:
q = 1- p
163
Nhiêm
» vu• điểu Chon
• 1 lần Chon
• nhiểu lần
tra chon
• mẫu
- Để suy rộng
SBQ (chỉ tiêu
b ìn h qu ân)
Hx =•
&
- Để suy rộng
1 1
th eo tỉ lệ
*
(chỉ tiêu tương
~
đối)
Các công thức sai sô" bình quân chọn mẫu trên
đây biểu thị trị sô" bình quân của các sai sô chọn mẫu có
thể gặp khi ước lượng. Song do tiến hành chọn ngẫu
nhiên nên sai số này không phải là 1 trị số được xác
định trước về dấu (+ hoặc -), mà phản ánh một phạm vi
chênh lệch có thể nhiều hơn hoặc ít hơn so vói tham sô"
của tổng thể chung. Như vậy, có nghĩa là chênh lệch
giữ a X và X g i ữ a w v à p k h ô n g p h ả i h o à n t o à n b ằ n g |a
m à n ằ m t r o n g p h ạ m v i ± |a.
Vậy: Ax = t. nx
Ap = t. Hp
pệ x - x |<Ax)=(p(t)
t _ịI
Với <p(t) = je 2dt
V2n 0
166
Từ bảng trên ví dụ với t = 2 thì cp(t) = 0,9545.
Điều đó có nghĩa rằng: trong 10.000 mẫu thì có
9.545 mẫu có trị tuyệt đối của sai số chọn mẫu không
vượt quá 26, còn lại có 455 mẫu có trị tuyệt đối của sai
sô" chọn mẫu vượt quá 25.
2.1.5. Vân đ ề xác đinh sô đơn vị tổng t h ể m ẫu
Trước Jíhi tiến hành điều tra chọn mẫu phải xác
định
• sô" đơn vị • • s ố đơn vị •
mẫu cần điều tra. Xác định mẫu
cần điều tra phải đáp ứng 2 yêu cầu:
- Bảo đảm sai sô" chọn mẫu nhỏ nhất.
t2.p.q.N
N.Ap + t 2.p.q
Nhìn vào các công thức trên có thể thấy các nhân
tô" quyết định sồ" đơn vị mẫu cần điều tra là:
- Nếu như đây là lần đầu tiên thực hiện điều tra
chọn mẫu thì: hoặc có thể điều tra thử trong phạm vi
nhỏ để tính phương sai và tỉ lệ, hoặc có thể sử dụng
phương sai và tỉ lệ của nơi khác nếu nơi đó có đặc điểm
và điều kiện tương tự...
Theo quy tắc 30, nếu X ~ N(|i,ỗ2) thì hầu hết các
giá trị của X sai lệch với |a không quá 3 lần s.
Ta có R - (Xmax - Xmin)=:(|i+3ô)-(|i-3ô)=6ô
max
max X mịn g
6
169
H-3Ô H-2Ỗ ụ. n+lô ụ.+2ô H+3Ô
X - Ax < X < x + Ax
w - Ap < p < w + Ap
X - Ax < X < x + Ax
_ 20
Ta có: w = —— = 0,01 hay 1%
2000
w - Àp < p < w + Ap
1% - 0 ,2 % < p < 1% + 0 ,2 %
* P hương p h á p hệ s ố điều ch ỉn h
174
Kết quả điều tra
Hệ sô" điều chọn mẫu (trên cùng
chỉnh Kết quả điều tra Phv m vi>
toàn bộ
1250
- Chọn cả khối
Khi tính toán sai sô" trung bình chọn mẫu hoặc
ước lượng các tham sô" của tổng thể chung ta có thể sử
dụng các công thức đã trình bày ở phần trên.
n
Cứ sau một khoảng cách bằng d sẽ chọn 1 đơn vị.
Đơn vị đầu tiên của tổng thể mẫu sẽ được chọn theo
phương pháp chọn ngẫu nhiên đơn giản, đơn vị thứ 2
của tổng thể mẫu được chọn bằng cách lấy sô" thứ tự của
đơn vị mẫu thứ nhất cộng với d, cứ tiếp tục như vậy sẽ
xác định được danh sách các đơn vị của tổng thể mẫu.
Ví dụ: Một doanh nghiệp có 400 lao động cần
chọn 50 lao động để điều tra. Đầu tiên, sắp xếp tên 400
người theo thứ tự A, B, c... Sau đó tính khoảng cách d =
400: 50 = 8. Lập phiếu cho 8 người đầu tiên, rồi rút
ngẫu nhiên ra người đầu tiên của mẫu là người thứ 5,
thì người thứ 2 được chọn sẽ là người thứ 13, ngươi thứ
3 được chọn là người thứ 21... cứ tiếp tục như vậy cho
đến khi chọn đủ 50 người.
177
Trong thực tế có những hiện tượng mà các đơn vị
của nó đã được sắp xếp sẵn và trong suốt thời gian điều
tra vẫn không thay đổi vị trí. Với những hiện tượng này
có thể lợi dụng sự bô" trí sẵn để chọn theo khoảng cách
mà tính.
Ví dụ:
* Khi điều tra chọn
9 mẫu dân sô",7 cứ theo thứ
tự sô" nhà trên các đường phố mà chọn theo khoảng cách
đã tính.
Như vậy, phương pháp chọn máy móc thủ tục tiến
hành đơn giản hơn chọn ngẫu nhiên đơn thuần. Do việc
chọn theo từng khoảng cách nhất định nên số đơn vị
mẫu được phân phối đều trong tổng thể, tính chất đại
biểu của tổng thể mẫu được nâng cao. Chọn máy móc
được tiến hành theo cách chọn 1 lần và thường cho sai
sô" nhỏ hơn phương pháp chọn ngẫu nhiên đơn giản.
2.2.3. P h ư ơ n g p h á p chon p h â n loai (phân tổ)
Chọn phân loại là tiến hành chọn các đơn vị mẫu
khi tổng thể chung đã được phân chia thành các tổ theo
tiêu thức liên quan trực tiếp đến mục đích nghiên cứu.
Sau đó, phân chia sô" lượng các đơn vị tổng thể mẫu cho
từng tổ. Việc chọn các đơn vị từ các tổ được tiến hành
theo phương pháp chọn ngẫu nhiên.
- Suy rộng tỉ lệ
Chọn nhiều lần Chọn một lần
Sai sô" bình quân chọn mẫu trong phân loại theo
tỉ lệ không phụ thuộc vào phương sai chung mà phụ
thuộc vào các phương sai bình quân tổ. Vì vậy trong
trường hợp chọn phân loại theo tỉ lệ ta có các công thức
tính sau:
PiQi
n n N
sp.O-PilN,
P i Qi = P i ( l - P i ) =
SNj
Trong chọn tối ưu, sai sô" bình quân chọn mẫu
được tính theo công thức:
181
•Suy rộng bình quân:
Chọn nhiều lần Chọn 1 lần
_ 1 SVPiO-P,)N,
^ = N' Ví
Ô -Í-—
lU -U
r
s 2 = I(Xi - x )2
* r
+ Nếu sô" lượng đơn vị các khối không bằng nhau
g 2 __ S( xi - x ) 2n,
*~ In,
Sw;
wr =
£w:n
w =
r Sn,
n, n,.n2 n,.n2.n3
Trong đó:
|ij, ụ2 |i3: là sai sô" bình quân chọn mẫu ỏ từng bậc.
186
Bước 1: X ác định mục đích nghiên cứu
Xác định mục đích nghiên cứu là bước đầu tiên
quan trọng là tiền đề cho các giai đoạn sau được tiến
hành tốt.
Mẫu sau khi được điều tra, tiếp tục xử lý, tính
toán các đặc trưng mẫu, sau đó sử dụng các phương
pháp thống kê để suy rộng thành các đặc trứng của tổng
thể. Các phương pháp suy rộng đã được trình bày ở mục
2 .1.6 .
- Căn cứ vào tính chất phức tạp của tổng thể điều
tra, tổng thể càng phức tạp càng cần điều tra nhiều đơn
Ví dụ: Khi điều tra mức sông ngưòi nông dân nếu
các gia đình ở địa phương có nhiều nghề phụ khác nhau,
có mức sông chênh lệch nhau nhiều thì cần điều tra
nhiều hộ.
Khi suy rộng kết quả điều tra chọn mẫu phi ngẫu
nhiên người ta suy rộng trực tiếp không suy rộng có
phạm vi như trong chọn ngẫu nhiên. Vì các đơn vị điều
tra được lựa chọn từ các bộ phận khác nhau nên khi suy
rộng phải theo thứ tự từng bước và phải chú ý đến tỉ
trọng của mỗi bộ phận chiếm trong tổng thể.
193
Chương 6