Professional Documents
Culture Documents
A3- trình bày dữ liệu thống kê PDF
A3- trình bày dữ liệu thống kê PDF
1
1.Phân tổ thống kê
Phân tổ thống kê là căn cứ vào một
hay một số tiêu thức nào đó để tiến
Khái niệm hành phân chia các đơn vị của hiện
tượng nghiên cứu thành các tổ (hoặc
tiểu tổ) có tính chất khác nhau.
Ý nghĩa
Điều tra thống kê
Phân tổ thống
kê đóng vai trò
quan trọng Tổng hợp thống kê
trong cả 3 giai
đoạn của quá
trình nghiên Phân tích thống kê
cứu
3
NHIỆM VỤ PHÂN TỔ THỐNG KÊ
Nhiệm vụ
1 2 3
Thực hiện Biểu hiện kết Biểu diễn mối
phân chia các cấu của hiện liên hệ giữa
loại hình kinh tượng nghiên các tiêu thức
tế xã hội của cứu
hiện tượng
nghiên cứu
4
CÁC LOẠI PHÂN TỔ THỐNG KÊ
Các Bước
Xác định mục đích phân tổ
bước 1
tiến Bước 2
hành
Lựa chọn tiêu thức phân tổ
phân tổ
thống Bước 3
kê Xác định số tổ và khoảng cách tổ (nếu c
Bước 4
Yêu cầu
Dựa trên cơ sở
phân tích lý Căn cứ vào điều
luận để chọn ra kiện lịch sử cụ
tiêu thức bản thể của hiện
chất nhất, phù tượng nghiên
hợp với mục cứu
đích nghiên cứu.
7
Bước 3: Xác định số tổ và khoảng cách tổ (nếu có)
8
TRƯỜNG HỢP 1
10
Phân tổ có khoảng cách tổ
Tổ có khoảng cách tổ bao gồm một phạm vi lượng
biến với 2 giới hạn.
- Giới hạn dưới là lượng biến nhỏ nhất để hình thành tổ.
- Giới hạn trên là lượng biến lớn nhất mà nếu quá nó thì
chất đổi, dẫn đến hình thành một tổ mới.
11
Phân tổ có khoảng cách tổ
12
Ví dụ
Trong 1 doanh nghiệp có 100 công nhân, chia thành 6 tổ,
khoảng cách tổ bằng nhau theo tiêu thức tiền lương. Biết công
nhân có lương cao nhất là 3.200.000 đồng, công nhân có lương
thấp nhất là 2.000.000.
Yêu cầu:
- Xác định khoảng cách từng tổ;
- Xác định trị số giữa từng tổ;
- Xác định giới hạn trên của tổ lớn nhất, giới hạn dưới của tổ nhỏ
nhất;
- Lập bảng phân tổ thống kê với số liệu giả định.
13
Bước 4: Phân chia các đơn vị vào mỗi tổ
DÃY SỐ PHÂN PHỐI
14
PHƯƠNG PHÁP TỔNG HỢP THỐNG KÊ
PHÂN TỔ THỐNG KÊ (TIẾP)
15
Tác dụng của dãy số phân phối
16
Các loại dãy số phân phối
17
PHƯƠNG PHÁP TỔNG HỢP THỐNG KÊ
PHÂN TỔ THỐNG KÊ (TIẾP)
Biểu hiện i Xi
18
Dạng tổng quát của 1 dãy số lượng biến
Lượng biến Tần số Tần suất Tần số tích luỹ Mật độ
(xi) (fi) (di) (Si) phân phối
(mi)
x1 f1 d1 S1=f1 m1=f1/h1
19
Thành phần cơ bản của dãy số lượng biến
20
Tổng hợp dữ liệu thống kê
Bảng Biểu đồ
Biểu đồ
Bảng tần số Hình cột Histogram nhiều phân tán
Hình tròn thanh
giản phân (Bar Stem-Leaf ( Scatter
(Pie)
đơn bố có chart) (Multiple plot)
Boxplot
KCT Bar Chart)
21
2. BẢNG THỐNG KÊ
Khái • “ Bảng thống kê là một hình thức biểu hiện các tài liệu
niệm thống kê một cách có hệ thống, hợp lý và rõ ràng, nhằm
nêu lên các đặc trưng về mặt lượng của hiện tượng nghiên
cứu”
• Có tác dụng quan trọng trong mọi công tác
Tác nghiên cứu KT-XH
dụng • Việc chứng minh vấn đề sẽ trở nên rất sinh động
và có sức thuyết phục
• Tiêu đề của bảng
Cấu • Nội dung bảng
thành • Phần giải thích
23
Kết cấu bảng thống kê
Phần giải
thích
Các chỉ tiêu giải thích
(Tên cột)
Phần chủ đề
(a) (1) (2) (…) (n)
Tên chủ đề
(Tên hàng)
Cộng
24
Bảng thống kê
Bảng phân
Bảng tần số phân bố tổ chéo
Phạm vi áp dụng
26
Xây dựng bảng giản đơn bằng
SPSS
VD: Có số liệu mẫu điều tra 30 lập trình viên làm
việc tại một số công ty tin học trên địa bàn Hà nội.
Số liệu điều tra gồm mức lương, giới tính và số năm
làm việc.
Yêu cầu:
1/ Có bao nhiêu lập trình viên là nam, chiếm bao
nhiêu phần trăm trong mẫu nghiên cứu?
2/ Hãy xác định số lượng lập trình viên tương ứng
với số năm kinh nghiệm của họ trong mẫu điều tra?
3/ Mức lương phổ biến của các lập trình viên ?
- 27
Ví dụ 1:
Mức lương số năm kinh Mức lương số năm kinh
(nghìn đ) Giới tính nghiệm (năm) (nghìn đ) Giới tính nghiệm (năm)
15000 nam 3 15500 nam 3
16000 nữ 4 15000 nam 3
17000 nam 5 18500 nữ 2
21000 nam 6 18000 nữ 2
18000 nam 2 22000 nữ 4
16500 nam 3 19000 nam 2
16000 nam 4 18000 nam 3
15000 nữ 5 18000 nữ 3
18000 nữ 6 17500 nam 4
16500 nữ 2 20500 nam 5
17000 nam 4 18500 nữ 6
14000 nam 5 16000 nam 2
17000 nam 6 19000 nam 2
21000 nam 2 18000 nam 3
17000 nam 2 18000 nữ 2 28
Dữ liệu đơn biến- Bảng tần số giản
đơn
• TH1: Xây dựng bảng tần số giản đơn cho biến định tính
• Trình tự thực hiện:
+ Mã hoá biến định tính bằng thang đo định
tính phù hợp
+ Xây dựng bảng tần số giản đơn
29
Dữ liệu đơn biến- Bảng tần số giản đơn
TH1: Xây dựng bảng tần số giản đơn cho biến định tính
• VD: Bảng tần số cho biến giới tính
Gioitinh
Cumulative
Frequency Percent Valid Percent Percent
Valid nam 20 64.5 66.7 66.7
nu 10 32.3 33.3 100.0
Total
30 96.8 100.0
Missing System
1 3.2
Total
31 100.0
31
Dữ liệu đơn biến - Bảng tần số có khoảng
cách tổ
• Phạm vi áp dụng: Biến định lượng liên tục hoặc
rời rạc có lượng biến biến thiên nhiều
• Trình tự thực hiện:
➢ Mã hoá lại biến định lượng liên tục bằng cách tạo
ra một biến mới và xác định các khoảng giá trị
tương ứng cho biến mới
(Transform -> Recode into Different Variables)
➢ Gán các giá trị cho biến vừa tạo (tuỳ theo khoảng
cách tổ muốn chia trong cửa sổ Variable View, chọn
View)
➢ Xây dựng bảng tần số có khoảng cách tổ cho
biến vừa tạo
32
Dữ liệu đơn biến- Bảng tần số có
khoảng cách tổ
Bước
1
Bước 2 Bước 3
33
Dữ liệu đơn biến- Bảng tần số có
khoảng cách tổ
• VD: Mức lương của lập trình viên được chia
thành 4 tổ với khoảngLuong
cách tổ bằng nhau
Frequency Percent Valid Percent Cumulative
Percent
34
Tổng hợp dữ liệu thống kê
36
DỮ LIỆU ĐA BIẾN- BẢNG PHÂN TỔ CHÉO
• TH1: Bảng phân tổ chéo giữa 2 biến định tính hoặc 2 biến định
lượng rời rạc ít giá trị
Ví dụ: Bảng tần số chéo giữa 2 biến giớiGioitinh
tính và số năm kinh nghiệm
nam nu
2 6 4
3 6 1
Namkinh 4 3 2
nghiem
5 3 1
6 2 2
37
Dữ liệu đa biến- Bảng phân tổ chéo
Bảng – Giá trị các loại hình đầu tư của nhà đầu tư 38
Thực hành SPSS xây dựng bảng phân
tổ chéo
• Analyze-> Tables -> Custom Tables
• Trong Hộp Custom Tables: kéo các biến cần biểu diễn mối liên hệ vào dòng và cột tương ứng
• Trong ô Statistics: Tùy chọn các thống kê phù hợp: count, sum....
39
3. Đồ thị thống kê
40
Tác dụng của đồ thị
41
Các thành phần của đồ thị thống kê
Các thành phần của dữ liệu dùng để trình bày dữ liệu: các
thanh, đường thẳng, các khu vực hoặc các điểm.
Các thành phần hỗ trợ trong việc tìm hiểu dữ liệu: tiêu
đề, ghi chú, nhãn dữ liệu, các đường lưới, chú thích và
nguồn dữ liệu.
Các thành phần dùng để trang trí không liên quan đến dữ
liệu.
42
Nguyên tắc trình bày đồ thị
43
Các loại đồ thị
+ Bar: Đồ thị thanh/cột (biểu diễn phân phối của dữ liệu)
+ Line: Đồ thị đường gấp khúc (biểu diễn xu hướng)
+ Area: Đồ thị diện tích
+ Pie: Đồ thị hình tròn (biểu diễn cơ cấu)
+ Boxplot: Đồ thị hộp (biểu diễn phân phối, xác định
Outliers)
+ Population Pyramid: Tháp dân số (Đặc trưng dân số
theo tuổi và giới tính)
+ Scatter/Dot: Đồ thị điểm (biểu diễn mối liên hệ giữa các
biến)
+ Histogram: Đồ thị tần số (biểu diễn phân phối của dữ
liệu)
44
ĐỒ THỊ THỐNG KÊ
Dữ liệu đơn
Dữ liệu đa biến
biến
biến định 6%
- Biểu hiện
kết cấu của Điện thoại các
loại & linh
Hàng thủy sản
dữ liệu 8% kiện
17%
Giày dép
10%
Dầu thô
Máy vi tính sản 11%
phẩm điện…
Hình 2.1: Tỷ trọng của 10 nhóm hàng xuất khẩu chủ lực
Hình 2.2: Danh mục đầu tư của nhà đầu tư A năm 2017
47
Biểu đồ Pareto
- Thường sử Các loại lỗi sản phẩm
dụng cho 60% 100%
thị, đồ thị
30%
lũy (Ogive)
Mối hàn xấu Lỗi về sơn Lỗi về điện Thiếu chi tiết Nứt Căn chỉnh kém
48
Đồ thị đường
- Sử dụng Doanh thu doanh nghiệp A giai đoạn
cho biến 2010-2016
định lượng (tỷ đồng)
rời rạc, 250
thường
dùng cho 200
dãy số theo
thời gian 150
100
50
0
2009 2010 2011 2012 2013 2014 2015 2016 2017
49
Dữ liệu đơn biến- Biểu đồ Histogram
- Sử dụng
cho biến
định lượng
- Chỉ ra chỗ
gãy khúc
trong bộ dữ
liệu
- Nêu lên sự
phân phối
của dãy số
50
Polygons
- Sử dụng cho Dữ liệu được sắp xếp theo thứ tự:
biến định 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41,
lượng 43, 44, 46, 53, 58
Tần số
- Nối các điểm
giữa của
Histogram và 7
nối xuống trục 6
hoành gọi là đa 5
giác tần số 4
(polygons) 3
2
1
0
5 15 25 35 45 55 More
Trị số giữa 51
Ogive
- Sử dụng cho Dữ liệu được sắp xếp theo thứ tự:
biến định 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41,
lượng 43, 44, 46, 53, 58
- Giá trị cao
Ogive
nhất của trục
tung là tổng tần
số (đa giác tần 120
số tích lũy) và 100
là 100% (đa 80
giác tần suất 60
tích lũy)
40
20
0
10 20 30 40 50 60
Giới hạn tổ 52
Sơ đồ thân - lá (Stem and leaf plot)
- Sử dụng cho
biến định
lượng, được
thể hiện ít nhất
2 chữ số
- Nêu lên phân
phối của dãy
số
- Có thể xác
định Mốt và
lượng biến đột
xuất
53
Sơ đồ hộp (Box plot)
Sơ đồ hộp so sánh mức lương khởi điểm
- Sử dụng cho biến của nhân viên theo giới tính
định lượng
- Nêu lên phân phối của
dãy số
- Nhận biết sự phân tán
của dữ liệu trên cơ sở
độ dài của hộp
(khoảng tứ phân vị
IQR) và độ dài của sơ
đồ hộp
- Nhận biết lượng biến
đột xuất và nghi ngờ
là đột xuất
- So sánh 2 hay nhiều
bộ dữ liệu với cùng 1
thước đo
54
Biểu đồ nhiều thanh (Multiple bar
chart)
- Sử dụng cho
dữ liệu đa
biến
55
Biểu đồ phân tán (Scatter plots)
- Sử dụng 9,000
cho dữ liệu
8,000
57
Thực hành SPSS
Analyze > Descriptive Statistics > Explore...
Lựa chọn Statistics...
Descriptives: để hiện thị
các tham số mô tả
M-estimators: Hiễn thị giá
trị trung bình theo trọng
số (gán các trọng số khác
nhau cho các giá trị quan
sát tùy theo khoảng cách
của nó đến giá trị trung
bình, càng xa trọng số
càng nhỏ)
Outliers: hiện thị 5 quan
sát nhỏ nhất và 5 quan sát
lớn nhất
Percentiles: để hiện thị
các phân vị thứ 5, 10, 25, 58
Thực hành SPSS
Analyze > Descriptive Statistics > Explore...
Lựa chọn Plots...
59
Thực hành SPSS
Analyze > Descriptive Statistics > Explore...
Exclude cases listwise chỉ những quan sát có ý nghĩa ở tất cả các
biến được đưa vào phân tích
Exclude cases pairwise những quan sát có ý nghĩa ở bất kỳ biến nào
đó được đưa vào phân tích
60
Thực hành SPSS
61
Thực hành SPSS
Đồ thị thanh (Bar) Graphs > Lagacy > Dialogs > Bar...
63
3.1. Khái niệm
3.
Phân tích 3.2. Ý nghĩa
thống kê
64
Quá trình nghiên cứu thống kê
Phân tích thống kê
Là việc nêu lên một cách tổng hợp bản
Khái chất và tính quy luật của các hiện tượng
niệm và quá trình KTXH số lớn trong điều kiện
lịch sử cụ thể qua các biểu hiện về lượng
và qua tính toán các mức độ trong tương
lai.
- Giúp thấy rõ bản chất, quy luật phát triển
Ý nghĩa của hiện tượng;
- Giúp thấy rõ mối liên hệ nội tại của các
bộ phận.
- Trên cơ sở phân tích lý luận xã hội;
Yêu cầu - Căn cứ sự kiện thực tế;
- Sử dụng những phương pháp phân tích
thống kê phù hợp.
65