Professional Documents
Culture Documents
Slide Chuong 3 - NLTK
Slide Chuong 3 - NLTK
PHÂN TỔ THỐNG KÊ
Phân tổ thống kê
số hộ gđ Số con
113 0
175 1
432 2
85 3
15 4
2.3 . Phương pháp xác định cụ thể
2.3.2 Đối với tiêu thức số lượng:
Trường hợp phức tạp: lượng biến biến đổi liên tục: nghĩa là sự
chênh lệch về lượng giữa các đơn vị tổng thể rất là lớn
Rơi vào trường hợp này ta thấy lại có 2 trường hợp hoặc lượng biến
rời rạc hoặc lượng biến liên tục.
+ Thứ nhất lượng biến rời rạc nhưng phạm vi biến thiên rộng ví dụ:
tuổi, nhân khẩu (khi điều tra dân số chỉ có thể khai 1t, 2t, 3t chứ k
ai khai 1,5t…do đó tuổi là lượng biến rời rạc).
+ Hoặc ở trường hợp này nhưng lượng biến liên tục. lượng biến liên
tục không thể đếm đc, lấp kín 1 khoảng trên trục số.
Khi đó mỗi 1 lượng biến biến động không thể hình thành 1 tổ
=> nguyên lý chung để tiến hành phân tổ là dựa vào mối quan hệ biện
chứng giữa lượng và chất “khi lượng tích lũy đến một giới hạn nào đó
chất sẽ thay đổi” Gặp trường hợp này chúng ta phải xem xét lượng tích
lũy đến mức độ nào mới dẫn đến sự thay đổi về chất và cho phép hình
thành một tổ mới. Khi đó một tổ sẽ bao gồm hai giới hạn gọi là một
phạm vi lượng biến:
- Giới hạn dưới (xmin): Là lượng biến nhỏ nhất của mỗi tổ (vượt qua giơi
hạn đó sẽ hình thành tổ mới).
- Giới hạn trên (xmax): Là lượng biến lớn nhất của mỗi tổ (vượt qua giới
hạn đó sẽ hình thành tổ mới).
Trị số chênh lệch giữa giới hạn trên và giới hạn dưới gọi là khoảng cách
tổ (h)
h = xmax - xmin
Việc phân tổ như vậy ta gọi là phân tổ có khoảng cách tổ.
2.3 . Phương pháp xác định cụ thể
2.3.1. Đối với tiêu thức số lượng
b. Trường hợp phức tạp:
VD: Phân chia số dân của địa phương A theo độ tuổi (từ 0
đến >100 tuổi)
- Nếu căn cứ vào tuổi lao động ta có:
Độ tuổi Số người
0 - > dưới 16
16 -> 60 (62)
trên 60 (62)
2.3 . Phương pháp xác định cụ thể
2.3.1. Đối với tiêu thức số lượng
b. Trường hợp phức tạp:
Nếu căn cứ vào tính chất tâm lí của từng lứa tuổi, ta có:
Độ tuổi Số người
0->3
3 -> 7
7 -> 12
…
>100
2.3 . Phương pháp xác định cụ thể
2.3.1. Đối với tiêu thức số lượng
b. Trường hợp phức tạp:
Chú ý: * Để xác định ranh giới giữa các tổ theo Tiêu thức ta nghiên cứu có 2 dạng:
- Thứ nhất: trị số của tiêu thức phân tổ biến thiên không liên tục (lượng biến rời rạc): giới
hạn trên của tổ đứng trước và giới hạn dưới của tổ đứng sau không trùng nhau, giới hạn
dưới của một tổ đứng sau là trị số sát với giới hạn trên của tổ đứng liền trước. Ví dụ như
phân chia dân số địa phương A theo độ tuổi lao động ở trên.
- Thứ hai: trị số của tiêu thức phân tổ biến thiên liên tục thì giới hạn dưới của một tổ và
giới hạn trên của tổ kề trước đó trùng nhau. Ví dụ phân chia dân số địa phương A theo tâm
lý từng lứa tuổi như trên. Theo quy ước nếu đơn vị nào có trị số tiêu thức trùng với giới
hạn trên của một tổ thì đơn vị đó được xếp vào tổ kế tiếp (ví dụ phân loại chiều cao của
sinh viên: 1,50-1,55m; 1,55-1,60m; 1,60-1,65m...).
* Khoảng cách tổ đều hay không đều còn tùy vào từng trường hợp nghiên cứu cụ thể do
sự phân bố về lượng trong tổng thể không đồng đều, như vậy gọi là phân tổ có khoảng
cách tổ không đều nhau, và trên thực tế các hiên tượng thường phân tổ không đều đặn.
2.3 . Phương pháp xác định cụ thể
2.3.1. Đối với tiêu thức số lượng
b. Trường hợp phức tạp:
Tuy nhiên đối với cá hiện tượng phân bố tương đối đồng nhất và lượng biến của các đơn vị
phân tán đều khi đó ta phân tổ với khoảng cách tổ đều. Trị số khoảng cách tổ được tính theo
công thức:
Xmax- Xmin
h = n
* Phân tổ mở là hình thức phân tổ mà tổ đầu tiên không có giới hạn dưới, tổ
cuối cùng không có giới hạn trên. Chẳng hạn ở trên đã chia tổ thì người trên
1,8m và dưới 1,4m sẽ rơi vào tổ mở.
- Ý nghĩa của việc phân tổ mở: tránh hình thành quá nhiều tổ. Vì có một số
lượng biến bất thường quá nhỏ hoặc quá lớn sẽ đc xếp vào các tổ mở hay ta
gọi là thu nạp được đầy đủ những lượng biến bất thường)
- quy ước khi tính toán: khoảng cách của tổ mở đúng bằng khoảng cách của tổ
gần nó nhất.
3. Dãy số phân phối
3.1. Khái niệm:
3.2. Các loại dãy số phân phối
3.3. Tác dụng của dãy số phân phối
3. Dãy số phân phối
3.1. Khái niệm:
Là dãy số biểu hiện số lượng các đơn vị trong tổng thể được
phân chia vào từng tổ theo tiêu thức nhất định.
3.2. Các loại dãy số phân phối
• Dãy số phân phối thuộc tính: Biểu hiện kết quả của quá
trình phân tổ thống kê theo tiêu thức thuộc tính.
VD: Phân chia tổng số dân của địa phương Y theo giới tính.
Giới tính Số người
Nam 1.152.413
Nữ 1.522.132
2.674.545
3. Dãy số phân phối
3.2. Các loại dãy số phân phối
• Dãy số phân phối theo tiêu thức số
lượng: Biểu hiện kết quả của quá trình
phân tổ thống kê theo tiêu thức số lượng
3. Dãy số phân phối
3.2. Các loại dãy số phân phối
• Dãy số phân phối theo tiêu thức số lượng: Biểu hiện kết
quả của quá trình phân tổ thống kê theo tiêu thức số lượng
Một dãy số phân phối lượng biến bao gồm 2 thành phần:
Lượng biến (xi): Là biểu hiện cụ thể về lượng theo một
tiêu thức số lượng nào đó.
Tần số (fi): là số đơn vị của tổng thể được phân phối vào
mỗi tổ.
Tần số được biểu hiện bằng số tuyệt đối. Nếu nó được biểu
hiện bằng số tương đối thì đó là tần suất. Tần suất kí hiệu
là di, cho biết kết cấu tổng thể theo tiêu thức lượng biến.
3. Dãy số phân phối
3.3. Tác dụng của dãy số phân phối
- Dùng để khảo sát tình hình phân bố các đơn vị của
tổng thể, từ đó xác định được kết cấu của tổng thể.
- Dùng để tính toán các chỉ tiêu phản ánh đặc trưng của
từng tổ và tổng thể.
4. Chỉ tiêu giải thích
4.1. Khái niệm
Là những chỉ tiêu làm sáng rõ thêm đặc trưng của từng
tổ cũng như của toàn bộ tổng thể.
4.2 Tác dụng:
- Giúp ta xác định rõ đặc trưng của từng tổ cũng như
của toàn bộ tổng thể.
- Là căn cứ để so sánh giữa các tổ với nhau.
Là căn cứ tính toán các chỉ tiêu phân tích khác.
4.3 Cơ sở khoa học xác định các chỉ tiêu giải thích