You are on page 1of 32

Thống kê Thống kê

ứng dụng ứng dụng

NTMộngNgọc NTMộngNgọc
Tài liệu học tập
Tổng quan về
• Giáo trình chính:
thống kê • Phạm Văn Chững, Lê thanh Hoa và Nguyễn Đình Uông
Thu thập dữ
liệu
[2016], Giáo trình Thống kê ứng dụng, NXB ĐHQG tp
Chương 1 Thống kê mô tả Trình bày dữ
HCM.
liệu
Tóm tắt dữ liệu định
• Tài liệu tham khảo:
tính: phương pháp
bảng và đồ thị • Hoàng Trọng, Chu Nguyễn Mộng Ngọc [2011], Thống kê
Tóm tắt dữ liệu định
lượng: phương pháp
bảng và đồ thị
ứng dụng trong kinh tế xã hội, NXB Lao động xã hội.
Phương pháp nhánh • Hoàng Trọng, Chu Nguyễn Mộng Ngọc [2009], “Bài tập và

bài giải - Thống kê ứng dụng trong Kinh tế - Xã hội”,
Nguyễn Thị Mộng Ngọc Tóm tắt dữ
liệu bằng các NXB Thống Kê.
University of Science, VNU - HCM đại lượng
• Trần Bá Nhẫn, Đinh Thái Hoàng, “Thống kê ứng dụng
thống kê mô
ngtmngoc@hcmus.edu.vn tả
trong quản trị, kinh doanh và nghiên cứu kinh tế” [2006],
Các đặc trưng đo
lường khuynh hướng
tập trung
NXB Thống kê.
Các đặc trưng đo
lường khuynh hướng
• Excel ứng dụng trong kinh tế, Chương trình giảng dạy kinh
phân tán
Khảo sát hình dáng
tế Fulbright.
phân phối của dữ liệu
Phân tích dữ liệu
• Doughlas A. Lind, William G. Marchal, Samuel A. Wathen,
thăm dò
Basic Statistics for Business and Economics [2008], Mc
Graw Hill, Singapore.

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Giới thiệu môn học NTMộngNgọc
Ứng dụng của thống kê:
Tổng quan về Tổng quan về
thống kê thống kê

Thu thập dữ • Khái niệm: Thống kê là một nhánh của toán Thu thập dữ
liệu liệu

Trình bày dữ học liên quan đến việc thu thập, trình bày và Trình bày dữ
liệu liệu
Tóm tắt dữ liệu định
tính: phương pháp
phân tích dữ liệu. Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định
lượng: phương pháp
• Quá trình nghiên cứu thống kê trải qua 3 giai Tóm tắt dữ liệu định
lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh

đoạn có quan hệ chặt chẽ và mật thiết với Phương pháp nhánh

Tóm tắt dữ
liệu bằng các
nhau, trong đó giai đoạn trước làm tiên đề để Tóm tắt dữ
liệu bằng các
đại lượng
thống kê mô
thực hiện giai đoạn sau: đại lượng
thống kê mô
tả • Giai đoạn điều tra thống kê: ghi chép, thu thập tài liệu tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng thống kê. lường khuynh hướng
tập trung tập trung
Các đặc trưng đo
• Giai đoạn tổng hợp và trình bày kết quả điều tra thu thập Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán được. phân tán
Khảo sát hình dáng
phân phối của dữ liệu • Giai đoạn phân tích và dự báo thống kê. Khảo sát hình dáng
phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc Ứng dụng của thống kê trong kinh doanh NTMộngNgọc


Tổng quan về thống kê
Tổng quan về
và kinh tế: Tổng quan về
thống kê thống kê
• Kế toán: Công ty kiểm toán sử dụng các thủ tục lấy mẫu
Thu thập dữ
liệu thống kê khi tiến hành kiểm toán cho khách hàng. Thu thập dữ
liệu Hai lĩnh vực thống kê:
Trình bày dữ
liệu
• Tài chính: Chuyên gia tài chính sử dụng một loạt các thông tin Trình bày dữ
liệu
• Thống kê mô tả
Tóm tắt dữ liệu định
tính: phương pháp
thống kê để hướng dẫn khuyến nghị đầu tư. Tóm tắt dữ liệu định
tính: phương pháp
• Thu thập số liệu
bảng và đồ thị
• Marketing: Máy quét điện tử tại quầy tính tiền bán lẻ thu thấp
bảng và đồ thị
• Tính toán các đặc trưng đo lường
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp • Mô tả, trình bày dữ liệu, ...
bảng và đồ thị
dữ liệu cho một loạt các ứng dụng nghiên cứu thị trường. bảng và đồ thị
Phương pháp nhánh

Phương pháp nhánh
lá nhằm mô tả đối tượng nghiên cứu.
• Sản xuất: Chất lượng được chú trọng đã làm cho kiểm soát
Tóm tắt dữ
liệu bằng các chất lương trở thành một ứng dụng quan trọng của thống kê
Tóm tắt dữ
liệu bằng các
• Thống kê suy diễn
đại lượng
thống kê mô trong sản xuất. Có nhiều biểu đồ kiểm soát chất lượng thống kê
đại lượng
thống kê mô
• Ước lượng, kiểm định thống kê
tả
được sử dụng để giám sát đầu ra của một quấ trình sản xuất. tả • Phân tích mối liên hệ
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng • Dự đoán, ... .
tập trung
• Kinh tế học: Các nhà kinh tế sử dụng một loạt thông tin tập trung
Các đặc trưng đo Các đặc trưng đo Mô hình hóa trên các dữ liệu quan trắc để đưa ra các suy
lường khuynh hướng
phân tán thống kê để đưa ra các dự báo về tương lai của nền kinh tế lường khuynh hướng
phân tán
diễn về đối tượng được nghiên cứu.
Khảo sát hình dáng
phân phối của dữ liệu hoặc một khía cạnh nào đó của nền kinh tế. Khảo sát hình dáng
phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Một số khái niệm thường dùng NTMộngNgọc
Một số khái niệm thường dùng
Tổng quan về
trong thống kê Tổng quan về
trong thống kê (tt)
thống kê thống kê

Thu thập dữ
liệu • Thống kê: khoa học và nghệ thuật thu thập, phân
Thu thập dữ
liệu
• Dữ liệu: những sự kiện và con số được thu
Trình bày dữ
liệu
tích, trình bày và diễn giải dữ liệu. Trình bày dữ
liệu
thập, phân tích và tổng hợp để trình bày và
Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
• Tổng thể: tập hợp các đơn vị/phần tử cần phân Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
giải thích.
Tóm tắt dữ liệu định
lượng: phương pháp
tích/nghiên cứu. Tóm tắt dữ liệu định
lượng: phương pháp • Tập dữ liệu: tất cả các dữ liệu thu thập trong
bảng và đồ thị bảng và đồ thị
• Đơn vị tổng thể: phần tử nhỏ nhất tạo thành tổng thể.
Phương pháp nhánh

Phương pháp nhánh

nghiên cứu cụ thể.
Tóm tắt dữ • Mẫu: một phần của tổng thể được chọn ra để thu Tóm tắt dữ
liệu bằng các
đại lượng thập thông tin.
liệu bằng các
đại lượng
• Biến: khái niệm dùng để chỉ các đặc điểm
thống kê mô thống kê mô
tả
Các đặc trưng đo Ví dụ: Để tìm hiểu điểm trung bình môn Thống kê của sinh
tả
Các đặc trưng đo
của đơn vị tổng thể mà ta nghiên cứu.
lường khuynh hướng lường khuynh hướng
tập trung
Các đặc trưng đo viên trường đại học, người ta xét bảng điểm của 250 sinh
tập trung
Các đặc trưng đo
Ví dụ: Để nghiên cứu sinh viên trường đại học, ta
lường khuynh hướng lường khuynh hướng
phân tán
Khảo sát hình dáng viên được chọn ngẫu nhiên. Hãy chỉ ra tổng thể, đơn vị
phân tán
Khảo sát hình dáng
cần nghiên cứu các biến như: giới tính, tuổi, dân
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu
thăm dò tổng thể và mẫu.
Phân tích dữ liệu
thăm dò tộc, ngành học, số tiền chi tiêu trung bình hàng
tháng, ...
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Một số khái niệm thường dùng NTMộngNgọc
Một số khái niệm thường dùng
Tổng quan về
trong thống kê (tt) Tổng quan về
trong thống kê (tt)
thống kê thống kê
• Tiêu thức, tiêu chí, biến: đặc điểm của đơn vị
Thu thập dữ
liệu
Thu thập dữ
liệu • Quan sát (quan trắc): Tập hợp tất cả các dữ
Trình bày dữ
tổng thể dùng để quan sát hay thu thập dữ Trình bày dữ
liệu liệu liệu liệu thu thập được của một đơn vị tổng thể
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp • Biến định tính: đặc điểm biểu hiện không phải là số tính: phương pháp
hay mẫu.
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định • Biến định lượng: đặc điểm biểu hiện là các trị số có thể rời Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị
Phương pháp nhánh
rạc hay liên tục bảng và đồ thị
Phương pháp nhánh
Ví dụ:
lá lá
Trong ví dụ trước:
Tóm tắt dữ Tóm tắt dữ • Quan sát 1: giới tính: nam, tuổi: 19, dân tộc:
liệu bằng các • biến định tính: giới tính, dân tộc , ngành học, liệu bằng các
đại lượng
thống kê mô
• biến định lượng: tuổi, số tiền chi tiêu trung bình hàng đại lượng
thống kê mô
Kinh , ngành học: 401, số tiền chi tiêu trung
tả tháng. tả
bình hàng tháng: 2.5 triệu đồng.
Các đặc trưng đo Các đặc trưng đo

• Chỉ tiêu: trị số phản ảnh đặc điểm/tính chất


lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo • Quan sát 1: giới tính: nữ, tuổi: 21, dân tộc:
lường khuynh hướng
phân tán trong điều kiện thời gian và không gian xác lường khuynh hướng
phân tán
Khảo sát hình dáng
phân phối của dữ liệu định Khảo sát hình dáng
phân phối của dữ liệu Tày , ngành học: 402, số tiền chi tiêu trung
Phân tích dữ liệu Phân tích dữ liệu
thăm dò
• Chỉ tiêu khối lượng: biểu hiện quy mô khối lượng thăm dò
bình hàng tháng: 2 triệu đồng.
• Chỉ tiêu chất lượng: biểu hiện tính chất , mức độ phổ biến

Thống kê
ứng dụng
Thống kê
ứng dụng
Phân loại dữ liệu:
NTMộngNgọc
Các loại thang đo NTMộngNgọc • Dữ liệu định tính: thu thập từ thang đo
Tổng quan về
thống kê
Tổng quan về
thống kê
danh nghĩa và thứ bậc ⇒ không tính được trị
Thu thập dữ Thu thập dữ trung bình.
liệu liệu
• Dữ liệu định lượng: thu thập từ thang đo
Trình bày dữ
liệu • Thang đo danh nghĩa: dùng để phân loại Trình bày dữ
liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định khoảng cách và tỷ lệ ⇒ tính được trị trung
tính: phương pháp
bảng và đồ thị • Thang đo thứ bậc: phản ánh sự hơn kém tính: phương pháp
bảng và đồ thị
Tóm tắt dữ liệu định
lượng: phương pháp
Tóm tắt dữ liệu định
lượng: phương pháp
bình.
bảng và đồ thị
Phương pháp nhánh
• Thang đo khoảng cách: phản ánh mức độ bảng và đồ thị
Phương pháp nhánh
lá lá

Tóm tắt dữ hơn kém Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng
thống kê mô • Thang đo tỷ lệ: phản ánh mức độ hơn kém và đại lượng
thống kê mô
tả tả
Các đặc trưng đo
lường khuynh hướng
so sánh tỷ lệ Các đặc trưng đo
lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc NTMộngNgọc
Ví dụ: Dữ liệu thời điểm
Tổng quan về Tổng quan về
thống kê thống kê

Thu thập dữ Thu thập dữ


liệu liệu

Trình bày dữ
liệu
• Dữ liệu thời điểm: dữ liệu được thu thập ở Trình bày dữ
liệu
Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
cùng hoặc xấp xỉ vào cùng một thời điểm. Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị

• Dữ liệu chuỗi thời gian: dữ liệu thu thập


Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh

được qua nhiều giai đoạn thời gian. lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung
Các đặc trưng đo
tập trung
Các đặc trưng đo
Dữ liệu trong bảng 1.1 là dữ liệu thời điểm vì họ
lường khuynh hướng lường khuynh hướng
phân tán
Khảo sát hình dáng
phân phối của dữ liệu
phân tán
Khảo sát hình dáng
phân phối của dữ liệu
mô tả 5 biến của 25 công ty trong danh sách SP
Phân tích dữ liệu
thăm dò
Phân tích dữ liệu
thăm dò 500 tại cùng một thời điểm.

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Ví dụ: Dữ liệu chuỗi thời gian NTMộngNgọc
Các kỹ thuật lấy mẫu
Tổng quan về Tổng quan về
thống kê thống kê

Thu thập dữ Thu thập dữ


liệu liệu

Trình bày dữ Trình bày dữ


liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung
Các đặc trưng đo
Dữ liệu trong Hình 1.1 cho thấy giá trung bình tập trung
Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán
Khảo sát hình dáng
phân phối của dữ liệu
của mỗi gallon xăng không chì tại Mỹ từ tháng phân tán
Khảo sát hình dáng
phân phối của dữ liệu
Phân tích dữ liệu
thăm dò 3/2006 đến tháng 5/2009. Phân tích dữ liệu
thăm dò
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Thu thập dữ liệu NTMộngNgọc Dữ liệu thứ cấp và dữ liệu sơ cấp
Tổng quan về Tổng quan về
thống kê thống kê

Thu thập dữ Thu thập dữ


liệu liệu

Trình bày dữ Trình bày dữ


liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng Các phương pháp thu thập dữ liệu sơ cấp
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
• Thực nghiệm,
lường khuynh hướng lường khuynh hướng
tập trung
Các đặc trưng đo
tập trung
Các đặc trưng đo
• Thư hỏi,
lường khuynh hướng lường khuynh hướng
phân tán
Khảo sát hình dáng
phân tán
Khảo sát hình dáng
• Khảo sát qua điện thoại,
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu
thăm dò
Phân tích dữ liệu
thăm dò
• Phỏng vấn cá nhân,
• Quan sát trực tiếp.

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Thu thập dữ liệu cần : NTMộngNgọc
Bảng câu hỏi điều tra:
Tổng quan về Tổng quan về
thống kê thống kê

Thu thập dữ Thu thập dữ


liệu liệu

Trình bày dữ Trình bày dữ


liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Kỹ thuật thiết kế bảng câu hỏi NTMộngNgọc
Kỹ thuật thiết kế bảng câu hỏi
Tổng quan về
điều tra Tổng quan về
điều tra
thống kê thống kê

Thu thập dữ Thu thập dữ


liệu liệu

Trình bày dữ Trình bày dữ


liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Kỹ thuật thiết kế bảng câu hỏi NTMộngNgọc
Các thang đo
Tổng quan về
điều tra Tổng quan về
thống kê thống kê

Thu thập dữ Thu thập dữ


liệu liệu

Trình bày dữ Trình bày dữ


liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Thang đo định danh NTMộngNgọc
Thang đo định danh
Tổng quan về Tổng quan về
thống kê thống kê

Thu thập dữ Thu thập dữ


liệu liệu

Trình bày dữ Trình bày dữ


liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Thang đo thứ bậc NTMộngNgọc
Thang đo khoảng
Tổng quan về Tổng quan về
thống kê thống kê

Thu thập dữ Thu thập dữ


liệu liệu

Trình bày dữ Trình bày dữ


liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Thang đo tỉ lệ NTMộngNgọc
Chú ý
Tổng quan về Tổng quan về
thống kê thống kê

Thu thập dữ Thu thập dữ


liệu liệu

Trình bày dữ Trình bày dữ


liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Tóm tắt dữ liệu định tính NTMộngNgọc

• Phân phối tần số (Frequency distribution): Bảng tóm tắt dữ • Phân phối tần suất (Relative frequency
Tổng quan về Tổng quan về
thống kê liệu thể hiện số lượng (tần số) của giá trị dữ liệu trong mỗi thống kê
distribution): Bảng tóm tắt dữ liệu thể hiện tỷ
Thu thập dữ nhóm riêng biệt. Ví dụ: Thu thập dữ
liệu liệu lệ các giá trị dữ liệu trong mỗi nhóm riêng biệt.
Trình bày dữ Trình bày dữ
liệu liệu Với n là số quan sát trong tập dữ liệu (cỡ mẫu):
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định
lượng: phương pháp
Tóm tắt dữ liệu định
lượng: phương pháp
tần số fi
bảng và đồ thị bảng và đồ thị
tần suất di = .
Phương pháp nhánh

Phương pháp nhánh
lá n
Tóm tắt dữ Tóm tắt dữ
liệu bằng các
đại lượng
liệu bằng các
đại lượng
• Phân phối tần suất phần trăm (Percent
thống kê mô thống kê mô
tả
Các đặc trưng đo
tả
Các đặc trưng đo
frequency distribution): Bảng tóm tắt dữ liệu
lường khuynh hướng
tập trung
Các đặc trưng đo
lường khuynh hướng
tập trung
Các đặc trưng đo
thể hiện tỷ lệ % của các giá trị dữ liệu trong
lường khuynh hướng lường khuynh hướng
phân tán
Khảo sát hình dáng
phân tán
Khảo sát hình dáng
mỗi nhóm riêng biệt.
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Bảng phân phối tần suất và tần NTMộngNgọc
Bảng tần số - tần suất cho dữ liệu
Tổng quan về
suất phần trăm của nước ngọt Tổng quan về
định tính
thống kê thống kê

Thu thập dữ Thu thập dữ


liệu liệu

Trình bày dữ Trình bày dữ


liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò

Thống kê Thống kê
ứng dụng ứng dụng • Biểu đồ thanh (Bar graph): Biểu đồ mô tả
NTMộngNgọc
Ví dụ: Bảng tần số - tần suất cho NTMộngNgọc
dữ liệu định tính đã được tóm tắt trong bảng
Tổng quan về
ngành học của sinh viên trong một Tổng quan về
thống kê thống kê phân phối tần số, tần suất hoặc tần suất
trường ĐH
Thu thập dữ
liệu
Thu thập dữ
liệu phần trăm.
Trình bày dữ
liệu
Trình bày dữ
liệu Ví dụ: Biểu đồ thanh các lần mua nước ngọt
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò
Thống kê
ứng dụng
• Biểu đồ hình tròn (Pie chart): Biểu đồ tóm Thống kê
ứng dụng

NTMộngNgọc tắt dữ liệu dựa trên các phần trong một NTMộngNgọc
Tóm tắt dữ liệu định lượng
Tổng quan về
thống kê
đường tròn tương ứng với các tần suất cho Tổng quan về
thống kê
• Dữ liệu có ít giá trị: Tương tự như định nghĩa trong tóm tắt dữ
liệu định tính, Bảng tần số cũng có 3 cột nhưng cột thứ nhất
Thu thập dữ
liệu
mỗi nhóm. Thu thập dữ
liệu ghi các giá trị của dữ liệu. Ví dụ khảo sát điểm thi môn Toán
Trình bày dữ
liệu
Ví dụ: Biểu đồ hình tròn các loại nước ngọt được Trình bày dữ
liệu
của một số sinh viên:
Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
mua Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu • Dữ liệu có nhiều giá trị: Ta cần phân nhóm cho các giá trị rồi
thăm dò thăm dò
mới lập bảng tần số trên cơ sở dữ liệu đã phân nhóm.

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Tóm tắt dữ liệu định lượng NTMộngNgọc
Ví dụ
• Phân phối tần số (Frequency distribution): Tương tự như định Hãy lập bảng tần số cho năng suất (tạ/ha) của một lạoi cây thu
Tổng quan về Tổng quan về
thống kê thống kê hoạch được tại 40 vùng như sau:
nghĩa trong tóm tắt dữ liệu định tính, đó là bảng tóm tắt dữ
Thu thập dữ
liệu
liệu thể hiện số lượng (tần số) của các phần tử trong mỗi nhóm Thu thập dữ
liệu
không chồng lấn. Tuy nhiên, ở đây cần xác định các nhóm
Trình bày dữ Trình bày dữ
liệu không chồng lấn. liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp Các bước xác định các nhóm: Giả sử, mẫu dữ liệu có n phần tính: phương pháp
bảng và đồ thị

tử (cỡ mẫu là n).


bảng và đồ thị
√ √
Tóm tắt dữ liệu định
lượng: phương pháp
Tóm tắt dữ liệu định
lượng: phương pháp • Xác định số lượng các nhóm: k = 3 2n = 3 2 ∗ 40 = 4, 3 ≈ 4 ;
bảng và đồ thị bảng và đồ thị
• Xác định số lượng các nhóm riêng biệt (thường từ 5 đến • Xác định độ rộng của mỗi nhóm
Phương pháp nhánh
lá √ Phương pháp nhánh

20 nhóm): k = 3 2n ;
Tóm tắt dữ
• Xác định độ rộng của mỗi nhóm
Tóm tắt dữ xmax − xmin 179 − 153
liệu bằng các liệu bằng các h= = = 6, 5 chọn h = 6.
đại lượng đại lượng k 4
thống kê mô thống kê mô
tả Giá trị lớn nhất − Giá trị nhỏ nhất tả
Bảng tần số
Các đặc trưng đo độ rộng của nhóm = ; Các đặc trưng đo
lường khuynh hướng
tập trung
số nhóm lường khuynh hướng
tập trung
Năng suất Tần số Tần suất
Các đặc trưng đo Các đặc trưng đo
153 - 159 7 17,5
lường khuynh hướng
phân tán xmax − xmin lường khuynh hướng
phân tán
Khảo sát hình dáng hay h= ; Khảo sát hình dáng
160 - 166 19 47,5
phân phối của dữ liệu k phân phối của dữ liệu
167-173 8 20
Phân tích dữ liệu Phân tích dữ liệu
thăm dò • Xác định các giới hạn của nhóm (được lựa chọn sao cho thăm dò
174-180 6 15
mỗi giá trị của quan sát thuộc về một và chỉ một nhóm). Tổng 40 100
Thống kê
ứng dụng
Thống kê
ứng dụng • Phân phối tần suất (Relative frequency
Ví dụ khác
NTMộngNgọc
Thời gian kiểm toán (ngày)
NTMộngNgọc
distribution) và Phân phối tần suất phần
Tổng quan về
thống kê
Tổng quan về
thống kê
trăm (Percent frequency distribution): tương
Thu thập dữ
liệu
Thu thập dữ
liệu
tự trong tóm tắt dữ liệu định tính.
Trình bày dữ
liệu
Trình bày dữ
liệu
Ví dụ: Bảng phân phối tần suất và tần suất phần
Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
trăm của dữ liệu trên
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị Bảng phân phối tần số của dữ liệu trên bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu
thăm dò
Lưu ý: Trị số giữa nhóm (class midpoint): Giá trị chính giữa giá trị Phân tích dữ liệu
thăm dò
nhỏ nhất và giá trị lớn nhất. Ví dụ với dữ liệu trên ta có trị số giữa
của 5 nhóm trên là 12, 17, 22, 27 và 32.

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Bảng tần số cho dữ liệu định lượng NTMộngNgọc
Bảng tần số kết hợp hai biến
Tổng quan về
(nhóm mở) Tổng quan về
thống kê thống kê

Thu thập dữ Thu thập dữ


liệu liệu Ví dụ: Điều tra chi tiêu của 200 sinh viên tại 3 vùng được kết quả
Trình bày dữ Trình bày dữ sau:
liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò
Thống kê
ứng dụng
Thống kê
ứng dụng • Đồ thị điểm (Dot plot): Đồ thị tóm tắt dữ
NTMộngNgọc
Bảng tần số kết hợp hai biến NTMộngNgọc
liệu bằng các điểm nằm trên nằm trên các
Tổng quan về
thống kê
Tổng quan về
thống kê
giá trị dữ liệu biểu diễn trên trục ngang.
Thu thập dữ
liệu
Bảng tần số kết hợp hai biến "chi tiêu" và "vùng": Thu thập dữ
liệu
Ví dụ: Đồ thị điểm cho thời gian kiểm toán
Trình bày dữ Trình bày dữ
liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò

Thống kê
ứng dụng • Biểu đồ phân phối (Histogram): Biểu đồ thể
Thống kê
ứng dụng • Biểu đồ phân phối (Histogram): dùng để
NTMộngNgọc NTMộngNgọc
hiện phân phối tần số, phân phối tần suất hoặc phân phối tần cung cấp thông tin về hình dạng của một
Tổng quan về Tổng quan về
thống kê
suất phần trăm của dữ liệu định lượng xây dựng bằng cách đặt thống kê phân phối.
Thu thập dữ khoảng giá trị nhóm trên trục ngang và tần số, tần suất hoặc Thu thập dữ
liệu liệu Ví dụ: Biểu đồ phân phối mô tả các hình dáng phân phối
Trình bày dữ tần suất phần trăm trên trục thẳng đứng. Trình bày dữ
liệu liệu
Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
Ví dụ: Biểu đồ phân phối thời gian kiểm toán Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc • Phân phối tần số tích lũy (Cumulative NTMộngNgọc


Bảng tần số, tần suất, và tần số
Tổng quan về frequency distribution): cho thấy số lượng các Tổng quan về
tích lũy, tần suất tích lũy
thống kê thống kê

Thu thập dữ giá trị dữ liệu ít hơn hoặc bằng giới hạn trên Thu thập dữ
liệu liệu

Trình bày dữ của mỗi nhóm. Trình bày dữ


liệu liệu
Tóm tắt dữ liệu định
tính: phương pháp
• Phân phối tần suất tích lũy (Cumulative Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định
lượng: phương pháp
bảng và đồ thị
relative frequency distribution): cho thấy tỷ lệ Tóm tắt dữ liệu định
lượng: phương pháp
bảng và đồ thị
Phương pháp nhánh
lá của số các giá trị dữ liệu nhỏ hơn hoặc bằng Phương pháp nhánh

Tóm tắt dữ Tóm tắt dữ


liệu bằng các giới hạn trên của mỗi nhóm. liệu bằng các
đại lượng đại lượng
thống kê mô
tả • Phân phối tần suất phần trăm tích lũy thống kê mô
tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng
tập trung (Cumulative percent frequency distribution): lường khuynh hướng
tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng
phân tán cho thấy tỷ lệ phần trăm giá trị dữ liệu nhỏ lường khuynh hướng
phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu
Phân tích dữ liệu
thăm dò
hơn hoặc bằng giới hạn trên của mỗi nhóm. phân phối của dữ liệu
Phân tích dữ liệu
thăm dò

Thống kê
ứng dụng
Thống kê
ứng dụng
• Đồ thị Ogive (Đồ thị của phân phối tích
NTMộngNgọc
Ví dụ: Phân phối tần số tích lũy, tần suất tích lũy NTMộngNgọc lũy): cho thấy giá trị của dữ liệu trên trục ngang và một trong
Tổng quan về
và tần suất phần trăm tích lũy cho dữ liệu thời Tổng quan về số tần số tích lũy, tần suất tích lũy và tần suất phần trăm tích
thống kê thống kê

Thu thập dữ
gian kiểm toán Thu thập dữ lũy trên trục thẳng đứng.
liệu liệu

Trình bày dữ Trình bày dữ Ví dụ: Đồ thị Ogive thời gian kiểm toán
liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò
Thống kê Thống kê
ứng dụng ứng dụng
Biểu đồ cành lá (Stem-Leaf)
NTMộngNgọc
Biểu đồ nhánh lá NTMộngNgọc

Tổng quan về
(Stem-and-leaf ): Tổng quan về
• Biểu đồ stem-leaf cung cấp một cái nhìn trực
thống kê

Thu thập dữ
thống kê

Thu thập dữ
quan về bộ dữ liệu x1 , x2 , . . . , xn , với mỗi xi
liệu liệu
gồm ít nhất hai chữ số.
Trình bày dữ Trình bày dữ
liệu
Tóm tắt dữ liệu định
liệu
Tóm tắt dữ liệu định
• Biểu đồ stem-leaf có nhiều thuận lợi trong
tính: phương pháp tính: phương pháp
bảng và đồ thị
Tóm tắt dữ liệu định
lượng: phương pháp
bảng và đồ thị
Tóm tắt dữ liệu định
lượng: phương pháp
việc tìm các đặc trưng của dữ liệu như các
bảng và đồ thị
Phương pháp nhánh

Biểu đồ nhánh lá được sử dụng để hiển thị cả thứ bảng và đồ thị
Phương pháp nhánh

phân vị, các tứ phân vị, trung vị, mode.
Tóm tắt dữ
liệu bằng các
tự và hình dạng của một bộ dữ liệu cùng một lúc. Tóm tắt dữ
liệu bằng các
• Để xây dựng một biểu đồ stem-leaf, ta thực
đại lượng
thống kê mô
đại lượng
thống kê mô
hiện theo các bước sau:
tả tả 1 Sắp xếp dữ liệu theo thứ tự tăng dần
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng
tập trung
lường khuynh hướng
tập trung
2 Chia các giá trị sắp xếp thành hai phần: phần gốc stem,
Các đặc trưng đo Các đặc trưng đo gồm một (hoặc vài) chữ số đầu tiên, và phần lá leaf, gồm
lường khuynh hướng lường khuynh hướng
phân tán phân tán các chữ số còn lại.
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu 3 Liệt kê các giá trị stem vào một cột dọc.
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò 4 Ghi lại leaf cho mỗi quan sát vào bên cạnh stem của nó.
5 Viết các đơn vị cho các stem và leaf lên đồ thị.

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Biểu đồ Stem-Leaf NTMộngNgọc
Biểu đồ Stem-Leaf
Ví dụ Một ví dụ khác
Tổng quan về Tổng quan về
thống kê thống kê

Thu thập dữ Thu thập dữ


liệu liệu
Sử dụng đơn vị hàng trăm cho stem
Trình bày dữ
liệu • Sắp xếp dữ liệu: Trình bày dữ
liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị 21, 24, 24, 26, 27, 27, 30, 32, 38, 41 tính: phương pháp
bảng và đồ thị
Data: Stem Leaves
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp
bảng và đồ thị
• Hoàn thành biểu đồ stem - leaf:
lượng: phương pháp
bảng và đồ thị 613, 632, 658, 717, 6 136
Phương pháp nhánh Phương pháp nhánh

Stem Leaves

722, 750, 776, 827, 7 2258
Tóm tắt dữ Tóm tắt dữ
liệu bằng các
đại lượng 2 144677
liệu bằng các
đại lượng
841, 859, 863, 891, 8 346699
thống kê mô thống kê mô
tả
3 028 tả 894, 906, 928, 933, 9 13368
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng
tập trung
4 1
lường khuynh hướng
tập trung 955, 982, 1034, 10 356
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng
phân tán
Khảo sát hình dáng
lường khuynh hướng
phân tán
Khảo sát hình dáng
1047, 1056, 1140, 11 47
phân phối của dữ liệu
Phân tích dữ liệu
thăm dò
phân phối của dữ liệu
Phân tích dữ liệu
thăm dò
1169, 1224 12 2
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Biểu đồ Stem-Leaf NTMộngNgọc
Ví dụ khác
Một ví dụ khác
Tổng quan về
thống kê
Tổng quan về
thống kê Biểu đồ nhánh - lá về trọng lượng của một nhóm
Thu thập dữ
liệu
Thu thập dữ
liệu
sinh viên:
Trình bày dữ Trình bày dữ
liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
Vẽ đồ thị stem - leaf cho tập dữ liệu sau: tính: phương pháp
bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị
Phương pháp nhánh

61 63 70 71 71 81 83 84 64 65 bảng và đồ thị
Phương pháp nhánh

Tóm tắt dữ 65 66 84 87 73 75 92 93 77 78 Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng
thống kê mô
78 88 88 95 79 đại lượng
thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò

Thống kê
ứng dụng
Thống kê
ứng dụng
• Đồ thị phân tán (Scatter diagram): một trình
NTMộngNgọc
Biểu đồ hình tròn NTMộngNgọc bày đồ họa mối liên hệ giữa hai biến định lượng, và đường xu
Tổng quan về Tổng quan về hướng (trendline) cung cấp một xấp xỉ cho mối liên hệ.
thống kê thống kê

Thu thập dữ Thu thập dữ Ví dụ: Đồ thị phân tán và đường xu hướng cửa hàng âm thanh và
liệu liệu

Trình bày dữ Trình bày dữ thiết bị âm thanh


liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Bài tập ứng dụng NTMộngNgọc
Bài tập nhóm về nhà
Tổng quan về Tổng quan về
thống kê
Doanh thu các ngày của một cửa hàng internet tháng 11/2020 được thống kê

Thu thập dữ
thu thập như sau: Thu thập dữ
liệu liệu

Trình bày dữ Trình bày dữ


liệu
Tóm tắt dữ liệu định
liệu
Tóm tắt dữ liệu định
• Lập phiếu điều tra (chủ đề tự chọn), thu thập thông tin của ít
tính: phương pháp
bảng và đồ thị
tính: phương pháp
bảng và đồ thị nhất 5 biến, số lượng quan sát ít nhất 30.
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp
bảng và đồ thị
lượng: phương pháp
bảng và đồ thị
• Lập bảng tần số cho từng biến (bảng tần số có thêm tần số tích
Phương pháp nhánh

Phương pháp nhánh
lá lũy, tần suất tích lũy).
Tóm tắt dữ Tóm tắt dữ
liệu bằng các liệu bằng các
• Vẽ biểu đồ tần số và biểu đồ tần suất.
đại lượng đại lượng
thống kê mô thống kê mô • Nhận xét về kết quả thu được.
tả tả
Các đặc trưng đo • Lập bảng tần số (với khoảng cách số nhóm bằng nhau)? Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo
lường khuynh hướng
• Xác định % số ngày trong tháng có doanh thu từ 800 000đ trở Các đặc trưng đo
lường khuynh hướng
phân tán
Khảo sát hình dáng
lên? phân tán
Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu
thăm dò
• Biểu diễn số liệu đã phân nhóm bằng đồ thị. Phân tích dữ liệu
thăm dò

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Thống kê mô tả trong thực tế NTMộngNgọc
VD: Công ty Small Fry Design (tt)
VD: Công ty Small Fry Design là một công ty sản xuất các phụ kiện
Tổng quan về Tổng quan về Số liệu thống kê mô tả sau được cung cấp cho thời gian của các hóa
thống kê và đồ chơi, thiết kế và nhập khẩu các sản phẩm cho trẻ sơ sinh. Hiện thống kê
đơn đến hạn phải trả:
Thu thập dữ nay, các sản phẩm của công ty này được phân phối tại hơn 1000 cửa Thu thập dữ
liệu liệu
hàng bán lẻ trên khắp nước Mỹ. • Trung bình: 40 ngày
Trình bày dữ Trình bày dữ
liệu • Quản lý dòng tiền là một trong những hoạt động quan trọng liệu • Trung vị: 35 ngày
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp nhất trong hoạt động hàng ngày của công ty này. tính: phương pháp
bảng và đồ thị bảng và đồ thị • Mode: 31 ngày
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp • Phân tích và kiểm soát các khoản phải thu là một yếu tố quan lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Các số liệu thống kê cho thấy thời hạn trung bình của một hóa đơn
Phương pháp nhánh trọng của việc quản lý dòng tiền. Phương pháp nhánh
lá lá
là 40 ngày. Trung vị cho thấy 50% số hóa đơn có thời hạn là 35 ngày
Tóm tắt dữ • Bằng cách tính toán thời gian và giá trị trung bình của các hóa Tóm tắt dữ
hoặc nhiều hơn. Mode cho thấy khoản thời hạn phổ biến nhất của
liệu bằng các liệu bằng các
đại lượng đơn đến hạn phải trả, người quản lý có thể dự đoán sẵn tiền mặt đại lượng một hóa đơn đến hạn là 31 ngày.
thống kê mô thống kê mô
tả và giám sát các thay đổi về tình trạng của các khoản phải thu. tả Ngoài ra, tóm tắt thống kê cũng cho thấy chỉ có 3% của giá trị tính
Các đặc trưng đo
lường khuynh hướng
• Mục tiêu của công ty:
Các đặc trưng đo
lường khuynh hướng bằng $ của tất cả các khoản phải thu là hơn 60 ngày.
tập trung tập trung
Các đặc trưng đo
lường khuynh hướng
phân tán
• thời gian trung bình cho các hóa đơn đến hạn không vượt
Các đặc trưng đo
lường khuynh hướng
phân tán
Dựa trên các thông tin thống kê, ban quản lý đã
Khảo sát hình dáng
phân phối của dữ liệu quá 45 ngày; Khảo sát hình dáng
phân phối của dữ liệu hài lòng với các khoản phải thu và dòng tiền đã
Phân tích dữ liệu • giá trị ($) của các hóa đơn hơn 60 ngày không được vượt Phân tích dữ liệu
thăm dò

quá 5% giá trị ($) của tất cả các khoản thu.


thăm dò
được kiểm soát.
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Các độ đo hướng tâm NTMộngNgọc
Trung bình
Tổng quan về Tổng quan về
thống kê thống kê
Trung bình (mean) là đại lượng thường được sử
Thu thập dữ Thu thập dữ
liệu liệu dụng nhất để đo giá trị trung tâm của dữ liệu
Trình bày dữ Trình bày dữ
liệu
Tóm tắt dữ liệu định
liệu
Tóm tắt dữ liệu định
(của biến định lượng). Giả sử ta có dữ liệu (của
tính: phương pháp
bảng và đồ thị
Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
Tóm tắt dữ liệu định
tổng thể hoặc mẫu) là x1 , x2 , . . . , xn . Khi đó,
lượng: phương pháp
bảng và đồ thị
Phương pháp nhánh
lượng: phương pháp
bảng và đồ thị
Phương pháp nhánh
trung bình (của tổng thể hoặc mẫu) là trung
lá lá

Tóm tắt dữ Tóm tắt dữ


bình cộng của các phần tử trong dữ liệu, tức là
liệu bằng các liệu bằng các
đại lượng
thống kê mô
đại lượng
thống kê mô 1X n
tả tả xi
Các đặc trưng đo
lường khuynh hướng
tập trung
Các đặc trưng đo
lường khuynh hướng
tập trung
n i=1
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán
Khảo sát hình dáng
phân phối của dữ liệu
phân tán
Khảo sát hình dáng
phân phối của dữ liệu
Ta sẽ ký hiệu tổng này là µ (tương ứng x̄ ) nếu
Phân tích dữ liệu
thăm dò
Phân tích dữ liệu
thăm dò dữ liệu là của tổng thể (tương ứng, của mẫu).

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Trung bình (tt) NTMộngNgọc
Trung bình (tt)
Tổng quan về
thống kê
• Trung bình tổng thể: Tổng quan về
thống kê

Thu thập dữ
liệu
Nếu một tổng thể có N phần tử được kí hiệu Thu thập dữ
liệu • Trường hợp dữ liệu có tần số như trong bảng
Trình bày dữ
liệu
là x1 , x2 , . . . , xN , thì trung bình tổng thể là Trình bày dữ
liệu sau
Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
x1 + x2 + . . . + xN 1 N
X
Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
Giá trị dữ liệu x1 x2 . . . xk
Tóm tắt dữ liệu định
lượng: phương pháp µ= = xi Tóm tắt dữ liệu định
lượng: phương pháp
Tần số tương ứng n1 n2 . . . nk
bảng và đồ thị
Phương pháp nhánh
N N i=1
bảng và đồ thị
Phương pháp nhánh

Tóm tắt dữ

Tóm tắt dữ
trong đó, n1 + n2 + . . . + nk = n.
liệu bằng các
đại lượng
• Trung bình mẫu: liệu bằng các
đại lượng Khi đó, trung bình mẫu được tính theo công
thống kê mô thống kê mô
tả Nếu n quan sát của một mẫu được kí hiệu là tả thức
Các đặc trưng đo Các đặc trưng đo
1X k
lường khuynh hướng
tập trung x1 , x2 , . . . , xn , thì trung bình mẫu là lường khuynh hướng
tập trung
x̄ = ni xi (1)
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng
n
lường khuynh hướng
n i=1
phân tán
Khảo sát hình dáng x1 + x2 + . . . + xn 1 X
phân tán
Khảo sát hình dáng
phân phối của dữ liệu
x̄ = = xi phân phối của dữ liệu
Phân tích dữ liệu
thăm dò n n i=1 Phân tích dữ liệu
thăm dò
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Trung bình (tt) NTMộngNgọc
Trung bình (tt)
Tổng quan về Ví dụ: Bảng 3.1 Lương khởi điểm hàng tháng của 12 người tốt Tổng quan về
thống kê thống kê
Ví dụ khác : Lương tháng của 16 công nhân được chọn ngẫu nhiên
Thu thập dữ
nghiệp ngành kinh doanh Thu thập dữ
liệu liệu (đv triệu đồng) trong một nhà máy như sau:
Trình bày dữ Trình bày dữ
liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
Lương tháng 0,8 1,0 1,2 1,3 1,5 1,7 2 2,3 2,5
tính: phương pháp
bảng và đồ thị
tính: phương pháp
bảng và đồ thị Số công nhân 1 1 2 2 2 3 2 2 1
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị
Phương pháp nhánh
bảng và đồ thị
Phương pháp nhánh
Lương trung bình hàng tháng của một công nhân từ mẫu gồm 16
lá lá

Tóm tắt dữ Tóm tắt dữ


công nhân trên là:
liệu bằng các liệu bằng các
đại lượng đại lượng Pk P9
i=1 ni xi i=1 ni xi
thống kê mô thống kê mô
tả tả
x̄ = =
Các đặc trưng đo
lường khuynh hướng
tập trung
Mức lương khởi điểm hàng tháng trung bình của mẫu gồm 12 sinh
Các đặc trưng đo
lường khuynh hướng
tập trung
n 16
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng
phân tán viên tốt nghiệp ngành kinh doanh là : lường khuynh hướng
phân tán 0, 8 ∗ 1 + · · · + 2, 3 ∗ 2 + 2, 5 ∗ 1
Khảo sát hình dáng
phân phối của dữ liệu P12 Khảo sát hình dáng
phân phối của dữ liệu x̄ = = 1, 625
Phân tích dữ liệu
i=1 xi 3450 + 3550 + ... + 3480 Phân tích dữ liệu 16
thăm dò
x̄ = = = 3540 thăm dò

12 12

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc Khi dữ liệu được trình bày dưới dạng khoảng như NTMộngNgọc
Trung bình (tt)
Tổng quan về sau Tổng quan về Trung bình bị ảnh hưởng bởi các giá trị ngoại lai
thống kê thống kê

Thu thập dữ Giá trị dữ liệu < a1 [a1 , b1 [ . . . [ak , bk [ ≥ bk Thu thập dữ
(outliers).
liệu liệu

Trình bày dữ
liệu
Tần số tương ứng n1 n2 ... nk+1 nk+2 Trình bày dữ
liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
Bảng: Dữ liệu dưới dạng khoảng tính: phương pháp
bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh

Giả sử rằng độ rộng các khoảng là như nhau, tức lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các
đại lượng
là bi − ai = c với mọi i. Khi đó, mỗi khoảng ta liệu bằng các
đại lượng
thống kê mô thống kê mô
tả thay bằng điểm chính giữa của khoảng, riêng hai tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng
tập trung khoảng đầu và cuối ta thay bằng a1 − c/2 và lường khuynh hướng
tập trung
Các đặc trưng đo Các đặc trưng đo Ví dụ: Giả sử rằng sinh viên tốt nghiệp ở bảng 3.1 có mức
lường khuynh hướng
phân tán bk + c/2. Sau đó, dùng công thức (1) để tính lường khuynh hướng
phân tán
Khảo sát hình dáng Khảo sát hình dáng
lương khởi điểm cao nhất là 10000 USD/tháng không phải là
phân phối của dữ liệu
Phân tích dữ liệu trung bình. phân phối của dữ liệu
Phân tích dữ liệu
thăm dò thăm dò
3925USD như trong bảng 3.1 thì trung bình mẫu thay đổi từ
3540 USD đến 4046 USD.
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Trung bình nhân NTMộngNgọc
Trung bình nhân
Tổng quan về Tổng quan về
thống kê thống kê

Thu thập dữ Thu thập dữ


liệu liệu

Trình bày dữ Trình bày dữ


liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Trung vị mẫu NTMộngNgọc
Trung vị mẫu (tt)
Tổng quan về
thống kê • Trung vị mẫu (sample median) là giá trị chia Tổng quan về
thống kê
Cách tìm trung vị
Sắp xếp dữ liệu mẫu theo thứ tự tăng dần.
Thu thập dữ
liệu các quan sát thành hai phần bằng nhau. Một Thu thập dữ
liệu
• Nếu kích thước mẫu là lẻ thì trung vị là giá trị ở vị trí
Trình bày dữ
liệu
phần chứa các quan sát nhỏ hơn trung vị và Trình bày dữ
liệu trung tâm của mẫu được sắp
Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
phần còn lại chứa các quan sát lớn hơn trung Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị • Nếu kích thước mẫu là chẵn thì trung vị là trung bình của
Tóm tắt dữ liệu định
lượng: phương pháp
bảng và đồ thị
vị. Tóm tắt dữ liệu định
lượng: phương pháp
bảng và đồ thị
hai giá trị ở vị trí trung tâm của mẫu được sắp
Phương pháp nhánh Phương pháp nhánh

• Trung vị không bị ảnh hưởng bởi các giá trị lá
Nói cách khác, gọi n là kích thước mẫu và
Tóm tắt dữ Tóm tắt dữ
liệu bằng các
đại lượng ngoại lai (outliers). liệu bằng các
đại lượng
thống kê mô thống kê mô i = (n + 1)/2, thì
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng
tập trung
lường khuynh hướng
tập trung • Nếu n lẻ thì trung vị là giá trị thứ i hay xi (trung vị là giá
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng
phân tán
lường khuynh hướng
phân tán
trị chính giữa);
Khảo sát hình dáng
phân phối của dữ liệu
Khảo sát hình dáng
phân phối của dữ liệu • Nếu n chẵn thì trung vị là trung bình của hai giá trị thứ i
Phân tích dữ liệu
thăm dò
Phân tích dữ liệu
thăm dò
x[i] + x[i]+1
và thứ i + 1 hay trung vị = , với [i] là phần
2
nguyên của i (trung vị là trung bình của hai giá trị ở giữa).
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Trung vị (tt) NTMộngNgọc
Trung vị (tt)
Tổng quan về Tổng quan về Ví dụ 2: Tìm trung vị mức lương khởi điểm của
thống kê thống kê

Thu thập dữ
Ví dụ 1: Tìm trung vị về quy mô lớp cho mẫu Thu thập dữ
12 sinh viên trong bảng 3.1. Giải:
liệu liệu

Trình bày dữ của chín lớp đại học sau: Trình bày dữ
• Sắp xếp dữ liệu theo thứ tự tăng dần :
liệu liệu
Tóm tắt dữ liệu định
tính: phương pháp 35; 34; 32; 56; 30; 54; 46; 38; 42. Giải: Tóm tắt dữ liệu định
tính: phương pháp
3310; 3355; 3450; 3480; 3480; 3490; 3520;
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định
lượng: phương pháp • Sắp xếp dữ liệu theo thứ tự tăng dần : Tóm tắt dữ liệu định
lượng: phương pháp
3540; 3550; 3650; 3730; 3925.
• n = 12 và i = (n + 1)/2 = (12 + 1)/2 = 6.5;
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh

30; 32; 34; 35; 38; 42; 46; 54; 56. lá

Tóm tắt dữ Tóm tắt dữ • Do n = 12 chẳn nên trung vị là trung bình


liệu bằng các
đại lượng • n = 9 và i = (n + 1)/2 = (9 + 1)/2 = 5; liệu bằng các
đại lượng
thống kê mô thống kê mô của hai giá trị thứ 6 (x6 ) và thứ 7 (x7 ) hay
tả
Các đặc trưng đo
• Do n = 9 lẻ nên trung vị là giá trị thứ 5 hay tả
Các đặc trưng đo x[6] + x[6]+1 3490 + 3520
lường khuynh hướng
tập trung
xi = x5 = 38. Vậy trung vị về quy mô lớp học
lường khuynh hướng
tập trung trung vị = = =
Các đặc trưng đo
lường khuynh hướng
Các đặc trưng đo
lường khuynh hướng
2 2
phân tán
Khảo sát hình dáng
phân phối của dữ liệu
với mẫu trên là 38 sinh viên. phân tán
Khảo sát hình dáng
phân phối của dữ liệu
3505 . Vậy trung vị mức lương khởi điểm của
Phân tích dữ liệu
thăm dò
Phân tích dữ liệu
thăm dò 12 sinh viên tốt nghiệp đại học kinh doanh
trong bảng 3.1 là 3505 USD.

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Trung vị (tt) NTMộngNgọc
Xác định trung vị cho dữ liệu có
Tổng quan về Tổng quan về
phân nhóm
thống kê thống kê

Thu thập dữ Thu thập dữ


liệu liệu

Trình bày dữ
Trung vị không bị ảnh hưởng bởi các giá trị Trình bày dữ
liệu liệu
Tóm tắt dữ liệu định
tính: phương pháp
ngoại lai (outliers). Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
Tóm tắt dữ liệu định
lượng: phương pháp
Ví dụ: Giả sử rằng sinh viên tốt nghiệp ở bảng bảng và đồ thị
Tóm tắt dữ liệu định
lượng: phương pháp
bảng và đồ thị
3.1 có mức lương khởi điểm cao nhất là 10000
bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ
liệu bằng các
USD/tháng không phải là 3925 USD/tháng như Tóm tắt dữ
liệu bằng các
đại lượng
thống kê mô trong bảng 3.1 thì trung vị vẫn không thay đổi vì đại lượng
thống kê mô
tả tả
Các đặc trưng đo
lường khuynh hướng
3490 USD và 3520 USD vẫn là hai giá trị ở giữa Các đặc trưng đo
lường khuynh hướng
tập trung tập trung
Các đặc trưng đo
lường khuynh hướng
như trên. Các đặc trưng đo
lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Xác định trung vị cho dữ liệu có NTMộngNgọc
Xác định trung vị cho dữ liệu có
Tổng quan về
phân nhóm Tổng quan về
phân nhóm
thống kê thống kê

Thu thập dữ Thu thập dữ


liệu liệu

Trình bày dữ Trình bày dữ


liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Số yếu vị (Mode) NTMộngNgọc
Xác định Mode cho dữ liệu phân
Tổng quan về Mode của dữ liệu là giá trị của dữ liệu có tần số Tổng quan về
nhóm có khoảng cách đều nhau
thống kê thống kê

Thu thập dữ
xuất hiện lớn nhất. Nếu mọi giá trị dữ liệu đều có Thu thập dữ
liệu liệu

Trình bày dữ
cùng tần số, ta nói dữ liệu không có mode. Trình bày dữ
liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng
thống kê mô
• Mode không bị ảnh hưởng bởi các điểm ngoại đại lượng
thống kê mô
tả
Các đặc trưng đo
lai (outlier); tả
Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung
Các đặc trưng đo
lường khuynh hướng
• Mode có thể sử dụng cho cả dữ liệu số và dữ tập trung
Các đặc trưng đo
lường khuynh hướng
phân tán
Khảo sát hình dáng
phân phối của dữ liệu
liệu phân loại. phân tán
Khảo sát hình dáng
phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò Ví du: Dữ liệu ở bảng 3.1, mode là 3480 vì chỉ có mức lương thăm dò

khởi điểm hàng tháng có tần số cao nhất là 3480 USD.


Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Xác định Mode cho dữ liệu phân NTMộngNgọc
Xác định Mode cho dữ liệu phân
Tổng quan về
nhóm có khoảng cách đều nhau Tổng quan về
nhóm có khoảng cách không đều
thống kê thống kê

Thu thập dữ Thu thập dữ


nhau
liệu liệu

Trình bày dữ Trình bày dữ


liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Xác định Mode cho dữ liệu phân NTMộngNgọc
So sánh trung bình, trung vị và
Tổng quan về
nhóm có khoảng cách không đều Tổng quan về
mode
thống kê thống kê

Thu thập dữ
nhau Thu thập dữ
liệu liệu

Trình bày dữ
liệu
Trình bày dữ
liệu
• Nếu dữ liệu có phân phối đối xứng, thì trung
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
tính: phương pháp
bảng và đồ thị
bình và trung vị sẽ bằng nhau và rơi vào tâm
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp
bảng và đồ thị
lượng: phương pháp
bảng và đồ thị của phân phối.
Phương pháp nhánh Phương pháp nhánh

Tóm tắt dữ

Tóm tắt dữ
• Nếu dữ liệu có phân phối bị lệch (skewed)
liệu bằng các liệu bằng các
đại lượng đại lượng (tức là bất đối xứng, với một đuôi kéo dài về
thống kê mô thống kê mô
tả
Các đặc trưng đo
tả
Các đặc trưng đo
một phía), thì trung bình và trung vị đều bị
lường khuynh hướng lường khuynh hướng
tập trung
Các đặc trưng đo
tập trung
Các đặc trưng đo
kéo về phía đuôi dài hơn, nhưng trung bình,
lường khuynh hướng lường khuynh hướng
phân tán
Khảo sát hình dáng
phân tán
Khảo sát hình dáng
thông thường, được kéo xa hơn trung vị.
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
So sánh trung bình, trung vị và NTMộngNgọc
Phân vị
Tổng quan về
mode (tt) Tổng quan về Phân vị thứ p là một giá trị mà ít nhất có p%
thống kê thống kê

Thu thập dữ Thu thập dữ


các quan sát có giá trị nhỏ hơn hoặc bằng giá trị
liệu liệu

Trình bày dữ
• nếu phân phối là lệch phải thì Trình bày dữ
này và ít nhất có (100 − p)% các quan sát có giá
liệu liệu
Tóm tắt dữ liệu định
tính: phương pháp
mode < trung vị < trung bình; Tóm tắt dữ liệu định
tính: phương pháp
trị lớn hơn hoặc bằng giá trị này.
bảng và đồ thị bảng và đồ thị Ví dụ: Các trường đại học thường báo cáo kết quả kiểm tra
Tóm tắt dữ liệu định
lượng: phương pháp
• nếu phân phối là lệch trái thì Tóm tắt dữ liệu định
lượng: phương pháp
đầu vào dưới dạng phân vị. Giả sử, một sinh viên đạt được
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh
lá mode > trung vị > trung bình. Phương pháp nhánh
lá điểm của phần thi nói là 54 của một bài kiểm tra đầu vào.
Tóm tắt dữ Tóm tắt dữ • Làm thế nào để đánh giá sinh viên này trong mối liên hệ
liệu bằng các liệu bằng các
đại lượng đại lượng với các sinh viên khác cùng tham gia bài kiểm tra tương
thống kê mô thống kê mô
tả tả tự?
Các đặc trưng đo
lường khuynh hướng
tập trung
Các đặc trưng đo
lường khuynh hướng
tập trung
• TL: không dễ dàng trả lời câu hỏi này nếu không biết gì
Các đặc trưng đo
lường khuynh hướng
Các đặc trưng đo
lường khuynh hướng
thêm về dữ liệu.
phân tán
Khảo sát hình dáng
phân tán
Khảo sát hình dáng
• Tuy nhiên, nếu số điểm 54 tương ứng với phân vị thứ 70,
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu
thăm dò
Phân tích dữ liệu
thăm dò
chúng ta biết rằng khoảng 70% số sinh viên đạt điểm thấp
hơn so với sinh viên này và khoảng 30% số sinh viên có
điểm số cao hơn sinh viên này.

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Phân vị (tt) NTMộngNgọc
Phân vị (tt)
Ví dụ 1: Hãy xác định phân vị thứ 85 cho các dữ liệu mức
Tổng quan về Tổng quan về
thống kê Cách tính phân vị thứ p: thống kê lương khởi điểm trong bảng 3.1?
Thu thập dữ Thu thập dữ Giải :
liệu • Bước 1: Sắp xếp dữ liệu theo thứ tự tăng dần. liệu
• Bước 1: Sắp xếp dữ liệu theo thứ tự tăng dần:
Trình bày dữ Trình bày dữ
liệu
Tóm tắt dữ liệu định
• Bước 2: Tính chỉ số i liệu
Tóm tắt dữ liệu định
3310; 3355; 3450; 3480; 3480; 3490; 3520; 3540; 3550; 3650;
tính: phương pháp tính: phương pháp
3730; 3925.
bảng và đồ thị
p bảng và đồ thị

• Bước 2: Tính
Tóm tắt dữ liệu định
lượng: phương pháp
i =( )∗n Tóm tắt dữ liệu định
lượng: phương pháp
bảng và đồ thị
Phương pháp nhánh 100 bảng và đồ thị
Phương pháp nhánh
p 85
lá lá
i =( )∗n =( ) ∗ 12 = 10, 2.
Tóm tắt dữ Tóm tắt dữ 100 100
liệu bằng các trong đó, p là phân vị cần tính và n là số liệu bằng các
đại lượng đại lượng • Bước 3: Vì i vừa tính không phải là một số nguyên, làm
thống kê mô
tả
quan sát. thống kê mô
tả tròn nó. Vị trí của phân vị thứ 85 là số nguyên kế tiếp lớn
Các đặc trưng đo
lường khuynh hướng
tập trung
• Bước 3: Các đặc trưng đo
lường khuynh hướng
tập trung
hơn 10, 2 là vị trí thứ 11. Vậy, phân vị thứ 85 cho các dữ
Các đặc trưng đo • Nếu i là một số nguyên, phân vị thứ p là trung bình của Các đặc trưng đo
liệu mức lương khởi điểm trong bảng 3.1 là giá trị dữ liệu
lường khuynh hướng lường khuynh hướng
phân tán
Khảo sát hình dáng
hai giá trị ở vị trí thứ i và i + 1. phân tán
Khảo sát hình dáng ở vị trí thứ 11 là 3730.
phân phối của dữ liệu • Nếu i không phải là một số nguyên, làm tròn nó. Số phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò
nguyên tiếp theo lớn hơn i biểu thị vị trí của phân vị thứ p. thăm dò Ví dụ 2: Hãy xác định phân vị thứ 50 cho các dữ liệu mức
lương khởi điểm trong bảng 3.1?
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Tứ phân vị NTMộngNgọc
Ví dụ 2: Hãy xác định tứ phân vị cho các dữ

Tổng quan về Tứ phân vị chia dữ liệu thành bốn phần, mỗi Tổng quan về
liệu mức lương khởi điểm trong bảng 3.1?
thống kê thống kê
phần chứ khoảng 25% số quan sát. Giải : Chúng ta cần tìm phân vị thứ 25 (Q1 ) , phân vị thứ 50
Thu thập dữ Thu thập dữ
liệu liệu (Q2 ) và phân vị thứ 75 (Q3 ).
Trình bày dữ Trình bày dữ • Sắp xếp dữ liệu theo thứ tự tăng dần:
liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định 3310; 3355; 3450; 3480; 3480; 3490; 3520; 3540; 3550; 3650;
tính: phương pháp tính: phương pháp
bảng và đồ thị
Tóm tắt dữ liệu định
bảng và đồ thị
Tóm tắt dữ liệu định
3730; 3925.
• Tìm Q1 : Tính i = ( 100p 25
lượng: phương pháp
bảng và đồ thị
lượng: phương pháp
bảng và đồ thị ) ∗ n = ( 100 ) ∗ 12 = 3. Vì i = 3 là
Phương pháp nhánh Phương pháp nhánh
lá lá một số nguyên nên phân vị thứ 25 là trung bình của hai
Tóm tắt dữ
liệu bằng các
Tóm tắt dữ
liệu bằng các
giá trị dữ liệu thứ ba và thứ tư hay
đại lượng đại lượng Q1 = (3450 + 3480)/2 = 3465.
thống kê mô thống kê mô
50
• Tìm Q2 : Tính i = ( 100
tả tả ) ∗ 12 = 6. Vì i = 6 là một số
Các đặc trưng đo
lường khuynh hướng
Hình 3.1 cho thấy một phân phối dữ liệu chia thành bốn phần. Các đặc trưng đo
lường khuynh hướng nguyên nên trung vị là trung bình của hai giá trị dữ liệu
tập trung tập trung
Các đặc trưng đo
Các điểm chia đgl Tứ phân vị và được xac định như sau: Các đặc trưng đo
thứ sáu và thứ bảy hay Q2 = (3490 + 3520)/2 = 3505.
lường khuynh hướng lường khuynh hướng
phân tán • Q1 = tứ phân vị thứ nhất, hay là phân vị thứ 25. phân tán 75
• Tìm Q3 : Tính i = ( 100 ) ∗ 12 = 9. Vì i = 9 là một số
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu
Phân tích dữ liệu
• Q2 = tứ phân vị thứ hai, hay là phân vị thứ 50 phân phối của dữ liệu
Phân tích dữ liệu nguyên nên phân vị thứ 75 là trung bình của hai giá trị dữ
thăm dò thăm dò
(Q2 cũng được gọi là trung vị ). liệu thứ chín và thứ mười hay
• Q3 = tứ phân vị thứ ba, hay là phân vị thứ 75. Q3 = (3550 + 3650)/2 = 3600.

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Độ đo sự biến thiên của dữ liệu NTMộngNgọc
Khoảng biến thiên hay
Tổng quan về
(hay độ phân tán) Tổng quan về
Miền giá trị mẫu (sample range)
thống kê thống kê
Khoảng biến thiên = giá trị lớn nhất − giá trị nhỏ nhất. Ví dụ:
Thu thập dữ Thu thập dữ
liệu liệu Khoảng biến thiên trong bộ dữ liệu ở bảng 3.1 là
Trình bày dữ Trình bày dữ 3925 − 3310 = 615.
liệu liệu
Tóm tắt dữ liệu định
tính: phương pháp
Tóm tắt dữ liệu định
tính: phương pháp
Hay miền giá trị mẫu là khoảng cách giữa giá trị lớn nhất và
bảng và đồ thị
Tóm tắt dữ liệu định
bảng và đồ thị
Tóm tắt dữ liệu định
giá trị nhỏ nhất trong mẫu.
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị Nếu n quan sát trong một mẫu được kí hiệu là x1 , x2 , . . . , xn
Phương pháp nhánh Phương pháp nhánh
lá lá thì miền giá trị mẫu là
Tóm tắt dữ Tóm tắt dữ
liệu bằng các liệu bằng các
đại lượng đại lượng r = max(xi ) − min(xi )
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Khoảng biến thiên (tt) NTMộngNgọc
Độ trải giữa hay Khoảng tứ phân
Tổng quan về Tổng quan về
vị (interquartile range - IQR)
thống kê thống kê

Thu thập dữ
Khoảng biến thiên bị ảnh hưởng bởi các giá trị Thu thập dữ
liệu liệu Độ trải giữa (hay Khoảng tứ phân vị ) (IQR) là
ngoại lai (hay giá trị đột biến).
Trình bày dữ
liệu
Trình bày dữ
liệu khoảng cách giữa tứ phân vị đầu tiên và tứ phân
vị thứ ba; tức là, IQR = Q3 − Q1 .
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
Ví dụ: Giả sử rằng sinh viên tốt nghiệp ở bảng 3.1 có mức tính: phương pháp
bảng và đồ thị
Tóm tắt dữ liệu định
lượng: phương pháp lương khởi điểm cao nhất là 10000 USD/tháng không phải là Tóm tắt dữ liệu định
lượng: phương pháp
Ví dụ: Đối với mức lương khởi điểm hàng tháng trong bảng
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh 3925 USD/tháng như trong bảng 3.1 thì khoảng biến thiên Phương pháp nhánh

trong trường hợp này sẽ là 10000 − 3310 = 6690 không phải là



3.1, độ trải giữa là IQR = Q3 − Q1 = 3600 − 3465 = 135.
Tóm tắt dữ Tóm tắt dữ
liệu bằng các
đại lượng
615 như đã tính ở trên. liệu bằng các
đại lượng • Người ta thường sử dụng IQR để đo sự biến
thống kê mô thống kê mô
tả Ta thấy rõ là giá trị khoảng biên thiên lớn trong trường hợp tả
thiên của dữ liệu khi trung vị được sử dụng
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung này sẽ không mô tả tốt sự thay đổi trong bộ dữ liệu vì 11 trong tập trung
để đo trung tâm của dữ liệu.
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán 12 mức lương khởi điểm nằm trong khoảng 3310 USD và 3730 phân tán
• Tương tự trung vị, IQR không bị ảnh hưởng
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
USD.
Phân tích dữ liệu
thăm dò
Phân tích dữ liệu
thăm dò bởi các điểm ngoại lai (outlier).

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Ví dụ NTMộngNgọc
Phương sai và độ lệch chuẩn
Phương sai là trung bình bình phương độ lệch so với giá trị
Tổng quan về Tổng quan về
thống kê Một công ty truyền thông khảo sát thói quen thống kê trung bình. Phương sai phản ánh mức độ phân tán các giá trị
Thu thập dữ Thu thập dữ của các quan sát xung quanh giá trị trung bình.
liệu xem ti vi của một cộng đồng dân cư. 20 người liệu
• Nếu x1 , x2 , . . . , xN là các phần tử của tổng thể và µ là
Trình bày dữ
liệu được chọn ngẫu nhiên và có thời gian (giờ) xem Trình bày dữ
liệu trung bình tổng thể thì phương sai tổng thể là
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị ti vi hàng tuần như sau: tính: phương pháp
bảng và đồ thị N
X
Tóm tắt dữ liệu định
lượng: phương pháp
Tóm tắt dữ liệu định
lượng: phương pháp (xi − µ)2
bảng và đồ thị
Phương pháp nhánh

25 41 27 32 43 bảng và đồ thị
Phương pháp nhánh
lá σ2 = i=1
.
Tóm tắt dữ 66 35 31 15 5 Tóm tắt dữ
N
liệu bằng các liệu bằng các • Trường hợp dữ liệu có tần số ni của xi với i = 1, 2, ..., k:
đại lượng
thống kê mô 34 26 32 38 16 đại lượng
thống kê mô
k
tả tả
30 38 30 20 21
X
Các đặc trưng đo
lường khuynh hướng
Các đặc trưng đo
lường khuynh hướng
(xi − µ)2 ni k
tập trung tập trung
i=1
X
Các đặc trưng đo
lường khuynh hướng
Các đặc trưng đo
lường khuynh hướng
σ2 = k
, trong đó, ni = N
phân tán
Khảo sát hình dáng
(a) Tìm các tứ phân vị của mẫu dữ liệu trên? phân tán
Khảo sát hình dáng
X
ni i=1
phân phối của dữ liệu phân phối của dữ liệu

(b) Tìm khoảng tứ phân vị? i=1


Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò
. √
• Độ lệch chuẩn tổng thể là σ = σ 2 .
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Phương sai và độ lệch chuẩn NTMộngNgọc
Phương sai và độ lệch chuẩn (tt)
Tổng quan về • Nếu x1 , x2 , . . . , xn là một mẫu có n quan sát Tổng quan về Ví dụ: Tính phương sai mẫu về dữ liệu lương khởi
thống kê thống kê

Thu thập dữ và x̄ là trung bình mẫu thì phương sai mẫu là Thu thập dữ
điểm trong bảng 3.1
liệu liệu

Trình bày dữ n Trình bày dữ


(xi − x̄ )2
X
liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định

s2 = i=1
tính: phương pháp tính: phương pháp
bảng và đồ thị
. bảng và đồ thị

n−1
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh

Tóm tắt dữ
• Trường hợp dữ liệu có tần số ni của xi với lá

Tóm tắt dữ
liệu bằng các liệu bằng các
đại lượng
thống kê mô
i = 1, 2, ..., k: đại lượng
thống kê mô
tả tả
Các đặc trưng đo k Các đặc trưng đo

(xi − x̄ )2 ni
lường khuynh hướng
X lường khuynh hướng
tập trung tập trung
Các đặc trưng đo k Các đặc trưng đo
lường khuynh hướng
2 i=1 X lường khuynh hướng
phân tán
s = , với ni = n. phân tán
Khảo sát hình dáng
phân phối của dữ liệu
Phân tích dữ liệu
n−1 i=1
Khảo sát hình dáng
phân phối của dữ liệu
Phân tích dữ liệu
thăm dò
√ thăm dò

• Độ lệch chuẩn mẫu là s = s 2.

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Phương sai và độ lệch chuẩn (tt) NTMộngNgọc
So sánh các độ lệch chuẩn
Tổng quan về Ví dụ: Tính phương sai mẫu về dữ liệu lương khởi Tổng quan về
thống kê thống kê

Thu thập dữ
điểm trong bảng 3.1 Thu thập dữ
liệu liệu

Trình bày dữ Trình bày dữ


liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Độ lệch tuyệt đối trung bình NTMộngNgọc
Hệ số biến thiên
Tổng quan về
thống kê
Tổng quan về
thống kê
Hệ số biến thiên cho biết độ lệch chuẩn lớn bằng
Lưu ý: Đối với bất kỳ bộ dữ liệu nào, tổng các độ lệch so với
Thu thập dữ
liệu giá trị trung bình sẽ luôn bằng không,
Thu thập dữ
liệu
bao nhiêu lần so với trung bình,
Trình bày dữ Trình bày dữ
liệu n liệu
Tóm tắt dữ liệu định
X
(xi − x̄ ) = 0. Tóm tắt dữ liệu định Độ lệch chuẩn
tính: phương pháp
bảng và đồ thị
i=1
tính: phương pháp
bảng và đồ thị CV = × 100%.
Tóm tắt dữ liệu định
lượng: phương pháp
Tóm tắt dữ liệu định
lượng: phương pháp
Ttrung bình
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh Các độ lệch dương và các độ lệch âm bù trừ lẫn nhau, dẫn đến Phương pháp nhánh
lá lá
Hệ số biến thiên là một thống kê hữu ích để so
Tóm tắt dữ tổng các độ lệch so với giá trị trung bình bằng không. Tóm tắt dữ
liệu bằng các
đại lượng
liệu bằng các
đại lượng
sánh độ phân tán của các biến có độ lệch chuẩn
thống kê mô thống kê mô
tả
Để tránh tất cả các độ lệch so với giá trị trung bình triệt tiêu tả khác nhau và trung bình khác nhau.
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng
tập trung lẫn nhau khi chúng ta cộng chúng lại với nhau, ta xét định lường khuynh hướng
tập trung Ví dụ: Đối với bộ dữ liệu lương khởi điểm trong bảng 3.1, hệ số
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng
phân tán
nghĩa độ lệch tuyệt đối trung bình như sau: lường khuynh hướng
phân tán biến thiên là [(165, 65/3540) × 100]% = 4, 7%. Hệ số biến
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu Pn phân phối của dữ liệu
Phân tích dữ liệu i=1 |xi − x̄ | Phân tích dữ liệu thiên này cho chúng ta biết độ lệch chuẩn mẫu chỉ bằng 4, 7%
thăm dò . thăm dò

n giá trị trung bình mẫu.

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Ví dụ so sánh hệ số biến thiên NTMộngNgọc
Hệ số bất đối xứng (Skewness)
Tổng quan về • Dữ liệu 1 có: trung bình x̄1 = 50 và độ lệch Tổng quan về
thống kê thống kê

Thu thập dữ chuẩn s1 = 5 nên Thu thập dữ


liệu liệu

Trình bày dữ Trình bày dữ Hệ số bất đối xứng (Skewness) là một đại lượng
liệu
x̄1 5 liệu
Tóm tắt dữ liệu định
tính: phương pháp CV1 = × 100% = × 100% = 10%. Tóm tắt dữ liệu định
tính: phương pháp số quan trọng đo lường hình dáng của một phân
bảng và đồ thị
Tóm tắt dữ liệu định
lượng: phương pháp
s1 50 bảng và đồ thị
Tóm tắt dữ liệu định
lượng: phương pháp phối.
bảng và đồ thị
• Dữ liệu 2 có: trung bình x̄2 = 100 và độ lệch bảng và đồ thị
Phương pháp nhánh

Phương pháp nhánh
lá Công thức tính Skewness cho dữ liệu mẫu:
Tóm tắt dữ chuẩn s2 = 5 nên Tóm tắt dữ
liệu bằng các liệu bằng các
n n x − x̄
i
)3 .
đại lượng đại lượng X
thống kê mô thống kê mô Skewness = (
tả
x̄2 5 tả
(n − 1)(n − 2) i=1 s
× 100% = × 100% = 5%.
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng
tập trung
CV2 = lường khuynh hướng
tập trung
Các đặc trưng đo
lường khuynh hướng
s2 100 Các đặc trưng đo
lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng
phân phối của dữ liệu
• Cả hai bộ dữ liệu có cùng độ lệch chuẩn Khảo sát hình dáng
phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò
nhưng dữ liệu 2 biến thiên ít hơn so với giá thăm dò

trị của nó.


Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Hệ số bất đối xứng (Skewness) (tt) NTMộngNgọc
Ví dụ:
Biểu đồ phân phối tần suất mô tả độ lệch
Tổng quan về Tổng quan về
thống kê • Khi phân phối đối xứng, Skewness có giá trị là 0, thì trung thống kê của bốn phân phối:
Thu thập dữ bình, trung vị và mode bằng nhau; Thu thập dữ
liệu liệu

Trình bày dữ
• Khi bộ dữ liệu có phân phối lệch phải, Skewness có giá trị Trình bày dữ
liệu liệu
Tóm tắt dữ liệu định
dương, thì mode < trung vị < trung bình; Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị • Khi bộ dữ liệu có phân phối lệch trái, Skewness có giá trị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp
bảng và đồ thị âm, thì mode > trung vị > trung bình. lượng: phương pháp
bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng đại lượng
thống kê mô thống kê mô
tả tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Giá trị z (giá trị chuẩn hóa) NTMộngNgọc
Giá trị z (giá trị chuẩn hóa) (tt)
Tổng quan về
thống kê Giả sử chúng ta có một mẫu gồm n quan sát với
Tổng quan về
thống kê
Ví dụ: Giá trị z của quy mô lớp học
Thu thập dữ Thu thập dữ
liệu các giá trị tương ứng x1 , x2 , ..., xn . liệu

Trình bày dữ Trình bày dữ


liệu Giá trị z (giá trị chuẩn hóa) được tính cho mỗi xi liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị là: tính: phương pháp
bảng và đồ thị
Tóm tắt dữ liệu định
xi − x̄ Tóm tắt dữ liệu định
lượng: phương pháp
bảng và đồ thị zi = , lượng: phương pháp
bảng và đồ thị
Phương pháp nhánh
lá s Phương pháp nhánh

Tóm tắt dữ
liệu bằng các
trong đó, Tóm tắt dữ
liệu bằng các
đại lượng
thống kê mô
• zi là giá trị z cho xi ; đại lượng
thống kê mô
tả tả
Các đặc trưng đo • x̄ là trung bình mẫu; Các đặc trưng đo
lường khuynh hướng
tập trung
• s là độ lệch chuẩn mẫu.
lường khuynh hướng
tập trung Trong bảng 3.4, ta thấy giá trị z là −1, 5 của
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng
phân tán
lường khuynh hướng
phân tán quan sát thứ năm cho thấy quan sát này ở xa so
Khảo sát hình dáng
Giá trị z cho bất kỳ quan sát nào có thể hiểu như là một thước Khảo sát hình dáng
phân phối của dữ liệu
Phân tích dữ liệu
phân phối của dữ liệu
Phân tích dữ liệu với trung bình; giá trị của quan sát này nhỏ hơn
thăm dò
đo vị trí tương đối của quan sát đó trong tập dữ liệu. thăm dò

trung bình 1, 5 lần độ lệch chuẩn.


Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Quy tắc Chebyshev NTMộngNgọc
Ví dụ:
Tổng quan về Tổng quan về
thống kê Quy tắc Chebyshev Ít nhất là (1 − 1/z 2 )100% số lượng giá trị thống kê

Thu thập dữ dữ liệu nằm trong khoảng z độ lệch chuẩn so với giá trị trung Thu thập dữ
liệu liệu
bình, trong đó z là giá trị bất kỳ lớn hơn 1.
Trình bày dữ Trình bày dữ
liệu liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
Ý nghĩa của quy tắc này: Với một tổng thể bất kì có trung bình tính: phương pháp
bảng và đồ thị
Tóm tắt dữ liệu định
lượng: phương pháp
µ và độ lệch chuẩn σ, và z > 1, có ít nhất [1 − (1/z 2 )]100% Tóm tắt dữ liệu định
lượng: phương pháp
bảng và đồ thị bảng và đồ thị
Phương pháp nhánh các giá trị quan trắc nằm trong khoảng [µ − zσ, µ + zσ] Phương pháp nhánh
lá lá

Tóm tắt dữ • Với z = 2: ít nhất 75% các giá trị dữ liệu nằm trong Tóm tắt dữ
liệu bằng các liệu bằng các
đại lượng khoảng z = 2 độ lệch chuẩn so với giá trị trung bình, hay đại lượng
thống kê mô thống kê mô
tả ít nhất 75% các giá trị rơi vào khoảng (µ − 2σ, µ + 2σ). tả
Các đặc trưng đo
lường khuynh hướng
tập trung
• Với z = 3: ít nhất 89% các giá trị dữ liệu nằm trong Các đặc trưng đo
lường khuynh hướng
tập trung
Các đặc trưng đo
lường khuynh hướng
khoảng z = 3 độ lệch chuẩn so với giá trị trung bình. Các đặc trưng đo
lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng
phân phối của dữ liệu
• Với z = 4: ít nhất 94% các giá trị dữ liệu nằm trong Khảo sát hình dáng
phân phối của dữ liệu
Phân tích dữ liệu
thăm dò khoảng z = 4 độ lệch chuẩn so với giá trị trung bình. Phân tích dữ liệu
thăm dò

Thống kê Ví dụ khác : Giả sử rằng các điểm kiểm tra giữ kỳ cho 100 sinh Thống kê
ứng dụng ứng dụng
viên của khóa học thống kê có điểm trung bình là 70 và độ Quy tắc thực nghiệm
NTMộngNgọc NTMộngNgọc
lệch chuẩn là 5. Có bao nhiêu sinh viên có điểm kiểm tra nằm
Tổng quan về
thống kê
giữa 60 và 80? Có bao nhiêu sinh viên có điểm kiểm tra nằm Tổng quan về
thống kê
Quy tắc Chebyshev áp dụng cho bất kỳ tập dữ
Thu thập dữ
giữa 58 và 82? Thu thập dữ liệu nào bất kể hình dáng của phân phối dữ liệu.
liệu • Chúng ta thấy 60 và 80 lần lượt ở dưới và ở trên trung liệu

Trình bày dữ
bình 2 lần độ lệch chuẩn. Theo quy tắc Chebyshev, ta biết Trình bày dữ
Quy tắc thực nghiệm áp dụng cho những tập dữ
liệu liệu
Tóm tắt dữ liệu định
tính: phương pháp
được có ít nhất 75% các quan sát có giá trị nằm trong Tóm tắt dữ liệu định
tính: phương pháp
liệu được cho là xấp xỉ phân phối Gauss (hay
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định
khoảng z = 2 độ lệch chuẩn so với giá trị trung bình. Như Tóm tắt dữ liệu định phân phối hình chuông).
lượng: phương pháp lượng: phương pháp
bảng và đồ thị vậy, ít nhất có 75% số sinh viên có điểm kiểm tra nằm bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh Ý nghĩa của quy tắc thực nghiệm

giữa 60 và 80. lá

Tóm tắt dữ
• Chúng ta thấy rằng (58 − 70)/5 = −2, 4 cho thấy 58 ở Tóm tắt dữ • Khoảng 68% của các giá trị dữ liệu sẽ nằm trong khoảng
liệu bằng các liệu bằng các
đại lượng
dưới trung bình 2,4 lần độ lệch chuẩn và đại lượng cộng và trừ 1 độ lệch chuẩn so với giá trị trung bình
thống kê mô thống kê mô
tả
(82 − 70)/5 = 2, 4 cho thấy 82 ở trên trung bình 2,4 lần tả (x̄ ± 1s).
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng
tập trung độ lệch chuẩn. Áp dụng quy tắc Chebychev với z = 2, 4, lường khuynh hướng
tập trung
• Khoảng 95% của các giá trị dữ liệu sẽ nằm trong khoảng
Các đặc trưng đo
lường khuynh hướng ta có : Các đặc trưng đo
lường khuynh hướng cộng và trừ 2 độ lệch chuẩn so với giá trị trung bình
phân tán
1 phân tán
(x̄ ± 2s).
Khảo sát hình dáng
phân phối của dữ liệu (1 − 1/z 2 ) = (1 − = 0, 826. Khảo sát hình dáng
phân phối của dữ liệu
Phân tích dữ liệu 2, 42 Phân tích dữ liệu
• Hầu như tất cả các giá trị dữ liệu sẽ nằm trong khoảng 3
thăm dò thăm dò

Vậy có ít nhất 82, 6% số sinh viên có điểm kiểm tra nằm độ lệch chuẩn so với giá trị trung bình (x̄ ± 3s).
giữa 58 và 82.
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc NTMộngNgọc
Ví dụ khác :
Tổng quan về
Ví dụ: Hộp carton đựng nước giặt được tự động đóng gói trong Tổng quan về
thống kê
một dây chuyền sản xuất. Trọng lượng sau khi đóng gói thường thống kê

Thu thập dữ Thu thập dữ


liệu có phân phối hình chuông. liệu

Trình bày dữ Nếu trọng lượng trung bình là x̄ = 16 ounce và độ lệch chuẩn Trình bày dữ
liệu liệu
Tóm tắt dữ liệu định
là s = 0, 25 ounce, áp dụng quy tắc thực nghiệm chúng ta có Tóm tắt dữ liệu định
tính: phương pháp tính: phương pháp
bảng và đồ thị thể rút ra kết luận sau: bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp
bảng và đồ thị • Khoảng 68% các hộp có trọng lượng nằm giữa 15,75 và lượng: phương pháp
bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh
lá 16,25 (x̄ ± 1s). lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các • Khoảng 95% các hộp có trọng lượng nằm giữa 15,50 và liệu bằng các
đại lượng đại lượng
thống kê mô 16,50 (x̄ ± 2s). thống kê mô
tả tả
Các đặc trưng đo • Hầu như tất cả các hộp có trọng lượng nằm giữa 15,25 và Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung
Các đặc trưng đo
16,75 (x̄ ± 3s). tập trung
Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Phát hiện các giá trị ngoại lai (hay NTMộngNgọc
Độ lệch chuẩn tuyệt đối trung bình
Tổng quan về
bất thường) Tổng quan về
Độ lệch chuẩn tuyệt đối trung bình là số bình quân số học của
thống kê thống kê các độ lệch tuyệt đối giữa các lượng biến với bình quân số học của
Thu thập dữ Thu thập dữ các lượng biến đó.
liệu liệu

Trình bày dữ
liệu Những giá trị quá lớn hoặc quá nhỏ trong một Trình bày dữ
liệu
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
tập dữ liệu đgl giá trị ngoại lai (hay giá trị bất tính: phương pháp
bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp
bảng và đồ thị thường). lượng: phương pháp
bảng và đồ thị
Phương pháp nhánh Phương pháp nhánh

Giá trị z (giá trị chuẩn hóa) có thể được sử dụng lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các
đại lượng
để xác định giá trị ngoại lai (hay giá trị bất liệu bằng các
đại lượng
thống kê mô thống kê mô
tả thường). Khi đó, bất kỳ giá trị dữ liệu nào với giá tả
Các đặc trưng đo Các đặc trưng đo
lường khuynh hướng
tập trung
Các đặc trưng đo
trị z nhỏ hơn −3 hoặc lớn hơn 3 thì được xem là lường khuynh hướng
tập trung
Các đặc trưng đo
lường khuynh hướng
phân tán
Khảo sát hình dáng
giá trị ngoại lai (hay bất thường). lường khuynh hướng
phân tán
Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Ví dụ: NTMộngNgọc
Phân tích dữ liệu thăm dò
Có sos liệu về năng suất lao động năm của công nhân trong một
Tổng quan về Tổng quan về
thống kê doanh nghiệp như sau: thống kê
Ngoài kỹ thuật phân tích dữ liệu thăm dò bằng biểu đồ nhánh
Thu thập dữ Thu thập dữ
liệu liệu
lá, chúng ta còn có thể dùng cách xem xét bộ tóm tắt năm trị
Trình bày dữ Trình bày dữ
liệu
Tóm tắt dữ liệu định
liệu
Tóm tắt dữ liệu định
số hoặc dùng biểu đồ hộp.
tính: phương pháp tính: phương pháp
bảng và đồ thị bảng và đồ thị
Tóm tắt dữ liệu định Tóm tắt dữ liệu định
lượng: phương pháp
bảng và đồ thị
Phương pháp nhánh
lượng: phương pháp
bảng và đồ thị
Phương pháp nhánh
Bộ tóm tắt năm số gồm:
• Giá trị nhỏ nhất;
lá lá

Tóm tắt dữ Tóm tắt dữ


liệu bằng các liệu bằng các
đại lượng
thống kê mô
đại lượng
thống kê mô
• Tứ phân vị thứ nhất (Q1 );
tả
• Tính trung bình tả
Các đặc trưng đo
lường khuynh hướng
x̄ = 20 Các đặc trưng đo
lường khuynh hướng
• Trung vị (Q2 );
tập trung tập trung
Các đặc trưng đo
lường khuynh hướng
phân tán
• Tính độ lệch chuẩn tuyệt đối trung bình Các đặc trưng đo
lường khuynh hướng
phân tán
• Tứ phân vị thứ ba (Q3 );
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu
Phân tích dữ liệu
d̄ =
| 10 − 20 | 10+ | 15 − 20 | 20 + ...+ | 35 − 20 | 10
=
400
=4
phân phối của dữ liệu
Phân tích dữ liệu
• Giá trị lớn nhất.
thăm dò thăm dò
10 + 20 + 50 + 10 + 10 100

Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Bộ tóm tắt năm số NTMộngNgọc
Biểu đồ hộp
Tổng quan về Tổng quan về Một biểu đồ hộp là một tóm tắt bằng hình vẽ của dữ liệu dự
thống kê thống kê
trên một bộ tóm tắt năm số.
Thu thập dữ
liệu Cách xây dựng bộ tóm tắt năm số: Thu thập dữ
liệu Cách xây dựng biểu đồ hộp:
Trình bày dữ
liệu • Sắp xếp dữ liệu theo thứ tự tăng dần; Trình bày dữ
liệu B1. Xác định ba tứ phân vị (Q1 , Q2 và Q3 ) và độ trải giữa
Tóm tắt dữ liệu định Tóm tắt dữ liệu định (IQR = Q3 − Q1 );
tính: phương pháp
bảng và đồ thị • Xác định giá trị nhỏ nhất; ba tứ phân vị (Q1 , tính: phương pháp
bảng và đồ thị
Tóm tắt dữ liệu định
lượng: phương pháp
Tóm tắt dữ liệu định
lượng: phương pháp
B2. Xác định các giá trị bất thường: điểm ngoại lai (outlier) và cực
bảng và đồ thị
Phương pháp nhánh
Q2 và Q3 ) và giá trị lớn nhất. bảng và đồ thị
Phương pháp nhánh
ngoại lai (extreme outlier) (nếu có) và giá trị nhỏ nhất, giá rị
lá lá
lớn nhất.
Tóm tắt dữ Tóm tắt dữ
liệu bằng các liệu bằng các Vẽ một trục tọa độ ngang (hoặc dọc), và vẽ các đoạn thẳng tại
đại lượng Ví dụ: đại lượng
B3.
thống kê mô thống kê mô Q1 , Q2 và Q3 . Đóng khung các đoạn thẳng này trong một hộp.
tả
Bộ tóm tắt năm số cho các dữ liệu trong bảng tả
Các đặc trưng đo
lường khuynh hướng
Các đặc trưng đo
lường khuynh hướng B4. Vẽ một đoạn thẳng (bằng đường đứt nét) từ Q1 đến giá trị dữ
tập trung
Các đặc trưng đo
3.1 về mức lương khởi điểm hàng tháng là : tập trung
Các đặc trưng đo liệu nhỏ nhất nhưng lớn hơn Q1 − 1, 5IQR. Vẽ một đoạn thẳng
lường khuynh hướng lường khuynh hướng
phân tán
3310, 3465, 3505, 3600, 3925. phân tán (bằng đường đứt nét) từ Q3 đến giá trị dữ liệu lớn nhất nhưng
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu nhỏ hơn Q3 + 1, 5IQR.
Phân tích dữ liệu Phân tích dữ liệu
thăm dò thăm dò
B5. Đánh dấu các điểm outlier và extreme outlier.
Thống kê Thống kê
ứng dụng ứng dụng

NTMộngNgọc
Biểu đồ hộp (tt) NTMộngNgọc
Biểu đồ hộp (tt)
Tổng quan về Tổng quan về
thống kê Ví dụ: Biểu đồ hộp cho các dữ liệu trong bảng thống kê

Thu thập dữ
liệu 3.1 về mức lương khởi điểm hàng tháng được xây Thu thập dữ
liệu Biểu đồ hộp về mức lương khởi điểm hàng tháng
Trình bày dữ dựng như sau: Trình bày dữ
liệu liệu
Tóm tắt dữ liệu định
tính: phương pháp
• Một hộp được vẽ với các cạnh của hộp nằm ở Q1 = 3465 và Tóm tắt dữ liệu định
tính: phương pháp
bảng và đồ thị
Tóm tắt dữ liệu định
Q3 = 3600; bảng và đồ thị
Tóm tắt dữ liệu định
lượng: phương pháp lượng: phương pháp
bảng và đồ thị
Phương pháp nhánh
• Đường thẳng được vẽ trong hộp ở vị trí trung vị Q2 = 3505; bảng và đồ thị
Phương pháp nhánh
lá lá

Tóm tắt dữ
• Với IQR = Q3 − Q1 = 135, ta có các giới hạn cho biểu đồ hộp Tóm tắt dữ
liệu bằng các
đại lượng
là Q1 − 1, 5IQR = 3465 − 1, 5 ∗ 135 = 3262, 5 và liệu bằng các
đại lượng
thống kê mô Q3 + 1, 5IQR = 3600 + 1, 5 ∗ 135 = 3802, 5. Dữ liệu nằm ngoài thống kê mô
tả tả
Các đặc trưng đo các giới hạn này được xem là các giá trị bất thường. Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
tập trung tập trung
Các đặc trưng đo
• Vẽ các râu bằng đường đứt nét từ các cạnh của hộp đến giá trị Các đặc trưng đo
lường khuynh hướng lường khuynh hướng
phân tán tiền lương 3310 và 3730. phân tán
Khảo sát hình dáng Khảo sát hình dáng
phân phối của dữ liệu phân phối của dữ liệu
Phân tích dữ liệu
• Dùng biểu tượng dấu sao ∗ để đánh dấu điểm ngoại lai 3925. Phân tích dữ liệu
thăm dò thăm dò

Thống kê
ứng dụng

NTMộngNgọc
Ví dụ: Biểu đồ hộp
Tổng quan về
thống kê

Thu thập dữ
liệu
Cho dữ liệu của một mẫu điều tra nhỏ về tuổi của 30 sinh viên
Trình bày dữ
liệu tại chức đang học năm 1 ngành Kế toán - Kiểm toán như sau:
Tóm tắt dữ liệu định
tính: phương pháp 28 23 30 24 19 21 39 22 22 31
bảng và đồ thị
Tóm tắt dữ liệu định 37 33 20 30 35 21 26 27 25 29
lượng: phương pháp
bảng và đồ thị
Phương pháp nhánh
27 21 25 28 26 29 29 22 32 27.

Tóm tắt dữ
liệu bằng các
đại lượng
thống kê mô 1) Lập bảng tần số về tuổi của 30 sinh viên tại chức đang học
tả
Các đặc trưng đo năm 1 ngành Kế toán - Kiểm toán.
lường khuynh hướng
tập trung
Các đặc trưng đo 2) Lập biểu đồ hộp và râu mô tả tập dữ liệu trên.
lường khuynh hướng
phân tán
Khảo sát hình dáng
phân phối của dữ liệu
Phân tích dữ liệu
thăm dò

You might also like