Professional Documents
Culture Documents
Thống kê mô tả
Hoàng Văn Hà
University of Science, VNU - HCM
hvha@hcmus.edu.vn
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Outline
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Biến và dữ liệu
• Biến (variable): một đặc trưng mà thay đổi từ người hay vật, hiện tượng
này sang người hay vật, hiện tượng khác. Biến gồm hai loại: biến định tính
(qualitative variable) và biến định lượng (quantitative variable).
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Biến và dữ liệu
• Biến (variable): một đặc trưng mà thay đổi từ người hay vật, hiện tượng
này sang người hay vật, hiện tượng khác. Biến gồm hai loại: biến định tính
(qualitative variable) và biến định lượng (quantitative variable).
• Biến định tính: biểu diễn tính chất của đặc trưng mà nó thể hiện, có tác
dụng phân loại. Ví dụ: nhóm máu (A, B, AB, O), giới tính (nam, nữ), màu
mắt (đen, nâu, xanh), . . .
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Biến và dữ liệu
• Biến (variable): một đặc trưng mà thay đổi từ người hay vật, hiện tượng
này sang người hay vật, hiện tượng khác. Biến gồm hai loại: biến định tính
(qualitative variable) và biến định lượng (quantitative variable).
• Biến định tính: biểu diễn tính chất của đặc trưng mà nó thể hiện, có tác
dụng phân loại. Ví dụ: nhóm máu (A, B, AB, O), giới tính (nam, nữ), màu
mắt (đen, nâu, xanh), . . .
• Biến định lượng: biểu diễn độ lớn của đặc trưng mà nó thể hiện. Ví dụ:
chiều cao, cân nặng, thời gian, . . .
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Biến và dữ liệu
• Biến (variable): một đặc trưng mà thay đổi từ người hay vật, hiện tượng
này sang người hay vật, hiện tượng khác. Biến gồm hai loại: biến định tính
(qualitative variable) và biến định lượng (quantitative variable).
• Biến định tính: biểu diễn tính chất của đặc trưng mà nó thể hiện, có tác
dụng phân loại. Ví dụ: nhóm máu (A, B, AB, O), giới tính (nam, nữ), màu
mắt (đen, nâu, xanh), . . .
• Biến định lượng: biểu diễn độ lớn của đặc trưng mà nó thể hiện. Ví dụ:
chiều cao, cân nặng, thời gian, . . .
• Biến định lượng bao gồm biến rời rạc (discrete variable) và biến liên tục
(continuous variable).
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Biến và dữ liệu
• Biến rời rạc liên quan đến bài toán đếm số các phần tử của một tổng thể.
Ví dụ: số sản phẩm hỏng trong 1 lô hàng, số con trong 1 gia đình, số cuộc
điện thoại đến tổng đài trong 1 giờ, . . . . Biến liên tục liên quan đến sự đo
đạc. Ví dụ: cân nặng của 1 sản phẩm, chiều cao của 1 cái cây, cường độ
dòng điện, nhiệt độ, doanh thu của một công ty . . .
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Biến và dữ liệu
• Biến rời rạc liên quan đến bài toán đếm số các phần tử của một tổng thể.
Ví dụ: số sản phẩm hỏng trong 1 lô hàng, số con trong 1 gia đình, số cuộc
điện thoại đến tổng đài trong 1 giờ, . . . . Biến liên tục liên quan đến sự đo
đạc. Ví dụ: cân nặng của 1 sản phẩm, chiều cao của 1 cái cây, cường độ
dòng điện, nhiệt độ, doanh thu của một công ty . . .
• Dữ liệu (data): các giá trị của một biến. Tập hợp tất cả những quan trắc
(observations) cho một biến cụ thể được gọi là một tập dữ liệu (dataset).
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Thang đo dữ liệu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Thang đo dữ liệu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Thang đo dữ liệu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Thang đo dữ liệu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Thang đo dữ liệu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Thang đo dữ liệu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
• Tổng thể (population): tập hợp tất cả những phần tử mang đặc trưng
quan tâm hay cần nghiên cứu.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
• Tổng thể (population): tập hợp tất cả những phần tử mang đặc trưng
quan tâm hay cần nghiên cứu.
• Mẫu (sample): là một tập con được chọn ra từ tổng thể.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
• Tổng thể (population): tập hợp tất cả những phần tử mang đặc trưng
quan tâm hay cần nghiên cứu.
• Mẫu (sample): là một tập con được chọn ra từ tổng thể.
• Tham số (parameter): là một đặc trưng cụ thể của một tổng thể.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
• Tổng thể (population): tập hợp tất cả những phần tử mang đặc trưng
quan tâm hay cần nghiên cứu.
• Mẫu (sample): là một tập con được chọn ra từ tổng thể.
• Tham số (parameter): là một đặc trưng cụ thể của một tổng thể.
• Thống kê (statistic): là một đặc trưng cụ thể của một mẫu.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Ví dụ về tổng thể
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Ví dụ về tổng thể
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Một mẫu ngẫu nhiên (random sample) gồm n phần tử được chọn ra từ một
tổng thể phải thỏa các điều kiện sau:
Mỗi phần tử trong tổng thể phải được chọn ngẫu nhiên và độc lập
Mỗi phần tử trong tổng thể có khả năng được chọn như nhau (xác suất
được chọn bằng nhau)
Mọi mẫu cỡ n cũng có cùng khả năng được chọn từ tổng thể
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Một mẫu ngẫu nhiên (random sample) gồm n phần tử được chọn ra từ một
tổng thể phải thỏa các điều kiện sau:
Mỗi phần tử trong tổng thể phải được chọn ngẫu nhiên và độc lập
Mỗi phần tử trong tổng thể có khả năng được chọn như nhau (xác suất
được chọn bằng nhau)
Mọi mẫu cỡ n cũng có cùng khả năng được chọn từ tổng thể
Phương pháp chọn mẫu ngẫu nhiên đơn giản (simple random sampling):
+ Đánh số các phần tử của tổng thể từ 1 đến N. Lập các phiếu cũng đánh
số như vậy.
+ Trộn đều các phiếu, sau đó chọn có hoàn lại n phiếu. Các phần tử của
tổng thể có số thứ tự trong phiếu lấy ra sẽ được chọn làm mẫu.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Thống kê mô tả
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Suy diễn (inference) là một quá trình rút ra các kết luận hoặc đưa ra các
quyết định về một tổng thể dựa vào các kết quả nghiên cứu từ mẫu.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Suy diễn (inference) là một quá trình rút ra các kết luận hoặc đưa ra các
quyết định về một tổng thể dựa vào các kết quả nghiên cứu từ mẫu.
Thống kê suy diễn (Inferential statistics): xử lý các thông tin có được
từ thống kê mô tả, từ đó đưa ra các cơ sở cho những dự đoán
(predictions), dự báo (forecasts) và các ước lượng (estimations).
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Suy diễn (inference) là một quá trình rút ra các kết luận hoặc đưa ra các
quyết định về một tổng thể dựa vào các kết quả nghiên cứu từ mẫu.
Thống kê suy diễn (Inferential statistics): xử lý các thông tin có được
từ thống kê mô tả, từ đó đưa ra các cơ sở cho những dự đoán
(predictions), dự báo (forecasts) và các ước lượng (estimations).
+ Ước lượng: ví dụ ước lượng tỷ lệ sản phẩm kém chất lượng trong 1 nhà máy,
ước lượng tỷ lệ hành khách đã mua vé nhưng vắng mặt trên một chuyến bay.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Mô tả dữ liệu định lượng
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Suy diễn (inference) là một quá trình rút ra các kết luận hoặc đưa ra các
quyết định về một tổng thể dựa vào các kết quả nghiên cứu từ mẫu.
Thống kê suy diễn (Inferential statistics): xử lý các thông tin có được
từ thống kê mô tả, từ đó đưa ra các cơ sở cho những dự đoán
(predictions), dự báo (forecasts) và các ước lượng (estimations).
+ Ước lượng: ví dụ ước lượng tỷ lệ sản phẩm kém chất lượng trong 1 nhà máy,
ước lượng tỷ lệ hành khách đã mua vé nhưng vắng mặt trên một chuyến bay.
+ Kiểm định giả thuyết: ví dụ cần kiểm định khẳng định rằng lợi nhuận trung
bình của một cửa hàng trong một tháng là 300 triệu.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Giới thiệu
Việc mô tả dữ liệu bằng đồ thị sẽ cho ta một cái nhìn tổng quan về dữ
liệu trước khi đi vào phân tích cụ thể.
Các loại đồ thị được sử dụng sẽ phụ thuộc vào dạng biến cần phân tích.
Một số dạng đồ thị thường dùng: đồ thị tổ chức tần số (histogram) / đồ
thị thân và lá (stem-and-leaf), đồ thị phân tán (scatter plot).
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Phân bố tần số
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Phân bố tần số
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Phân bố tần số
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Ví dụ 1
Chọn ngẫu nhiên 20 ngày mùa đông có nhiệt độ cao và đo nhiệt độ (Đv: độ F)
được số liệu như sau
24 35 17 21 24 37 26 46 58 30
32 13 12 38 41 43 44 27 53 27
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Đồ thị biểu diễn bảng phân bố tần số gọi là đồ thị tổ chức tần số (histogram).
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Dáng điệu của phân phối (shape of the distribution) gọi là đối xứng
(symmetric) nếu các giá trị quan trắc cân bằng xung quanh trung tâm.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Dáng điệu của phân phối gọi là bất đối xứng (skewed) nếu dữ liệu quan
trắc không phân bố đối xứng xung quanh trung tâm.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Sử dụng đồ thị histogram để nhận biết phân phối xác suất của một đại
lượng ngẫu nhiên.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Đồ thị thân và lá
Là một dạng đồ thị đơn giản dùng để nhận biết phân phối của một biến từ
một tập dữ liệu.
Phương pháp: sắp xếp dữ liệu theo thứ tự tăng dần, chia các giá trị đã
sắp xếp thành hai phần: phần thứ nhất gồm các chữ số dẫn đầu (stem) và
phần thứ hai là chữ số đuôi (leaf).
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Đồ thị thân và lá - ví dụ
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Đồ thị thân và lá - ví dụ
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Đồ thị thân và lá - ví dụ
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Đồ thị thân và lá - ví dụ
Ví dụ 2
Bộ dữ liệu sau mô tả kết quả thi môn Toán (thang điểm 100) của 20 sinh viên
trong một lớp học.
72 49 62 58 73 55 78 83 57 63
73 73 75 85 85 64 61 67 75 91
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Đồ thị thân và lá - ví dụ
Ví dụ 2
Bộ dữ liệu sau mô tả kết quả thi môn Toán (thang điểm 100) của 20 sinh viên
trong một lớp học.
72 49 62 58 73 55 78 83 57 63
73 73 75 85 85 64 61 67 75 91
Ví dụ 3
Bộ dữ liệu dưới đây cho biết kết quả của thi môn bật xa (Đv: m) của 10 sinh
viên trong môn học giáo dục thể chất:
2.3 2.5 2.5 2.7 2.8 3.2 3.6 3.6 4.5 5.0
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân bố tần số và đồ thị histogram
Mô tả dữ liệu định lượng
Đồ thị thân và lá (stem & leaf) và đồ thị phân tán
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Đồ thị phân tán (scatter plot) được sử dụng để xác định mối liên hệ giữa hai
biến X và Y .
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Giới thiệu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Trung bình
Trung bình (mean) là đại lượng thường được sử dụng nhất để đo giá trị
trung tâm của dữ liệu.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Trung bình
Trung bình (mean) là đại lượng thường được sử dụng nhất để đo giá trị
trung tâm của dữ liệu.
Với một tổng thể có N phần tử, trung bình tổng thể tính bởi
PN
i=1 xi x1 + x2 + . . . + xN
µ= = .
N N
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Trung bình
Trung bình (mean) là đại lượng thường được sử dụng nhất để đo giá trị
trung tâm của dữ liệu.
Với một tổng thể có N phần tử, trung bình tổng thể tính bởi
PN
i=1 xi x1 + x2 + . . . + xN
µ= = .
N N
Với một mẫu cỡ n, trung bình mẫu
Pn
i=1 xi x1 + x2 + . . . + xn
x̄ = = .
n n
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Trung bình
Trung bình bị ảnh hưởng bởi các giá trị ngoại lai (outliers).
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Trung vị
Trong một tập dữ liệu được sắp xếp theo thứ tự tăng dần, trung vị
(median) là giá trị "chính giữa" của dữ liệu (50% bên trên, 50% bên dưới).
Trung vị không bị ảnh hưởng bởi các điểm ngoại lai (outliers).
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Trung vị
Vị trí của trung vị: sắp xếp dữ liệu theo thứ tự tăng dần, gọi i là vị trí của
trung vị
n+1
i=
2
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Mode (yếu vị) là một đại lượng để đo xu hướng trung tâm của dữ liệu,
là giá trị thường xảy ra nhất,
không bị ảnh hưởng bởi các điểm ngoại lai,
có thể sử dụng cho cả dữ liệu định tính và dữ liệu định lượng,
có thể có nhiều mode hoặc không tồn tại mode.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Trung bình luôn luôn được sử dụng, nếu các điểm ngoại lai (outliers)
không tồn tại hoặc sau khi loại bỏ các điểm ngoại lai.
Trung vị thường được dùng nếu bộ dữ liệu có các điểm ngoại lai hoặc rất
bất đối xứng.
Yếu vị (mode) thường dùng để mô tả các biến định tính.
Vị trí của trung vị và trung bình ảnh hưởng bởi dáng diệu của phân phối:
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Ví dụ 4
Bộ dữ liệu sau mô tả kết quả thi môn Toán (thang điểm 100) của 20 sinh viên
trong một lớp học.
72 49 62 58 73 55 78 83 57 63
73 73 75 85 85 64 61 67 75 91
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Độ đo sự biến thiên
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Khoảng tứ phân vị
Ta có thể loại bỏ các điểm ngoại bằng cách sử dụng khoảng tứ phân vị
(Inter-Quartile Range - IQR) (hay còn được gọi là độ trãi giữa ).
Công thức tính khoảng tứ phân vị:
IQR = Q3 − Q1
với Q1 là phân vị thứ 1 (mức 25%) và Q3 là phân vị thứ 3 (mức 75%) của
dữ liệu.
Các điểm Q1 , Q2 , và Q3 được gọi là các điểm tứ phân vị.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Sắp xếp dữ liệu theo thứ tự tăng dần, gọi Q1 , Q2 (trung vị), Q3 lần lượt là phân
vị thứ 1, 2 và 3 của dữ liệu. Vị trí của Q1 , Q2 và Q3 được xác định như sau
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Để biểu diễn khoảng tứ phân vị và các điểm ngoại lai (outliers) ta dùng đồ
thị hộp (boxplot):
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Phương sai
Phương sai (Variance) là trung bình của bình phương độ lệch các giá trị so
với trung bình.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Phương sai
Phương sai (Variance) là trung bình của bình phương độ lệch các giá trị so
với trung bình.
Phương sai phản ánh độ phân tán hay sự biến thiên của dữ liệu.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Phương sai
Phương sai (Variance) là trung bình của bình phương độ lệch các giá trị so
với trung bình.
Phương sai phản ánh độ phân tán hay sự biến thiên của dữ liệu.
Phương sai tổng thể PN
i=1 (xi − µ)2
σ2 =
N
với N là số phần tử của tổng thể, µ là trung bình tổng thể, xi là giá trị thứ
i của biến x.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Phương sai
Phương sai (Variance) là trung bình của bình phương độ lệch các giá trị so
với trung bình.
Phương sai phản ánh độ phân tán hay sự biến thiên của dữ liệu.
Phương sai tổng thể PN
i=1 (xi − µ)2
σ2 =
N
với N là số phần tử của tổng thể, µ là trung bình tổng thể, xi là giá trị thứ
i của biến x.
Phương sai mẫu Pn
− X̄ )2
i=1 (Xi
S2 =
n−1
với X̄ là trung bình mẫu, n là cỡ mẫu, Xi là giá trị thứ i của biến X .
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Độ đo sự biến thiên
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Hệ số biến thiên
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Hệ số biến thiên
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Hệ số biến thiên
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Hệ số biến thiên
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Dữ liệu A:
Trung bình x̄A = 50
Độ lệch chuẩn sA = 5
SA 5
CVA = 100% = 100% = 10%.
x̄A 50
Dữ liệu B:
Trung bình x̄B = 100
Độ lệch chuẩn sB = 5
SB 5
CVB = 100% = 100% = 5%.
x̄B 100
Cả hai tập dữ liệu có cùng độ lệch chuẩn, nhưng dữ liệu B biến thiên ít
hơn so với giá trị của nó.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Các độ đo trung tâm
Mô tả dữ liệu định lượng
Các độ đo sự biến thiên
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Ví dụ 5
Bộ dữ liệu sau mô tả kết quả thi môn Toán (thang điểm 100) của 20 sinh viên
trong một lớp học.
72 49 62 58 73 55 78 83 57 63
73 73 75 85 85 64 61 67 75 91
a) Tìm Q1 , Q2 , Q3 .
b) Vẽ đồ thị boxplot cho tập dữ liệu trên.
c) Tính phương sai và độ lệch chuẩn.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị Phân phối chuẩn
Mô tả dữ liệu định lượng Phân phối Chi bình phương
Các phân phối thường gặp trong thống kê Phân phối Student t
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị Phân phối chuẩn
Mô tả dữ liệu định lượng Phân phối Chi bình phương
Các phân phối thường gặp trong thống kê Phân phối Student t
Phân phối mẫu
Biến ngẫu nhiên X được gọi là có phân phối chuẩn tắc nếu nó có phân phối
chuẩn với tham số µ = 0 và σ 2 = 1, ký hiệu X ∼ N (0, 1).
Theo quy ước, hàm phân phối của biến ngẫu nhiên chuẩn hóa được ký hiệu là
Φ(x), tức là Z x
1 y2
Φ(x) = √ e − 2 dy .
2π −∞
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị Phân phối chuẩn
Mô tả dữ liệu định lượng Phân phối Chi bình phương
Các phân phối thường gặp trong thống kê Phân phối Student t
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị Phân phối chuẩn
Mô tả dữ liệu định lượng Phân phối Chi bình phương
Các phân phối thường gặp trong thống kê Phân phối Student t
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị Phân phối chuẩn
Mô tả dữ liệu định lượng Phân phối Chi bình phương
Các phân phối thường gặp trong thống kê Phân phối Student t
Phân phối mẫu
Ví dụ 6
Đường kính của một chi tiết máy do một máy tiện sản xuất có phân phối
chuẩn với kỳ vọng 20mm, phương sai (0.2mm)2 . Tính xác suất lấy ngẫu nhiên
một chi tiết
a) có đường kính trong khoảng 19.9mm đến 20.3mm.
b) có đường kính sai khác với kỳ vọng không quá 0.3mm.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị Phân phối chuẩn
Mô tả dữ liệu định lượng Phân phối Chi bình phương
Các phân phối thường gặp trong thống kê Phân phối Student t
Phân phối mẫu
Biến ngẫu nhiên liên tục X nhận giá trị trong khoảng (0, +∞) được gọi là có
phân phối chi bình phương với n bậc tự do, ký hiệu X ∼ χ2 (n), nếu hàm mật
độ xác suất có dạng
0 với x ≤ 0,
f (x) = 1 n −1 − x
2 n2 Γ n x 2 e 2 với x > 0.
(2)
R∞
trong đó Γ(x) = 0 t x−1 e −t dt là hàm Gamma .
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị Phân phối chuẩn
Mô tả dữ liệu định lượng Phân phối Chi bình phương
Các phân phối thường gặp trong thống kê Phân phối Student t
Phân phối mẫu
Xây dựng phân phối Chi bình phương từ phân phối chuẩn
Nếu Z ∼ N (0, 1), thì Y = Z 2 sẽ tuân theo một phân phối được gọi là
phân phối Chi bình phương với 1 bậc tự do. Ký hiệu: Y ∼ χ2 (1).
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị Phân phối chuẩn
Mô tả dữ liệu định lượng Phân phối Chi bình phương
Các phân phối thường gặp trong thống kê Phân phối Student t
Phân phối mẫu
Xây dựng phân phối Chi bình phương từ phân phối chuẩn
Nếu Z ∼ N (0, 1), thì Y = Z 2 sẽ tuân theo một phân phối được gọi là
phân phối Chi bình phương với 1 bậc tự do. Ký hiệu: Y ∼ χ2 (1).
Xét Y1 , Y2 , . . . , Yn là n biến ngẫu nhiên độc lập và có phân phối Chi bình
Pn
phương với 1 bậc tự do. Đặt X = Y1 + Y2 + · · · + Yn = Yi , thì X có
i=1
phân phối Chi bình phương với n bậc tự do. Ký hiệu: X ∼ χ2 (n).
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị Phân phối chuẩn
Mô tả dữ liệu định lượng Phân phối Chi bình phương
Các phân phối thường gặp trong thống kê Phân phối Student t
Phân phối mẫu
Xây dựng phân phối Chi bình phương từ phân phối chuẩn
Nếu Z ∼ N (0, 1), thì Y = Z 2 sẽ tuân theo một phân phối được gọi là
phân phối Chi bình phương với 1 bậc tự do. Ký hiệu: Y ∼ χ2 (1).
Xét Y1 , Y2 , . . . , Yn là n biến ngẫu nhiên độc lập và có phân phối Chi bình
Pn
phương với 1 bậc tự do. Đặt X = Y1 + Y2 + · · · + Yn = Yi , thì X có
i=1
phân phối Chi bình phương với n bậc tự do. Ký hiệu: X ∼ χ2 (n).
n
i.i.d
Zi2 ∼ χ2 (n).
P
Suy ra: nếu Z1 , Z2 , . . . , Zn ∼ N (0, 1), thì
i=1
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị Phân phối chuẩn
Mô tả dữ liệu định lượng Phân phối Chi bình phương
Các phân phối thường gặp trong thống kê Phân phối Student t
Phân phối mẫu
Xây dựng phân phối Chi bình phương từ phân phối chuẩn
Nếu Z ∼ N (0, 1), thì Y = Z 2 sẽ tuân theo một phân phối được gọi là
phân phối Chi bình phương với 1 bậc tự do. Ký hiệu: Y ∼ χ2 (1).
Xét Y1 , Y2 , . . . , Yn là n biến ngẫu nhiên độc lập và có phân phối Chi bình
Pn
phương với 1 bậc tự do. Đặt X = Y1 + Y2 + · · · + Yn = Yi , thì X có
i=1
phân phối Chi bình phương với n bậc tự do. Ký hiệu: X ∼ χ2 (n).
n
i.i.d
Zi2 ∼ χ2 (n).
P
Suy ra: nếu Z1 , Z2 , . . . , Zn ∼ N (0, 1), thì
i=1
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị Phân phối chuẩn
Mô tả dữ liệu định lượng Phân phối Chi bình phương
Các phân phối thường gặp trong thống kê Phân phối Student t
Phân phối mẫu
Xây dựng phân phối Chi bình phương từ phân phối chuẩn
Nếu Z ∼ N (0, 1), thì Y = Z 2 sẽ tuân theo một phân phối được gọi là
phân phối Chi bình phương với 1 bậc tự do. Ký hiệu: Y ∼ χ2 (1).
Xét Y1 , Y2 , . . . , Yn là n biến ngẫu nhiên độc lập và có phân phối Chi bình
Pn
phương với 1 bậc tự do. Đặt X = Y1 + Y2 + · · · + Yn = Yi , thì X có
i=1
phân phối Chi bình phương với n bậc tự do. Ký hiệu: X ∼ χ2 (n).
n
i.i.d
Zi2 ∼ χ2 (n).
P
Suy ra: nếu Z1 , Z2 , . . . , Zn ∼ N (0, 1), thì
i=1
Định lý 1 (Các đặc trưng của biến ngẫu nhiên có phân phối Chi bình phương)
Cho X là biến ngẫu nhiên có phân phối chi bình phương với n bậc tự do thì
i) Kỳ vọng E (X ) = n,
ii) Phương sai Var (X ) = 2n,
iii) Nếu X ∼ χ2 (n), Y ∼ χ2 (m) và X , Y là hai biến ngẫu nhiên độc lập thì
X + Y ∼ χ2 (m + n).
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị Phân phối chuẩn
Mô tả dữ liệu định lượng Phân phối Chi bình phương
Các phân phối thường gặp trong thống kê Phân phối Student t
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị Phân phối chuẩn
Mô tả dữ liệu định lượng Phân phối Chi bình phương
Các phân phối thường gặp trong thống kê Phân phối Student t
Phân phối mẫu
Biến ngẫu nhiên liên tục X nhận giá trị trong khoảng (−∞, +∞) được gọi là
có phân phối Student với n bậc tự do, ký hiệu X ∼ t(n), nếu hàm mật độ xác
suất có dạng
!− n+1
Γ( n+1
2
) t2
2
f (x) = √ 1 + ,
nπ Γ( n2 ) n
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị Phân phối chuẩn
Mô tả dữ liệu định lượng Phân phối Chi bình phương
Các phân phối thường gặp trong thống kê Phân phối Student t
Phân phối mẫu
Biến ngẫu nhiên T được định nghĩa như trên sẽ tuân theo phân phối
Student với n bậc tự do, ký hiệu T ∼ t(n).
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị Phân phối chuẩn
Mô tả dữ liệu định lượng Phân phối Chi bình phương
Các phân phối thường gặp trong thống kê Phân phối Student t
Phân phối mẫu
Biến ngẫu nhiên T được định nghĩa như trên sẽ tuân theo phân phối
Student với n bậc tự do, ký hiệu T ∼ t(n).
Định lý 2 (Các đặc trưng của biến ngẫu nhiên có phân phối Student)
Cho X ∼ t(n) thì
i) Kỳ vọng E (X ) = 0 nếu n > 1, các trường hợp còn lại E (X ) không được
định nghĩa.
n
ii) Phương sai Var (X ) = n−2 nếu n > 2; Var (X ) = ∞ nếu 1 < n ≤ 2 các
trường hợp còn lại Var (X ) không được định nghĩa.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị Phân phối chuẩn
Mô tả dữ liệu định lượng Phân phối Chi bình phương
Các phân phối thường gặp trong thống kê Phân phối Student t
Phân phối mẫu
Lưu ý
• Đồ thị của hàm mật độ phân phối Student có dạng hình chuông như đồ
thị hàm mật độ của phân phối chuẩn, nhưng có phần đỉnh thấp hơn và hai
phần đuôi cao hơn so với phân phối chuẩn.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân phối mẫu của trung bình và phương sai
Mô tả dữ liệu định lượng
Phân phối mẫu của tỷ lệ
Các phân phối thường gặp trong thống kê
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân phối mẫu của trung bình và phương sai
Mô tả dữ liệu định lượng
Phân phối mẫu của tỷ lệ
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Định lý 3
Nếu tổng thể X có phân phối chuẩn X ∼ N(µ, σ 2 ) và (X1 , ..., Xn ) là một mẫu
ngẫu nhiên từ tổng thể trên. Xét
n n
1X 1 X
X̄ = Xi và S 2 = (Xi − X̄ )2 .
n i=1 n − 1 i=1
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân phối mẫu của trung bình và phương sai
Mô tả dữ liệu định lượng
Phân phối mẫu của tỷ lệ
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Trong trường hợp tổng thể không có phân phối chuẩn, từ định lý giới hạn
trung tâm ta suy ra rằng
√
(X̄ − µ) n D
−→ N(0, 1)
σ
√
(X̄ − µ) n D
−→ N(0, 1)
S
Từ kết quả này, trong thực hành, khi mẫu có kích thước, n, đủ lớn ta có các
phân phối xấp xỉ chuẩn sau
√
(X̄ − µ) n
≈ N(0, 1)
σ
√
(X̄ − µ) n
≈ N(0, 1)
S
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân phối mẫu của trung bình và phương sai
Mô tả dữ liệu định lượng
Phân phối mẫu của tỷ lệ
Các phân phối thường gặp trong thống kê
Phân phối mẫu
Ý nghĩa:
• σX̄ đo độ biến thiên của X̄ xung quanh µ,
• Sai số chuẩn càng nhỏ, ước lượng tham số từ tổng thể càng tốt và độ tin
cậy cao.
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân phối mẫu của trung bình và phương sai
Mô tả dữ liệu định lượng
Phân phối mẫu của tỷ lệ
Các phân phối thường gặp trong thống kê
Phân phối mẫu
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân phối mẫu của trung bình và phương sai
Mô tả dữ liệu định lượng
Phân phối mẫu của tỷ lệ
Các phân phối thường gặp trong thống kê
Phân phối mẫu
• Giả sử cần khảo sát đặc trưng A của một tổng thể, khảo sát n phần tử và
đặt (
1, nếu thỏa A
Xi =
0, nếu không thỏa A
V. H. Hoang Thống kê mô tả
Một số khái niệm cơ bản
Mô tả dữ liệu bằng đồ thị
Phân phối mẫu của trung bình và phương sai
Mô tả dữ liệu định lượng
Phân phối mẫu của tỷ lệ
Các phân phối thường gặp trong thống kê
Phân phối mẫu
P̂ − p
r ; N(0, 1)
p(1 − p)
p
p(1−p)
Vì vậy trong thực hành, khi np ≥ 5, n(1 − p) ≥ 5, ta có P̂ ≈ N p, n
.
V. H. Hoang Thống kê mô tả