Biến định tính: chia tập hợp (tổng thể, mẫu) thành các nhóm, không có đơn vị đo lường - Biến nhị phân: chỉ có 2 nhóm, ví dụ giới tính (nam, nữ), thích/không thích, … - Biến định danh: mỗi nhóm được gắn tên và không thể sắp xếp thứ tự, ví dụ quê quán của sinh viên - Biến thứ bậc: mỗi nhóm được gắn tên (số hoặc chữ) và có thể sắp thứ tự, ví dụ size quần áo, giầy dép Biến định lượng: có đơn vị đo lường - Biến định lượng rời rạc: nhận các giá trị tách rời nhau, ví dụ tuổi, điểm thi THPT môn toán, … - Biến định lượng liên tục: nhận các giá trị lấp đầy ít nhất một khoảng trên trục số, ví dụ thời gian hoàn thành một bài thi của sinh viên, kết quả phép đo chiều cao của một ngọn núi, …
Bảng các thống kê mô tả của số liệu về 1 biến
Tên đại lượng Tổng thể Mẫu So sánh Trung bình ∑𝒙𝒊 ∑𝒙𝒊 Công thức tương tự nhau 𝝁= ̅= 𝒙 Ý nghĩa giống nhau 𝑵 𝒏 Trung vị = Q2 Sắp xếp các phần tử từ nhỏ đến lớn Cách tìm và ý nghĩa Trung vị là giá trị ở chính giữa giống nhau (Nếu có 2 giá trị ở giữa thì lấy trung bình) Mốt Giá trị có tần số từ 2 trở lên và tần số lớn nhất Q1, Q3 Tham khảo: Qβ ở vị trí (n+1)β Phương sai 𝟐 ∑(𝑥𝑖 − 𝜇)2 𝟐 ∑(𝑥𝑖 − 𝑥̅ )2 Tử số tương tự nhau, mẫu 𝝈 = 𝒔 = số khác nhau 𝑵 𝒏−𝟏 Độ lệch chuẩn 𝜎 = √𝜎 2 𝑠 = √𝑠 2 Đều là căn bậc hai của phương sai Chú ý: phương sai khác nhau Hệ số biến thiên 𝜎 𝑠 Công thức tương tự nhau 𝐶𝑉 = × 100% 𝐶𝑉 = × 100% 𝜇 𝑥̅ Chú ý: độ lệch chuẩn khác nhau Khoảng biến R = max – min Công thức tương tự nhau thiên Ý nghĩa giống nhau Khoảng tứ phân IQR = Q3 – Q1 vị Hệ số bất đối 𝛼3 ∑(𝑥𝑖 − 𝑥̅ )3 /𝑛 Công thức tương tự nhau xứng )3 ∑(𝑥𝑖 − 𝜇 /𝑁 𝑎3 = Chú ý: độ lệch chuẩn 𝑠3 = khác nhau 𝜎3 Hệ số nhọn 𝛼4 ∑(𝑥𝑖 − 𝑥̅ ) /𝑛 Công thức tương tự nhau 4
∑(𝑥𝑖 − 𝜇)4 /𝑁 𝑎4 = Chú ý: độ lệch chuẩn
𝑠4 = khác nhau 𝜎4 Thống kê mô tả liên quan số liệu 2 biến: Tên đại Tổng thể Mẫu So sánh lượng Hiệp phương ∑(𝑥𝑖 − 𝜇𝑋 )(𝑦𝑖 − 𝜇𝑌 ) ∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) Công thức sai 𝐶𝑜𝑣 ( 𝑋, 𝑌 ) = 𝑐𝑜𝑣 ( 𝑋, 𝑌 ) = tương tự nhau. 𝑁 𝑛−1 2 2 Chú ý: 𝐶𝑜𝑣 𝑋, 𝑋 = 𝜎𝑋 ( ) Chú ý: 𝐶𝑜𝑣 𝑋, 𝑋 = 𝑠𝑋 ( ) Hệ số tương 𝑪𝒐𝒗(𝑿, 𝒀) 𝑪𝒐𝒗(𝑿, 𝒀) Ý nghĩa giống quan 𝝆𝑿,𝒀 = 𝒓𝑿,𝒀 = nhau. 𝝈𝑿 𝝈𝒀 𝒔𝑿 𝒔𝒀 Chú ý: độ lệch chuẩn tổng thể và mẫu tính khác nhau Dùng để đo lường liên hệ giữa 2 biến có chặt không, mối liên hệ này gọi là tương quan.
Các bài tập
6.1. Một công ty có 25 nhân viên. Lương tháng của họ được cho trong bảng pp tần số sau đây (đv triệu đồng): Lương tháng (xi) 3 3,5 3,8 4,4 4,5 Tổng Số nhân viên (ni) 2 6 9 7 1 25 Tổng thể hay mẫu? (stt 17, đúng) Tổng thể vì tổng số qs = 25 = số nv của công ty a. Hãy tìm các tham số đặc trưng xu hướng trung tâm là trung bình, mốt, trung vị. (stt14) Trung bình = µ = 3,86; Trung vị = md = x13 = 3,8; Mốt = m0 = 3,8 b. Hãy tìm các tham số đặc trưng độ phân tán là phương sai, độ lệch chuẩn, hệ số biến thiên. 6.12. Một công ty điện lực phát các phiếu điều tra cho khách hàng với các mẫu câu hỏi sau đây: (stt21) a. Tuổi của chủ hộ. Định lượng rời rạc b. Giới tính của chủ hộ. Định tính, nhị phân c. Số người trong hộ. Định lượng rời rạc d. Có dùng điện để đun nấu không (có hoặc không) Định tính, nhị phân e. Nếu có thì đun nấu bình quân mấy giờ trong một ngày. Định lượng f. Thu nhập của hộ gia đình. Định lượng g. Tiền điện bình quân hàng tháng phải trả. Định lượng Hãy dùng các bnn để đặc trưng cho các câu hỏi trên và cho biết chúng là các biến định tính hay định lượng. 6.13. Hãy tính trung bình ( x ), trung vị xm, mốt x0, phương sai và độ lệch chuẩn của các mẫu cụ thể cho ở các bảng dưới đây: a. xi -2 1 2 3 4 5 ni 2 1 2 2 2 1 b. xi 12 13 15 17 18 20 ni 2 5 8 4 4 2 c. xi 4 7 8 12 ni 5 2 3 10 d. xi 21 24 25 26 28 32 34 ni 10 20 30 15 10 10 5 6.14. Cho 8 kết quả đo đạc về một đại lượng X bởi cùng một máy đo không có sai số hệ thống 369; 378; 315; 420; 385; 401; 372; 383 Hãy tính x, s 2 (377,875; 921,8393) 6.15. Theo dõi thời gian hoàn thành sp (phút) ở hai nhóm công nhân, ta thu được số liệu sau: a. Nhóm 1 X (phút) 42 44 45 48 60 64 Số người 4 5 20 10 8 3 b. Nhóm 2 X (phút) 46 48 51 Số người 2 40 8 Hãy mô tả và tìm đặc trưng của hai mẫu cụ thể nói trên. Cho nhận xét. 6.26. Có các số liệu sau đây về sản lượng thép hàng tháng của một tổng công ty thép (đơn vị: ngàn tấn) 7,0 6,9 8,2 7,8 7,7 7,3 6,8 6,7 8,2 8,4 7,0 6,7 7,5 7,2 7,9 7,6 6,7 6,6 6,3 5,6 7,8 5,5 6,2 5,8 5,8 6,1 6,0 7,3 7,3 7,5 7,2 7,2 7,4 7,6 7,3 a. Hãy vẽ đồ thị hình hộp của dãy số liệu trên. b. PP của các số liệu là đối xứng hay bất đối xứng. Nếu là bất đối xứng thì lệch về phía nào?