You are on page 1of 86

CHAPTER 3

Descriptive Statistics:
Numerical Measures
CONTENTS Chebyshev’s Theorem
STATISTICS IN PRACTICE: Empirical Rule
SMALL FRY DESIGN Detecting Outliers

3.1 MEASURES OF LOCATION 3.4 EXPLORATORY DATA


Mean ANALYSIS
Median Five-Number Summary
Mode Box Plot
Percentiles 3.5 MEASURES OF
Quartiles ASSOCIATION BETWEEN
3.2 MEASURES OF VARIABILITY TWO VARIABLES
Range Covariance
Interquartile Range Interpretation of the Covariance
Variance Correlation Coefficient
Standard Deviation Interpretation of the Correlation
Coefficient of Variation Coefficient

3.3 MEASURES OF 3.6 THE WEIGHTED MEAN AND


DISTRIBUTION SHAPE, WORKING WITH GROUPED
RELATIVE LOCATION, AND DATA
DETECTING OUTLIERS Weighted Mean
Distribution Shape Grouped Data
z-Scores

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 1
Chapter 3: Thống kê mô tả

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 2
Nội dung

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 3
3.1 Thước đo vị trí
thước đo cho dữ liệu định lượng

! Bên cạnh bảng, biểu đồ, nếu là dữ liệu định lượng


thống kê mô tả có thể sử dụng thước đo số
(numerical measures) để trình bày dữ liệu.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 4
3.1 Thước đo vị trí (tiếp)
trung bình

! Thước đo vị trí bao gồm: giá trị trung bình (mean),


trung vị (median) và yếu vị (mode). Ngoài ra còn có
phân vị (percentile), và tứ phân vị (quartiles)

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 5
3.1 Thước đo vị trí (tiếp)
trung bình

! Trung bình: bao gồm trung bình mẫu và trung bình


tổng thể
• Trung bình mẫu: tổng các giá trị (quan sát) có
trong mẫu chia cho số phần tử có trong mẫu.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 6
3.1 Thước đo vị trí (tiếp)
trung bình

! Công thức tính trung bình mẫu

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 7
3.1 Thước đo vị trí (tiếp)
Ví dụ

! Ví dụ: Khi hỏi số ly cà phê uống mỗi tuần của một


mẫu 5 sinh viên và ghi lại được như sau:
21, 25, 10, 8, 11
Tính trung bình mẫu cho đữ liệu này.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 8
3.1 Thước đo vị trí (tiếp)
Ví dụ

! Trả lời: áp dụng công thức của trung bình mẫu, ta có

Số ly cà phê trung bình của mẫu là 15.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 9
3.1 Thước đo vị trí (tiếp)
So sánh trung bình mẫu và tổng thể

! Công thức tính trung bình tổng thể tương tự với


trung bình mẫu

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 10
3.1 Thước đo vị trí (tiếp)
trung vị

! Trung vị: đó là giá trị tới hạn mà một nửa dữ liệu nhỏ
hơn nó và nửa còn lại thì lớn hơn.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 11
3.1 Thước đo vị trí (tiếp)
trung vị

! Công thức tính trung vị: sắp xếp các giá trị trong tập dữ liệu
theo thứ tự tăng dần.
• Nếu cỡ mẫu là lẻ, trung vị là giá trị tương ứng với vị trí !"#
$
• Nếu cỡ mẫu là chẵn, trung vị là trung bình cộng của các giá
! !
trị thứ và + 1
$ $

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 12
3.1 Thước đo vị trí (tiếp)
ví dụ

! Ví dụ: Cho tập dữ liệu sau: 4, 2, 8, 1, 15. Tính giá trị


trung vị.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 13
3.1 Thước đo vị trí (tiếp)
ví dụ

! Lời giải: sắp xếp tập dữ liệu đã cho. Cỡ mẫu bằng 5 là


số lẻ. Trung vị bằng 4.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 14
3.1 Thước đo vị trí (tiếp)
so sánh trung bình và trung vị

! Trung vị không bị ảnh hưởng bởi những cực hạn


(extreme value), hay ngoại lệ (outlier value)
(https://www.geogebra.org/m/k9k6sx2v)

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 15
3.1 Thước đo vị trí (tiếp)
ví dụ

! Hãy xem xét dữ liệu dưới đây. Dùng thước đo nào


để đánh giá vị trí trung tâm (giá trị đại diện) cho dữ
liệu này

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 16
3.1 Thước đo vị trí (tiếp)
yếu vị

! Yếu vị: là giá trị có mặt nhiều nhất trong tập dữ liệu.
• Trong tập dữ liệu có thể có nhiều hơn một yếu vị

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 17
3.1 Thước đo vị trí (tiếp)
yếu vị

! Ví dụ: Tìm yếu vị cho tập dữ liệu sau: 67, 27, 46, 21,
46, 29, 67, 28, 65, 67, 10

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 18
3.1 Thước đo vị trí (tiếp)
yếu vị

! Lời giải: Giá trị 67 có mặt nhiều nhất (3 lần) trong tập
dữ liệu.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 19
3.1 Thước đo vị trí (tiếp)
bách phân vị

! Bách phân vị thứ p: là giá trị tới hạn mà p% dữ liệu


nhỏ hơn hoặc bằng giá trị này và (100 – p)% dữ liệu
còn lại lớn hơn hoặc bằng giá trị này.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 20
3.1 Thước đo vị trí (tiếp)
bách phân vị

! Tính giá trị tương ứng bách phân vị thứ p: p là vị trí


của giá trị đó trong dữ liệu theo thang đo 100, l là thứ
bậc của giá trị khi được sắp xếp từ nhỏ đến lớn.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 21
3.1 Thước đo vị trí (tiếp)
bách phân vị

• B1: sắp xếp dữ liệu từ nhỏ đến lớn


%
• B2: tính thứ hạng 𝑙 = #&& 𝑛.
• B3: nếu l không nguyên thì vị trí trong dữ liệu là [l] + 1 ([l] là
phần nguyên của l), nếu l nguyên thì giá trị cần tìm là trung
bình cộng của hai giá trị ở vị trí l và l + 1.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 22
3.1 Thước đo vị trí (tiếp)
ví dụ

! Ví dụ: Dữ liệu dưới đây là điểm số của 25 sinh viên


đã được sắp xếp thứ tự
19, 28, 34, 36, 37, 43, 44, 44, 46, 46, 47, 48, 51, 52, 54, 55,
55, 56, 59, 60, 62, 62, 65, 66, 68
Tìm bách phân vị thứ 70 và thứ 80.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 23
3.1 Thước đo vị trí (tiếp)
ví dụ

! Lời giải:

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 24
3.1 Thước đo vị trí (tiếp)
tứ phân vị

! Tứ phân vị: bao gồm tứ phân vị thứ nhất Q1, tứ phân vị thứ hai
Q2 (còn gọi là trung vị) và tứ phân vị thứ ba Q3.
• Q1: giá trị tới hạn mà 25% dữ liệu nhỏ hơn nó, và 75% còn lại
thì lớn hơn.
• Q2: 50% dữ liệu nhỏ hơn nó
• Q3: 75% dữ liệu nhỏ hơn nó, và 25% còn lại thì lớn hơn

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 25
3.1 Thước đo vị trí (tiếp)
ví dụ

! Ví dụ: Tìm các tứ phân vị cho dữ liệu sau (đã sắp xếp
thứ tự tăng dần)
28, 30, 40, 44, 44, 44, 45, 46, 47, 51, 54, 54, 55

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 26
3.1 Thước đo vị trí (tiếp)
ví dụ

! Lời giải:

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 27
3.2 Thước đo sự biến thiên

! Thước đo sự biến thiên: đo lường mức độ phân tán


của dữ liệu bao gồm khoảng biến thiên (range),
khoảng tứ phân vị (interquartile range), phương sai
(variance), độ lệch chuẩn (standard deviation), và hệ
số biến thiên (coefficient of variation)

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 28
3.2 Thước đo sự biến thiên (tiếp)
khoảng biến thiên

! Khoảng biến thiên: là hiệu số giữa giá trị lớn nhất và


giá trị nhỏ nhất trong dữ liệu

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 29
3.2 Thước đo sự biến thiên(tiếp)
khoảng biến thiên và đồ thị hộp

! Khoảng biến thiên và đồ thị hộp (box plot)

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 30
3.2 Thước đo sự biến thiên(tiếp)
khoảng tứ phân vị

! Khoảng tứ phân vị: hiệu số giữa tứ phân vị thứ ba và


tứ phân vị thứ nhất
IQR = Q3 – Q1

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 31
3.2 Thước đo sự biến thiên (tiếp)
phương sai

! Phương sai: phản ánh mức độ phân tán của các giá trị
trong dữ liệu với vị trí làm chuẩn là giá trị trung
bình.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 32
3.2 Thước đo sự biến thiên (tiếp)
công thức phương sai mẫu

! Công thức tính phương sai mẫu:


• tính giá trị trung bình mẫu
• Tính khoảng cách mỗi giá trị trong dữ liệu tới trung bình
mẫu
• Bình phương các khoảng cách này
• Cộng tất cả các giá trị này và chia đều cho n - 1

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 33
3.2 Thước đo sự biến thiên (tiếp)
ví dụ

! Ví dụ: tính phương sai mẫu cho dữ liệu mẫu sau


1, 2, 3, 4, 5

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 34
3.2 Thước đo sự biến thiên (tiếp)
ví dụ

! Trả lời: phương sai mẫu của mẫu đã cho là 2.5

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 35
3.2 Thước đo sự biến thiên (tiếp)
phương sai tổng thể

! Phương sai tổng thể được tính tương tự; trong biểu
thức của phương sai mẫu thay vì chia n – 1 thì thay
bằng N

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 36
3.2 Thước đo sự biến thiên (tiếp)
ví dụ

! Ví dụ: cho dữ liệu chiều cao từ một tổng thể như sau
54, 77, 67, 68, 46, 64, 62, 56, 38
Tính phương sai tổng thể.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 37
3.2 Thước đo sự biến thiên (tiếp)
ví dụ

! Trả lời: phương sai tổng thể là 127.43

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 38
3.2 Thước đo sự biến thiên (tiếp)
so sánh phương sai mẫu và phương sai tổng thể

! Trong công thức tính phương sai mẫu đã có sự hiệu


chỉnh

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 39
3.2 Thước đo sự biến thiên (tiếp)
ý nghĩa của phương sai

! Phương sai phản anh mức độ phân tán của dữ liệu.


Phương sai càng lớn dữ liệu càng phân tán, không
đồng đều và ngược lại.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 40
3.2 Thước đo sự biến thiên (tiếp)
ý nghĩa của phương sai

! Có thể quan sát được mức độ phân tán của hai tập dữ
liệu này là khác nhau

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 41
3.2 Thước đo sự biến thiên (tiếp)
độ lệch chuẩn

! Độ lệch chuẩn (standard deviation) là căn bậc hai của


phương sai.
• Ý nghĩa: nó là khoảng cách trung bình từ mỗi giá
trị của dữ liệu tới giá trị trung bình

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 42
3.2 Thước đo sự biến thiên (tiếp)
công thức độ lệch chuẩn

! Công thức tính độ lệch chuẩn của mẫu và tổng thể

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 43
3.2 Thước đo sự biến thiên (tiếp)
ví dụ

! Ví dụ: Điểm số của một mẫu các sinh viên như sau

Student 1 2 3 4 5 6 7 8 9 10
Score 4 5 5 8 9 12 14 16 17 20

Tính độ lệch chuẩn cho mẫu này.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 44
3.2 Thước đo sự biến thiên (tiếp)
ví dụ

! Lời giải: Giá trị trung bình mẫu là 11


Áp dụng công thức phương sai mẫu

Độ lệch chuẩn cho mẫu là

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 45
3.2 Thước đo sự biến thiên (tiếp)
so sánh

! So sánh các thước đo sự biến thiên: độ lệch chuẩn,


khoảng biến thiên và khoảng phân vị

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 46
3.2 Thước đo sự biến thiên (tiếp)
hệ số biến thiên

! Hệ số biến thiên: tỷ số giữa độ lệch chuẩn và giá trị


trung bình

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 47
3.2 Thước đo sự biến thiên (tiếp)
hệ số biến thiên

! Ví dụ: so sánh hai tập dữ liệu sau

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 48
3.3 Thước đo độ lệch của phân phối
hệ số lệch

! Hệ số lệch (skewness) là hệ số phản ánh mức độ đối


xứng của một phân phối
• Công thức tính hệ số lệch như sau

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 49
3.3 Thước đo độ lệch của phân phối (tiếp)
hệ số lệch

! Hệ số lệch âm thì phân phối lệch (nhọn) trái, hệ số lệch dương


thì phân phối lệch (nhọn) phải

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 50
3.3 Thước đo độ lệch của phân phối (tiếp)
hệ số z-score

! Mỗi giá trị trong dữ liệu có thể quy đổi về z-score; đó


là hệ số cho biết giá trị đó cách giá trị trung bình bao
nhiêu lần độ lệch chuẩn

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 51
3.3 Thước đo độ lệch của phân phối (tiếp)
biểu thức z-score

! Hệ số z-score cho mẫu được tính như sau

! Hệ số z-score cho tổng thể có công thức tính tương tự

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 52
3.3 Thước đo độ lệch của phân phối (tiếp)
dữ liệu có phân phối chuẩn

! Ta nói phân phối chuẩn (hặc gần chuẩn) nếu đồ thị có


hình chuông (bell-shape)

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 53
3.3 Thước đo độ lệch của phân phối (tiếp)
quy tắc thực nghiệm

! Nếu dữ liệu có phân phối hình chuông thì


• Xấp xỉ 68% dữ liệu nằm trong khoảng một độ lệch chuẩn từ
vị trí trung bình (trung tâm)
• Xấp xỉ 95% dữ liệu nằm trong khoảng hai độ lệch chuẩn từ
vị trí trung tâm
• Hầu hết dữ liệu nằm trong khoảng ba độ lệch chuẩn từ vị trí
trung tâm

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 54
3.4 Phân tích khám phá dữ liệu

! Phân tích khám phá dữ liệu (Exploratory Data


Analysis): phân tích tìm ra cấu trúc chung có trong
dữ liệu. Trong quá trình phân tích có thể tìm thấy các
đột biến (outlier) hoặc các thành tố ngoài dự đoán.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 55
3.4 Phân tích khám phá dữ liệu (tiếp)
5 giá trị tổng quan

! 5 giá trị tổng quan (five-number summary) bao gồm:


giá trị nhỏ nhất, tứ phân vị thứ nhất Q1, trung vị Q2
tứ phân vị thứ ba Q3, giá trị lớn nhất.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 56
3.4 Phân tích khám phá dữ liệu (tiếp)
biểu đồ hộp

! Biểu đồ hộp (box plot) sử dụng 5 giá trị tổng quan để


mô tả dữ liệu.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 57
3.4 Phân tích khám phá dữ liệu (tiếp)
biểu đồ hộp và dữ liệu chuẩn

! Biểu đồ hộp (box plot) và dữ liệu có phân phối chuẩn


(hoặc gần chuẩn)

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 58
3.5 Thước đo quan hệ giữa hai biến

! Quan hệ giữa hai biến có thể phản ánh bằng các thước đo: hiệp
phương sai (covariance), hệ số tương quan (correlation
coefficient)

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 59
3.5 Thước đo quan hệ giữa hai biến (tiếp)
quan hệ tuyến tính

! Hai biến (đặc điểm) X và Y có mối quan hệ tuyến


tính (linear relationship) nếu Y = aX + b.
• Trong thực tế ta bắt gặp mối quan hệ ”gần” tuyến
tính
• Biểu đồ phân tán của dữ liệu là chùm các điểm
bám xung quanh một trục đường thẳng

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 60
3.5 Thước đo quan hệ giữa hai biến (tiếp)
hiệp phương sai

! Hiệp phương sai: là hệ số phản ánh mức độ phụ


thuộc tuyến tính giữa hai đại lượng (biến)

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 61
3.5 Thước đo quan hệ giữa hai biến (tiếp)
biểu thức hiệp phương sai

! Biểu thức tính hiệp phương sai

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 62
3.5 Thước đo quan hệ giữa hai biến (tiếp)
ví dụ

! Ví dụ: Cho dữ liệu mẫu sau:

Hãy tính hiệp phương sai giữa hai đại lượng này.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 63
3.5 Thước đo quan hệ giữa hai biến (tiếp)
ví dụ

! Lời giải:

Hiệp phương sai giữa hai đại lượng là 1.533.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 64
3.5 Thước đo quan hệ giữa hai biến (tiếp)
ý nghĩa

! Nếu hệ số hiệp phương sai là giá trị dượng, nghĩa là


tồn tại mối quan hệ phụ thuôc tuyến tính đồng biến
giữa các đại lượng, nếu là giá trị âm thì mối phụ
thuộc tuyến tính là nghịch biến.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 65
3.5 Thước đo quan hệ giữa hai biến (tiếp)
hệ số tương quan

! Hệ số tương quan (correlation coefficient) có vai trò


tương tự với hiệp phương sai, nó phản ánh mối quan
hệ phụ thuộc tuyến tính giữa hai đại lương. Thực
chất là hệ số hiệp phương sai đã được chuẩn hóa.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 66
3.5 Thước đo quan hệ giữa hai biến (tiếp)
công thức tính hệ số tương quan

! Biểu thức tính hệ số tương quan

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 67
3.5 Thước đo quan hệ giữa hai biến (tiếp)
ví dụ

! Ví dụ: Tính hệ số tương quan cho dữ liệu mẫu sau

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 68
3.5 Thước đo quan hệ giữa hai biến (tiếp)
ví dụ

! Lời giải: hệ số tương quan r = 1

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 69
3.5 Thước đo quan hệ giữa hai biến (tiếp)
ý nghĩa hệ số tương quan

! Hệ số tương quan có giá trị thuộc [-1, 1]


• Hệ số tương quan bằng 0: không tồn tại sự phụ thuộc tuyến
tính
• Càng gần với 1: sự phụ thuộc tuyến tính (đồng biến) càng
mạnh; ngược lại với gần -1.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 70
3.6 Trung bình có trọng số và dữ liệu nhóm

! Sử dụng công thức trung bình có trọng số (weighted


mean) khi dữ liệu được biểu diễn dưới dạng bảng
phân phối tần số.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 71
3.6 Trung bình có trọng số và dữ liệu nhóm
công thức

! Công thức tính trung bình có trọng số:

• trong đó, xi là giá trị có mặt wi lần trong tập dữ


liệu

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 72
3.6 Trung bình có trọng số và dữ liệu nhóm
ví dụ

! Ví dụ: Tính trung bình có trọng số cho dữ liệu sau:

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 73
3.6 Trung bình có trọng số và dữ liệu nhóm
ví dụ

! Lời giải: trung bình có trọng số là 6.53 giờ.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 74
3.6 Trung bình có trọng số và dữ liệu nhóm

! Công thức trung bình cho dữ liệu nhóm là tương tự.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 75
3.6 Trung bình có trọng số và dữ liệu nhóm
ví dụ

! Ví dụ: Dữ liệu về số ly cà phê mỗi tuần. Tính số ly cà


phê trung bình.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 76
3.6 Trung bình có trọng số và dữ liệu nhóm
ví dụ

! Lời giải:

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 77
3.6 Trung bình có trọng số và dữ liệu nhóm
phương sai cho dữ liệu nhóm

! Công thức tính phương sai cho dữ liệu nhóm: tương tự với dữ
liệu có trọng số
• Giá trị trung điểm của mỗi lớp (midpoint) sẽ đại diện cho
lớp.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 78
Hướng dẫn sử dụng máy tính cầm tay

! Hầu hết các máy tính cầm tay thế hệ gần đây đều có
thể thực hiện chức năng thông kê cơ bản

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 79
Hướng dẫn sử dụng máy tính cầm tay (tiếp)

! B1: khởi động chức năng thống kê


• Chọn tổ hợp phím
• Màn hình xuất hiện

• Bấm 1 cho thống kê 1 biến; 2 cho thống kê 2 biến


với mối quan hệ phụ thuộc tuyến tính; 3 cho thống
kê 2 biến với mối quan hệ là đường bậc hai ...

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 80
Hướng dẫn sử dụng máy tính cầm tay (tiếp)

! B2: Nhập dữ liệu cho thống kê một biến


• Chọn tổ hợp phím

• Trong trường hợp là dữ liệu có trọng số (cần thêm


cột tần số) thì thêm bước cài đặt sau rồi thực hiện
tổ hợp trên

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 81
Hướng dẫn sử dụng máy tính cầm tay (tiếp)
ví dụ

! Ví dụ: Cho dữ liệu sau


x freq
1 1
2 2
3 3
4 2
5 1

Xem là dữ liệu tổng thể, hãy tính giá trị trung bình và
độ lệch chuẩn.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 82
Hướng dẫn sử dụng máy tính cầm tay (tiếp)
ví dụ

! Lời giải: thao tác trên máy các tổ hợp phím như sau

Trả lời: trung bình bằng 3, độ lệch chuẩn tổng thể bằng
1.154700538

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 83
Hướng dẫn sử dụng máy tính cầm tay (tiếp)
ví dụ

! Ví dụ: Thu thập dữ liệu cho cặp biến (X, Y) như sau
X 20 110 200 290
Y 3150 7310 8800 9310

Tính hệ số tương quan giữa hai biến này (sử dụng chế
độ Fix 3, tức kết quả làm tròn tới 3 chữ số thập phân).

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 84
Hướng dẫn sử dụng máy tính cầm tay (tiếp)
ví dụ

! Lời giải: Thực hiên tổ hợp phím sau

Trả lời: hệ số tương quan r = 0.923.

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 85
Quizzes on the canvas

TT GIÁO DỤC SỚM & XUẤT SẮC PMH


Vinhomes Grand Park Slide 86

You might also like