Professional Documents
Culture Documents
bài giảng
bài giảng
BT24/153. In the Excel file Weddings, determine the correlation between the wedding costs
and attendance.
Correlations
N 25 25
N 25 25
r = 0.733 ***
p < 0.001
Correlations
N 23 23 23
N 23 23 23
N 23 23 23
- Độ tương quan
Độ tương quan giữa BMI Calculation và Weight: r=0.933*** ; p< 0.001 => tương quan
mạnh
Độ tương quan giữa BMI Calculation và Height (inches) : r=0.488* ; p< 0.018 => tương
quan yếu
Độ tương quan giữa Weight và Height (inches): r=0.766** ; p < 0.001 => tương quan trung
bình
BT27/154. The Excel file Beverage Sales lists a sample of weekday sales at a convenience
store, along with the daily high temperature. Compute the covariance and correlation
between temperature and sales.
- Hiệp phương sai
Hiệp phương sai của 2 biến Temperature and Sales được thể hiện ở bảng sau:
Correlations
Temperature Sales
N 21 21
Sales Pearson Correlation ,922 **
1
N 21 21
Hiệp phương sai Temperature là: 35,148
Mối tương quan giữa 2 biến Temperature and Sales được thể hiện như bảng sau:
Correlations
Temperature Sales
N 21 21
Sales Pearson Correlation ,922** 1
N 21 21
r = 0,922***
p<0,001
BT29/154. In the Excel file Call Center Data, how strongly is length of service correlated
with starting age?
Mối tương quan giữa 2 biến Length of Service and Starting Age được thể hiện như bảng sau:
Correlations
Length of
Starting Age Service (years)
N 70 70
Length of Service (years) Pearson Correlation -,608 **
1
N 70 70
r = -0,608***
p<0,001
Như vậy, 2 biến này có tương quan thuộc dạng là âm trong đó thời gian phục vụ càng cao thì độ
tuổi càng thấp và thời gian phục vụ càng thấp thì độ tuổi càng cao
Bước 1:
H0: Không có mối quan hệ giữa imcome và employ
H1: Có tương quan imcome và employ
Bước 2: Dùng phương pháp Correlation
Bước 3: Data Collection
Bước 4: Kết luận cách thức
Giải:
Bước 1:
H0: không có mối tương quan giữa biến income và employ
H1: có mối tương quan giữa biến income và employ
Bước 2: kiểm định giả thiết bằng tương quan Pearson
Correlations
N 6400 6400
N 6400 6400
p<0.001
bác bỏ H0 và chấp nhận H1: có mối tương quan mạnh giữa biến income vvaf
employ (với mức ý nghĩa 0.001)
Kq. 1 sample t test t >= 1.96 => đạt yêu cầu có sự khác biệt
khác biệt = -5.5k so với 75k => có ý nghĩ thống kê với mức ý nghĩa là 0.001
p < 0.01
Vd: file DEMO (kiểm tra sự khác biệt giũa gender và jobsas)
H0: không có sự khác biệt về sự hài lòng khác biệt giữa nam và nữ
Vd: file DEMO (kiểm tra sự khác biệt giũa wireless và income)
H0:
H1:
M0 = 62.9735, Std = 67
P< 0.001
Có sự khác biệt giữa thu nhập gia đình với việc sử dụng di động. Trong đó, những người
có sử dụng dịch vụ di động lớn hơn những người không sử dụng dịch vụ di động là 16.33
Paired samples t test
- So sánh 2 mean Mean(L1) vs Mean(L2) cùng 1 sự vật hiện tượng
Anova – so sánh 3 nhóm (trở lên) khác nhau cùng 1 vấn đề
Vd: file demo // Carcat – income
H0: không có sự khác biệt về thu nhập giữa 3 nhóm người đi 3 loại xe khác nhau
H1: có sự khác biệt về thu nhập giữa 3 nhóm người đi 3 loại xe khác nhau
Phương pháp Anova
Mean = ….., std =
+ F= 2056.246
+ P<=0.05 *
Những người đi xe Eco thì ít tiền hơn STA, nhưng người đi STA thì thu nhập ít
tiền hơn LUX
NOTE:
- P<=0.05 lấy LSD ở dưới, p>0.05 lấy LSD trên
H0: trình độ học vấn khác nhau không ảnh hưởng đến thu nhập hộ gia đình
H1: trình độ học vấn khác nhau có ảnh hưởng đến thu nhập hộ gia đình
Mean = ….; std của 5 nhóm
F = 15.309
P<0.001
Có sự khác biệt giữa những người có trình độ học vấn khác nhau sẽ có mức thu
nhập khác nhau
Bảng Tamhane
Chưa học hết cấp 2 vs cao đẳng chênh lệch 10.268, p<0.05 => có ý nghĩa thống kê
P<=0.05 => variane NOT equal: mẫu không đồng nhất => kết quả ANOVA không
tin cậy => Robus test welch
+ p của Welch
+ posthoc Tamhane
ANOVA 2 WAY
Vd: empcat – > income < – gender (M,F)
Analyze -
H0: không có sứ =j khác Sự tương tác của giới tính với số năm làm việc với ông chủ
hiện tại
M F
<5 35.5 35.6 35.58
5-15 54.02 54.72 54.37
>15 130.34 130.35 130.35
70.16 68.77
Empcat: p<0.001 => có sự khác biệt
P (retire) <0.001
Hồi quy
X-> Y Satifaction (sự hài lòng - X) -> Loyalty (sự trung thành - Y)
Y = C + * X
: hệ số gốc
Y
Mục tiêu là dựng được 1 đường thẳng tập hợp được nhiều điểm nhất trên phương trình
Mục tiêu: chứng minh diện tích (SF) có ảnh hưởng đến giá trị ngôi nhà (MV)
Note: ANOVA: kiểm tra sự tồn tại của đường hồi quy
Vd: tuổi thọ của ngôi nhà ảnh hưởng thế nào đến giá trị thị trường
R2 = 0.131
đánh giá giá trị thị trường (MV) dựa vào 2 biến
MV = C + 1*SF + 2*HA
R2 = 0.556
Chỉ cần 1 trong 2 khác 0 thì sẽ tồn tại phương trình hồi quy
Chưa chuẩn hóa MV = 47331 + 40.911*SF - 825.161* HA => tuổi nhà càng cao giá trị
nhà càng giảm
dependent: continuas
V = 0.731 * SF
MARKET VALUE
JOB SAT
Biến định danh đưa vào phương trình hồi quy chỉ có 2 giá trị
Vd: đánh giá khoảng cách và giá cả liệu có tác động đến overall
B1: Tính giá trị tiêu chuẩn zcore: analyze – descriptive st – descriptives
Vd: