Professional Documents
Culture Documents
TLCH
TLCH
2. Tìm cơ sở lý thuyết ở đâu? Trong các bài báo khoa học, luận văn tốt nghiệp, luận văn thạc sỹ có
liên quan trên Google Scholar, Research Gate, Sciencedirect…
3. Thiết kế thang đo như thế nào? Cơ sở xây dựng các thang đo được tham khảo từ các công trình
nghiên cứu trước đó, dịch sang tiếng việt (nếu cần) cũng như điều chỉnh để phù hợp với bối cảnh
nghiên cứu của khóa luận tốt nghiệp.
4. Cơ sở tính số lượng mẫu nghiên cứu? Số mẫu tối thiểu = Số biến quan sát*5 (Bollen, 1989)=
24*5 = 120
< 0.6. Thang đo nhân tố là không phù hợp (có thể trong môi trường nghiên cứu đối tượng không có cảm
nhận về nhân tố đó)
0.6 – 07: Chấp nhận được với các nghiên cứu mới
>= 0.95: Chấp nhận được nhưng không tốt, nên xét xét các biến quan sát có thể có hiện tượng “trùng
biến”
Hệ số tương quan biến tổng là hệ số cho biến mức độ “liên kết” giữa một biến quan sát trong nhân tố với
các biến còn lại. Nó phản ánh mức độ đóng góp vào giá trị khái niệm của nhân tố của một biến quan sát
cụ thể. Tiêu chuẩn để đánh giá một biến có thực sự đóng góp giá trị vào nhân tố hay không là hệ số tương
quan biến tổng phải lớn hơn 0.3. Nếu biến quan sát có hệ số tương quan biến tổng nhỏ hơn 0.3 thì phải
loại nó ra khỏi nhân tố đánh giá.
- Phương trình hồi quy chuẩn hóa mang ý nghĩa kinh tế nhiều hơn là toán học. Căn cứ vào phương
trình hồi quy, nhà kinh tế xác định được rằng yếu tố nào quan trọng nhất (hệ số hồi quy chuẩn hóa
càng lớn càng quan trọng), yếu tố nào ít quan trọng hơn đề dành thời gian + tiền bạc đầu tư một cách
hợp lý (hệ số hồi quy lớn nhất thì quan tâm, đầu tư nhiều hơn bởi vì nó tác động mạnh nhất tới Y).
a. Hiện tượng đa cộng tuyến
Trong mô hình hồi quy, nếu các biến độc lập có quan hệ chặt với nhau, các biến độc lập có mối quan
hệ tuyến tính, nghĩa là các biến độc lập có tương quan chặt, mạnh với nhau thì sẽ có hiện tượng đa
cộng tuyến, đó là hiện tượng các biến độc lập trong mô hình phụ thuộc lẫn nhau và thể hiện được
dưới dạng hàm số. Ví dụ có hai biến độc lập A và B, khi A tăng thì B tăng, A giảm thì B giảm…. thì
đó là một dấu hiệu của đa cộng tuyến. Nói một cách khác là hai biến độc lập có quan hệ rất mạnh với
nhau, đúng ra hai biến này nó phải là 1 biến nhưng thực tế trong mô hình nhà nghiên cứu lại tách làm
2 biến. Hiện tượng đa cộng tuyến vi phạm giả định của mô hình hồi qui tuyến tính cổ điển là các biến
độc lập không có mối quan hệ tuyến tính với nhau.
—> Vấn đề đa cộng tuyến xảy ra khi các biến (nhân tố) độc lập có tương quan tuyến tính khá mạnh với
nhau. Nói cách khác hiện tượng đa cộng tuyến xảy ra khi có mối tương quan tuyến tính hiện hữu giữa các
biến độc lập trong mô hình.
Khi đó sẽ dẫn đến các vấn đề sau:
– Hạn chế giá trị của R bình phương (thường sẽ làm tăng r bình phương)
– Làm sai lệch/ đổi dấu các hệ số hồi quy
Nguyên nhân:
1. Do thu thập số liệu ít, không toàn diện
2. Do bản chất của các biến độc lập là tương quan nhau.
3. Do một số dạng mô hình sản sinh ra đa cộng tuyến
4. Hậu quả của đa cộng tuyến
5. Ước lượng phương sai trở nên kém chính xác. Hệ số phóng đại phương sai (VIF)
2. Giá trị tới hạn t trở nên nhỏ hơn so với thực tế trong khi R2 là khá cao. Kiểm định t và F trở nên
kém hiệu quả
3. Các giá trị ước lượng biến động mạnh khi thay đổi số liệu trong mô hình. (n è N) sẽ làm giảm khả
năng xảy ra đa cộng tuyến.
4. Các giá trị của các ước lượng có khả năng biến động mạnh khi thay đổi (rút ra hoặc thêm vào) các
biến có tham gia vào hiện tượng đa cộng tuyến.
III. Cách phát hiện đa cộng tuyến
1. Mô hình có các giá trị R2 cao trong khi các giá trị thống kê t rất thấp.
2. Dùng ma trận hệ số tương quan giữa các biến độc lập. Hệ số tương quan từ 0.8 trở lên là cao, từ
0.9 trở lên là rất cao.
3. Dùng mô hình hồi quy phụ, nếu R2 của mô hình hồi quy phụ cao hơn mô hình hồi quy chính thì
mô hình hồi quy chính có xảy ra hiện tượng đa cộng tuyến.
4. Dùng chỉ sổ phóng đại phương sai, nếu VIF >=10, mô hình xảy ra hiện tượng đa cộng tuyến rất
cao. Từ 5 trở lên là có hiện tượng ĐCT cao.
1. Cách khắc phục đa cộng tuyến
2. Dựa vào các thông tin tiên nghiệm, các đề tài nghiên cứu trước về vấn đề tương tự về vấn đề nghiên
cứu. các mô hình KTL trong trong các nghiên cứu này có tính khả thi và có thể khắc phụ được thì
tiến hành.
2. Thu thập thêm số liệu (nè N) có thể khắc phụ được hiện tượng đa cộng tuyến
3. Loại bỏ biến gây ra hiện tượng đa cộng tuyến. Chọn biến ít có ý nghĩa thống kê hơn loại ra trước.
(điều này chỉ mang tính tương đối).
4. Kết hợp giữa số liệu chuổi thời gian và số liệu chéo có thể khắc phục được hiện tượng đa cộng
tuyến.
5. Dùng mô hình sai phân
B1: xây dựng mô hình hồi quy gốc ban đầu
B2: xây dựng mô hình hồi quy thứ hai, trong đó, loại bỏ một quan sát đầu tiên. (do mô hình hồi quy đúng
với t quan sát thì cũng đúng với t-1 quan sát).
B3: Dùng mô hình ở B1 – B2 ta có mô hình sai phân bậc 1.
Đặc điểm: Mô hình sai phân B3 có thể giảm hiện tượng đa cộng tuyến của các biến độc lập.
b. Ý nghĩa của hệ số Durbin-Watson trong hồi quy: Hệ số Durbin Watson dùng để kiểm tra xem có
hiện tương tự tương quan hay không trong phần dư của một phép phân tích hồi quy. Durbin
Watson có giá trị biến thiên trong khoảng từ 0 đến 4; nếu các phần sai số không có tương quan
chuỗi bậc nhất với nhau thì giá trị sẽ gần bằng 2 (từ 1 -> 3); nếu giá trị càng nhỏ, gần về 0 thì các
phần sai số có tương quan thuận; nếu càng lớn, gần về 4 có nghĩa là các phần sai số có tương
quan nghịch
8. Phương pháp chọn mẫu: Do giới hạn về thời gian và nguồn lực, tác giả lựa chọn phương pháp lấy
mẫu phi xác suất thuận tiện
- Chọn mẫu phi xác suất là chọn mẫu theo ý định chủ quan của người nghiên cứu.
- Chọn mẫu phi xác suất kiểu thuận tiện: Các đơn vị mẫu được chọn ở tại một địa điểm và vào một
thời gian nhất định.
CÂU 16: Sự khác nhau giữa rsquare (r bình) và r square adjusted (r bình hiệu chỉnh) là gì? Vậy r
square và square adjusted có nhất thiết lúc nào cũng phải lớn hơn 50% hay không?
Điểm giống: Rsquare và Rsquare adjusted đều cho biết mức độ phù hợp của mô hình nghiên cứu với ý
nghĩa là các biến độc lập giải thích được bao nhiêu phần trăm (%) biến thiên của biến phụ thuộc.
Điểm khác: Rsquare adjusted phản ánh sát hơn mức độ phù hợp của mô hình vì nó không phụ thuộc vào
độ lệch phóng đại của Rsquare.(độ lệch này phụ thuộc vào kích thước mẫu, thị trường khảo sát… Ko nên
nói câu trong ngoặc này quá sâu vì dễ bị bắt bẽ, chừng nào hội đồng hỏi hãy nói…)
Các đề tài liên quan đến vấn đề nhận dạng… or giải thích…, (vd: các yếu ảnh hưởng đến mức độ hài
lòng…), thì r bình phương phải từ 0.5 (50%) trở lên. Các đề tài liên quan đến mối quan hệ…, (vd: ảnh
hưởng của tâm lý hay đến lòng trung thành, hay giữa các nhân tố với nhau..), thì không cần quan tâm
nhiều đến r bình phương mà khi đó hệ số hồi quy (beta).
CÂU 17: Sự Khác Nhau Giữa Beta Và Beta Chuẩn Hóa Là Gì?
Hệ số B chưa chuẩn hóa phản ánh lượng biến thiên của Y khi một đơn vị X thay đổi. Trong khi đó Hệ
số Beta đã chuẩn hóa phản ánh lượng biến thiên của độ lệch chuẩn (standard deviation) của Y khi một
đơn vị độ lệch chuẩn của X thay đổi. Cụ thể hơn, hệ số Beta đã chuẩn hóa là kết quả của việc giải phương
trình hồi quy mà các biến độc lập, biến phụ thuộc đã được chuẩn hóa ( phương sai =1). Còn hệ số B chưa
chuẩn hóa là kết quả của việc giải phương trình hồi quy mà các biến được giữ nguyên giá trị thô. Việc
chuẩn hóa hệ số beta thường dùng để trả lời câu hỏi: biến độc lập nào có tác động mạnh hơn vào biến phụ
thuộc khi phân tích hồi quy đa biến, khi mà các biến đo lường độc lập có đơn vị đo lường khác nhau (ví
dụ thu nhập được tính bằng dollars và kích cỡ gia đình được tính bằng số người).
Câu 19: Khác nhau giữa method enter và stepwise:
Enter: đổ hết các biến độc lập vào 1 lượt, kết quả cho ra ko sắp xếp theo mức độ tương quan mạnh yếu mà
sẽ xếp theo X1, X2, X3…Xn
Stepwise: đưa từng biến vào, đầu tiên là biến tác động mạnh nhất cho đến biến tác động yếu nhất. Kết quả
cho ra sẽ đc sắp xếp theo thứ tự mạnh-> yếu.