Professional Documents
Culture Documents
Thuyết trình
Thuyết trình
Nhận xét:
Ta nhận thấy giá trị P-value nhỏ hơn mức ý nghĩa nên ta bác bỏ
gải thuyết H0, và chấp nhận đối thuyết H1 tức là mô hình có ý
nghĩa thống kê.
Ta thấy rằng P-value ứng với từ F1-F9 < 2.10-6, nghĩa rằng ảnh
hưởng của các biến này có ý nghĩa rất lớn lên biến kích thước
phần cặn RMSD. Biến F5 cũng có ảnh hưởng lớn đến biến
RMSD nhưng ít hơn so với các biến còn lại.
Cuối cùng, từ mô hình hồi quy trên, ta tiến hành vẽ đồ thị biểu
thị sai số hồi quy và giá trị dự báo
Nhận xét:
Đường thẳng màu đỏ trên đồ thi không phải đường cong nên
chưa thỏa mãn giả định tuyến tính của dữ liệu.
Đường màu đỏ ko sát đường residuals = 0 thì giả định các sai số
có kì vọng bằng 0 ko thỏa mãn
Các giá trị thặng dư (sai số) phân tán không đều xung quang
đường thẳng y=0, chứng tỏ phương sai của các sai số không là
hằng số, vi phạm giả định trong mô hình hồi quy.
Ta có thể vẽ thêm các biểu đồ để kiểm tra các giả định của mô
hình hồi quy:
Nhận xét: Đồ thị kiểm tra giá trị về phân phối
chuẩn của các sai số. Nếu các điểm thặng
dư nằm trên cùng một đường thẳng thì điều kiện về
phân phối chuẩn được thỏa mãn.
Ta nhận thấy các giá trị thặng dư tập trung theo
những đường thẳng, ở khoảng đầu và
cuối có vài giá trị lệch ra khỏi đường thẳng. Tuy
nhiên, không đáng kể, ta xem như giả
định phân phối chuẩn của các sai số vẫn đáp ứng.
Dựa vào đồ thị ta thấy đường màu đỏ trên đồ thị là đường cong
và các giá trị thặng dư
không phân tán đều. Đồ thị cho ta thấy rằng giả định tính đồng
nhất về phương sai bị vi
phạm.
Dựa vào đồ thị, ta thấy quan trắc thứ 36240, 23637, 41818 có
thể là những điểm có ảnh
hưởng cao trong bộ dữ liệu. Tuy nhiên các điểm chưa vượt qua
đường khoảng cách
Cook. Do đó các điểm này chưa thật sự ảnh hưởng cao, do đó ta
không cần loại bỏ
chúng khi p
Nhận xét: với khoảng tin cậy 95% ta thấy được độ dài khoảng
tin cậy giá trị dự báo của X1 < X2 nên ta có thể kết luận với tập
dữ liệu X1, ta có thể thu được một giá trị dự báochính xác hơn
so với X2.
Từ mục (4) ta thấy mô hình ta xây dựng chưa thực sự phù hợp
ngoài việc vi phạm nhiều giả định hồi quy, hệ số R-Squared =
0,2823 cũng quá bé nên sự thay đổi của biến RMSDđược giải
thích bởi biến độc lập quá ít.
Do đó mô hình ta xây dựng chưa thực sự phùhợp để dự đoán
cho RMSD. Có thể khi phân tích bài toán ta nhận thấy các biến
F1, F2,F3, F4, F5, F6, F7, F8, F9 đều ảnh hưởng lớn đến biến
RMSD, dù vậy khi xây dựng mô hình hồi quy chưa thật sự tốt
dẫn đến kết quả dự báo sẽ không chính xác.