Professional Documents
Culture Documents
Untitled
Untitled
# Đọc dữ liệu
sapply(data1, class)
attach(data1)
head(data1)
apply(is.na(data1),2,which)
apply(is.na(data1),2,sum)
Fine.Aggregate..component.7..kg.in.a.m.3.mixture.-> fineagg
par(mfrow=c(1,1))
attach(data2)
# Tinh toan cac khoang gia tri phu hop cua tung bien dua vao summary
# bien slag
# kiểm tra xem khi ta loại bỏ các giá trị ngoại lai của biến slag thì các giá trị ngoại lai của các biến còn lại có
bị thay đổi hay không
# bien water
# bien superplastic
# bien age
func=function(x){list(mean(x),median(x),sd(x),min(x),max(x))}
table
# Vẽ biểu đồ thể hiện mối liên hệ
attach(data2)
hist(strength)
boxplot(strength ~ age, main= "Sự phụ thuộc của strength vào age")
pairs(strength ~ cement, col=2, main= "Sự phụ thuộc của strength vào cement")
pairs(strength ~ slag, col=3, main= "Sự phụ thuộc của strength vào slag")
pairs(strength ~ ash, col=4, main= "Sự phụ thuộc của strength vào ash")
pairs(strength ~ water, col=2, main= "Sự phụ thuộc của strength vào water")
pairs(strength ~ superplastic, col=3, main= "Sự phụ thuộc của strength vào superplastic")
pairs(strength ~ coarseagg, col=4, main= "Sự phụ thuộc của strength vào coarseagg")
pairs(strength ~ fineagg, col=5, main= "Sự phụ thuộc của strength vào fineagg")
fix(data3) -> chuyển đổi các dữ liệu trong data3 thành 1. Vd cemetn -> cement1
attach(data3)
names(data3)
Model1 <- lm(strength1 ~ cement1 + slag1 + ash1 + water1 + superplastic1 + coarseagg1 + fineagg1 + age1)
summary(Model1)
summary(Model2)
# So sánh 2 mô hình
# Ta thấy hệ số Pr>F >0.05 nên 2 bien coarseagg và fineagg không ảnh hưởng đến mô hình
# => mô hình Model2 (ít biến hơn) phù hợp hơn Model1
anova(Model1,Model2)
op<- par(mfrow=c(1,1))
plot(Model2)
# Dự đoán
B <- nrow(data.frame(which(A$PASS))==T)
head(strength3)
head(predict_strength)