Final Ep4

INTEGRANTES GRUPO 7: - ACUÑA GONZALES ANGEL - BUSTAMANTE CARRANZA LUCY -
ROMERO SALAS HARRY - ACENCIO VARGAS NICOLE - SILVA PEREZ BRYANT
library(haven)
library(survey)
## Warning: package ’survey’ was built under R version 4.1.3
## Loading required package: grid
## Loading required package: Matrix
## Loading required package: survival
##
## Attaching package: ’survey’
## The following object is masked from ’package:graphics’:

##
## dotchart
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5 v purrr 0.3.4

## v tibble 3.1.6 v dplyr 1.0.8
## v tidyr 1.2.0 v stringr 1.4.0
## v readr 2.1.2 v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --

## x tidyr::expand() masks Matrix::expand()
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
## x tidyr::pack() masks Matrix::pack()
## x tidyr::unpack() masks Matrix::unpack()
library(readxl)
library(knitr)
library(kableExtra)
## Warning: package ’kableExtra’ was built under R version 4.1.3
##
## Attaching package: ’kableExtra’
## The following object is masked from ’package:dplyr’:

##
## group_rows
1
#------------------
library(mctest)
library(lmtest)
## Warning: package ’lmtest’ was built under R version 4.1.3
## Loading required package: zoo
## Warning: package ’zoo’ was built under R version 4.1.3
##
## Attaching package: ’zoo’
## The following objects are masked from ’package:base’:

##
## as.Date, as.Date.numeric
library(foreign)
library(ggplot2)
library(strucchange)
## Warning: package ’strucchange’ was built under R version 4.1.3
## Loading required package: sandwich
## Warning: package ’sandwich’ was built under R version 4.1.3
##
## Attaching package: ’strucchange’
## The following object is masked from ’package:stringr’:

##
## boundary
library (dplyr)
library(car)
## Warning: package ’car’ was built under R version 4.1.3
## Loading required package: carData
## Warning: package ’carData’ was built under R version 4.1.3
##
## Attaching package: ’car’
## The following object is masked from ’package:dplyr’:

##
## recode
## The following object is masked from ’package:purrr’:

##
## some
2
library(olsrr)
## Warning: package ’olsrr’ was built under R version 4.1.3
##
## Attaching package: ’olsrr’
## The following object is masked from ’package:datasets’:

##
## rivers
#-------------------------------------*
options(scipen=999)
#-------------------------------------*
#dir.ubigeo <- "E:\\OneDrive - Universidad de San Martin de Porres\\Datos\\UBIGEO_2019.xlsx" #file.choos
maindir <- "C:/Users/Bryant Omar/Desktop/FINAL EP4"
#-------------------------------------*
#RUTAS DE TRABAJO
#-------------------------------------*
subdir.caract_UA1 <- c("/701-Modulo1529/01_Cap100_1.sav")
subdir.caract_UA2 <- c("/701-Modulo1529/01_Cap100_2.sav")
subdir.caract_financieras <- c("/701-Modulo1545/17_Cap900.sav")
#----*
subdir.sup_cosech <- c("/701-Modulo1530/02_Cap200ab.sav")
subdir.costo_cosech <- c("/701-Modulo1536/08_Cap200e.sav")
subdir.prod_cosech <- c("/701-Modulo1533/05_Cap200b.sav")
subdir.costo_produccion <- c("/701-Modulo1546/18_Cap1000.sav")
subdir.sup_cultivada <- c("/701-Modulo1549/21_Cap1200a.sav")
subdir.uso_tierra <- c("/701-Modulo1550/22_Cap1200a_1.sav")
#CARGANDO TABLA DE DATOS

#datos_ubigeo <- read_excel(dir.ubigeo)
CAR_UA1 <- read_sav(paste0(maindir,subdir.caract_UA1)) %>% filter(CCDD=="19")
CAR_UA2 <- read_sav(paste0(maindir,subdir.caract_UA2))%>% filter(CCDD=="19")
caract_financieras <- read_sav(paste0(maindir,subdir.caract_financieras)) %>% filter(CCDD=="19")
#--------------*
sup_cosechada <- read_sav(paste0(maindir,subdir.sup_cosech)) %>% filter(CCDD=="19")
costo_cosechada <- read_sav(paste0(maindir,subdir.costo_cosech)) %>% filter(CCDD=="19")
prod_cosechada <- read_sav(paste0(maindir,subdir.prod_cosech)) %>% filter(CCDD=="19")
costo_produccion <- read_sav(paste0(maindir,subdir.costo_produccion)) %>% filter(CCDD=="19")
s.cultivada <- read_sav(paste0(maindir,subdir.sup_cultivada)) %>% filter(CCDD=="19")
uso_tierra <- read_sav(paste0(maindir,subdir.uso_tierra)) %>% filter(CCDD=="19")
Análisis de las dimensiones de las tablas de datos
colnames(CAR_UA1)
## [1] "ANIO" "CCDD" "NOMBREDD" "CCPP" "NOMBREPV"

## [6] "CCDI" "NOMBREDI" "CONGLOMERADO" "NSELUA" "UA"
## [11] "ESTRATO" "RESFIN" "REGION" "DOMINIO" "FACTOR"
## [16] "CODIGO" "P15" "P101A" "P101" "P102_1"
3
## [21] "P102_2" "P102_3" "P102A_MES" "P102A_ANIO" "P102B"
## [26] "P103" "P103_EE" "P103_N" "P104_SUP_1" "P104_SUP_2"
## [31] "P104_UM" "P104_COD" "P104_EQUIV_1" "P104_EQUIV_2" "P104_SUP_ha"
## [36] "P229B" "P229F" "P242_1" "P242_2" "P242_3"
## [41] "P242_4" "P410A" "P418"
colnames(CAR_UA2)
## [1] "ANIO" "CCDD" "NOMBREDD" "CCPP"

## [5] "NOMBREPV" "CCDI" "NOMBREDI" "CONGLOMERADO"
## [9] "NSELUA" "UA" "ESTRATO" "RESFIN"
## [13] "REGION" "DOMINIO" "FACTOR" "CODIGO"
## [17] "P101A" "P102_1" "P102_2" "P102_3"
## [21] "P105_N" "P105_PROV_COD" "P105_PROV_NOM" "P105_DIST_COD"
## [25] "P105_DIST_NOM" "P105_SUP_1" "P105_SUP_2" "P105_EQUIV_1"
## [29] "P105_EQUIV_2" "P105_SUP_ha" "P110_1" "P110_2"
## [33] "P110_3" "P110_4" "P110_5" "P111"
## [37] "P202" "P224A" "P224G_1" "P224G_2"
## [41] "P224G_3" "P224G_4" "P224G_5" "P224G_6"
## [45] "P224G_8" "P224G_7"
#HALLANDO DUPLICADOS
dim(CAR_UA1) #dimensiones de una matriz de datos
## [1] 1180 43
dim(CAR_UA2) #dimensiones de una matriz de datos
## [1] 5568 46
#------------
temp_1 <- dim(CAR_UA1 %>% distinct(ANIO,CCDD,CCPP,CCDI,CONGLOMERADO,NSELUA,UA))
temp_2 <- dim(CAR_UA2 %>% distinct(ANIO,CCDD,CCPP,CCDI,CONGLOMERADO,NSELUA,UA))
#-------------
print(c(temp_1,temp_2))
## [1] 1180 7 1066 7
Podemos ver que el número de unidades agropecuarias (UA) de la tabla de datos CAR_UA1 es 1180, 7 y el
número de undidades agropecuarias (UA) de la tabla CAR_UA2 es 1066, 7. Como CAR_UA2 tiene menos
UA, esto indica que CAR_UA2 podría ser un subconjunto de la tabla CAR_UA1. Además, se observa que
la tabla CAR_UA2 tiene más filas, esto es porque se ecuentra a nivel de parcela.
Para poder identificar cuántas veces se duplica el ID de una unidad agropecuaria (el cual está compuesto por
las variables ANIO,CCDD,CCPP,CCDI,CONGLOMERADO,NSELUA,UA) utilizamos el siguiente
código.
#HALLANDO DUPLICADOS
CAR_UA2 <- CAR_UA2 %>%
group_by(ANIO,CCDD,CCPP,CCDI,CONGLOMERADO,NSELUA,UA) %>%
mutate(dup = n()) #CREA UNA COLUMNA DE NOMBRE 'dup' QUE CUENTA EL NÚMERO DE FILAS CON LOS MIS
4
Esta técnica utilizada para identificar filas duplicadas nos permite comprender que la tabla de datos se
encuentra a nivel de parcelas, en el siguiente caso particular presentamos un productor que tiene 90 parcelas.
Es importante tener en cuenta, que en el Perú distintos agricultores pueden tener distinas maneras de
medir la superficie agrícola. Por ello, es necesario estandarizar estas cantidades a una medida convencional
como hectáreas. Utilizamos el siguiente código para calcular la equivalencia a hectáreas y posteriormente
multiplicarlo sobre el total de superficie indicado.
CAR_UA1 <- CAR_UA1 %>% mutate(EQUIV_TOTAL=as.numeric(paste0(P104_EQUIV_1,".",P104_EQUIV_2)),

SUP_TOTAL=as.numeric(paste0(P104_SUP_1,".",P104_SUP_2))*EQUIV_TOTAL)
## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción
Se puede comparar la variable creada ‘SUP_TOTAL’ con la variable indicada por el INEI ‘P104_SUP_ha’.
sum(CAR_UA1$SUP_TOTAL,na.rm = T)
## [1] 53714.1
sum(CAR_UA1$P104_SUP_ha,na.rm = T)
## [1] 53714.1
Esta misma metodología se utilizará para el cálculo de superficie SEMBRADA y superficie

COSECHADA
#CREAMOS LA SIGUIENTE TABLA PARA AGREGAR LA COLUMNA 'EQUIV_TOTAL' EN LAS TABLAS NECESARIAS COMO LA DE SU
CAR_EQUIV <- CAR_UA1 %>% select(ANIO,CCDD,CCPP,CCDI,CONGLOMERADO,NSELUA,UA,EQUIV_TOTAL)
#-----------------*
sup_cosechada <- sup_cosechada %>% left_join(CAR_EQUIV,
by=c("ANIO","CCDD","CCPP","CCDI","CONGLOMERADO","NSELUA","U
#-----------------*
sup_cosechada <- sup_cosechada %>% mutate(sup_sembrada_raw=as.numeric(paste0(P210_SUP_1,".",P210_SUP_2))
sup_sembrada_ha=as.numeric(paste0(P210_SUP_1,".",P210_SUP_2))*
sup_cosechada_ha=as.numeric(paste0(P217_SUP_1,".",P217_SUP_2))
#-------------------------------------------------*
s.cultivada <- s.cultivada %>% left_join(CAR_EQUIV, by=c("ANIO","CCDD","CCPP","CCDI","CONGLOMERADO","NSE
s.cultivada <- s.cultivada %>% mutate(SUP_CULTIVADA=as.numeric(paste0(P1206_SUP_1,".",P1206_SUP_2))*EQUI
#-------------------------------------------------*
uso_tierra <- uso_tierra %>% left_join(CAR_EQUIV, by=c("ANIO","CCDD","CCPP","CCDI","CONGLOMERADO","NSELU
Ahora realizaremos algunas estadísticas descriptivas de las covariables a analizar (antes de costruir el conjunto
de datos para nuestro modelo)
Analisis de la superficie cosechada y destino de los cultivos cosechados
5
#----------------------------------------*
sup_cosechada <- sup_cosechada %>% mutate(cosechara_raw = as.numeric(paste0(P219_CANT_1,".",P219_C
destino_1_venta = as.numeric(paste0(P220_1_CANT_1,".",P220
destino_2_consumo = as.numeric(paste0(P220_2_ENT,".",P220_2_
destino_3_semilla = as.numeric(paste0(P220_3_ENT,".",P220_3_
destino_3_semilla_autoinsumo = as.numeric(paste0(P220_3A_ENT,"
destino_3_semilla_venta = as.numeric(paste0(P220_3B_ENT,"
destino_4_trueque = as.numeric(paste0(P220_4_ENT,".",P220_4_
destino_5_animales = as.numeric(paste0(P220_5_ENT,".",P220_5_
destino_6_derivados = as.numeric(paste0(P220_6_ENT,".",P220_6_
destino_7_otro = as.numeric(paste0(P220_7_ENT,".",P220_7_
destino_10_otro = as.numeric(paste0(P220_10_ENT,".",P220_1
#----------------------------------------*
#View(sup_cosechada %>% select(cosechara_raw,destino_3_semilla,starts_with("P220_3A"),starts_with("P220_
#----------------------------------------*
#View(sup_cosechada %>% select(cosechara_raw,starts_with("destino")))
#----------------------------------------*
sup_cosechada <- sup_cosechada %>% mutate(cosechara = as.numeric(paste0(P219_CANT_1,".",P219_CANT_2))*P2
destino_1_venta_kg=destino_1_venta*P219_EQUIV_KG*P220_1_PRE_KG
cosecho = as.numeric(paste0(P224_CANT_1,".",P224_CANT_2))*P224
#----------------*
#View(sup_cosechada %>% filter(P220_1_VAL!=destino_1_venta_kg)%>% select(destino_1_venta,destino_1_venta
#----------------------------------------*
#head(sup_cosechada %>% filter(is.na(P224_CANT_1)==F) %>% select(starts_with("P224")),10)
#------------*
Construyendo tabla de datos a nivel de unidad agropecuaria
sup_cosechada <- sup_cosechada %>% mutate(riego=ifelse(P212>1,1,0)) #RIEGO: 1 = EL CULTIVO TIENE RIEGO

#------------------------*
#
#
#------------------------*
destino_names <- colnames(sup_cosechada %>% select(starts_with("destino")))
6
#--------------------*
ua_produccion <- sup_cosechada %>%
summarise_at(.vars = c("sup_sembrada_ha","sup_cosechada_ha","cosechara","cosecho","riego",destino_na
.funs = sum,
na.rm=T)
#--------------------*
ua_produccion <- ua_produccion %>% mutate(riego=ifelse(riego>0,1,0))
#--------------------*
ua_produccion <- ua_produccion %>% inner_join(CAR_UA1, by=c("ANIO","CCDD","CCPP","CCDI","CONGLOMERADO","
#--------------------*
ua_produccion <- ua_produccion %>%
mutate(across(.cols =
c(sup_sembrada_ha, sup_cosechada_ha,SUP_TOTAL), #VECTOR DE VARIABLES A MODIFICAR
.fns = ~case_when(.x > 0 & .x < 1 ~ "1. Menos de 1 ha",
.x >= 1 & .x < 2 ~ "2. Entre 1 y menos de 2 ha",
.x >= 10 & is.na(.x)==F ~ "5. Mas de 10 ha",
TRUE ~ as.character(NA)),
.names = "{.col}_cat"))
#--------------------*
ua_produccion <- ua_produccion %>% mutate(cosechara_t=cosechara/1000,
cosecho_t=cosecho/1000,
rendimiento=cosechara_t/sup_cosechada_ha)
Análisis con datos muestrales, calculamos el rendimiento
ua_produccion %>% ungroup() %>%

summarise_at(.vars = c("sup_cosechada_ha","cosechara_t"),
.funs = sum,
na.rm = T)
## # A tibble: 1 x 2
## sup_cosechada_ha cosechara_t
## <dbl> <dbl>
## 1 21221. 257262.
#----------------------------------------*
Gráficos de la variable dependiente de nuestro modelo: Rendimiento por hectarea
par(mfrow=c(2,2))
hist(ua_produccion$rendimiento,main = "Histograma rendimiento")
hist(log(ua_produccion$rendimiento),main = "Histograma del logaritmo del rendimiento")
boxplot(ua_produccion$rendimiento,outline = T)
boxplot(ua_produccion$rendimiento,outline = F)
7
Histograma rendimiento Histograma del logaritmo del rendimiento
Frequency
Frequency
150
150
0
0
0 10 20 30 40 50 −2 −1 0 1 2 3 4
ua_produccion$rendimiento log(ua_produccion$rendimiento)
10 20
20 40
0
Analisis de datos muestrales: Rendimiento por hectarea según tamaño de la UA
ua_produccion %>% group_by(SUP_TOTAL_cat) %>%

summarise(sup_cosechada_ha=sum(sup_cosechada_ha,na.rm = T),
cosechara_t = sum(cosechara_t,na.rm = T),
rendimiento = cosechara_t/sup_cosechada_ha)
## # A tibble: 5 x 4
## SUP_TOTAL_cat sup_cosechada_ha cosechara_t rendimiento
## <chr> <dbl> <dbl> <dbl>
## 1 1. Menos de 1 ha 54.0 476. 8.82
## 2 2. Entre 1 y menos de 2 ha 77.3 816. 10.6
## 3 3. Entre 2 y menos de 5 ha 192. 1295. 6.75
## 4 4. Entre 5 y menos de 10 ha 229. 1412. 6.16
## 5 5. Mas de 10 ha 20668. 253262. 12.3
plot(ua_produccion$SUP_TOTAL,ua_produccion$rendimiento)
8
50
ua_produccion$rendimiento
40
30
20
10
0
0 2000 4000 6000 8000
ua_produccion$SUP_TOTAL
plot(log(ua_produccion$SUP_TOTAL),log(ua_produccion$rendimiento))
9
4
log(ua_produccion$rendimiento)
3
2
1
0
−1
−4 −2 0 2 4 6 8
log(ua_produccion$SUP_TOTAL)
cor.test(ua_produccion$SUP_TOTAL,ua_produccion$rendimiento)
##
## Pearson’s product-moment correlation
##
## data: ua_produccion$SUP_TOTAL and ua_produccion$rendimiento
## t = 0.9361, df = 1014, p-value = 0.3494
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.03217676 0.09072304
## sample estimates:
## cor
## 0.02938419
INTERPRETACIÓN Se observa que el coeficiente de correlacion de la superficie total y el rendimiento por

hectarea es de 0.02938419, cabe resaltar que cuando se encuentra cercano al 0 la correlacion de las variables
es debil ya que es menor a 0.5.
Análisis de la variable dependiente con los datos expandidos:
svy_ua_produccion <- svydesign(ids = ~1, weights = ~FACTOR, data = ua_produccion)

#----------------------------------------*
svyby(formula = ~cosechara_t,
denominator = ~sup_cosechada_ha,
by=~SUP_TOTAL_cat,
10
design = svy_ua_produccion,
FUN = svyratio)
## SUP_TOTAL_cat
## 1. Menos de 1 ha 1. Menos de 1 ha
## 2. Entre 1 y menos de 2 ha 2. Entre 1 y menos de 2 ha
## 5. Mas de 10 ha 5. Mas de 10 ha
## cosechara_t/sup_cosechada_ha
## 1. Menos de 1 ha 8.293887
## 2. Entre 1 y menos de 2 ha 9.542421
## 5. Mas de 10 ha 14.012611
## se.cosechara_t/sup_cosechada_ha
## 1. Menos de 1 ha 0.5961282
## 5. Mas de 10 ha 2.2607454
by=~riego,
FUN = svyratio)
## riego cosechara_t/sup_cosechada_ha se.cosechara_t/sup_cosechada_ha

## 0 0 13.584265 2.188562
## 1 1 8.155822 1.044784
INTERPRETACIÓN: Se observa que los que no riegan obtienen un rendimiento de 14 aproximadamente.

Mientras los que riegan obtendrán un rendimiento de 8 aproximadamente.
——————————————————————————
costo_cosechada <- costo_cosechada %>% mutate(uso_fertilizante=ifelse(P238==1,1,0),

uso_plaguicida=ifelse(P240==1,1,0))
#-----------------------------------------------*
ua_cosech <- costo_cosechada %>%
summarise(uso_fertilizante=max(uso_fertilizante,na.rm = T),
uso_plaguicida=max(uso_plaguicida,na.rm = T),
gasto_fertilizante=sum(P239,na.rm = T),
gasto_plaguicida=sum(P241,na.rm = T),
gasto_abono=sum(P237_VAL,na.rm = T),
gasto_semilla=sum(P235_VAL,na.rm = T))
## ‘summarise()‘ has grouped output by ’ANIO’, ’CCDD’, ’CCPP’, ’CCDI’,

## ’CONGLOMERADO’, ’NSELUA’. You can override using the ‘.groups‘ argument.
11
#-----------------------------------------------*
ua_produccion <- ua_produccion %>% left_join(ua_cosech,by=c("ANIO","CCDD","CCPP","CCDI","CONGLOMERADO","
#----------------------------------------*
by=~uso_fertilizante,
FUN = svyratio)
## uso_fertilizante cosechara_t/sup_cosechada_ha se.cosechara_t/sup_cosechada_ha

## 0 0 13.02612 2.655755
## 1 1 13.41790 1.467254
INTERPRETACIÓN: Se observa que los que no usan fertilizante obtienen un rendimiento de 13.03 aproxi-
madamente. Mientras los que usan fertilizante obtendrán un rendimiento de 13.42 aproximadamente.
by=~uso_plaguicida,
FUN = svyratio)
## uso_plaguicida cosechara_t/sup_cosechada_ha se.cosechara_t/sup_cosechada_ha

## 0 0 12.33826 2.957562
## 1 1 14.78439 1.226085
INTERPRETACIÓN: Se observa que los que no usan plaguicida obtienen un rendimiento de 12.34 aproxi-
madamente. Mientras los que usan plaguicida obtendrán un rendimiento de 14.78 aproximadamente.
——————————————————————————
caract_financieras <- caract_financieras %>% mutate(uso_credito=ifelse(P902==1,1,0)) %>% mutate(uso_cred

#CREDITO: 1 = EL AGRICULTOR TIENE ACCESO A CRÉDITO
#-------------------------------------------------
#Verificación de NA: table(caract_financieras$uso_credito,useNA="ifany")
#-------------------------------------------------
ua_credito <- caract_financieras %>%
summarise(uso_credito=max(uso_credito, na.rm = T))
## ‘summarise()‘ has grouped output by ’ANIO’, ’CCDD’, ’CCPP’, ’CCDI’,

## ’CONGLOMERADO’, ’NSELUA’. You can override using the ‘.groups‘ argument.
#-----------------------------------------------------------------
ua_produccion <- ua_produccion %>% left_join(ua_credito,by=c("ANIO","CCDD","CCPP","CCDI","CONGLOMERADO",
12
#----------------------------------------*
by=~uso_credito,
FUN = svyratio)
## uso_credito cosechara_t/sup_cosechada_ha se.cosechara_t/sup_cosechada_ha

## 0 0 12.72156 2.276129
## 1 1 16.26895 2.481226
INTERPRETACIÓN: Se observa que los que no usan credito obtienen un rendimiento de 12.72 aproximada-
mente. Mientras los que usan credito obtendrán un rendimiento de 16.27 aproximadamente.
——————————————————————————
ua_produccion_final <- ua_produccion %>% select(ANIO,NOMBREDD,NOMBREPV,NOMBREDI,CCDD,CCPP,CCDI,CONGLOMER

rendimiento,starts_with("sup"),starts_with("gasto"),rieg
uso_fertilizante,uso_plaguicida,uso_credito)
costo_produccion <- costo_produccion %>%

mutate(gasto_jornal=rowSums(costo_produccion %>% select(P1001A_2A_1,P1001A_2A_2,P1001A_2B_1,P1001A_2
cantidad_jornaleros=rowSums(costo_produccion %>% select(P1001A_2A_1C,P1001A_2A_2C,P1001A_2B_1
gasto_maquinaria=rowSums(costo_produccion %>% select(P1001A_5A,P1001A_5B,P1001A_6A,P1001A_6B,
gasto_riego=P1001A_3,
gasto_asistencia_tecnica=P1001A_4)
ua_produccion_final <- ua_produccion_final %>% left_join(costo_produccion,by=c("ANIO","CCDD","CCPP","CCD

#-------------------------------------------------------------------------------
1. ANÁLISIS DESCRIPTIVO
VARIABLE DEPENDIENTE: Es aquella varirable que depende de variables independientes para aumentar
o reducir en cantidad. En el caso presente, nuestra variable dependiente es el Rendimiento.
VARIABLES INDEPENDIENTES: Son aquellas variables que no dependen de un factor externo, sino que
mas bien determinan el valor de una dependiente.
a.Modelo 1
datos_finales_1 <- ua_produccion_final %>% filter(rendimiento>0)

datos_finales_1 <- datos_finales_1 %>% select(rendimiento, uso_fertilizante ,uso_plaguicida, uso_credi
## Adding missing grouping variables: ‘ANIO‘, ‘CCDD‘, ‘CCPP‘, ‘CCDI‘,

## ‘CONGLOMERADO‘, ‘NSELUA‘
datos_finales_1 <- datos_finales_1[complete.cases(datos_finales_1),]
13
modelo1 <- lm(rendimiento~ uso_fertilizante
+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono ,
data = datos_finales_1)
summary(modelo1)
##
## Call:
## lm(formula = rendimiento ~ uso_fertilizante + uso_plaguicida +
## uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_plaguicida +
## gasto_semilla + gasto_abono, data = datos_finales_1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -19.333 -5.243 -1.713 2.428 37.714
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.14089855 0.43085031 16.574 < 0.0000000000000002 ***
## uso_fertilizante -0.17832292 0.73002653 -0.244 0.8071
## uso_plaguicida 3.00292658 0.72998451 4.114 0.00004212 ***
## uso_credito 3.97580189 0.83939672 4.736 0.00000249 ***
## riego 1.17569382 0.60321631 1.949 0.0516 .
## SUP_TOTAL 0.00092345 0.00067803 1.362 0.1735
## gasto_fertilizante -0.00006033 0.00006681 -0.903 0.3668
## gasto_plaguicida 0.00006929 0.00003653 1.897 0.0582 .
## gasto_semilla 0.00098522 0.00041004 2.403 0.0165 *
## gasto_abono -0.00004298 0.00004353 -0.987 0.3237
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Residual standard error: 8.156 on 1006 degrees of freedom
## Multiple R-squared: 0.08695, Adjusted R-squared: 0.07878
## F-statistic: 10.64 on 9 and 1006 DF, p-value: 0.0000000000000007006
INTERPRETACIÓN:
Asumiendo que el modelo esta correctamente especificado (se cumplen todos los supuestos) podemos inferir
que:
• En el presente modelo de regresión se visualiza que si las variables independientes son 0, entonces el
rendimiento por hectarea aumenta en 714% gracias al intercepto.
• Un cambio en la variable “uso_fertilizante” tiene un efecto negativo del 17.8% sobre el rendimiento por
hectarea.
• Un cambio en los años de “uso_plaguicida” en una unidad tiene un efecto positivo del 300%% sobre el
rendimiento por hectarea.
14
• Un cambio en los años de “uso_credito” en una unidad tiene un efecto positivo del 398%% sobre el
• Un cambio en los años de “riego” en una unidad tiene un efecto positivo del 118% sobre el rentimiento
por hectarea.
• Un cambio en la variable “SUP_TOTAL” en una unidad tiene un efecto positivo del 0.09% sobre el
• Un cambio en los años de “gasto_fertilizante” en una unidad tiene un efecto negativo del 0.006% sobre el
• Un cambio en los años de “gasto_plaguicida” en una unidad tiene un efecto positivo del 0.007% sobre el
• Un cambio en el número de “gasto_semilla” en una unidad tiene un efecto positivo del 0.1% sobre el
• Un cambio en el número de “gasto_abono” en una unidad tiene un efecto negativo del 0.004% sobre el
b. Modelo 2
datos_finales_2 <- ua_produccion_final %>% filter(rendimiento>0)

datos_finales_2 <- datos_finales_2 %>% select(rendimiento, uso_fertilizante ,uso_plaguicida,uso_credit
## Adding missing grouping variables: ‘ANIO‘, ‘CCDD‘, ‘CCPP‘, ‘CCDI‘,

## ‘CONGLOMERADO‘, ‘NSELUA‘
datos_finales_2 <- datos_finales_2[complete.cases(datos_finales_2),]

#-------------------------------------------------------------------
svy_datos_finales <- svydesign(ids = ~1, weights = ~FACTOR, data = datos_finales_2)
modelo2 <- svyglm(rendimiento~ uso_fertilizante

+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono,
design = svy_datos_finales,
family = gaussian(link = "identity"))
summary(modelo2)
##
## Call:
## svyglm(formula = rendimiento ~ uso_fertilizante + uso_plaguicida +
## gasto_semilla + gasto_abono, design = svy_datos_finales,
## family = gaussian(link = "identity"))
##
## Survey design:
## svydesign(ids = ~1, weights = ~FACTOR, data = datos_finales_2)
15
##
## Coefficients:
## (Intercept) 5.79631429 0.44313178 13.080 < 0.0000000000000002 ***
## uso_fertilizante 0.99869245 0.94530298 1.056 0.2910
## uso_plaguicida 1.84259658 0.93958437 1.961 0.0501 .
## uso_credito 2.43591013 1.03437371 2.355 0.0187 *
## riego 2.51827069 0.53531334 4.704 0.0000029 ***
## SUP_TOTAL 0.00658744 0.00340150 1.937 0.0531 .
## gasto_plaguicida 0.00005455 0.00010955 0.498 0.6187
## gasto_semilla 0.00132185 0.00051217 2.581 0.0100 **
## gasto_abono -0.00002581 0.00008330 -0.310 0.7567
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## (Dispersion parameter for gaussian family taken to be 58.36385)
##
## Number of Fisher Scoring iterations: 2
INTERPRETACIÓN:
que:
• Un cambio en la variable “uso_fertilizante” tiene un efecto positivo del 100% sobre el rendimiento por
hectarea.
• Un cambio en los años de “uso_plaguicida” en una unidad tiene un efecto positivo del 184% sobre el
• Un cambio en los años de “uso_credito” en una unidad tiene un efecto positivo del 244% sobre el
por hectarea.
c. Comparación de gráficos del Modelo 1 y 2
16
plot(log(modelo1$fitted.values),log(svy_datos_finales$variables$rendimiento))
log(svy_datos_finales$variables$rendimiento)
4
3
2
1
0
−1
1.5 2.0 2.5 3.0
log(modelo1$fitted.values)
#-----------------------------------------------------------------
plot(log(modelo2$fitted.values),log(svy_datos_finales$variables$rendimiento))
## Warning in log(modelo2$fitted.values): Se han producido NaNs
17
log(svy_datos_finales$variables$rendimiento)
4
3
2
1
0
−1
1.5 2.0 2.5 3.0 3.5 4.0
log(modelo2$fitted.values)
INTERPRETACIÓN: Observando la grafica del modelo 1 y 2 se puede determinar que presenta heterocedas-
ticidad, debido a que el error no es constante presenta datos atípicos o aberrantes.
2. ANÁLISIS DE SUPUESTOS 2.1. Supuesto de multicolinealidad
a. Modelo 1
imcdiag(modelo1)
##
## Call:
## imcdiag(mod = modelo1)
##
##
## All Individual Multicollinearity Diagnostics Result
##
## VIF TOL Wi Fi Leamer CVIF Klein IND1
## uso_fertilizante 2.0006 0.4999 125.9489 144.0845 0.7070 2.1258 1 0.0040
## uso_plaguicida 2.0034 0.4991 126.3040 144.4907 0.7065 2.1288 1 0.0040
## uso_credito 1.0307 0.9703 3.8590 4.4146 0.9850 1.0952 0 0.0077
## riego 1.0529 0.9498 6.6569 7.6155 0.9746 1.1188 0 0.0075
## SUP_TOTAL 1.0222 0.9783 2.7938 3.1961 0.9891 1.0862 0 0.0078
## gasto_fertilizante 1.5820 0.6321 73.2549 83.8030 0.7951 1.6810 1 0.0050
## gasto_plaguicida 1.6136 0.6197 77.2399 88.3619 0.7872 1.7147 1 0.0049
## gasto_semilla 1.1466 0.8722 18.4501 21.1068 0.9339 1.2184 1 0.0069
18
## gasto_abono 1.0131 0.9871 1.6476 1.8849 0.9935 1.0765 0 0.0078
## IND2
## uso_fertilizante 2.2602
## uso_plaguicida 2.2633
## uso_credito 0.1344
## riego 0.2270
## SUP_TOTAL 0.0981
## gasto_fertilizante 1.6624
## gasto_plaguicida 1.7185
## gasto_semilla 0.5777
## gasto_abono 0.0584
##
## 1 --> COLLINEARITY is detected by the test
## 0 --> COLLINEARITY is not detected by the test
##
## uso_fertilizante , riego , SUP_TOTAL , gasto_fertilizante , gasto_plaguicida , gasto_abono , coeffici
##
## R-square of y on all x: 0.0869
##
## * use method argument to check which regressors may be the reason of collinearity
## ===================================
INTERPRETACIÓN: Vemos que se presenta multicolinealidad en las variables de: “uso_fertilizante,

uso_plaguicida, gasto_fertilizante, gasto_plaguicida, gasto_semila” mientras que las que no presentan son:
“riego, SUP_TOTAL, gasto_abono, uso_credito”. Por lo tanto se puede decir que hay una predominancia
de variables multicolineales.
b. Modelo 2
imcdiag(modelo2)
##
## Call:
## imcdiag(mod = modelo2)
##
##
## All Individual Multicollinearity Diagnostics Result
##
## VIF TOL Wi Fi Leamer CVIF Klein IND1
## uso_fertilizante 2.0006 0.4999 125.9489 144.0845 0.7070 2.1258 1 0.0040
## uso_plaguicida 2.0034 0.4991 126.3040 144.4907 0.7065 2.1288 1 0.0040
## uso_credito 1.0307 0.9703 3.8590 4.4146 0.9850 1.0952 0 0.0077
## riego 1.0529 0.9498 6.6569 7.6155 0.9746 1.1188 0 0.0075
## SUP_TOTAL 1.0222 0.9783 2.7938 3.1961 0.9891 1.0862 0 0.0078
## gasto_fertilizante 1.5820 0.6321 73.2549 83.8030 0.7951 1.6810 1 0.0050
## gasto_plaguicida 1.6136 0.6197 77.2399 88.3619 0.7872 1.7147 1 0.0049
## gasto_semilla 1.1466 0.8722 18.4501 21.1068 0.9339 1.2184 1 0.0069
## gasto_abono 1.0131 0.9871 1.6476 1.8849 0.9935 1.0765 0 0.0078
## IND2
## uso_fertilizante 2.2602
## uso_plaguicida 2.2633
## uso_credito 0.1344
## riego 0.2270
19
## SUP_TOTAL 0.0981
## gasto_fertilizante 1.6624
## gasto_plaguicida 1.7185
## gasto_semilla 0.5777
## gasto_abono 0.0584
##
## 1 --> COLLINEARITY is detected by the test
## 0 --> COLLINEARITY is not detected by the test
##
## uso_fertilizante , riego , SUP_TOTAL , gasto_fertilizante , gasto_plaguicida , gasto_abono , coeffici
##
## R-square of y on all x: 0.0869
##
## * use method argument to check which regressors may be the reason of collinearity
## ===================================
INTERPRETACIÓN: Vemos que se presenta multicolinealidad en las variables de: “uso_fertilizante,

uso_plaguicida, gasto_fertilizante, gasto_plaguicida, gasto_semila” mientras que las que no presentan son:
“riego, SUP_TOTAL, gasto_abono, uso_credito”. Por lo tanto se puede decir que hay una predominancia
de variables multicolineales.
——————————————————————————
2.2. Supuesto de heterocedasticidad 2.2.1. Identificación usando Breusch-Pagan a. Modelo 1
residuales<-modelo1$residuals
prediccion<-modelo1$fitted.values
ggplot(datos_finales_1,aes(uso_fertilizante
+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono, rendimiento))+geom_point()
20
50
40
30
rendimiento
20
10
0 100000 200000 300000

uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + ...
modelo_breusch <- lm((residualesˆ2) ~ uso_fertilizante

+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono,data=datos_finales_1)
summary(modelo_breusch)
##
## Call:
## lm(formula = (residuales^2) ~ uso_fertilizante + uso_plaguicida +
## gasto_semilla + gasto_abono, data = datos_finales_1)
##
## Residuals:
## -402.50 -60.01 -39.37 -13.16 1375.51
##
## Coefficients:
## (Intercept) 66.0752081 8.1162825 8.141 0.00000000000000115 ***
## uso_fertilizante -26.4752112 13.7521115 -1.925 0.0545 .
21
## uso_plaguicida 26.2909347 13.7513201 1.912 0.0562 .
## uso_credito 30.7373021 15.8124081 1.944 0.0522 .
## riego -18.8277819 11.3632829 -1.657 0.0979 .
## SUP_TOTAL 0.0101113 0.0127726 0.792 0.4288
## gasto_fertilizante 0.0023624 0.0012586 1.877 0.0608 .
## gasto_plaguicida 0.0009270 0.0006881 1.347 0.1782
## gasto_semilla -0.0050356 0.0077242 -0.652 0.5146
## gasto_abono -0.0002331 0.0008200 -0.284 0.7762
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
bptest(datos_finales_1$rendimiento ~ datos_finales_1$uso_fertilizante
+datos_finales_1$uso_plaguicida
+datos_finales_1$uso_credito
+datos_finales_1$riego
+datos_finales_1$SUP_TOTAL
+datos_finales_1$gasto_fertilizante
+datos_finales_1$gasto_plaguicida
+datos_finales_1$gasto_semilla
+datos_finales_1$gasto_abono)
##
## studentized Breusch-Pagan test
##
## data: datos_finales_1$rendimiento ~ datos_finales_1$uso_fertilizante + datos_finales_1$uso_plagu
## BP = 26.884, df = 9, p-value = 0.001462
INTERPRETACIÓN: A través de las pruebas de Breusch Pagan, se confirma que existe heterocedasticidad
en el modelo 1.
b. Modelo 2
residuales2 <-modelo2$residuals
prediccion2 <-modelo2$fitted.values
ggplot(svy_datos_finales$variables,aes(uso_fertilizante
+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono, rendimiento))+geom_point()
22
50
40
30
rendimiento
20
10
0 100000 200000 300000

uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + ...
modelo_breusch<-lm((residuales2ˆ2) ~ uso_fertilizante
+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono,data = svy_datos_finales$variables)
summary(modelo_breusch)
##
## Call:
## lm(formula = (residuales2^2) ~ uso_fertilizante + uso_plaguicida +
## gasto_semilla + gasto_abono, data = svy_datos_finales$variables)
##
## Residuals:
## -584.13 -58.18 -39.53 -18.71 1372.57
##
## Coefficients:
## (Intercept) 53.5845221 8.8717710 6.040 0.00000000217 ***
23
## uso_plaguicida 24.0828655 15.0313353 1.602 0.1094
## uso_credito 28.1240756 17.2842757 1.627 0.1040
## riego -14.2759629 12.4210123 -1.149 0.2507
## SUP_TOTAL 0.2957122 0.0139615 21.181 < 0.0000000000000002 ***
## gasto_fertilizante 0.0033814 0.0013758 2.458 0.0141 *
## gasto_plaguicida -0.0003582 0.0007522 -0.476 0.6340
## gasto_semilla -0.0024662 0.0084432 -0.292 0.7703
## gasto_abono -0.0007019 0.0008963 -0.783 0.4337
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## F-statistic: 52.77 on 9 and 1006 DF, p-value: < 0.00000000000000022
bptest(svy_datos_finales$variables$rendimiento ~ svy_datos_finales$variables$uso_fertilizante
+svy_datos_finales$variables$uso_plaguicida
+svy_datos_finales$variables$uso_credito
+svy_datos_finales$variables$riego
+svy_datos_finales$variables$SUP_TOTAL
+svy_datos_finales$variables$gasto_fertilizante
+svy_datos_finales$variables$gasto_plaguicida
+svy_datos_finales$variables$gasto_semilla
+svy_datos_finales$variables$gasto_abono)
##
## studentized Breusch-Pagan test
##
## data: svy_datos_finales$variables$rendimiento ~ svy_datos_finales$variables$uso_fertilizante + s
## BP = 26.884, df = 9, p-value = 0.001462
INTERPRETACIÓN: A través de las pruebas de Breusch Pagan, se confirma que existe heterocedasticidad
en el modelo 2.
——————————————————————————
2.2.2. Corrección de los modelos (No se conocen la varianzas) a. Modelo 1
df1_varianza <- lm(log(residualesˆ2) ~ log(uso_fertilizante

+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono)
, data = datos_finales_1)
summary(df1_varianza)
##
## Call:
## lm(formula = log(residuales^2) ~ log(uso_fertilizante + uso_plaguicida +
24
## gasto_semilla + gasto_abono), data = datos_finales_1)
##
## Residuals:
## -12.9386 -1.0813 0.5215 1.5182 4.8429
##
## Coefficients:
##
## (Intercept)
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
##
## (Intercept)
##
## (Intercept)
##
## (Intercept)
##
## (Intercept)
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Multiple R-squared: 0.0003615, Adjusted R-squared: -0.0006243
datos_finales_1$varianza <- exp(df1_varianza$fitted.values)

head(datos_finales_1)
## # A tibble: 6 x 17
## # Groups: ANIO, CCDD, CCPP, CCDI, CONGLOMERADO, NSELUA [6]
## ANIO CCDD CCPP CCDI CONGLOMERADO NSELUA rendimiento uso_fertilizante
## <dbl> <chr> <chr> <chr> <chr> <chr> <dbl> <dbl>
## 1 2019 19 01 02 10672 00018 5.28 1
## 2 2019 19 01 02 10672 00024 3.2 1
## 3 2019 19 01 02 10672 00029 6.19 1
## 4 2019 19 01 02 10672 00040 9.77 1
## 5 2019 19 01 02 10672 00053 3.02 1
## 6 2019 19 01 02 10672 00054 7 1
## # ... with 9 more variables: uso_plaguicida <dbl>, uso_credito <dbl>,
## # riego <dbl>, SUP_TOTAL <dbl>, gasto_fertilizante <dbl>,
## # gasto_plaguicida <dbl>, gasto_semilla <dbl>, gasto_abono <dbl>,
## # varianza <dbl>
df1_modelo_Ponderado1<-lm(rendimiento ~ uso_fertilizante
+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
25
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono,data = datos_finales_1,
weights = 1/varianza)
summary(df1_modelo_Ponderado1)
##
## Call:
## gasto_semilla + gasto_abono, data = datos_finales_1, weights = 1/varianza)
##
## Weighted Residuals:
## -5.5109 -1.5471 -0.5010 0.7383 11.2582
##
## Coefficients:
## (Intercept) 7.03107514 0.42204853 16.659 < 0.0000000000000002 ***
## uso_plaguicida 2.97283191 0.72849848 4.081 0.00004844 ***
## uso_credito 3.93951385 0.84028061 4.688 0.00000313 ***
## riego 1.24482582 0.60151888 2.069 0.0388 *
## SUP_TOTAL 0.00098192 0.00069580 1.411 0.1585
## gasto_semilla 0.00102256 0.00042177 2.424 0.0155 *
## gasto_abono -0.00004127 0.00004643 -0.889 0.3743
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
INTERPRETACIÓN:
Obtenemos la corrección del Modelo 1, si bien es cierto, los signos de las variables independientes no han
cambiado. Pero, se ve una reducción en la mayoría de estimados y de errores estándar.
que:
• Un cambio en la variable “uso_fertilizante” tiene un efecto negativo del 10.1% sobre el rendimiento por
hectarea.
26
por hectarea.
b. Modelo 2
df2_varianza <- lm(log(residuales2ˆ2) ~ log(uso_fertilizante

+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono), data = svy_datos_finales$variables)
summary(df2_varianza)
##
## Call:
## lm(formula = log(residuales2^2) ~ log(uso_fertilizante + uso_plaguicida +
## gasto_semilla + gasto_abono), data = svy_datos_finales$variables)
##
## Residuals:
## -12.2678 -1.2424 0.4375 1.4530 5.3410
##
## Coefficients:
##
## (Intercept)
##
## (Intercept)
##
## (Intercept)
##
## (Intercept)
##
## (Intercept)
27
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
datos_finales_2$varianza <- exp(df2_varianza$fitted.values)

head(datos_finales_2)
## # A tibble: 6 x 18
## # Groups: ANIO, CCDD, CCPP, CCDI, CONGLOMERADO, NSELUA [6]
## ANIO CCDD CCPP CCDI CONGLOMERADO NSELUA rendimiento uso_fertilizante
## <dbl> <chr> <chr> <chr> <chr> <chr> <dbl> <dbl>
## 1 2019 19 01 02 10672 00018 5.28 1
## 2 2019 19 01 02 10672 00024 3.2 1
## 3 2019 19 01 02 10672 00029 6.19 1
## 4 2019 19 01 02 10672 00040 9.77 1
## 5 2019 19 01 02 10672 00053 3.02 1
## 6 2019 19 01 02 10672 00054 7 1
## # ... with 10 more variables: uso_plaguicida <dbl>, uso_credito <dbl>,
## # riego <dbl>, SUP_TOTAL <dbl>, gasto_fertilizante <dbl>,
## # gasto_plaguicida <dbl>, gasto_semilla <dbl>, gasto_abono <dbl>,
## # FACTOR <dbl>, varianza <dbl>
df2_modelo_Ponderado2 <- lm(rendimiento ~ uso_fertilizante

+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono, data = datos_finales_2,
weights = 1/varianza)
##
## Call:
##
## -4.9574 -1.5741 -0.4753 0.8323 11.7175
##
## Coefficients:
## (Intercept) 6.68068233 0.39523626 16.903 < 0.0000000000000002 ***
## uso_plaguicida 2.90885063 0.72659416 4.003 0.00006703 ***
28
## uso_credito 3.77754006 0.84195345 4.487 0.00000807 ***
## riego 1.47069888 0.59740941 2.462 0.0140 *
## SUP_TOTAL 0.00119468 0.00076012 1.572 0.1163
## gasto_semilla 0.00115136 0.00046332 2.485 0.0131 *
## gasto_abono -0.00003467 0.00005731 -0.605 0.5454
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
INTERPRETACIÓN:
Obtenemos la corrección del Modelo 2, si bien es cierto, los signos de las variables independientes no han
cambiado. Pero, se ve una reducción en la mayoría de estimados y de errores estándar.
que:
• Un cambio en la variable “uso_fertilizante” tiene un efecto positivo del 12% sobre el rendimiento por
hectarea.
por hectarea.
——————————————————————————
2.3. Normalidad de los residuos a. Modelo 1
qqnorm(df2_modelo_Ponderado2$residuals)
qqline(df2_modelo_Ponderado2$residuals)
29
Normal Q−Q Plot
30
Sample Quantiles
20
10
0
−20
−3 −2 −1 0 1 2 3
Theoretical Quantiles
Prueba de normalidad
shapiro.test(residuales)
##
## Shapiro-Wilk normality test
##
## data: residuales
## W = 0.85571, p-value < 0.00000000000000022
INTERPRETACIÓN: En el modelo 1 se obtiene un p-value menor de 0.05 (0.00000000000000022), no pode-

mos aceptar la hipótesis nula (hipótesis de normalidad). Por lo tanto, podemos suponer anormalidad de los
residuos.
Identificación del dato atípico
which.max(df1_modelo_Ponderado1$residuals)
## 166
## 166
Exclusión del dato atípico
30
shapiro.test(df1_modelo_Ponderado1$residuals[-166])
##
##
## data: df1_modelo_Ponderado1$residuals[-166]
## W = 0.85891, p-value < 0.00000000000000022
INTERPRETACIÓN: Se confirma que los residuos sí se distribuyen de forma normal a excepción de un dato
extremo. Es necesario estudiar en detalle la influencia de esta observación para determinar si el modelo es
más preciso sin ella.
b. Modelo 2
qqnorm(df2_modelo_Ponderado2$residuals)
qqline(df2_modelo_Ponderado2$residuals)
Normal Q−Q Plot

30
Sample Quantiles
20
10
0
−20
−3 −2 −1 0 1 2 3
Theoretical Quantiles
Prueba de normalidad
shapiro.test(residuales2)
##
##
## data: residuales2
## W = 0.84222, p-value < 0.00000000000000022
31
INTERPRETACIÓN: En el modelo 2 se obtiene un p-value menor de 0.05 (0.00000000000000022), no pode-
mos aceptar la hipótesis nula (hipótesis de normalidad). Por lo tanto, podemos suponer que existen algunos
datos atípicos.
Identificación del dato atípico
which.max(df2_modelo_Ponderado2$residuals)
## 166
## 166
Exclusión del dato atípico
shapiro.test(df2_modelo_Ponderado2$residuals[-166])
##
##
## data: df2_modelo_Ponderado2$residuals[-166]
## W = 0.85918, p-value < 0.00000000000000022
INTERPRETACIÓN: Se confirma que los residuos sí se distribuyen de forma normal a excepción de un dato
extremo. Es necesario estudiar en detalle la influencia de esta observación para determinar si el modelo es
más preciso sin ella.
——————————————————————————
2.4. Variables influyentes a. Modelo 1
outlierTest(df1_modelo_Ponderado1)
## rstudent unadjusted p-value Bonferroni p

## 166 4.707342 0.0000028612 0.0029070
## 891 4.486037 0.0000080929 0.0082224
## 100 4.356117 0.0000145970 0.0148300
## 970 4.166959 0.0000335250 0.0340610
INTERPRETACIÓN: Tal como se apreció en el estudio de normalidad de los residuos, las observaciones 166,
100, 891 y 970 tienen un residuo estandarizado mayor que la desviación estándar de otros residuos.
summary(influence.measures(df1_modelo_Ponderado1))
## Potentially influential observations of

## lm(formula = rendimiento ~ uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL
##
## dfb.1_ dfb.us_f dfb.us_p dfb.us_c dfb.rieg dfb.SUP_ dfb.gst_f dfb.gst_p
## 5 0.02 0.02 0.02 0.05 -0.03 0.00 -0.02 0.02
## 69 0.09 -0.04 0.01 0.02 -0.03 -1.17_* -0.05 0.11
## 78 0.00 0.00 0.00 -0.01 -0.01 0.00 0.00 0.00
## 99 0.15 -0.04 -0.04 -0.02 -0.04 -0.02 0.00 0.00
## 100 0.22 -0.06 -0.06 -0.03 -0.05 -0.02 0.00 -0.01
## 101 0.18 -0.05 -0.04 -0.03 -0.04 -0.02 0.00 0.00
32
## 102 0.13 -0.04 -0.03 -0.02 -0.03 -0.01 0.00 0.00
## 108 0.12 -0.03 -0.03 -0.02 -0.03 -0.01 0.00 0.00
## 154 0.00 0.00 0.00 0.00 -0.01 0.00 0.00 0.00
## 160 -0.03 0.00 0.02 -0.04 0.10 0.00 0.02 -0.02
## 162 -0.03 0.02 0.03 -0.03 0.12 0.00 0.00 -0.01
## 166 -0.06 0.04 0.07 -0.05 0.25 0.01 -0.01 -0.01
## 219 -0.03 0.02 0.04 -0.03 0.13 0.00 0.00 -0.01
## 237 -0.02 -0.01 -0.01 0.04 0.01 0.00 0.01 -0.01
## 239 0.01 0.03 0.04 -0.06 -0.10 -0.01 0.01 -0.02
## 243 0.01 0.04 0.04 -0.03 -0.05 0.00 -0.01 -0.01
## 259 0.01 0.04 0.04 -0.05 -0.09 -0.01 0.01 -0.02
## 262 -0.03 0.05 0.02 0.28 -0.07 -0.01 -0.01 0.00
## 265 -0.03 0.02 0.03 -0.03 0.11 0.00 0.00 -0.01
## 340 0.00 0.00 0.01 0.01 0.00 -0.25 -0.01 0.02
## 371 0.01 0.05 0.05 -0.04 -0.07 0.00 -0.01 -0.01
## 388 0.05 -0.03 0.01 0.01 -0.01 -0.81 -0.03 0.07
## 418 0.03 0.05 0.05 0.08 0.00 0.00 -0.01 0.02
## 430 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
## 466 0.08 -0.05 -0.03 -0.02 0.14 -0.01 0.00 0.00
## 707 0.11 -0.03 -0.03 -0.02 -0.03 0.04 0.00 -0.01
## 709 0.05 0.08 -0.09 -0.01 -0.03 0.02 0.27 -0.15
## 711 0.03 0.02 0.07 0.06 0.01 0.00 0.06 -0.12
## 726 0.01 0.00 0.00 -0.03 -0.01 0.00 -0.01 0.00
## 729 0.03 0.03 0.04 -0.06 0.00 0.00 -0.04 0.03
## 737 0.07 0.20 -0.19 -0.01 -0.05 0.00 -0.04 0.04
## 744 0.00 0.00 0.00 0.01 0.01 0.00 -0.01 0.01
## 747 0.14 -0.04 -0.04 -0.02 -0.03 -0.01 0.00 0.00
## 750 0.01 0.06 0.06 -0.04 -0.07 0.02 -0.01 -0.01
## 752 0.06 -0.17 0.17 -0.04 -0.04 0.01 0.02 -0.04
## 754 0.20 -0.06 -0.05 -0.03 -0.05 -0.02 0.00 -0.01
## 756 0.01 -0.04 0.03 0.00 0.01 0.00 0.10 -0.18
## 759 0.18 -0.05 -0.05 -0.03 -0.04 0.07 0.01 -0.01
## 761 -0.01 -0.01 0.01 0.01 0.01 0.03 0.24 -0.41
## 769 0.02 -0.04 0.03 -0.01 -0.02 0.00 -0.10 0.17
## 770 0.01 0.05 0.05 -0.05 -0.09 0.02 -0.02 -0.01
## 771 0.11 -0.30 0.29 -0.06 -0.06 0.02 0.05 -0.08
## 772 -0.04 0.10 -0.04 0.19 -0.03 0.07 -0.18 0.29
## 773 0.04 -0.06 0.06 -0.02 -0.02 0.01 -0.27 0.46
## 774 0.06 -0.15 0.14 -0.03 -0.03 0.01 -0.04 0.06
## 775 0.08 -0.21 0.22 -0.04 -0.04 0.03 -0.03 0.05
## 776 0.03 -0.16 0.14 0.22 -0.04 -0.01 -0.05 0.09
## 777 0.07 -0.14 0.14 -0.03 -0.04 -0.01 -0.20 0.34
## 778 0.08 -0.24 0.24 -0.05 -0.05 0.10 0.04 -0.06
## 780 0.17 -0.05 -0.04 -0.02 -0.04 -0.02 0.00 -0.01
## 783 0.08 -0.21 0.22 -0.04 -0.04 -0.01 0.03 -0.05
## 785 0.09 -0.23 0.24 -0.04 -0.04 -0.02 0.04 -0.06
## 790 0.11 -0.27 0.27 -0.05 -0.05 -0.02 0.04 -0.07
## 798 0.00 0.03 -0.02 -0.06 0.01 -0.01 0.07 -0.11
## 802 -0.01 0.07 -0.04 -0.01 -0.02 -0.01 -0.11 0.31
## 803 0.00 -0.01 -0.01 -0.02 -0.02 0.00 0.00 -0.01
## 834 0.19 -0.05 -0.05 -0.03 -0.05 -0.01 0.00 -0.01
## 852 0.07 -0.18 0.18 -0.03 -0.03 -0.01 0.03 -0.04
## 891 0.12 -0.01 -0.07 -0.06 -0.04 0.09 1.98_* -1.14_*
## 898 0.13 -0.04 -0.07 0.33 -0.04 -0.02 0.00 0.00
33
## 901 0.18 -0.05 -0.05 -0.03 -0.04 -0.02 0.00 -0.01
## 918 0.12 -0.04 -0.07 0.32 -0.04 0.00 0.00 0.00
## 919 0.04 0.50 -0.15 0.06 -0.14 0.10 -6.48_* -0.68
## 923 0.17 -0.05 -0.04 -0.02 -0.04 -0.02 0.00 0.00
## 924 0.00 0.01 0.01 0.03 0.05 0.00 -0.01 0.02
## 926 0.01 0.01 0.01 -0.05 -0.08 0.00 0.01 -0.02
## 933 0.00 0.00 0.00 0.01 0.01 0.00 0.00 0.00
## 940 0.11 -0.34 0.28 0.00 -0.19 -0.07 0.97 -1.71_*
## 942 0.31 -0.04 -0.06 -0.04 0.02 0.03 0.18 -0.11
## 951 0.20 -0.06 -0.05 -0.03 -0.05 0.00 0.00 -0.01
## 953 0.12 -0.03 -0.03 -0.02 -0.03 0.02 0.00 -0.01
## 968 0.13 -0.04 -0.07 0.34 -0.04 0.02 0.00 0.00
## 969 0.07 0.23 -0.22 -0.01 -0.06 0.05 -0.03 0.03
## 970 0.10 0.31 -0.30 -0.02 -0.08 0.05 -0.06 0.05
## 1011 -0.03 0.06 0.02 0.27 -0.06 0.01 -0.02 0.02
## 1012 0.09 0.28 -0.27 -0.02 -0.07 0.05 -0.02 0.03
## 1013 0.06 -0.03 0.03 -0.02 -0.03 -0.03 -0.64 1.08_*
## dfb.gst_s dfb.gst_b dffit cov.r cook.d hat
## 5 -0.28 0.00 -0.30_* 1.03 0.01 0.04_*
## 69 0.00 0.04 -1.18_* 1.93_* 0.14 0.48_*
## 78 0.03 0.00 0.03 1.04_* 0.00 0.03
## 99 0.00 -0.01 0.15 0.93_* 0.00 0.00
## 100 0.00 -0.01 0.23 0.84_* 0.00 0.00
## 101 0.00 -0.01 0.18 0.90_* 0.00 0.00
## 102 0.00 0.00 0.13 0.95_* 0.00 0.00
## 108 0.00 -0.01 0.12 0.96_* 0.00 0.00
## 154 0.02 0.00 0.02 1.03_* 0.00 0.02
## 160 0.07 0.00 0.17 0.97_* 0.00 0.01
## 162 -0.02 0.00 0.16 0.96_* 0.00 0.00
## 166 -0.11 0.00 0.34_* 0.82_* 0.01 0.01
## 219 -0.04 0.00 0.17 0.96_* 0.00 0.00
## 237 0.10 0.00 0.12 1.05_* 0.00 0.04_*
## 239 0.13 0.01 0.23 0.88_* 0.01 0.00
## 243 -0.05 0.00 0.14 0.96_* 0.00 0.00
## 259 0.07 0.01 0.20 0.89_* 0.00 0.00
## 262 -0.06 -0.03 0.32_* 0.93_* 0.01 0.01
## 265 -0.01 0.00 0.15 0.96_* 0.00 0.00
## 340 0.00 0.01 -0.25 1.15_* 0.01 0.12_*
## 371 -0.06 0.00 0.18 0.92_* 0.00 0.00
## 388 0.00 0.03 -0.81_* 1.49_* 0.07 0.33_*
## 418 -0.56 -0.01 -0.57_* 1.11_* 0.03 0.11_*
## 430 0.00 0.00 0.00 1.05_* 0.00 0.03_*
## 466 -0.01 -0.01 0.18 0.97_* 0.00 0.01
## 707 0.00 0.07 0.15 0.95_* 0.00 0.00
## 709 -0.02 -0.01 0.31_* 1.01 0.01 0.03_*
## 711 -0.45 -0.01 -0.47_* 1.22_* 0.02 0.18_*
## 726 -0.04 0.00 -0.06 1.03_* 0.00 0.02
## 729 -0.36 0.01 -0.38_* 1.12_* 0.01 0.11_*
## 737 -0.02 -0.01 0.24 0.95_* 0.01 0.01
## 744 -0.05 0.00 -0.05 1.03_* 0.00 0.03
## 747 0.00 -0.01 0.14 0.94_* 0.00 0.00
## 750 -0.07 0.00 0.20 0.89_* 0.00 0.00
## 752 0.03 0.00 0.21 0.97_* 0.00 0.01
## 754 0.00 -0.01 0.20 0.89_* 0.00 0.00
34
## 756 -0.01 0.00 -0.18 1.15_* 0.00 0.12_*
## 759 0.00 -0.02 0.20 0.89_* 0.00 0.00
## 761 0.01 -0.01 -0.42_* 1.22_* 0.02 0.18_*
## 769 0.03 0.00 0.19 1.04_* 0.00 0.04_*
## 770 0.02 0.00 0.20 0.88_* 0.00 0.00
## 771 0.02 -0.01 0.36_* 0.87_* 0.01 0.01
## 772 -0.06 -0.01 0.37_* 1.00 0.01 0.03_*
## 773 -0.04 0.00 0.49_* 1.02 0.02 0.05_*
## 774 0.01 0.00 0.21 0.97_* 0.00 0.01
## 775 -0.04 0.00 0.28 0.92_* 0.01 0.01
## 776 -0.01 -0.02 0.33_* 0.96_* 0.01 0.02
## 777 -0.02 0.00 0.43_* 0.95_* 0.02 0.02
## 778 0.00 -0.01 0.31_* 0.92_* 0.01 0.01
## 780 0.01 -0.01 0.17 0.91_* 0.00 0.00
## 783 -0.02 0.00 0.26 0.94_* 0.01 0.01
## 785 -0.02 0.00 0.28 0.93_* 0.01 0.01
## 790 -0.03 0.00 0.33_* 0.90_* 0.01 0.01
## 798 -0.02 0.01 -0.15 1.04_* 0.00 0.04_*
## 802 -0.03 0.00 0.33_* 1.04_* 0.01 0.05_*
## 803 0.10 0.00 0.10 1.08_* 0.00 0.06_*
## 834 0.01 -0.01 0.19 0.89_* 0.00 0.00
## 852 -0.01 0.00 0.22 0.96_* 0.00 0.01
## 891 -0.08 0.19 2.04_* 1.00 0.41 0.17_*
## 898 -0.04 -0.04 0.37_* 0.92_* 0.01 0.01
## 901 0.02 -0.01 0.18 0.91_* 0.00 0.00
## 918 -0.04 -0.04 0.37_* 0.92_* 0.01 0.01
## 919 0.62 0.16 -8.57_* 5.54_* 7.25_* 0.84_*
## 923 0.00 0.00 0.17 0.91_* 0.00 0.00
## 924 -0.18 0.00 -0.19 1.03_* 0.00 0.03_*
## 926 0.18 0.01 0.22 0.97_* 0.00 0.01
## 933 -0.03 0.00 -0.04 1.04_* 0.00 0.03_*
## 940 0.17 -0.02 -1.74_* 1.32_* 0.30 0.29_*
## 942 0.06 -7.10_* -7.14_* 22.44_* 5.08_* 0.96_*
## 951 0.03 -0.01 0.20 0.87_* 0.00 0.00
## 953 0.02 -0.01 0.13 0.96_* 0.00 0.00
## 968 -0.03 -0.05 0.39_* 0.90_* 0.02 0.01
## 969 -0.03 0.00 0.28 0.93_* 0.01 0.01
## 970 -0.03 -0.01 0.38_* 0.86_* 0.01 0.01
## 1011 -0.08 -0.01 0.31_* 0.94_* 0.01 0.01
## 1012 -0.04 -0.01 0.34_* 0.88_* 0.01 0.01
## 1013 -0.08 0.01 1.12_* 1.02 0.12 0.11_*
influencePlot(df1_modelo_Ponderado1)
35
166 891
4
Studentized Residuals
2
0
942
−2
919
−4
0.0 0.2 0.4 0.6 0.8
Hat−Values
## StudRes Hat CookD

## 166 4.707342 0.005208086 0.01136207
## 891 4.486037 0.171017317 0.40741935
## 919 -3.725913 0.840998775 7.24993728
## 942 -1.530470 0.956020534 5.08496140
b. Modelo 2
outlierTest(df2_modelo_Ponderado2)
## rstudent unadjusted p-value Bonferroni p

## 166 4.744821 0.0000023888 0.0024271
## 100 4.450730 0.0000095142 0.0096664
## 754 4.208115 0.0000280540 0.0285030
## 970 4.201548 0.0000288660 0.0293280
INTERPRETACIÓN: Tal como se apreció en el estudio de normalidad de los residuos, las observaciones 166,
100, 754, 970 tienen un residuo estandarizado mayor que las desviaciones estándares de los residuos.
summary(influence.measures(df2_modelo_Ponderado2))
## Potentially influential observations of

## lm(formula = rendimiento ~ uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL
##
36
## dfb.1_ dfb.us_f dfb.us_p dfb.us_c dfb.rieg dfb.SUP_ dfb.gst_f dfb.gst_p
## 5 0.02 0.02 0.02 0.04 -0.03 0.00 -0.02 0.02
## 69 0.10 -0.05 0.01 0.02 -0.03 -1.24_* -0.04 0.10
## 78 0.00 0.00 0.00 0.00 -0.01 0.00 0.00 0.00
## 99 0.16 -0.04 -0.03 -0.02 -0.04 -0.01 0.00 0.00
## 100 0.22 -0.06 -0.05 -0.03 -0.05 -0.02 0.00 -0.01
## 101 0.18 -0.05 -0.04 -0.03 -0.04 -0.02 0.00 0.00
## 102 0.13 -0.03 -0.03 -0.02 -0.03 -0.01 0.00 0.00
## 108 0.12 -0.03 -0.03 -0.02 -0.03 -0.01 0.00 0.00
## 154 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
## 162 -0.03 0.02 0.03 -0.03 0.11 0.00 0.00 -0.01
## 166 -0.06 0.04 0.07 -0.05 0.25 0.01 -0.01 -0.01
## 219 -0.03 0.02 0.03 -0.03 0.12 0.00 0.00 -0.01
## 237 -0.01 -0.01 -0.01 0.03 0.01 0.00 0.01 -0.01
## 239 0.01 0.03 0.03 -0.05 -0.09 -0.01 0.01 -0.01
## 243 0.01 0.04 0.05 -0.03 -0.06 0.00 -0.01 -0.01
## 259 0.01 0.03 0.04 -0.05 -0.08 0.00 0.01 -0.02
## 262 -0.03 0.06 0.03 0.28 -0.06 -0.01 -0.01 0.00
## 265 -0.03 0.01 0.03 -0.03 0.10 0.00 0.00 0.00
## 340 0.00 -0.01 0.01 0.01 0.00 -0.26 -0.01 0.02
## 371 0.02 0.05 0.06 -0.04 -0.07 -0.01 -0.01 -0.01
## 388 0.06 -0.03 0.01 0.01 -0.02 -0.84 -0.03 0.07
## 418 0.03 0.05 0.05 0.07 0.00 0.00 -0.01 0.02
## 430 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
## 466 0.08 -0.05 -0.03 -0.02 0.16 -0.01 0.00 0.00
## 707 0.09 -0.02 -0.02 -0.02 -0.02 0.04 0.00 -0.01
## 709 0.03 0.05 -0.06 -0.01 -0.02 0.02 0.26 -0.14
## 711 0.02 0.02 0.07 0.05 0.01 0.00 0.06 -0.12
## 726 0.01 0.00 0.00 -0.03 -0.01 0.00 -0.01 0.00
## 729 0.03 0.03 0.04 -0.05 0.00 0.00 -0.03 0.03
## 737 0.07 0.22 -0.21 -0.01 -0.05 0.00 -0.04 0.04
## 744 0.00 0.00 0.00 0.01 0.01 0.00 -0.01 0.01
## 747 0.17 -0.04 -0.04 -0.03 -0.04 -0.01 0.00 -0.01
## 750 0.02 0.06 0.06 -0.04 -0.07 0.02 -0.01 -0.01
## 752 0.06 -0.17 0.16 -0.04 -0.04 0.01 0.02 -0.03
## 754 0.24 -0.06 -0.05 -0.04 -0.06 -0.02 0.00 -0.01
## 756 0.00 -0.03 0.03 0.00 0.01 0.00 0.10 -0.17
## 759 0.18 -0.05 -0.04 -0.03 -0.04 0.08 0.01 -0.01
## 761 -0.01 -0.01 0.01 0.01 0.01 0.02 0.21 -0.36
## 769 0.01 -0.03 0.02 -0.01 -0.01 0.00 -0.08 0.15
## 770 0.01 0.05 0.05 -0.05 -0.09 0.02 -0.02 -0.01
## 771 0.11 -0.30 0.30 -0.06 -0.06 0.03 0.04 -0.07
## 772 -0.03 0.08 -0.03 0.14 -0.02 0.05 -0.15 0.26
## 773 0.03 -0.04 0.04 -0.01 -0.01 0.01 -0.22 0.39
## 775 0.07 -0.17 0.18 -0.03 -0.03 0.03 -0.04 0.07
## 776 0.02 -0.13 0.12 0.18 -0.03 -0.01 -0.05 0.09
## 777 0.05 -0.10 0.10 -0.03 -0.03 0.00 -0.18 0.32
## 778 0.07 -0.23 0.24 -0.05 -0.04 0.10 0.03 -0.05
## 780 0.18 -0.05 -0.04 -0.03 -0.05 -0.02 0.00 -0.01
## 782 0.11 -0.03 -0.02 -0.02 -0.03 0.00 0.00 0.00
## 783 0.09 -0.23 0.24 -0.04 -0.04 -0.01 0.03 -0.05
## 785 0.10 -0.25 0.26 -0.05 -0.05 -0.02 0.03 -0.06
## 790 0.11 -0.29 0.31 -0.06 -0.06 -0.02 0.04 -0.07
## 798 0.00 0.02 -0.01 -0.05 0.01 -0.01 0.06 -0.10
37
## 802 0.00 0.05 -0.03 -0.01 -0.01 -0.01 -0.07 0.25
## 803 0.00 0.00 -0.01 -0.01 -0.02 0.00 0.00 0.00
## 834 0.19 -0.05 -0.04 -0.03 -0.05 0.00 0.00 -0.01
## 852 0.07 -0.19 0.20 -0.04 -0.04 -0.01 0.03 -0.04
## 891 0.08 -0.04 -0.03 -0.05 -0.03 0.07 1.74_* -0.97
## 898 0.14 -0.04 -0.08 0.42 -0.05 -0.02 0.00 0.00
## 901 0.19 -0.05 -0.04 -0.03 -0.05 -0.02 0.00 -0.01
## 918 0.13 -0.03 -0.07 0.38 -0.04 0.00 0.00 0.00
## 919 0.00 0.40 -0.09 0.06 -0.11 0.08 -5.06_* -0.59
## 923 0.16 -0.04 -0.03 -0.03 -0.04 -0.01 0.00 0.00
## 924 0.00 0.01 0.01 0.03 0.04 0.00 -0.01 0.02
## 933 0.00 0.00 0.00 0.01 0.01 0.00 0.00 0.00
## 940 0.08 -0.26 0.22 0.00 -0.14 -0.05 0.77 -1.42_*
## 942 0.25 -0.03 -0.04 -0.03 0.02 0.03 0.16 -0.09
## 951 0.20 -0.06 -0.05 -0.03 -0.05 0.01 0.00 -0.01
## 953 0.12 -0.03 -0.03 -0.02 -0.03 0.03 0.00 -0.01
## 968 0.12 -0.03 -0.07 0.38 -0.04 0.03 0.00 0.00
## 969 0.06 0.22 -0.21 -0.01 -0.05 0.06 -0.02 0.03
## 970 0.09 0.32 -0.30 -0.02 -0.08 0.06 -0.05 0.05
## 1011 -0.03 0.05 0.02 0.23 -0.05 0.01 -0.02 0.03
## 1012 0.08 0.27 -0.25 -0.02 -0.06 0.05 0.00 0.02
## 1013 0.03 0.00 0.01 -0.02 -0.02 -0.02 -0.50 0.89
## dfb.gst_s dfb.gst_b dffit cov.r cook.d hat
## 5 -0.27 0.00 -0.28 1.03 0.01 0.04_*
## 69 0.01 0.04 -1.24_* 1.89_* 0.15 0.47_*
## 78 0.02 0.00 0.02 1.04_* 0.00 0.03
## 99 0.00 -0.01 0.16 0.92_* 0.00 0.00
## 100 0.00 0.00 0.22 0.83_* 0.00 0.00
## 101 0.00 0.00 0.18 0.89_* 0.00 0.00
## 102 0.00 0.00 0.13 0.94_* 0.00 0.00
## 108 0.00 0.00 0.12 0.96_* 0.00 0.00
## 154 0.01 0.00 0.01 1.03_* 0.00 0.02
## 162 -0.01 0.00 0.15 0.96_* 0.00 0.00
## 166 -0.11 0.00 0.35_* 0.81_* 0.01 0.01
## 219 -0.04 0.00 0.17 0.96_* 0.00 0.00
## 237 0.08 0.00 0.09 1.05_* 0.00 0.04_*
## 239 0.13 0.00 0.21 0.90_* 0.00 0.00
## 243 -0.05 0.00 0.15 0.95_* 0.00 0.00
## 259 0.07 0.00 0.18 0.90_* 0.00 0.00
## 262 -0.06 -0.02 0.32_* 0.93_* 0.01 0.01
## 265 -0.01 0.00 0.14 0.97_* 0.00 0.00
## 340 0.00 0.01 -0.26 1.15_* 0.01 0.13_*
## 371 -0.06 0.00 0.19 0.91_* 0.00 0.00
## 388 0.00 0.03 -0.84_* 1.49_* 0.07 0.33_*
## 418 -0.52 -0.01 -0.53_* 1.10_* 0.03 0.11_*
## 430 0.00 0.00 0.00 1.05_* 0.00 0.04_*
## 466 -0.01 -0.01 0.20 0.96_* 0.00 0.01
## 707 0.00 0.08 0.13 0.96_* 0.00 0.00
## 709 -0.02 -0.01 0.29 1.02 0.01 0.03_*
## 711 -0.41 -0.01 -0.44_* 1.19_* 0.02 0.16_*
## 726 -0.04 0.00 -0.06 1.03_* 0.00 0.02
## 729 -0.34 0.01 -0.36_* 1.12_* 0.01 0.10_*
## 737 -0.03 -0.01 0.26 0.95_* 0.01 0.01
## 744 -0.05 0.00 -0.05 1.03_* 0.00 0.02
38
## 747 0.00 -0.01 0.17 0.92_* 0.00 0.00
## 750 -0.07 0.00 0.20 0.89_* 0.00 0.00
## 752 0.03 0.00 0.20 0.97_* 0.00 0.01
## 754 0.00 -0.02 0.24 0.85_* 0.01 0.00
## 756 0.00 0.00 -0.17 1.15_* 0.00 0.12_*
## 759 0.00 -0.02 0.21 0.88_* 0.00 0.00
## 761 0.01 -0.01 -0.37_* 1.21_* 0.01 0.17_*
## 769 0.02 0.00 0.16 1.04_* 0.00 0.04_*
## 770 0.03 0.00 0.20 0.88_* 0.00 0.00
## 771 0.03 -0.01 0.36_* 0.87_* 0.01 0.01
## 772 -0.05 0.00 0.31_* 1.01 0.01 0.03
## 773 -0.03 0.00 0.42_* 1.03_* 0.02 0.05_*
## 775 -0.04 0.00 0.24 0.93_* 0.01 0.01
## 776 -0.01 -0.02 0.27 0.97_* 0.01 0.01
## 777 -0.02 0.00 0.37_* 0.97_* 0.01 0.02
## 778 0.01 -0.01 0.30 0.92_* 0.01 0.01
## 780 0.02 -0.01 0.19 0.90_* 0.00 0.00
## 782 0.00 -0.01 0.11 0.97_* 0.00 0.00
## 783 -0.02 0.00 0.28 0.93_* 0.01 0.01
## 785 -0.02 0.00 0.31_* 0.92_* 0.01 0.01
## 790 -0.03 -0.01 0.36_* 0.89_* 0.01 0.01
## 798 -0.02 0.00 -0.12 1.04_* 0.00 0.03_*
## 802 -0.03 0.00 0.27 1.05_* 0.01 0.05_*
## 803 0.08 0.00 0.08 1.08_* 0.00 0.07_*
## 834 0.01 -0.01 0.19 0.88_* 0.00 0.00
## 852 -0.01 0.00 0.23 0.96_* 0.01 0.01
## 891 -0.08 0.16 1.77_* 1.07_* 0.31 0.18_*
## 898 -0.05 -0.04 0.46_* 0.89_* 0.02 0.02
## 901 0.02 -0.01 0.19 0.89_* 0.00 0.00
## 918 -0.04 -0.04 0.43_* 0.90_* 0.02 0.01
## 919 0.55 0.14 -6.57_* 5.05_* 4.28_* 0.82_*
## 923 0.00 0.00 0.16 0.91_* 0.00 0.00
## 924 -0.17 0.00 -0.17 1.03_* 0.00 0.03_*
## 933 -0.04 0.00 -0.04 1.04_* 0.00 0.03_*
## 940 0.13 -0.02 -1.44_* 1.32_* 0.21 0.28_*
## 942 0.06 -5.89_* -5.91_* 18.20_* 3.49_* 0.95_*
## 951 0.03 -0.01 0.20 0.86_* 0.00 0.00
## 953 0.02 -0.01 0.13 0.95_* 0.00 0.00
## 968 -0.04 -0.04 0.43_* 0.89_* 0.02 0.01
## 969 -0.03 0.00 0.26 0.93_* 0.01 0.01
## 970 -0.03 -0.01 0.38_* 0.86_* 0.01 0.01
## 1011 -0.07 0.00 0.27 0.94_* 0.01 0.01
## 1012 -0.04 -0.01 0.32_* 0.89_* 0.01 0.01
## 1013 -0.07 0.01 0.92_* 1.05_* 0.08 0.11_*
influencePlot(df2_modelo_Ponderado2)
39
166
100
4
Studentized Residuals
2
0
942
−2
919
0.0 0.2 0.4 0.6 0.8
Hat−Values
## StudRes Hat CookD

## 100 4.450730 0.002392937 0.00466433
## 166 4.744821 0.005303897 0.01175317
## 919 -3.096794 0.818199188 4.27952199
## 942 -1.418171 0.945594745 3.49208549
——————————————————————————
3. ELECCIÓN DEL MEJOR MODELO ECONOMÉTRICO 3.1. Análisis de modelos
mf1 <- summary(df1_modelo_Ponderado1)

mf2 <- summary(df2_modelo_Ponderado2)
#------------------------------------
ee.m1 <- sum(mf1$residualsˆ2)
cbind(mf1$coefficients[,1],
mf2$coefficients[,1])
## [,1] [,2]
## (Intercept) 7.03107514055 6.68068233223
## uso_fertilizante -0.10132779694 0.12145623886
## uso_plaguicida 2.97283191462 2.90885063142
## uso_credito 3.93951385060 3.77754005670
## riego 1.24482582002 1.47069887585
40
## SUP_TOTAL 0.00098192450 0.00119467804
## gasto_fertilizante -0.00005988727 -0.00005773672
## gasto_plaguicida 0.00007213651 0.00008116838
## gasto_semilla 0.00102256489 0.00115136267
## gasto_abono -0.00004127370 -0.00003466711
INTERPRETACIÓN: Podemos observar que en el modelo 1 el intercepto es mayor que en el modelo

2, también observamos que el uso_fertilizante es negativo en comparación al modelo 2; con respecto al
uso_plaguicida y uso_credito son ligeramente mayores en el modelo 1 que en el 2; sin embargo, en el caso
del riego, el modelo 2 presenta mayor estimado que en el 1. Hablando del SUP_TOTAL, en el modelo 2
también sería mayor que en el 1; el gasto_fertilizante y el gasto en abono mantienen su mismo signo para
ambos modelos. Por último, el estimado de gasto_plaguicida y gasto_semilla es mayor en el modelo 2 que
en el modelo 1.
ols_plot_diagnostics(df1_modelo_Ponderado1)
page 1 of 3
Residual vs Predicted Values Outlier and Leverage Diagnostics for rendimient
40 8
Observation
4
RStudent
Residual
20 normal
0 leverage
0 outlier
−4
outlier & leverage
−20
5 10 15 20 0.00 0.25 0.50 0.75 1.00
Predicted Value Leverage
Deleted Studentized Residual
Deleted Studentized Residual vs Predicted

Normal
ValuesQ−Q Plot
6 40
Sample Quantiles
3 Observation 20
normal
0
outlier 0
−3
−20
5 10 15 20 −2 0 2
Predicted Value Theoretical Quantiles
41
page 2 of 3
Observed by Predicted for rendimiento Residual Fit Spread Plot
15
20
rendimiento
Fit − Mean
10
15
5
10 0
5 −5
0 10 20 30 40 50 0.0 0.4 0.8 1.2

Predicted Value Proportion Less
Cook's D Chart Residual Fit Spread Plot

50
6
Cook's D
Residual
25
4
0
2
0 −25
0 250 500 750 1000 0.0 0.4 0.8 1.2
Observation Proportion Less
42
page 3 of 3
Residual Histogram
600
400
y
200
0
−20 0 20 40
Residuals
Residual Box Plot

40
Residuals
20
−20
ols_plot_diagnostics(df2_modelo_Ponderado2)
43
page 1 of 3
Residual vs Predicted Values Outlier and Leverage Diagnostics for rendimient
40 8
Observation
4
RStudent
Residual
20 normal
leverage
0
0 outlier
−4 outlier & leverage
−20
5 10 15 20 25 0.00 0.25 0.50 0.75
Predicted Value Leverage
Deleted Studentized Residual
Deleted Studentized Residual vs Predicted

Normal
ValuesQ−Q Plot
6 40
Sample Quantiles
4
Observation 20
2
normal
0
outlier 0
−2
−4 −20
5 10 15 20 25 −2 0 2
Predicted Value Theoretical Quantiles
44
page 2 of 3
Observed by Predicted for rendimiento Residual Fit Spread Plot
25
20
rendimiento
Fit − Mean
10
15
10 0
0 10 20 30 40 50 0.0 0.4 0.8 1.2

Predicted Value Proportion Less
Cook's D Chart Residual Fit Spread Plot

50
4
Cook's D
Residual
3 25
2
0
1
0 −25
0 250 500 750 1000 0.0 0.4 0.8 1.2
Observation Proportion Less
45
page 3 of 3
Residual Histogram
600
400
y
200
0
−20 0 20 40
Residuals
Residual Box Plot

40
Residuals
20
−20
#——————————————————————————#
IMPORTANTE: Según los modelos planteados para “df1_modelo_Ponderado1” y “df2_modelo_Ponderado2”
obtenemos que los R cuadrados son de 0.08829 (es decir que explica el modelo en 8.8%) y 0.09299 (es
decir que explica el modelo en 9.3%) respectivamente, siendo el modelo mejor explicado el el segundo. Sin
embargo también hacemos un a prueba de AIC para corroborar nuestra elección.
3.2. Prueba AIC del Modelo 1 y 2
AIC(df1_modelo_Ponderado1)
## [1] 7149.354
#-----------
AIC(df2_modelo_Ponderado2)
## [1] 7130.459
INTERPRETACIÓN: El AIC para el modelo1 es de 7149.354, por otro lado el AIC para el modelo2 es de
7130.459. Por ende el modelo que mas se ajusta es el que tiene menor AIC el cual es el modelo2.
——————————————————————————
4. ANÁLISIS DE PRUEBAS DE HIPÓTESIS (Test de significancia)
a. Modelo 2
46
Table 1: Chow test
Res.Df RSS Df Sum of Sq F Pr(>F)

1006 5905.989 NA NA NA NA
1006 6299.825 0 -393.8363 NA NA
##
## Call:
##
## -4.9574 -1.5741 -0.4753 0.8323 11.7175
##
## Coefficients:
## (Intercept) 6.68068233 0.39523626 16.903 < 0.0000000000000002 ***
## uso_plaguicida 2.90885063 0.72659416 4.003 0.00006703 ***
## uso_credito 3.77754006 0.84195345 4.487 0.00000807 ***
## riego 1.47069888 0.59740941 2.462 0.0140 *
## SUP_TOTAL 0.00119468 0.00076012 1.572 0.1163
## gasto_semilla 0.00115136 0.00046332 2.485 0.0131 *
## gasto_abono -0.00003467 0.00005731 -0.605 0.5454
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
INTERPRETACIÓN: Tenemos que los únicos parámetros significativos son los que presentan un p valor
menor al 5%, los cuales son uso_plaguicida (0.00006703), el uso_credito (0.00000807), riego (0.0140) y
gasto_semilla (0.0131).
——————————————————————————
5. ANÁLISIS DE ESTABILIDAD DE PARÁMETROS 5.1. Realizamos el test de Chow
kable(anova(df1_modelo_Ponderado1, df2_modelo_Ponderado2), caption="Chow test")
INTERPRETACIÓN: Debido a que no hay ningún valor de Chow mayor que F, no habría ningún cambio
estructural en el modelo.
47

Final Ep4

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Final Ep4

Uploaded by

Copyright:

Available Formats

INTEGRANTES GRUPO 7: - ACUÑA GONZALES ANGEL - BUSTAMANTE CARRANZA LUCY -

ROMERO SALAS HARRY - ACENCIO VARGAS NICOLE - SILVA PEREZ BRYANT

## Warning: package ’survey’ was built under R version 4.1.3

## Loading required package: grid

## Loading required package: Matrix

## Loading required package: survival

## The following object is masked from ’package:graphics’:

## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --

## v ggplot2 3.3.5 v purrr 0.3.4

## -- Conflicts ------------------------------------------ tidyverse_conflicts() --

## Warning: package ’kableExtra’ was built under R version 4.1.3

## The following object is masked from ’package:dplyr’:

## Warning: package ’lmtest’ was built under R version 4.1.3

## Loading required package: zoo

## Warning: package ’zoo’ was built under R version 4.1.3

## The following objects are masked from ’package:base’:

## Warning: package ’strucchange’ was built under R version 4.1.3

## Loading required package: sandwich

## Warning: package ’sandwich’ was built under R version 4.1.3

## The following object is masked from ’package:stringr’:

## Warning: package ’car’ was built under R version 4.1.3

## Loading required package: carData

## Warning: package ’carData’ was built under R version 4.1.3

## The following object is masked from ’package:dplyr’:

## The following object is masked from ’package:purrr’:

## Warning: package ’olsrr’ was built under R version 4.1.3

## The following object is masked from ’package:datasets’:

#CARGANDO TABLA DE DATOS

Análisis de las dimensiones de las tablas de datos

## [1] "ANIO" "CCDD" "NOMBREDD" "CCPP" "NOMBREPV"

## [1] "ANIO" "CCDD" "NOMBREDD" "CCPP"

dim(CAR_UA2) #dimensiones de una matriz de datos

## [1] 1180 7 1066 7

CAR_UA1 <- CAR_UA1 %>% mutate(EQUIV_TOTAL=as.numeric(paste0(P104_EQUIV_1,".",P104_EQUIV_2)),

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

Esta misma metodología se utilizará para el cálculo de superficie SEMBRADA y superficie

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

Construyendo tabla de datos a nivel de unidad agropecuaria

sup_cosechada <- sup_cosechada %>% mutate(riego=ifelse(P212>1,1,0)) #RIEGO: 1 = EL CULTIVO TIENE RIEGO

Análisis con datos muestrales, calculamos el rendimiento

ua_produccion %>% ungroup() %>%

Gráficos de la variable dependiente de nuestro modelo: Rendimiento por hectarea

Analisis de datos muestrales: Rendimiento por hectarea según tamaño de la UA

ua_produccion %>% group_by(SUP_TOTAL_cat) %>%

0 2000 4000 6000 8000

INTERPRETACIÓN Se observa que el coeficiente de correlacion de la superficie total y el rendimiento por

svy_ua_produccion <- svydesign(ids = ~1, weights = ~FACTOR, data = ua_produccion)

## riego cosechara_t/sup_cosechada_ha se.cosechara_t/sup_cosechada_ha

INTERPRETACIÓN: Se observa que los que no riegan obtienen un rendimiento de 14 aproximadamente.

costo_cosechada <- costo_cosechada %>% mutate(uso_fertilizante=ifelse(P238==1,1,0),

## ‘summarise()‘ has grouped output by ’ANIO’, ’CCDD’, ’CCPP’, ’CCDI’,

svy_ua_produccion <- svydesign(ids = ~1, weights = ~FACTOR, data = ua_produccion)

## uso_fertilizante cosechara_t/sup_cosechada_ha se.cosechara_t/sup_cosechada_ha