You are on page 1of 300

Índice

Índice

Estadística para tesis y uso del SPSS

Autor: Francisco Guillermo Sánchez Espejo


Editado por: Centrum Legalis E.I.R.L.
Urb. Santa Catalina I-18 B, José Luis B. y R., Arequipa, Perú.
Celular y Whatsapp (+51) 958029169
Primera edición, febrero, 2020
Tiraje: 1000 ejemplares
Hecho el Depósito Legal en la Biblioteca Nacional del Perú Nº 2020-01449
ISBN Nº 978-612-48174-1-0
Se terminó de imprimir en febrero del 2020 en:
Tarea Asociación Gráfica Educativa
Pasaje María Auxiliadora 156-164 Breña, Lima
Prohibida la reproducción de este libro total o parcialmente, sin permiso expreso
del autor
Pedidos a: info@aacentrum.com, T: (+51)958029169 a cualquier ciudad o país.
Visítenos en: www.aacentrum.com
Índice

A Jehová de los ejércitos

A Antonia, Luz,

Lady y José
Índice
INTRODUCCIÓN

El presente libro está dirigido a los profesionales que desarrollan


una tesis, donde la estadística tiene un papel muy importante para
realizar operaciones como la validación y confiabilidad del
instrumento, debemos de tener en cuenta que los profesionales que
desarrollan una tesis en muchos casos no son de la especialidad de
matemáticas, sino que son personas de distintas especialidades,
pueden ser del área de sociales, de biomédicas o de ingenierías, que
no necesariamente son expertos en la estadística, por este motivo el
presente libro proporciona una enseñanza básica de la estadística
aplicada a cálculos que se requiere en una tesis, se busca de una
manera sencilla explicar el procedimiento para justificar
estadísticamente una investigació
estadísticamente investigación.
n.
Para ello, hemos iniciado el estudio desarrollando los elementos
básicos para la prueba estadística, hemos desarrollado la elaboración
de un instrumento, donde se explica los requisitos que tiene en
relación al problema que se plantea, también se ha desarrollado la
forma de acopiar y ordenar la información, así como los
procedimientos estadísticos básicos para la confiabilidad del
instrumento, su validez y las pruebas de hipótesis que se pueden
plantear en una tesis.
Si bien, la estadística es muy amplia y una tesis puede hacer uso
de las diferentes operaciones de cálculos estadísticos, por nuestra
parte se ha buscado transmitir los conocimientos básicos de la
estadística para profesionales que no son expertos en esta área, a fin
de que cualquier persona pueda encontrar en este libro una guía
básica para realizar las principales operaciones estadísticas en la
elaboración de su tesis, el libro se complementa con el CD que viene
junto al libro y contiene la parte práctica del cálculo en el SPSS, así
mismo se adjunta un resumen estadístico
estadíst ico en una tabla que le será muy
Índice

útil al momento de operar las estadísticas, pues el resumen indica el


procedimiento del SPSS para los principales estadísticos que debe
tener la tesis.
Francisco G. Sánchez Espejo
Francisco Guillermo Sánchez Espejo

ÍNDICE

INTRODUCCIÓN ..................................................................................... v

ÍNDICE..................................................................................................... vii
1 Uso de la Estadística ..................................................................... 11

1.1. Estadísticas en una tesis..........


tesis............................
.....................................
...................13
1.2. ¿Qué son las variables?.................
....................................
...............................
............15
1.3. ¿Qué es medir?................
...................................
.....................................
...........................
.........22
1.4. ¿Por qué es obligatorio la estadística en una tesis? . 23
1.5. ¿Qué es el instrumento de medición?..................
........................
......25
1.6. ¿Qué medimos en la investigación cualitativa? .......
.......26
1.6.1. Codificación de la información...................
información...................................
................35
1.6.2. Acopio de la informació
informaciónn ...................
......................................
.........................
......43
1.6.3. Reordenandoo a la forma inicial del cuestionario .....46
Reordenand
1.6.4. Elaboración de la matriz de datos ..................
..............................
............49
1.6.5. La matriz de datos en el SPSS ..................
.....................................
...................52

1.7. El Programa SPSS ....................


.......................................
.....................................
..................54
1.7.1. Configuración inicial...............
..................................
.....................................
..................54
1.7.2. Configurando la “vista de variables” ..................
........................
......55
1.7.3. Insertando los datos .........................
............................................
............................
.........61
2 Cálculo de una Muestra ............................................................... 63

2.1. Población y Muestra................


...................................
.....................................
..................63
2.1.1. Intervalo de confianza ..............................
.................................................
...................68

vii www.aacentrum.com
Estadística para tesis

2.2. Técnicas de muestreo .....


.......................
.....................................
............................
.........71
2.2.1. Muestreo estadístico ..................
.....................................
..................................
...............72
2.2.2. Muestreo por elección................
...................................
..................................
...............74
2.3. Cálculo del tamaño de una muestra .................
..........................
.........75
2.3.1. Cálculo de una muestra cualitativa ..................
...........................
.........75
2.3.2. Cálculo de una muestra cuantitativa .......
.........................
..................77
2.3.3. Cálculo de una muestra en el SPSS ................
............................
............79
3 Confiabilidad del Instrumento .................................................. 83

3.1. El estadístico KR-20 .....


.......................
.....................................
...............................
............84
3.2. El Alfa de Crombac
Crombachh ............
..............................
.....................................
......................
...88
3.2.1. Mejorar el nivel del Alfa de Crombach ...
.....................
..................93
4 Validez del Instrumento..........
......................
.......................
......................
.......................
................
.... 103

4.1. La validez de contenido................


...................................
.............................
..........103
4.1.1. Validez por juicio de expertos ........
..........................
..........................
........104
4.1.2. Validación con la V de Aiken ..................
...................................
.................105
4.1.3. Validación con Lawshe ......................
.....................................
..........................
.......116

4.1.4. Validación con prueba binomial ...................


..............................
...........121
4.1.5. Kappa de Kohen .........................
............................................
................................
.............129
4.2. La validez interna ...........
.............................
.....................................
..........................
.......142
5 Prueba de Hipótesis ................................................................... 147

5.1. Las hipótesis......................


.........................................
.....................................
.......................
.....147
5.2. La prueba de hipótesis de la Tesis ....................
...........................
.......151
5.3. Prueba de normalidad .....................
........................................
..........................
.......152

viii www.aacentrum.com
Francisco Guillermo Sánchez Espejo

5.3.1. Pasos para el cálculo de la normalidad en el SPSS 155


5.3.2. Ejemplo de prueba de normalidad .......................... 157
5.3.3. Prueba de normalidad en grupos segmentados .... 160
5.3.4. La distribución normal .................................
..............................................
.............164
5.4. Prueba de la hipótesis general .................
..................................
.................167
5.4.1. Prueba de hipótesis con R de Pearson .................
.....................
....168
5.4.2. Prueba de Rho de Spearman.................
....................................
.....................177
5.5. Prueba de hipótesis especifica
especificass ..................
................................
..............181
5.5.1. Prueba de la 1ra. Hipótesis específica: ....................182
5.5.2. Prueba de la 2da Hipótesis especifica
especifica..................
......................
....190
5.6. Prueba de la hipótesis de trabajo .............................192
5.6.1. Prueba de hipótesis de una proporción .................
...................197
5.7. Prueba de hipótesis chi cuadrado ......
........................
......................
....200
5.7.1. Problema 1 ................
...................................
.....................................
................................
..............201
5.7.2. Problema 2 ................
...................................
.....................................
................................
..............205
5.7.3. Problema 3 ................
...................................
.....................................
................................
..............209

5.8. Prueba de hipótesis con T de Student .....................214


5.8.1. Características: ................
...................................
.....................................
.........................
.......215
5.8.2. Aplicación:................
...................................
.....................................
................................
..............215
5.8.3. Conocimientoss previos: ................
Conocimiento ...................................
.............................
..........215
5.8.4. Requisitos .................
....................................
.....................................
................................
..............216
5.8.5. Pasos para su desarroll
desarrolloo ...............
..................................
.............................
..........216
5.8.6. Ejercicios ................
...................................
.....................................
...................................
.................217
ix www.aacentrum.com
Estadística para tesis

5.9. Prueba de hipótesis con F de Fisher .................


........................
.......219
6 Regresión Lineal ......................................................................... 225

6.1. Tipos de regresiones lineales .............


...............................
.......................
.....226

6.2. Ejercicios prácticos ..................


.....................................
...................................
................228
7 La Estadística ............................................................................... 237

7.1. ¿Qué es la estadística?................


...................................
................................
.............237
7.2. Teoría de las probabilidades
probabilidades .....
.......................
................................
..............238
7.3. Ramas de la Estadística..
Estadística....................
.....................................
..........................
.......239
7.4. La Estadística Descriptiv
Descriptivaa ..................
.....................................
.......................
....240
7.4.1. Análisis de tendencia central ..........
............................
..........................
........241
7.4.2. Medidas de dispersi
dispersión
ón..................
.....................................
.............................
..........246
7.4.3. Medidas de distribuc
distribución
ión .........
...........................
...................................
.................252
7.4.4. Estadística descriptiv
descriptivaa en la tesis .............
.............................
................253
7.4.5. Gráficos y análisis de variables categóricas ............265
7.5. La Estadística Inferencial.................
....................................
..........................
.......272
7.5.1. Estimación puntual .................
....................................
...................................
................273

7.5.2. Estimación por intervalos................


...................................
..........................
.......283
7.5.3. Coeficiente de correlación ..................
.....................................
.......................
....290
7.5.4. Simbología estadística....
......................
.....................................
..........................
.......291
Ejemplo de estadística en una tesis .......................
............ ......................
.......................
..................
...... 299

x www.aacentrum.com
Francisco Guillermo Sánchez Espejo
Índice

1 Uso de la

Estadística
La estadística es una ciencia que estudia las probabilidades que un
evento suceda, para la elaboración de una tesis, tiene diversas
aplicaciones, sin embargo, existen operaciones estadísticas que se
aplican más frecuentemente a una investigación. El propósito del
presente libro es enseñar el desarrollo de estas operaciones, pues
debemos tener presente que la persona que desarrolla una tesis, no
necesita volverse un experto matemático, sino, buscamos en la
estadística una herramienta accesible para que cualquier profesional,
que puede ser un abogado, un médico, un odontólogo, un psicólogo,
etc., tenga una noción elementa
elementall de los cálculos más frecuentes que se
realiza en una tesis, estas operaciones más frecuentes son:

Para el cálculo de una muestra


(Pg. 55)

Para establecer la confiabilidad de un


instrumento (Pg. 75)

Para establecer la validez de un


instrumento (Pg. 95)

Para contrastar hipótesis (P.139)

Para predecir un evento (Pg. 217)

11 www.aacentrum.com
Estadística para tesis
Índice
Aplicación de la estadística en una tesis
La aplicación hasta diría obligatoria de la estadística en una tesis,
se da en las siguientes operaciones que serán desarrolladas
ampliamente en el presente libro:

Uso Estadístico

Cálculo de una muestra Con población conocida


Con población desconocida
Para establecer la fiabilidad Alfa de Crombach
del instrumento
Kr-20
Para establecer la validez Validez de contenido:
• V de Aiken
• Lawshe
• Prueba binomial

Validez interna
• KMO

Para probar hipótesis R de Pearson


Rho de Spearman

Para predecir eventos Regresión lineal

Debemos aclarar que las operaciones antes indicados no son las


únicas operaciones para el cálculo de estadísticas, sino que hemos
tomado los más elementales para cada cálculo. La tesis puede tener
muchas operaciones de cálculo estadístico, sin embargo, será
necesario que realice cálculos para la muestra, para establecer la
validez, para la confiabilidad del instrumento y las pruebas para el
cálculo de normalidad y de asociación de variables.

12 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice

***Si una tesis tiene instrumentos de medición, consideramos que


necesariamente debe tener a) Prueba de fiabilidad, b) Prueba de
validez, c) prueba de normalidad, y si la tesis corresponde al nivel
explicativo debe tener la prueba de asociación o de contrastación de
hipótesis. Estos estadísticos se desarrolla en el presente libro ***

1.1. Estadísticas en una tesis

1. El cálculo de una muestra

Se usa para conocer el tamaño de una muestra que represente a la


población y permita hacer los cálculos que posteriormente se va a
inferir a la población

2. La confiabilidad de un instrumento
Se usa para conocer la consistencia interna de un instrumento, de
manera que se pueda confiar su funcionamiento en la medición

3. La validez de un instrumento

Permite conocer si un instrumento es válido, es decir si es


apropiado para medir lo que se quiere medir

4. La normalidad de la distribución de la variable


Es necesario este cálculo para poder aplicar el estadístico
adecuado en la prueba de hipótesis

5. La prueba de hipótesis

Mide el grado de influencia o asociación entre variables

13 www.aacentrum.com
Estadística para tesis Índice
6. La regresión lineal

Ayuda a predecir un fenómeno, en base al comportamiento que


el objeto ha tenido

***Consideramos que una tesis mínimamente debe tener las


aplicaciones estadísticas 2, 3, 4 y 5 antes indicadas***
Estas son las operaciones o cálculos más usados en una tesis y que
un tesista no puede obviar, su aplicación no solo se puede realizar en
investigacioness cuantitativas sino también en cualitativas.
investigacione
¿Cuándo una investigación es cuantitativa y cuando cualitativa?
Existe diferentes posiciones al respecto, algunos dicen que es
cuantitativa cuando la hipótesis tiene una respuesta de sí o no,
verdadero o falso, por ejemplo, si estoy preparando un vehículo y mi
hipótesis indica que “es posible que la falla sea de la válvula”, a esta
hipótesis se puede responder con un sí o con un no, entonces la
investigación es cuantitativa, porque es susceptible de ser medida
estadísticamente, de lo contrario si tengo que dar una respuesta
fundamenta como por ejemplo se investiga el período de extinción de
los dinosaurios, en este caso la respuesta no es solo un sí o un no, sino
la respuesta requiere de una explicación, en este caso algunos autores
indican que es cualitativa.

Otro sector considera que una investigación es cuantitativa si


utiliza cálculos estadísticos de lo contrario es cualitativa, sin embargo
en un análisis riguroso, podemos darnos cuenta que el centro de todo
el problema de investigación es la medición de variables, de esta
manera, todo gira en torno a medir las variable, se puede decir que es
el corazón de la investigación y que diferencia a la tesis de una
monografía u otro documento académico y por tanto la forma de
medir las variables define el enfoque de la investigación como
cualitativa o cuantitativa, de esta manera, podemos decir que la
investigación es cuantitativa si la medición de las variables se realiza
14 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice
con números y será cualitativa si la medición se realiza en
proporciones.
Pero acá viene el problema, pues siempre nos han enseñado a
medir con cantidades numéricas y no comprendemos medir con
criterios o cualidades, así, resulta difícil imaginar medir el derecho, la
psicología y en general las ciencias sociales, pero sí es posible, solo
debemos entender que son las cualidades o los criterios y como se
mide en proporciones, así podemos fundamentar que una ley jurídica
es constitucional o inconstitucional, que un delincuente es culpable o
inocente, se puede medir el daño o la gravedad del delito no
numéricamente sino proporcionalmente, en una mayor o menor
medida. Para entender mejor el tema, es necesario definir y precisar
el concepto de variables.

1.2. ¿Qué son las variables?

Gran parte del trabajo de la estadística se realiza con las variables,


se busca medirlas de diferentes formas. El tema de las variables la
considero como la parte más importante no solo de la investigación,
sino de la metodología en general, sin embargo las variables ha sido
deficientemente definidas en la literatura sobre metodología y los
errores en conceptualizarla y definirla ha traído una distorción del
enfoque en toda la metodología, al punto que se ha confundido los
enfoques cualitativo con el cuantitativo e incluso se ha cosiderado a
un tercer enfoque como es el enfoque mixto en forma deficiente,
considero que estas confusiones van a ser aclaradas con una correcta
definición y con un claro deslinde entre las variables cuantitativas y
cualitativas, que considero tienen especial trascendencia en el
plantemiento metodológico de la investigación.
Empezaremos definiendo a las variables como propiedades
suceptibles de ser objeto de medición, estas propedades pueden ser
la edad, la distancia, la satisfacción u otro tipo de propiedad que

15 www.aacentrum.com
Estadística para tesis Índice

pueda ser medible. Se cuestiona si puede ser objeto de medición por


ejemplo la justicia, la democracia, la felicidad entre otras cualidades
que por lo general corresponden a las ciencias sociales, al respecto
debemos indicar que si se puede medir, así por ejemplo tenemos el
Observatorio de Derechos Humanos (OBSDH) que emite informes y
en cierto modo mide los grados de afectación de los derechos
fundamentales de las personas, esto por el múmero de casos y la
intensidad de la lesión, también se tiene distintas calificadoras que
miden el grado de democracia, el grado de corrupción e incluso el
grado de felicidad por ciudades del Perú, como lo indica el estudio
realizado el 2015 por la PUCP. Otro ejemplo de medición de variables
cualitativas lo tenemos en la medición de aspectos sociales, así, el
referendum llevado a cabo el nueve de diciembre del 2018, se
consulto a la población sobre la conformación de la junta nacional de
justicia, el financiamiento
financiamiento a las
las organizacione
organizacioness políticas, la reelección
reelección
de congresistas y sobre la bicameralidad, donde pese a tratarse de
variables que pertenecen a las ciencias sociales y calificadas como
cualitativas,
cualitativ as, la forma de medición numérica, de los votos las convierte
en cuantitativa
cuantitativas. s.
Un ejemplo claro de la medición de variables cualitativas en base
a proporciones, lo tenemos en la ley de ponderación y la fórmula del
peso que considera medible la afectación de los derechos
fundamentales, así derechos como la vida, la seguridad, la educación,
la libertad pueden ser medidas según el grado de importancia y la
intensidad de la afectación, es decir comparando el grado de
proporción que tienen, en especial cuando colicionan los principios
referidos a los derechos fundamentales, así la ley de ponderación de
principios indica: “Cuanto mayor es el grado de la no satisfacción o
de afectación de uno de los principios, tanto mayor debe ser la
importancia de la satisfacción del otro”, para medir la afectación de

16 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice
un derecho fundamental contenida en un principio se aplica la
fórmula del peso, cuya fórmula es la siguiente1:
GPi,jC = IPiC · GPiA · SPiC
WPjC · GPjA · SPjC
Donde:
“C” expresa las circunstancias del caso, relevantes para la
decisión.
“IPiC” hace explícitos tres aspectos. “Pi” pone de
manifiesto que se trata del principio Pi, “I” que se
trata de la intensidad de la intervención en el
principio Pi y “C” que se trata de un caso concreto.
En IPiC, a efectos de no mencionar los tres aspectos, se
habrá de escribir
escribir solo lli,i, en lugar de IPiC
Se utiliza la letra I = a intensidad.
Se utiliza la letra i para hacer expícito que se trata de una
“intervención” en el principio pi,
El peso abstracto de Pi, es GPi
Si se quiere hacer explícito el carácter abstracto, entonces
puede adicionarse “A” para formar una analogía con
“C”. Por lo tanto, la denominación completa del peso
(G) abstracto (A) de Pi es “GPiA”
El peso abstracto expresado con “Gi” o “GPiA” sólo juega
un papel en la ponderación cuando los principios en
colisión se diferencian en su peso abstracto.

1 Carlos Bernal Pulido (1989) Estructura y límites de la ponderación,


ponderación, Extraído
de DOXA, Cuaderno de filosofía N° 26, publicado por el departamento de
filosofía del derecho de la Universidad de Alicante España, edición
electrónica.

17 www.aacentrum.com
Estadística para tesis
Índice
Si los pesos abstractos son iguales, entonces se
neutralizan mutuamente.

En las variables cualitativas no se puede medir en cantidades


exactas, así por ejemplo no podemos medir una, dos o tres
satisfacciones, uno o dos justicias, uno o dos democracias, pero si
podemos medir las proporciones entre la satisfacción e insatisfaccón,
la justicia con la injusticia o la democracia con la dictadura, esto en
base a las proporciones que tienen sus indicadores de referencia. Por
tanto la proporción es la forma de medición en la variable cualitativa,
Respecto a la proporción como forma de mediciónn en las
variables cualitativas y aplicada como principio en el derecho, tiene
la sentencia del Tribunal Constitucional en el caso EXP.N. ° 579-2008-

PA/TC Lambayeque, indica:


… Para hacer más racional dicha operación resulta
relevante contrastar los grados o intensidades de afectación
en el ámbito del derecho a la ejecución con los grados o
niveles de satisfacción que se logra en los bienes u objetivos
constitucionales que persigue la intervención por parte de la
ley y su aplicación en el caso concreto. Este colegiado ha
incorporado una escala triádica para asignar dichos valores.
En tal sentido hemos establecido que “la valoración de las
intensidades puede ser catalogada como: grave, medio o
leve, escala que es equivalente a la de: elevado, medio o
débil. Por esta razón, la escala puede también ser aplicada
para valorar los grados de realización [grados de
satisfacción] del fin constitucional de la restricción [STC
0045-2005-PI/TC, fundamento N.º 35]

Los problemas para la medición de las variables son la


identificación de los indicadores y el grado de objetividad y
representatividad que tiene, la distinción de variables cuantitativas y
cualitativas que se fundamenta en las propiedades de la medición.
Así, queremos dejar en claro que las variables cuantitativas se mide

18 www.aacentrum.com
Francisco Guillermo Sánchez Espejo
Índice
por números, mientras que las variables cualitativas se miden en
proporciones de la cualidad que se mide, propiedades que pueden
ser dicotómicas si toman dos valores (justicia o injusticia, soltero o
casado) y politómicas si toman más de dos valores, situación que sirve
de fundamento para determinar el enfoque de la investigación como
cuantitativo, cualitativo o mixto.
Las variables cuantitativas y cualitativas
Las variables cuantitativas tienen como unidades de medición a
cantidades numéricas, la medición de las variables se hacen en razón
de dimensiones numeradas conforme al sistema de numeración que
puede corresponder al sistema decimal, sexagesimal, binario u otro
sistema que permita la medición numérica.

Se considera
cuantitativas, queesto
sobre la longitud,
debo decirlaque
masa o el tiempo
depende, porqueson variables
la longitud,
la masa o el tiempo en realidad son cualidades o propiedades que
tiene un objeto que si se miden numéricamente serán variables
cuantitativas
cuantitat ivas y si se mide en proporciones serán variables cualit
cualitativas,
ativas,
es decir, en realidad, lo que define como cuantitativo o cualitativo no
es la dimensión, sino la forma de su medición, pues un objeto físico
puede medirse como muy pesado, poco pesado o nada pesado, en ese
caso el peso será una variable cualitativa y si se mide numericamente
como por ejemplo la cantindad de objetos numéricamente, será una
variable cuantitativa
cuantitativa..
Tampoco podemos decir que el estado civil o el color de ojos son
variables cualitativas porque si mido el estado civil numéricamente,
por ejemplo 100 solteros o 50 personas de ojos de color marrón, la
variable se vuelve cuantitativa, también se dice por ejempo que la
variable sexo es cualitativa, pero si mido el número de varones y el
número de mujeres, entonces ya no es cualitativa sino cuantitatva,
cuantitatv a, por
tanto a priori no podemos decir que una variable es cualitativa o
cuantitativa, sino debemos de evaluar la forma de medición que

19 www.aacentrum.com
Estadística para tesis Índice
tenga. En realidad todos los elementos son cualidades, así por
ejemplo la altura o el peso es una cualidad de un objeto físico y será
una variable cualitativa si lo medimos en proporciones como
pequeño, grande o muy grande y será cuantiativa si lo medimos en
unidades de kilogramos, lo que diferencia a lo cualitativo y lo
cuantitativo es la forma de medición y no la dimensión.
La proporción es una forma de medición que se puede emplear
para la medición de diferentes cualidades, puede suceder que la
variable sea medida por la intensidad que tiene el objeto conceptual,
por ejemplo en situaciones de afectación subjetiva, pero también
podemos medir situaciones objetivas, como por ejemplo la
destrucción de un objeto que puede ser parcial o total. También se
puede medir por el estado de salud, así tenemos a pesonas sanas, o

enfermas, pero
de medición de cuando enumeramos
la variable, y esta enumeración
esta es cuantitativa es la forma
y no cualitativa.

Una variable tendrá enfoque cuantitativo si la forma de medición de la


variable es numérica y será cualitativo si la forma de medición de la
variable es en proporciones. Será mixta si una variable(s) es medida
numéricamente y la otra(s) es medida en proporciones o viciversa.

Entonces la identificación de una variable es fundamental porque


de esta clasificación depende la aplicación de la metodología a
emplear, depende la aplicación de los cálculos estadísticos y el diseño
de la investigación
¿Entonces que diferencia a una variable cualitativa de una
cuantitativa?
Como reiteramos, lo que diferencia a la variable cualitativa de la
cuantitativa, es la forma de medición, en las variables cualitativas la
medición no es numérica, sino en proporciones, así, de puede medir
la intensidad del dolor, la intensidad de la felicidad, este tipo de
medición permite grados de medición que puede variar:

20 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice

Poco intenso Algo intenso Intenso Muy intenso


En economía
Se mide el nivel económico de las familias por sectores socio
económicos, así se tiene:

Sector A Sector B Sector C Sector D Sector E


En la escala anterior se puede observar que la medición de la
variable se realiza por niveles de intensidad que permite al
investigador diferenciar situaciones y trabajar con ellas, esto no
significa que no se pueda hacer cálculos estadísticos, pues con dichos
valores se puede hacer calculos como la fiabilidad, validez o prueba
de hipótesis.
Sin embargo la medición de las variables no siempre va a tener
varios valores como en el ejemplo anterior que tiene cuatro,
generalmente los valores cualitativos son dicotómicos, es decir que
cambian entre dos cualidades, de esta manera se tiene el siguiente
ejemplo:
Sano – Enfermo

Inocente – Culpable
Constitucional – Inconstitucio
Inconstitucional
nal
Democracia – Dictadura
Legal – Ilegal
Encendido - Apagado
La dicotomía de estas dimensiones hace que tenga una medición
restringida a dos valores, donde el grado de libertad se reduce a la
elección de una de las dos categorías, esta medición es igual a tener
21 www.aacentrum.com
Estadística para tesis
Índice
mas de dos categorias y resulta de uso estricto incluso en el área de
ingenierías donde las investigaciones son más cuantitativas, por
ejemplo un circuito eléctrico puede tener solo dos categorías (on – of)
y no se acepta otro tipo de categoría.

Una misma dimención física como el tiempo o la velocidad o conceptual


como la justicia o lá libertad, será cuantiativa si se mide en unidades
numéricas y será cualitativa si se mide en proporciones como por
ejemplo justo o injusto, libre o no libre, en este caso son cualitativas
dicotómicas.

1.3. ¿Qué es medir?

Medir es cuantificar una dimensión, es establecer valores a


determinado objeto, sea este un objeto conceptual o un objeto físico,
las medidas más usadas son las siguientes:
Objeto Unidades
El tiempo Segundos
La distancia Metros
La temperatura En grados centígrados
… …
En general las unidades de medidas físicas se encuentran en el
sistema internacional de unidades de medición, pero estas

mediciones
por ejemploen las cuales
medir se pueden
el tiempo utilizar medidas
en segundos, conviertenuméricas como
a la variable en
cuantitativa, pero también podemos medir en proporciones, por
ejemplo si decimos que el tiempo de viajar en bus es mayor a viajar
en avión, entonces la variable se convierte en cualitativa. Pero
también existen otros tipos de objetos que pueden ser medibles, así se
tiene como ejemplos:
Objeto Unidades
La inocencia de un imputado Criterio
Criterioss de culpabilidad
La satisfacción del cliente Grados de satisfacción

22 www.aacentrum.com
Francisco Guillermo Sánchez Espejo
Índice
La constitucionalidad de una Criterios de constituciona
constitucionalidad
lidad
norma
Los derechos fundamen
fundamentales
tales Intensidad de la afectación
La lesión corporal Intensidad de la lesión

En estos casos las cualidades o criterios se pueden medir en


unidades o en proporciones, será en unidades por ejemplo si la
inocencia de un imputado lo medimos por los votos de un jurado o
podrá ser en proporciones si decimos que se tiene más evidencia de
culpabilidad que de inocencia, en el primer caso se tratará de una
variable cuantitativa y en el segundo caso de una variable cualitativa.

La característica principal que distingue a una tesis de otro estudio


académico, es que en las tesis se mide las variables que fundamentan
las hipótesis

1.4. ¿Por qué es obligatorio la


estadística en una tesis?

La tesis es un documento técnico sobre el registro de un proceso


de medición de una (s) variable(s), de lo contrario estamos ante una
monografía o una tesina. Si esto es cierto, que la tesis tiene como
característica fundamental medir las variables, entonces una tesis
necesariamente debe tener en primer lugar una población y si el tipo

de
paramuestreo
calculares aleatorio
la muestrasimple
y debe
si estener
por loselección,
cálculos debe
estadísticos
tener
necesariamente los criterios para la elección de la muestra, en
segundo lugar, una tesis necesariamente debe tener un instrumento o
varios instrumentos de medición, esto a efectos de medir las
variables.
Si bien es cierto que algunas variables pueden justificarse
argumentativamente como es el caso del derecho, donde por ejemplo
la inocencia o culpabilidad del imputado se puede argumentar con
criterios lógicos, sin embargo la intensidad, la cantidad o el respaldo
23 www.aacentrum.com
Estadística para tesis
Índice
profesional del argumento puede ser objeto de medición por un
instrumento documental, y si la tesis tiene un instrumento de
medición necesariamente debe tener cálculos referidos a la validación
del constructo y cálculos referentes a la validación interna del
instrumento.
Si como instrumento se utiliza el cuestionario o la escala,
necesariamente debe tener cálculos estadísticos sobre la
confiabilidad, así mismo si se trata de una investigación explicativa
necesariamente debe de tener cálculos sobre la normalidad y la
prueba de hipótesis, esto porque toda investigación que corresponde
al nivel explicativo necesariamente relaciona a la variable
independiente con la dependiente y esta relación constituye la
hipótesis principal de la investigación y requiere ser probada, en este

caso consideramos quesin


argumentativamente, la relación
embargoo influencia
la mediciónpuede ser justificada
estadística le da
mayor objetividad.
Cálculos estadísticos necesarios en una tesis

Operación Estadístico obligatorio


obligatorio

Muestreo aleatorio simple Cálculo de la muestra

Validación del constructo Cálculos de validación

Fiabilidad del instrumento Cálculos de fiabilidad

Normalidad de la variable Cálculos de normalidad

Asociación
Asociaci ón de hipótesis Cálculos de prueba de
hipótesis

24 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice
La tesis no es un documento discursivo subjetivo, sino es un
documento técnico que busca la objetividad, aun cuando en algunas
ciencias permita que el investigador sea más o menos objetivo y que
requiera de la estadística para fundamentar su objetividad. Los
cálculos estadísticos antes indicados son los mínimos necesarios para
una tesis, sin embargo, eso no quiere decir que sean los únicos, el
propósito del presente libro es enseñar los cálculos básicos que una
tesis debe tener, pero las tesis pueden ser tan complejas como el
investigador las desarrolle y tener cuantas operaciones estadísticas
necesite para medir y fundamentar el cálculo de las variables.
La estadística es una herramienta de calculo que es muy empleada
en la tesis debido a que permite conocer aproximaciones y
posibilidades que son necesarios para la interpretación de los datos

obtenidos y el
desarrollado porprograma más
la empresa usado para la estadística es el SPSS
IBM.

1.5. ¿Qué es el instrumento de


medición?

Son herramientas que tienen patrones que pueden medir


determinada propiedad por comparación al objeto medible,
discriminando la aproximación o alejamiento a los valores
previamente calibrados.
Tipos de instrumentos
Se puede considerar dos tipos de instrumento
instrumentos:s: a) los instrumento
instrumentoss
que miden valores objetivos como la balanza, el metro o el
termómetro y b) instrumentos que miden valores subjetivos como el
cuestionario, la escala o el inventario. Estos instrumentos si bien
miden valores subjetivos, esto no los descalifica como instrumentos
confiables cuando son bien aplicados.

25 www.aacentrum.com
Estadística para tesis Índice

1.6. ¿Qué medimos en la investigación


cualitativa?

En la investigación cualitativa medimos las cualidades o criterios


de las variables de un problema, para cumplir con el objetivo de la
investigación, como sabemos las variables son propiedades
susceptibles de ser medidas, así por ejemplo tenemos el siguiente
enunciado de problema:

“Deficiencias en la reparación del daño en el procedimiento


administrativo disciplinario que regula la ley 30057, Ley del Servicio
Civil, que justifique su modificación legislativa para la defensa del
patrimonio del Estado, Perú, 2019”

Se tiene como variables:


Variable 1: Reparación del daño (V1)
• Reposición del bien (Indicador 1)
• Pago del valor del bien (Indicado
(Indicadorr 2)
Variable 2: Modificación legislativa (V2)
• Modificación necesaria / innecesaria (Indicador 3)
En este caso se pretende medir si existen o no deficiencias en la
reparación del daño que justifiquen una modificación legislativa en la
ley.

¿Pero cómo vamos a medir?


Teniendo en cuenta que el derecho es una ciencia convencional, es
decir los ciudadanos nos ponemos de acuerdo sobre lo que es bueno y lo
que es malo, sobre lo sancionable o no, podemos medir el conocimiento o
criterio de la deficiencia normativa en las opiniones de juristas
reconocidos, es decir de un conjunto representativo de la sociedad.

26 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice
¿Qué ocurre con el resto de las ciencias sociales?
Creo que la medición de las variables en el resto de las ciencias sociales
es más fácil, por ejemplo, en las ciencias administrativas podemos medir
la satisfacción laboral, la calidad de un producto, en las ciencias
educativas podemos medir el aprendizaje del alumno, en las ciencias
económicas podemos medir la competitividad de un país, en las ciencias
de la psicología podemos medir el nivel de agresividad, etc.
¿Qué medimos en ingenierías o en biomédicas?
Tratándose de las ciencias de la naturaleza, por lo general la forma de
medición es mediante instrumentos objetivos, así por ejemplo el médico
mide la fiebre con un termómetro, el ingeniero medirá la longitud de un
material con el metro otro profesional medirá el voltaje de la corriente
eléctrica con un voltímetro, etc. Sin embargo, el uso de los instrumentos
documentales no es ajenos a estas profesiones, así, por ejemplo, el
respaldo de una teoría por un grupo de profesionales puede ser medido
mediante instrumentos documentales, el médico puede medir el dolor del
paciente mediante una escala, el arquitecto puede medir la satisfacción de
su cliente mediante un cuestionario o una escala, el ingeniero civil puede
medir la opinión de la comunidad sobre una obra mediante el
cuestionario.

Del planteamiento del problema del ejemplo y de las variables e


indicadores dan lugar a los objetivos que en este caso serían los
siguientes:
Objetivo principal:
Establecer las deficiencias que hay en la reparación del daño en el
procedimiento administrativo disciplinario que regula la ley 30057,
Ley del Servicio Civil, que justifique su modificación legislativa para
la defensa del patrimonio del Estado, Perú, 2019.

27 www.aacentrum.com
Estadística para tesis
Índice
Es decir:

V1 V2
Deficiencias Modificación
En la reparación del daño Legislativa
Objetivos específicos:
Explicar las deficiencias que hay en la reposición del bien
en el procedimiento administrativo disciplinario que
regula la ley 30057, Ley del Servicio Civil, que
justifique su modificació
modificaciónn legislativa para la defensa
del patrimonio del Estado, Perú, 2019

En este caso se busca medir la influencia de “La reposición del


bien” en la justificación
j ustificación que sustente la “modificación legislativa”

Es decir:

Ind1 Ind3

Indicar las deficiencias que hay en el pago del valor del


bien en el procedimiento administrativo disciplinario
que regula la ley 30057, Ley del Servicio Civil, que
justifique su modificació
modificaciónn legislativa para la defensa
del patrimonio del Estado, Perú, 2019.
Es decir:
In1 In3

De los objetivos tenemos las hipótesis que son las posibles


respuestas que van a ser probadas estadísticamente, así tenemos:

28 www.aacentrum.com
Francisco Guillermo Sánchez Espejo
Índice

Hipótesis principal

Dado que ...


Es posible que existan deficiencias en la reparación del daño en el
procedimiento administrativo
administrativo disciplinario que regula la ley 30057, Ley
del Servicio Civil, que justifique su modificación legislativa para la
defensa del patrimonio del Estado, Perú, 2019

Como podemos apreciar, las hipótesis siguen la misma relación


entre variables e indicadores.
Hipótesis especificas
Primera hipótesis especifica:
Dado que (…)

Es posible que las deficiencias en la reposición del bien en el


procedimiento administrativo disciplinario que regula la ley
30057, Ley del Servicio Civil, justifique su modificación legislativa
para la defensa del patrimonio del Estado, Perú, 2019.
Segunda hipótesis especifica:
Dado que (…)

Es posible que las deficiencias en el pago del valor del bien en el

procedimiento
30057, Ley deladministrativo disciplinario
Servicio Civil, justifique que
su regula la ley
modificación
legislativa para la defensa del patrimonio del Estado, Perú, 2019

Estas hipótesis serán objeto de medición mediante el instrumento


llamado cuestionario y de sus resultados se harán los cálculos
estadísticos que se pueda hacer inferencia a toda la población.

En ese sentido en el presente caso se tiene como población de


estudio:

29 www.aacentrum.com
Estadística para tesis
Índice
Población
Como población de estudio tenemos al conjunto de abogados con
especialidad en derecho administrativo de la ciudad de Arequipa,

2019.
Muestreo
El tipo de muestreo que corresponde aplicar es del tipo por
elección, intencionado, es decir la investigadora elegirá a las personas
que van a ser objeto de aplicación del cuestionario conforme a
criterios de inclusión y exclusión.
Criterios de inclusión
Que los abogados a encuestar sean de la especialidad de
Derecho Administrativo
Administrativo..
Que los señores abogados se encuentren en el ejercicio de
la profesión.
Que sean entrevistados durante el período asignado al
recojo de la información.
Que laboren en el servicio público, privado y en el
ejercicio de la docencia.

Criterios de exclusión

Que
Que no
nopresten su consentimie
consentimiento
sean ubicables en elntoperíodo de recojo de
información

Realizado el muestreo, se obtuvo la siguiente muestra:


Muestra
Se ha identificado a 30 abogados que tienen la especialidad o
ejercen la abogacía en la rama del derecho administrativo, a quienes

30 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice
se les ha evaluado mediante el cuestionario que a continuación se
presenta:

Cuestionario
Nombre y Apellidos:___________________________________
Apellidos:___________________________________
Fecha:________________________
A continuación, debe indicar marcando con una X el grado de acuerdo o
desacuerdo con la pregunta del cuestionario.

Totalmente en desacuerdo = 1
En desacuerdo = 2
Ni de acuerdo ni en desacuerdo = 3
De acuerdo =4
Totalmente de acuerdo = 5

El presente cuestionario permitirá conocer las opiniones de los abogados


de derecho administrativo sobre los criterios que permita modificar la
reparación del daño en el procedimiento administrativo disciplinario que
regula la ley 30057, Ley del Servicio Civil, para la defensa del patrimonio del
Estado:

CUESTIONARIO
CUESTIONARIO PARA ABOGADOS

( ) Funcionario ( ) Masculino
público Sexo ( ) Femenino
Nivel
( ) Actividad ( ) hasta 35 años = 1
ocupacional:
Privada
Edad ( ) de 35 a 50 años = 2
( ) Docente
( ) mayores de 50 años = 3
INSTRUCCIONES
Se presenta un conjunto de afirmaciones sobre la INCORPORCION DE LA
REPARACIÓN DEL DAÑO EN EL PROCEDIMIENTO ADMINISTRATIVO
DISCIPLINARIO QUE REGULA LA LEY 30057, LEY DEL SERVICIO CIVIL, para la
defensa del patrimonio del Estado, a las que se debe responder con la mayor

31 www.aacentrum.com
Estadística para tesis Índice

sinceridad y veracidad posible de acuerdo a las


l as observaciones realizadas. No existen
respuestas correctas o incorrectas. El instrumento tiene carácter anónimo e
individual. Se debe colocar una (X) en el recuadro correspondiente de acuerdo a los
siguientes enunciados:

1 2 3 4 5

Muy en En Poco de De Muy de


desacuerdo desacuerdo acuerdo acuerdo acuerdo

N° AFIRMACIONES OPCIONES

V1: Reparación del daño 1 2 3 4 5

Dimensión 1: Reposición del bien


¿Está usted de acuerdo en que la falta de regulación

1 de la reposición
Servicio delque
Civil evita bien
el en la ley
Estado 30057recuperar
pueda Ley del
su patrimonio afectado por la conducta del
infractor?
¿Está usted de acuerdo que en el procedimiento
administrativo disciplinario se exija al infractor
2
junto a la sanción la rep
reparación
aración del bien afec
afectado
tado por
la conducta del infractor?
¿Está usted de acuerdo en que la exigencia de
3 reposición del bien dañado en la vía judicial es un
proceso lento e ineficiente?
¿Está usted de acuerdo en que la exigencia de
4 reposición del bien dañado en la vía judicial podría
prescribir por la lentitud de este proceso?
¿Está usteddel
reposición debien
acuerdo en en
dañado que la exigencia
la vía de la
administrativo
5
disciplinaria sería más célere y más eficiente que en
la vía judicial?
Dimensión 2: El pago del valor del bien
¿Está usted de acuerdo en que la falta de regulación
del pago del valor del bien en la ley 30057 Ley del
6 Servicio Civil evita que el Estado pueda recuperar
su patrimonio afectado por la conducta del
infractor?
¿Está usted de acuerdo que en el procedimiento
administrativo disciplinario se exija al infractor
7
junto a la sanción del pago del valor del bien
afectado por la conducta del infractor?

32 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice
¿Está usted de acuerdo en que la exigencia del pago
8 del valor del bien en la vía judicial es un proceso
lento e ineficiente?
¿Está usted de acuerdo en que la exigencia del pago
9 del valor del bien en la vía judicial podría prescribir
por la lentitud de este proceso?
¿Está usted de acuerdo en que la exigencia del pago
del valor del bien en la vía administrativo
10
disciplinaria sería más célere y más eficiente que en
la vía judicial?

V2: Modificación legislativa

Dimensión 1: Justificada / Injustificada


¿Está usted de acuerdo en que el procedimiento
sancionador que regula la ley 30057, Ley del Servicio
11
Civil se enfoca en el castigo al infractor y desprotege
el patrimonio del Estado?
¿Está usted de acuerdo en que la reposición del bien
12 o el pago de su valor exigidos en la sanción
administrativa protegería el patrimonio del estado?
¿Está usted de acuerdo en que la reparación civil
13 está compuesta por la reparación del daño y la
indemnización de los daños y perjuicios?
¿Está usted de acuerdo en que la reparación del
14 daño implica la reposición del bien y si no fuera
posible el pago de su valor?
¿Está usted de acuerdo en que la reparación del
daño sea también exigible en la vía administrativo
15
disciplinaria, en cambio la exigencia de los daños y
perjuicios sea exclusivo de la vía judicial?
¿Esta usted de acuerdo en que se justifica la
16 modificación legislativa conforme al proyecto de ley
que se adjunta?
Indique sus observaciones:
……………………………………………………………………………………
……………………………………………………………………………………
TOTAL

TOTAL, EN PORCENTAJE

Como vemos el cuestionario está elaborado para medir la primera


variable (V1) en base a sus dos indicadores y también mide la

33 www.aacentrum.com
Estadística para tesis
Índice
segunda variable (V2) conforme a su indicador y en relación a la
influencia que puede recibir de la primera.
La medición de la segunda variable en realidad se trata más de una
justificación para
para su proc
procedencia,
edencia, ppues
ues de verifi
verificarse
carse la hipó
hipótesis
tesis que
considera las deficiencias en la regulación del daño, entonces procede
la segunda variable, es decir se justifica la modificación legislativa.
La ficha técnica:
La ficha técnica del cuestionario está compuesta por las
características que tiene el instrumento y las recomendaciones para
su aplicación.
N° Item Descripción
1 Nombre Cuestionario de evaluación para modificar la
reparación del daño en el procedimiento
administrativo disciplinario que regula la ley 30057,
Ley del Servicio Civil, para la defensa del patrimonio
del Estado
2 Autor Francisco Guillermo Sánchez Espejo
3 Fecha de 14 de octubre del año 2019
elaboración del
instrumento
4 Duración de la De 20 a 30 minutos.
aplicación
5 Periodo de Del 20 al 30 de noviembre del 2019
aplicación
6 Objetivo Conocer las opiniones sobre la necesidad de modificar
la reparación del daño en el procedimiento
administrativo disciplinario que regula la ley 30057,
Ley del Servicio Civil, para la defensa del patrimonio
del Estado
7 Calificación (A) Totalmente en desacuerdo = 1
(B) En desacuerdo = 2
(C) Ni de acuerdo ni en desacuerdo = 3
(D) De acuerdo =4
(E) Totalmente de acuerdo = 5
8 Objetivos • Explicar la necesidad de la reposición del
bien en las sanciones disciplinarias de la ley 3007,

34 www.aacentrum.com
Francisco Guillermo Sánchez Espejo
Índice
Ley del Servicio Civil, para la defensa del
patrimonio del Estado.
• Establecer la necesidad del pago del valor del
bien en las sanciones disciplinarias de la ley 3007,
Ley del Servicio Civil, para la defensa del
patrimonio del Estado.
• Establecer la viabilidad de modificar la ley
30057
9 Puntajes De 15 a 30 = Se considera
consi dera nivel muy bajo
De 30 a 45 = Se considera
consi dera bajo
De 45 a 60 = Se considera
consi dera aceptable
De 60 a 75 = Se considera
consi dera muy aceptable
10 Validez La validez ha sido validada mediante opinión de
expertos, compuesta por un jurado de 3 especialistas,
dos de ellos especialistas en metodología de la
investigación y uno de ellos especialista en derecho
administrativo disciplinario.

11 Confiabilidad La confiabilidad
mediante cálculosdelestadísticos
instrumentodehala sido evaluado
ecuación del
Alpha de Crombach.

Recomendaciones
Recomendaciones para la elaboración de cuestionarios
Las preguntas salen de las variables
Las preguntas proponen conceptos conforme a los
objetivos que tiene la investigació
investigaciónn
Las preguntas están dirigidas a probar la hipótesis de la
investigación, esto es la H1
Todas las preguntas apuntan a probar las hipótesis
Se puede cambiar el sentido y el orden de las preguntas
conforme a un patrón que permita luego volver a
ordenarlas

1.6.1. Codificación de la información

La información se codifica básicamente por la siguiente razón:

35 www.aacentrum.com
Estadística para tesis
Índice

Porque necesitamos abreviaturas para operar


estadisticamente

En efecto, el trabajo estadístico requiere que los datos sean cortos


para que puedan entrar en las matrices y en las tablas de cálculo, el
SPSS permite que se opere con la información codificada sin que
pierda el titulo o denominación, así tiene la cabecera de la vista
variable se tiene: “Nombre” para el código y la cabecera “Etiqueta”
para un nombre largo de la variable.

Para el código Para el nombre largo


La codificación para operar variables cuando estas son categóricas,
también se puede realizar
realizar en el SPSS, así, en la vista variable se tiene
la cabecera “Valores” que al hacer c lic sale un cuadro para introducir
la categoría y el código con el cual se va a operar (ver 1.6.2).
La codificación por lo general se realiza con las primeras letras o
iniciales del nombre de la variable o del indicador, en caso de las
categorías que se va a operar en el SPSS la codificación se realiza
mediante la asignación de números. En el ejemplo que venimos
desarrollando la codificación de la se realiza de la siguiente manera:

Codificación de la variable e indicador


Enunciado Código
La reparación del daño (Variable) RD
Reposición del bien (Indicador) RB
Pregunta sobre la reposición del bien RB1, RB2 y así
sucesivamente

36 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice

Pago de su valor (Indicador) PV


Pregunta sobre el pago del valor del bien PV1, PV2 y así
sucesivamente
Modificación legislativa (Variable) ML
Modificable / no modificable M
Pregunta sobre la modificación de la ley M1 y así sucesivamente
Codificación de las categorías
Categoría Código
Sexo masculino 1
Sexo femenino 2
Funcionario público 1
Actividad privada 2
Docente 3
Menor de 30 años 1
De 30 a 50 años 2
Mayor de 50 años 3

Ordenación de las preguntas y respuestas


Mantener un orden en las preguntas puede tener algunas
complicaciones al momento de su aplicación, debido principalmente
a dos factores: a) A que todas las preguntas apuntan a una misma
dirección, situación que pudiera dar lugar a subjetividades y b) El
orden y su pertenencia a los indicadores, pueden ser consideradas
como muy sugerentes para que responda el encuestado, motivo por
el cual se considera que deben ser cambiadas, tanto en el orden de las
preguntas como en la dirección de la respuesta, esto, a efectos de
evitar subjetivismos al momento de aplicar el cuestionario, la
ordenación de preguntas y respuestas se hace conforme a un patrón
de alteración, para que luego de realizada la encuesta se regrese a su
posición inicial, pues los cálculos estadísticos necesitan la

37 www.aacentrum.com
Estadística para tesis Índice
uniformidad en el orden de las preguntas y en la dirección de las
respuestas.
Patrón de alteración

El patrón de alteración es el esquema que permite alterar la


orientación y el orden de las preguntas, en el presente ejemplo vamos
a cambiar el orden de las preguntas y la dirección de las respuestas y
luego de aplicado el cuestionario, regresaremos a su posición inicial
tanto las preguntas como invertiremos la dirección de las respuestas
para hacer los cálculos estadísticos como la confiabilidad, validez o la
prueba de hipótesis.

o
l d
a a
i
m b a a
ro m Pregunta ste l ste da
n ca u a u ib
m m sp rm sp m
e e e o e
tI tI R n R ca
1 3 ¿Está usted de acuerdo en Directa = (el símbolo
que la falta de regulación de igual indica
la reposición del bien en la que no se
ley 30057 Ley del Servicio cambia el
sentido de la
Civil evita que el Estado repuesta
pueda recuperar su
patrimonio afectado por la
conducta del infractor?

2 5 ¿Está
en usted el deprocedimiento
acuerdo que Directa Indirecta
administrativo disciplinario
se exija al infractor junto a la
sanción la reparación del bien
afectado por la conducta del
infractor?
3 1 ¿Está usted de acuerdo en Directa =
que la exigencia de
reposición del bien dañado
en la vía judicial es un
proceso lento e ineficiente?

38 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice
4 2 ¿Está usted de acuerdo en Directa Indirecta
que la exigencia de
reposición del bien dañado
en la vía judicial podría
prescribir por la lentitud de

4 este proceso?
¿Está usted de acuerdo en Directa
5 =
que la exigencia de la
reposición del bien dañado
en la vía administrativo
disciplinaria sería más célere
y más eficiente que en la vía
judicial?
6 8 ¿Está usted de acuerdo en Directa =
que la falta de regulación del
pago del valor del bien en la
ley 30057 Ley del Servicio
Civil evita que el Estado
pueda recuperar su
patrimonio afectado por la
conducta del infractor?
7 6 ¿Está usted de acuerdo que Directa =
en el procedimiento
administrativo disciplinario
se exija al infractor junto a la
sanción del pago del valor del
bien afectado por la conducta
del infractor?
8 7 ¿Está usted de acuerdo en Directa Indirecta
que la exigencia del pago del
valor del bien en la vía
judicial es un proceso lento e
ineficiente?
9 10 ¿Está usted de acuerdo en Directa =
que la exigencia del pago del
valor del bien en la vía
judicial podría prescribir por
p or
la lentitud de este proceso?
10 9 ¿Está usted de acuerdo en Directa =
que la exigencia del pago del
valor del bien en la vía
administrativo disciplinaria
sería más célere y más

39 www.aacentrum.com
Estadística para tesis Índice

eficiente que en la vía


judicial?
11 11 ¿Está usted de acuerdo en Directa =
que el procedimiento
sancionador que regula la ley
30057, Ley del
se enfoca en elServicio
castigoCivil
al
infractor y desprotege el
patrimonio del Estado?
12 16 ¿Está usted de acuerdo en Directa Indirecta
que la reposición del bien o el
pago de su valor exigidos en
la sanción administrativa
protegería el patrimonio del
estado?
13 12 ¿Está usted de acuerdo en Directa =
que la reparación civil está
compuesta por la reparación
del daño y la indemnización
de los daños y perjuicios?
14 13 ¿Está usted de acuerdo en Directa =
que la reparación del daño
implica la reposición del bien
y si no fuera posible el pago
de su valor?
15 15 ¿Está usted de acuerdo en Directa =
que la reparación del daño
sea también exigible en la vía
administrativo disciplinaria,
en cambio la exigencia de los
daños y perjuicios sea
exclusivo de la vía judicial?
16 14 ¿Está usted de acuerdo en Directa =
que se justifica la
modificación legislativa
conforme al proyecto de ley
que se adjunta?
Como se puede apreciar se ha propuesto un nuevo orden de las
preguntas y el cambio en la dirección de las respuestas, realizando la
nueva formulación del cuestionario, se tendría del siguiente modo:
Cuestionario modificado.- listo para su aplicación

40 www.aacentrum.com
Francisco Guillermo Sánchez Espejo
Índice

CUESTIONARIO PARA ABOGADOS


( ) Masculino
( ) Funcionario ( ) Femenino
Nivel público Sexo
( ) Actividad
ocupacional: ( ) hasta
hasta 35 años
Privada Edad
( ) Docente ( ) de 35 a 50 años
( ) mayores
mayores de 50 años
INSTRUCCIONES
Se presenta un conjunto de afirmaciones sobre la INCORPORCION DE
LA REPARACIÓN DEL DAÑO EN EL PROCEDIMIENTO
ADMINISTRATIVO DISCIPLINARIO QUE REGULA LA LEY 30057, LEY
DEL SERVICIO CIVIL, para la defensa del patrimonio del Estado, a las que
se debe responder con la mayor sinceridad y veracidad posible de acuerdo a
las observaciones realizadas. No existen respuestas correctas o incorrectas. El
instrumento tiene carácter anónimo e individual. Se debe colocar una (X) en
el recuadro correspondiente de acuerdo a los siguientes enunciados

1 2 3 4 5
Muy en En Poco de De Muy de
desacuerdo desacuerdo acuerdo acuerdo acuerdo
N° AFIRMACIONES OPCIONES

Preguntas 1 2 3 4 5

¿Está usted de acuerdo en que la exigencia de


1 reposición del bien dañado en la vía judicial es
un proceso lento e ineficiente?
¿Está usted en desacuerdo en que la exigencia
de reposición del bien dañado en la vía judicial
2 podría prescribir por la lentitud de este
proceso?
¿Está usted de acuerdo en que la falta de
regulación de la reposición del bien en la ley
3 30057 Ley del Servicio Civil evita que el Estado
pueda recuperar su patrimonio afectado por la
conducta del infractor?

41 www.aacentrum.com
Estadística para tesis Índice

¿Está usted en desacuerdo que en el


procedimiento administrativo disciplinario se
4 exija al infractor junto a la sanción la
reparación del bien afectado por la conducta
del infractor?
¿Está usted de acuerdo
la reposición del bienen dañado
que la exigencia de
en la vía
5 administrativo disciplinaria sería más célere y
más eficiente que en la vía judicial?
¿Está usted en desacuerdo en que la exigencia
6 del pago del valor del bien en la vía judicial es
un proceso bien lento e ineficiente?
¿Está usted de acuerdo en que la falta de
regulación del pago del valor del bien en la ley
7 30057 Ley del Servicio Civil evita que el Estado
pueda recuperar su patrimonio afectado por la
conducta del infractor?
¿Está usted de acuerdo que en el
procedimiento administrativo disciplinario se
8 exija al infractor junto a la sanción del pago del
valor del bien afectado por la conducta del
infractor?
¿Está usted de acuerdo en que la exigencia del
pago del valor del bien en la vía administrativo
9 disciplinaria sería más célere y más eficiente
que en la vía judicial?
¿Está usted de acuerdo en que la exigencia del
10 pago del valor del bien en la vía judicial podría
prescribir por la lentitud de este proceso?
¿Está usted de acuerdo en que el
procedimiento sancionador que regula la ley
11 30057, Ley del Servicio Civil se enfoca en el
castigo al infractor y desprotege el patrimonio
del Estado?
¿Está usted de acuerdo en que se justifica la
12 modificación legislativa conforme al proyecto
de ley que se adjunta?
¿Está usted en desacuerdo en que la reposición
del bien o el pago de su valor exigidos en la
13 sanción administrativa no protegería el
patrimonio del estado?
¿Está usted de acuerdo en que la reparación
14 civil está compuesta por la reparación del daño
y la indemnización de los daños y perjuicios?
42 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice
¿Está usted de acuerdo en que la reparación del
daño sea también exigible en la vía
15 administrativo disciplinaria, en cambio la
exigencia de los daños y perjuicios sea
exclusivo de la vía judicial?
¿Está usted de acuerdo en que la reparación del
16 daño implica la reposición del bien y si no
fuera posible el pago de su valor?
Indique sus observaciones:
……………………………………………………………………………………
……………………………………………………………………………………
TOTAL
TOTAL, EN PORCENTAJE

1.6.2. Acopio de la información

Los datos de la aplicación del cuestionario requieren agruparse


para su ordenación, el medio donde por lo general se ordena la
información es en el mismo instrumento, pues puede haberse
alterado las preguntas conforme al patrón de alteración que se
desarrollará más adelante, no debe confundirse con la matriz 2 de
datos que contiene la información ordenada y lista para su
procesamiento que puede hacerse en Word, Excel o SPSS, la
recolección o acopio puede hacerse del siguiente modo:

CUESTIONARIO PARA ABOGADOS

(11) Funcionario (12) Masculino


público Sexo (8) Femenino
Nivel
(6)Actividad
ocupacional: (5) Hasta 35 años
Privada Edad
(3) Docente (12) De 35 a 50 años
(3) Mayores de 50 años

2 La matriz de datos se desarrolla en el punto 1.5.4

43 www.aacentrum.com
Estadística para tesis Índice
INSTRUCCIONES
Se presenta un conjunto de afirmaciones sobre la INCORPORCION DE
LA REPARACIÓN DEL DAÑO EN EL PROCEDIMIENTO
ADMINISTRATIVO DISCIPLINARIO QUE REGULA LA LEY 30057, LEY
DEL SERVICIO CIVIL, para la defensa del patrimonio del Estado , a las que
se
lasdebe responderrealizadas.
observaciones con la mayor
No sinceridad y veracidad
existen respuestas posible
correctas de acuerdoEla
o incorrectas.
instrumento tiene carácter anónimo e individual. Se debe colocar una (X) en
el recuadro correspondiente de acuerdo a los siguientes enunciados

1 2 3 4 5
Muy en En Poco de De Muy de
desacuerdo desacuerdo acuerdo acuerdo acuerdo
N° AFIRMACIONES OPCIONES

Preguntas 1 2 3 4 5

¿Está usted de acuerdo en que la exigencia de


1 reposición del bien dañado en la vía judicial es 0 1 3 11 5
un proceso lento e ineficiente?

¿Está usted en desacuerdo en que la exigencia


de reposición del bien dañado en la vía judicial
2 3 7 5 3 2
podría prescribir por la lentitud de este
proceso?
¿Está usted de acuerdo en que la falta de
regulación de la reposición del bien en la ley
3 30057 Ley del Servicio Civil evita que el Estado 0 3 4 8 5
pueda recuperar su patrimonio afectado por la
conducta del infractor?
¿Está usted en desacuerdo que en el
procedimiento administrativo disciplinario se
4 exija al infractor junto a la sanción la 1 1 6 8 4
reparación del bien afectado por la conducta
del infractor?
¿Está usted de acuerdo en que la exigencia de
la reposición del bien dañado en la vía
5 3 12 5 0 0
administrativo disciplinaria sería más célere y
más eficiente que en la vía judicial?
¿Está usted en desacuerdo en que la exigencia
6 del pago del valor del bien en la vía judicial es 0 1 4 5 10
un proceso bien lento e ineficiente?
44 www.aacentrum.com
Francisco Guillermo Sánchez Espejo
Índice
¿Está usted de acuerdo en que la falta de
regulación del pago del valor del bien en la ley
7 30057 Ley del Servicio Civil evita que el Estado 8 6 3 3 0
pueda recuperar su patrimonio afectado por la
conducta del infractor?
¿Está usted de acuerdo que en el
procedimiento administrativo disciplinario se
8 exija al infractor junto a la sanción del pago del 0 0 3 11 6
valor del bien afectado por la conducta del
infractor?
¿Está usted de acuerdo en que la exigencia del
pago del valor del bien en la vía administrativo
9 1 0 5 9 5
disciplinaria sería más célere y más eficiente
que en la vía judicial?
¿Está usted de acuerdo en que la exigencia del
10 pago del valor del bien en la vía judicial podría 1 1 4 7 7
prescribir por la lentitud de este proceso?
¿Está usted de acuerdo en que el
procedimiento sancionador que regula la ley
11 30057, Ley del Servicio Civil se enfoca en el 0 3 7 8 2
castigo al infractor y desprotege el patrimonio
del Estado?
¿Está usted de acuerdo en que se justifica la
12 modificación legislativa conforme al proyecto 1 0 6 8 5
de ley que se adjunta?
¿Está usted en desacuerdo en que la reposición
del bien o el pago de su valor exigidos en la
13 0 1 5 7 7
sanción administrativa no protegería el
patrimonio del estado?
¿Está usted de acuerdo en que la reparación
14 civil está compuesta por la reparación del daño 0 2 3 7 8
y la indemnización de los daños y perjuicios?
¿Está usted de acuerdo en que la reparación del
daño sea también exigible en la vía
15 administrativo disciplinaria, en cambio la 0 0 2 12 6
exigencia de los daños y perjuicios sea
exclusivo de la vía judicial?
¿Está usted de acuerdo en que la reparación del
16 daño implica la reposición del bien y si no 4 9 4 3 0
fuera posible el pago de su valor?
Indique sus observaciones:
……………………………………………………………………………………
……………………………………………………………………………………

45 www.aacentrum.com
Estadística para tesis Índice

TOTAL
TOTAL, EN PORCENTAJE

1.6.3. Reordenando a la forma inicial


del cuestionario

Luego de aplicar el instrumento, se procede a reordenar la


información en base al patrón de alteración, retornando al orden
inicial e invirtiendo el sentido de las preguntas y sus respuestas que
fueron cambiadas, así se tiene.

CUESTIONARIO PARA ABOGADOS

(11) Funcionario (12) Masculino


público Sexo (8) Femenino
Nivel
( 6) Actividad
ocupacional: (5) hasta 35 años
Privada Edad
(3) Docente (12) de 35 a 50 años
(3) mayores de 50 años
INSTRUCCIONES
Se presenta un conjunto de afirmaciones sobre la INCORPORCION DE
LA REPARACIÓN DEL DAÑO EN EL PROCEDIMIENTO
ADMINISTRATIVO DISCIPLINARIO QUE REGULA LA LEY 30057, LEY
DEL SERVICIO CIVIL, para la defensa del patrimonio del Estado, a las que se
debe responder con la mayor sinceridad y veracidad posible de acuerdo a las
observaciones realizadas. No existen respuestas correctas o incorrectas. El
instrumento tiene carácter anónimo e individual. Se debe colocar una (X) en
el recuadro correspondiente de acuerdo a los siguientes enunciados

1 2 3 4 5
Muy en En Poco de De Muy de
desacuerdo desacuerdo acuerdo acuerdo acuerdo
N° AFIRMACIONES OPCIONES
V1: Reparación del daño 1 2 3 4 5

46 www.aacentrum.com
Francisco Guillermo Sánchez Espejo
Índice
Dimensión 1: Reposición del bien
¿Está usted de acuerdo en que la falta de
regulación de la reposición del bien en la ley
1 30057 Ley del Servicio Civil evita que el Estado 0 3 4 8 5
pueda recuperar
conducta su patrimonio afectado por la
del infractor?
¿Está usted de acuerdo que en el
procedimiento administrativo disciplinario se
2 exija al infractor junto a la sanción la 0 0 5 12 3
reparación del bien afectado por la conducta
del infractor?
¿Está usted de acuerdo en que la exigencia de
3 reposición del bien dañado en la vía judicial es 0 1 3 11 5
un proceso lento e ineficiente?
¿Está usted de acuerdo en que la exigencia de
reposición del bien dañado en la vía judicial
4 2 3 5 7 3
podría prescribir por la lentitud de este
proceso?
¿Está usted de acuerdo en que la exigencia de
la reposición del bien dañado en la vía
5 1 1 6 8 4
administrativo disciplinaria sería más célere y
más eficiente que en la vía judicial?
Dimensión 2: El pago del valor del bien
¿Está usted de acuerdo en que la falta de
regulación del pago del valor del bien en la ley
6 30057 Ley del Servicio Civil evita que el Estado 0 0 3 11 6
pueda recuperar su patrimonio afectado por la
conducta del infractor?

¿Está usted administrativo


procedimiento de acuerdo disciplinario
que en se el
7 exija al infractor junto a la sanción del pago del 0 1 4 5 10
valor del bien afectado por la conducta del
infractor?
¿Está usted de acuerdo en que la exigencia del
8 pago del valor del bien en la vía judicial es un 0 3 3 6 8
proceso lento e ineficiente?
¿Está usted de acuerdo en que la exigencia del
9 pago del valor del bien en la vía judicial podría 1 1 4 7 7
prescribir por la lentitud de este proceso?
¿Está usted de acuerdo en que la exigencia del
10 1 0 5 9 5
pago del valor del bien en la vía administrativo

47 www.aacentrum.com
Estadística para tesis
Índice
disciplinaria sería más célere y más eficiente
que en la vía judicial?
V2: Modificac
Modificación
ión legislativa

Dimensión 1: Justificada / Injustificada


¿Está usted de acuerdo en que el
procedimiento sancionador que regula la ley
11 30057, Ley del Servicio Civil se enfoca en el 0 3 7 8 2
castigo al infractor y desprotege el patrimonio
del Estado?
¿Está usted de acuerdo en que la reposición del
bien o el pago de su valor exigidos en la
12 0 3 4 9 4
sanción administrativa protegería el
patrimonio del estado?
¿Está usted de acuerdo en que la reparación
13 civil está compuesta por la reparación del daño 1 0 6 8 5
y la indemnización de los daños y perjuicios?
¿Está usted de acuerdo en que la reparación del
14 daño implica la reposición del bien y si no 0 1 5 7 7
fuera posible el pago de su valor?
¿Está usted de acuerdo en que
q ue la reparación del
daño sea también exigible en la vía
15 administrativo disciplinaria, en cambio la 0 0 2 12 6
exigencia de los daños y perjuicios sea
exclusivo de la vía judicial?
¿Está usted de acuerdo en que se justifica la
16 modificación legislativa conforme al proyecto 0 2 3 7 8
de ley que se adjunta?
Indique sus observaciones:
……………………………………………………………………………………
……………………………………………………………………………………
TOTAL
TOTAL, EN PORCENTAJE

El análisis de la información es la parte donde se mide las


variables, en esta parte se determina en base a gráficos las
proporciones y se justifican los criterios de estudio, la medición se
realiza descriptiva e inferencial menté, el análisis descriptivo se
realiza evaluando las características del objeto de estudio, el análisis

inferencial se analiza ejecutando los cálculos estadísticos de


48 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice
confiabili dad, validez y asociación. Para ello es necesario la formación
confiabilidad,
de la matriz de datos.

1.6.4. Elaboración de la matriz de


datos

La matriz de datos es el consolidado de la información que se


ordena una vez que la información ha sido acopiada y reordenada si
esta tuvo un patrón de alteración. El completamiento de la matriz de
datos se realiza directamente de las encuestas recopiladas, teniendo
en cuenta la ordenación realizada luego del acopio (me refiero a la
reordenación con el patrón de alteración si fuera el caso), pues cada
ítem (It) es uno de los encuestados y debe de mantenerse el orden de
sus preguntas, es decir la distribución de las respuestas se realiza fila
por fila conforme al cuestionario individual de cada encuestado, esto
a efectos de poder medir la consistencia y la validez.
Para el completamiento de la matriz de datos, es necesario tener
t ener en
cuenta el sentido de las preguntas hacia la misma dirección,
completadas con la codificación ordinal, pues el completamiento de
la matriz necesariamente se realiza con la información codificada, así
mismo es necesario tener en cuenta el orden o la secuencia de las
preguntas.

49 www.aacentrum.com
Estadística para tesis Índice
La matriz de datos toma en cuenta:
El sentido y orden de las preguntas (Luego de la ordenación)
Matriz de datos

El orden de las respuestas (cuestionario)

Debemos de recalcar la necesidad de mantener el orden tanto en


las preguntas como de las respuestas a efectos que tengamos un
procesamiento
procesamien to válido.
Ejemplo de matriz de datos
It Sex Pro Ed RB1 RB2 RB3 RB4 RB5 TRB PV6 PV7

1 1 1 1 4 3 2 2 1 12 4 4
2 1 2 2 4 4 4 1 2 15 5 4
3 1 3 2 2 4 4 3 3 16 3 2
4 1 1 1 5 3 3 1 4 16 4 4
5 1 1 2 3 5 5 2 4 19 3 3
6 1 2 1 4 5 3 3 3 18 4 4
7 2 1 3 5 3 5 2 4 19 3 4
8 2 1 1 3 4 5 4 4 20 5 3
9 1 3 3 4 5 4 5 3 21 5 5
10 2 3 1 4 4 3 4 3 18 4 3
11 1 1 2 2 3 4 3 4 16 4 3
12 1 1 3 5 3 4 3 3 18 4 5
13 1 1 2 4 4 5 4 5 22 5 5
14 2 2 2 3 4 4 3 3 17 4 5
15 1 1 2 2 4 4 5 4 19 4 5
16 1 2 2 5 4 4 4 5 22 5 5
17 2 2 2 4 4 4 4 4 20 4 5
18 2 1 2 4 4 4 4 5 21 4 5
19 2 1 2 3 4 4 4 5 20 4 5
20 2 2 2 5 4 5 5 4 23 5 5

50 www.aacentrum.com
Francisco Guillermo Sánchez Espejo
Índice

PV PV9 PV TPV TV M1 M1 M1 M1 M1 M1
8 10 1 1 2 3 4 5 6
4 1 1 14 26 3 3 1 3 4 3
3 3 4 19 34 4 4 4 2 3 3

25 42 44 16
18 32
34 42 24 53 44 53 22
5 4 3 18 37 5 2 3 4 5 3
5 5 4 22 40 2 3 4 4 4 4
5 3 3 18 37 5 4 5 3 4 4
3 5 4 20 40 2 2 3 3 4 4
2 3 3 18 39 3 3 4 4 4 4
4 3 5 19 37 3 4 3 3 4 4
5 5 4 21 37 4 3 4 3 4 4
2 4 3 18 36 3 5 4 4 4 4
5 5 5 25 47 4 4 3 5 4 5
4 4 3 20 37 3 5 3 4 4 5
3 4 4 20 39 4 4 5 5 4 5
5 5 5 25 47 4 4 5 5 4 5
5 5 4 23 43 4 4 4 5 5 5
4 5 5 23 44 4 4 5 5 5 5
4 4 4 21 41 3 5 4 5 5 5
4 4 5 23 46 3 5 4 5 5 5

TM TV TT
2
17 17 43
20 20 54
18 18 50
22 22 56
22 22 59
21 21 61
25 25 62
18 18 58
22 22 61
21 21 58
22 22 59
24 24 60
25 25 72
24 24 61
27 27 66
27 27 74
27 27 70
28 28 72
27 27 68
27 27 73

51 www.aacentrum.com
Estadística para tesis Índice
La matriz permite hacer las operaciones estadísticas en el SPSS, se
puede elaborar en Word o Excel y permite copiar y pegar al SPSS.
Códigos de la matriz

En la matriz se ha considerado los siguientes códigos:


It Sex Pro Ed RB1 TRB PV6
Item Sexo Profesión Edad Reposición Total Pago de su
1= del bien indicador valor
Varón “reposición
2=Mujer del bien”

TPV TVRD M1 TM TT
Total Total Modificación Total indicador Total, total
indicador variable legal “modificación
“pago de reparación pregunta 1 legal”
su valor” del daño

1.6.5. La matriz de datos en el SPSS

La matriz de datos es el ordenamiento en tablas de doble entrada,


donde las columnas son las variables. Por lo general la primera
columna es el ID, que significa el identificador y va numerada
correlativamente, este identificador es necesario porque permite
regresar al orden inicial cuando se hayan modificado el orden de los
valores, por lo general las primeras columnas son para las variables
como el sexo, las edades u otro tipo de información que sea relevante
para las operaciones estadísticas.
La matriz de datos en el SPSS tiene dos tipos de vistas, en la vista
de variables, se configura la matriz para que se pueda ingresar los
datos, en la vista de datos sirve para el ingreso de los datos conforme
se ha configurado en la vista de variables.

52 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice

La matriz en la “Vista de datos”

En esta vista se presenta un formulario para insertar los valores de


las variables

La matriz en la “Vista de variables”

En esta vista se presenta los valores de las variables que deben ser
configuradas para que se pueda insertar los datos

53 www.aacentrum.com
Estadística para tesis
Índice
1.7. El Programa SPSS

Es un programa diseñado para hacer cálculos estadísticos, este


programa fue creado por la compañía IBM, en la actualidad se
encuentra en su versión N° 25, cuya versión de prueba lo puede
descargar gratuitamente de https://www.ibm.com/pe-
es/analytics/spss-trials

1.7.1. Configuración inicial

Al iniciar el programa de SPSS, versión 23, versión 24 o versión 25,


al iniciar nos abre una ventana, que sirve para abrir algún archivo
anteriormente guardado, si queremos crear uno nuevo, por lo general
se recomienda cerrar esta ventana, para comenzar a operar una nueva
matriz de datos.

Debemos cerrar la ventana (de arriba), quedándonos la siguiente


ficha de ingreso de datos. La primera ventana que se nos presenta al
abrir el SPSS es diferente en las versiones 23, 24 y 25 sin embargo
tienen la misma función que es presentar los documentos guardados
que se puede abrir.

54 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice

Vista de datos y
Vista de variables

Esta es la ficha de ingreso de datos “vista de datos”, ingresaremos


los valores de las variables, sin embargo, antes, debemos de
configurar la “vista de variables”

1.7.2. Configurando la vista de


variables

La configuración se inserta en la “vista de variables”, que se ubica


en la parte inferior izquierda de la pantalla del SPSS:

En la ficha “vista de datos”, se tiene las siguientes columnas:

55 www.aacentrum.com
Estadística para tesis Índice
Nombre:
En esta columna se pone el nombre de la variable, por lo general
es un nombre corto, sin espacios y sin caracteres especiales, por lo

general lleva la codificación de las variables e indicadores.


Tipo3
Establece el tipo de medición que va a tener la variable, al hacer
clic, sale una ventana para elegir el tipo de valor que va a
ingresarse en la variable.
Numérico:
Una variable cuyos valores son números. Los valores se muestran
en formato numérico estándar. El Editor de datos acepta valores

numéricos en formato estándar o en notación científica.

3 Recuperado de:
https://www.ibm.com/support/knowledgecenter/es/SSLVMB_sub/stati

stics_mainhelp_ddita/spss/base/idh_defvar_type.html
56 www.aacentrum.com
Francisco Guillermo Sánchez Espejo
Índice
Coma:
Una variable numérica cuyos valores se muestran con comas
que delimitan cada tres posiciones y con el punto como

delimitador decimal.
numéricos para este tipoEldeEditor de con
variables datos
o sinacepta
comas,valores
o bien
en notación científica.
científ ica. Los valores no pueden contener comas
a la derecha del indicador decimal.
Puntos:
Una variable numérica cuyos valores se muestran con
puntos que delimitan cada tres posiciones y con la coma
como delimitador decimal. El Editor de datos acepta valores
numéricos para este tipo de variables con o sin puntos, o bien
en notación científica. Los valores no pueden contener
puntos a la derecha del indicador decimal.
Notación científica:
Una variable numérica cuyos valores se muestran con una E
intercalada y un exponente con signo que representa una
potencia de base 10. El Editor de datos acepta para estas
variables, valores numéricos con o sin el exponente. El
exponente puede aparecer precedido por una E o una D con
un signo opcional, o bien sólo por el signo (por ejemplo, 123,
1,23E2, 1,23D2, 1,23E+2 y 1,23+2).
Fecha:
Una variable numérica cuyos valores se muestran en uno de
los diferentes formatos de fecha-calendario u hora-reloj.
Seleccione un formato de la lista. Puede introducir las fechas
utilizando como delimitadores: barras inclinadas, guiones,
puntos, comas o espacios. El rango de siglo para los valores
de año de dos dígitos está determinado por la configuración

57 www.aacentrum.com
Estadística para tesis Índice

de las opciones (en el menú Edición, seleccione Opciones y,


a continuación, pulse en la pestaña Datos).
Dólar:

Una variable numérica que se muestra con un signo dólar


inicial ($), comas que delimitan cada tres posiciones y un
punto como delimitador decimal. Se pueden introducir
valores de datos con o sin el signo dólar inicial.
Moneda personalizada:
Una variable numérica cuyos valores se muestran en uno de
los formatos de moneda personalizados que se hayan
definido previamente en la pestaña Moneda del cuadro de
diálogo Opciones. Los caracteres definidos en la moneda
personalizada no se pueden emplear en la introducción de
datos, pero sí se mostrarán en el Editor de datos.

Cadena:
Una variable cuyos valores no son numéricos y, por lo tanto,
no se utilizan en los cálculos. Los valores pueden contener
cualquier carácter siempre que no se exceda la longitud
definida. Las mayúsculas y las minúsculas se consideran
diferentes. Este tipo también se conoce como variable
alfanumérica.
Numérico restringido:
restringido:
Una variable cuyos valores están restringidos para enteros
no negativos. Los valores aparecen con los ceros iniciales
llenando el ancho máximo de la variable. Los valores se
pueden introducir en notación científica.

58 www.aacentrum.com
Índice
Francisco Guillermo Sánchez Espejo

Anchura
Es la distancia o cuantos dígitos va a tener la variable como limite
Decimales
Son para poner el número de decimales que queremos tenga la
variable. Solo aplica en variables de escala.
Etiqueta
Sirve para nombrar a la variable, a diferencia de la primera
columna “nombre” que es para nombres precisos, esta columna
acepta nombres largos y cualquier tipo de caracteres especial,
cuando completamos una encuesta, en este espacio va la pregunta
realizada.
Valores
Solamente se usa para aquellos casos nominales u ordinales, se
representa mediante valores los conjuntos nominales o los
conjuntos ordinales, al hacer clic sobre esta casilla, obtendremos la
siguiente ventana:

En la casilla valor ponemos el número que representará el grupo


nominal u ordinal, en la etiqueta ponemos el nombre al que será

59 www.aacentrum.com
Estadística para tesis Índice

representado por el valor numérico, al hacer clic en añadir, la


codificación se agregará y podemos ir aumentando todas las
codificaciones que requiera la variable.

Perdidos
Los valores perdidos el programa SPSS los excluye no los toman
en cuenta solo los toman en cuenta cuando son ingresados, son
datos perdidos, por ejemplo, las preguntas que el encuestado se
niegue a responder.
Es una información importante cuando tenemos información
faltante dentro de las encuestas
Columnas

Damos un valor de que tan ancho queremos que sea la columna


Alineación
Permite configurar la alineación a la izquierda a la derecha o
centrada.
Medida
Sirve para establecer
establ ecer el tipo de valor que va a tener la variable,
que puede ser en escala, nominal u ordinal.
De escala
Elegimos este tipo de medida cuando la variable se mide en
números, esta puede ser de razón o de escala (decimos que es
de razón cuando el cero indica ausencia de atributo, por ejemplo,
decir cero años, significa ausencia de espacio temporal, esto no
sucede cuando decimos cero grados centígrados no significa
ausencia de temperatura), la variable medida en escala,
permiten comparaciones de distancia entre valores, esto se
puede aplicar en mediciones de edades, de ingresos
ingre sos o de peso.

60 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice

Nominal
En este caso la discriminación de la variable no se hace por
cantidades, sino por sus cualidades, la clasificación es

indiferente
distinguimosahombres
un orden de lossanos
de mujeres, grupos, por ejemplo,
de enfermos, etc.
Ordinal
La discriminación de la variable no se hace por cantidades ni
por cualidades, en este caso se hace por niveles de
importancia, por una clasificación intrínseca que se selecciona
en categorías pero que estas tienen un orden de prelación, por
ejemplo, cuando seleccionamos los ganadores de una
competencia atlética, entonces categorizamos a los ganadores
del primer puesto, del segundo y del tercer puesto.

1.7.3. Insertando los datos

Luego de configurar la “vista de variables”, vamos a la “vista de


datos”, donde se insertan los datos conforme al valor configurado
para cada variable.

61 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice

2 Cálculo de una

Muestra
El cálculo de una muestra es una operación estadística que tiene
lugar cuando la muestra es del tipo aleatoria simple, para analizar el
tema es necesario tener en cuenta los siguientes conceptos:

2.1. Población y Muestra

La población

La población es el conjunto de objetos que tienen características


comunes que van a ser objeto de estudio, se denomina población al
conjunto completo de elementos, con alguna característica común,
que es el objeto de nuestro estudio, puede ser población un conjunto
definido y determinado como por ejemplo los alumnos del 5to grado
del Colegio San José de Jauja, 2018, y también puede ser un conjunto
indefinido como por ejemplo el conjunto de mascotas.
Clases de poblaciones:

N° de habitantes
habitantes
de una ciudad
Finitas
N° de vehícul
vehículos
os
de una empresa
Clases de
Poblaciones
N° de aves
aves
Infinitas
Cantidad de
granos de arena

63 www.aacentrum.com
Estadística para tesis Índice

Esta clase de poblaciones tiene importancia para el cálculo, pues


tendrán diferentes fórmulas para hallar la muestra.
La población y la población de estudio
Llamamos población al conjunto de individuos que pertenecen a
una especie o género, que son objeto de estudio y que tienen una
característica común, así por ejemplo podemos estudiar a los
pacientes de alguna enfermedad, a los estudiantes
est udiantes de un colegio, a los
trabajadores de una empresa, etc. Un sector de la doctrina considera
que población es el género es decir si vamos a estudiar a los alumnos
de un colegio, entonces los alumnos en general es la población y la
población de estudio indican que sería parte de esa población, pero
delimitada por criterios de selección, así, vendría a ser los alumnos
del Colegio Miguel Grau del distrito de Socabaya, Arequipa y recién
de esta población delimitada tendríamos la muestra.
Ejemplo:
Población: Alumnos de secundaria
Población de estudio: Alumnos de secundaria del Colegio Miguel
Grau del distrito de Socabaya, Arequipa.
Muestra: 10 alumnos por aula
Al respecto no estamos de acuerdo con esta clasificación de la
población, consideramos que la población viene establecida en el
enunciado de investigación y no cabe hacer la diferenciación entre
población y población de estudio. Por ejemplo, supongamos que
tenemos el siguiente enunciado:
“Relación entre adolescentes sobreprotegidos y los rasgos
psicopáticos en los alumnos del primero al tercero de secundaria, en
el distrito de Miraflores, Arequipa
Arequipa,, 2019”
En este caso la población de estudio serán tolos los alumnos del
primero al tercero de secundaria de todos los colegios de Miraflores

64 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice

en Arequipa en el 2019 y de la cual se extraerá la muestra para


estudiar. Ahora, diferente es el caso si el enunciado del problema
tiene la siguiente redacción
redacción::

“Relación entre adolescentes sobreprotegidos y los rasgos


psicopáticos en los alumnos del primero al tercero de secundaria, en
el Colegio Hipólito Unanue del distrito de Miraflores, Arequipa,
2019”
En este caso la población de estudio es más reducida y debido a
que cada grado tiene como 8 secciones, se considera extraer una
muestra estadística, entonces se tiene:
Población: 1200 alumnos
Muestra: 220 alumnos
Como podemos apreciar, el conjunto de individuos que conforman
la población de estudio y de la cual se va a extraer la muestra es
relativo, pues está definido por el objeto de estudio que se indica en
el enunciado de la investigación,
investigación , que en algunos casos puede ser igual
a la muestra, por ejemplo si se hace un estudio sobre el volcán Misti,
no podemos decir que la población son todos los volcanes, porque en
el enunciado ya está identificado el objeto de estudio, en este caso “los
volcanes” sería el universo, pero no la población o población de
estudio.
El uso de los criterios de selección no es para diferenciar la
población de la población de estudio, sino los criterios de selección es
una forma de muestreo intencionado, se usa para obtener una
muestra normalmente cualitativa y no para obtener una población de
estudio de una población en general, consideramos que esta
distinción que utiliza los criterios de selección para separar una
población de estudio de una población en general es equivocada. La
población siempre se encontrará en el enunciado de la investigación
y el investigador elegirá estudiar toda la población o con una muestra
para lo cual aplicará alguno de los tipos de muestreo antes indicado.
65 www.aacentrum.com
Estadística para tesis
Índice

La muestra
La muestra es una parte de la población que la representa, al ser la
muestra de un tamaño pequeño, facilita a realizar estudios y cálculos
que serán aplicable a toda la población. La finalidad de la muestra es
poder hacer estudios con una porción pequeña de la población
obteniendo resultados como si trabajáramos con toda la población.
Relación entre población y muestra

Hay representatividad

No hay representatividad

La muestra no solo debe ser parte de la población, es importante que la


represente, es decir que tenga las mismas características de la
población, que sea relevantes para el estudio, pero en tamaño reducido

Por ejemplo, si se analiza a la población conformada por las líneas


aéreas que prestan servicios de Perú a Europa y Norteamérica, la
muestra también debe considerar que los elementos seleccionados
cubran esos destinos, si tomamos como muestra solo a las líneas
aéreas con destino a Europa y no a Norteamérica, no habría
representatividad, es decir que la muestra debe conservar las
mínimas características de la población que van a influir en las

66 www.aacentrum.com
Francisco Guillermo Sánchez Espejo
Índice

operaciones de cálculo. Otro ejemplo puede ser: Un estudio sobre el


bullying que se realice en un colegio, con el siguiente enunciado:
“Análisis de las causas del bullying en el colegio Carlos Meza de
Paucarpata en Arequipa 2019”, en este caso la población de estudio
está conformado por todos los integrantes del colegio Carlos Meza,
esto es:
1.- El director
2.- El personal administrativo
3.- Los profesores
4.- Los alumnos
Entonces, no se podría extraer una muestra para el estudio de solo
el conjunto de alumnos, porque no sería representativa de todo el
colegio, pues la muestra debería involucrar a todos los integrantes de
dicho colegio, esto es al director, al personal administrativo, a los
profesores y alumnos, en otras palabras, la muestra debe ser un
colegio en miniatura si se puede graficar de esa manera.
La muestra debe tener una cantidad mínima en relación a la
población y al error que se quiera asumir. Cuanto más grande sea la
muestra y se acerque al tamaño de la población, los
lo s cálculos serán más
exactos y cuanto más reducido sea y se aleje del tamaño de la

población los cálculos


vez de trabajar tendrán
con toda más error.
la población, Ellas
tiene trabajo con la ventajas:
siguientes muestra en

Reduce los costos de las operaciones estadísticas


Facilita y simplifica las operaciones
Cuando el número de la población es desconocida,
sustituye los valores de la población con cierta
probabilidad de error
Facilita el acceso a la información cuando el trabajo con
toda la población resulta difícil.

67 www.aacentrum.com
Estadística para tesis Índice

2.1.1. Intervalo de confianza

Es el valor mínimo y máximo en que puede encontrarse un valor


con cierto pronóstico de confianza, este intervalo está comprendido
entre dos valores simétricos medidos desde el punto medio.

Elementos

1.- Nivel de confianza:


Es la porción debajo de la curva que puede encontrarse el
parámetro, esto es 95% y es igual a = 1- α y por lo general se asume
valores del 90%, 95% y 99%.
2.- Nivel de riesgo:
Llamada también
también nivel de significación, es la parte de los extremos
de la distribución, el riesgo es la posibilidad que el parámetro se
encuentre en los extremos (fuera del nivel de confianza), por lo
general el riesgo que se asume es del 5% y se denota α = 5%, que
dividido en sus dos extremos es 2.5%, así α/2 = 2.5% , a su vez ese
2.5% como valor Z = 1.96
Como podemos apreciar el nivel de confianza se relaciona
directamente con el riesgo,
riesgo , pues son complementarios y sumados dan
el 100%
Límite de confianza
Es similar al nivel de confianza, pero no es igual, el límite de
confianza está conformado por los puntos donde se separa el nivel de

68 www.aacentrum.com
Francisco Guillermo Sánchez Espejo
Índice

confianza con el riesgo. La media es la línea media que divide en dos


lados iguales a la distribución, por tanto, para hallar el límite inferior
se resta y para hallar el límite superior se suma el mismo valor.

El error
Se relaciona con el límite de confianza, es la probabilidad que el
valor buscado no se encuentre dentro del límite de confianza.
Debemos aclarar que el error no es lo mismo que el riesgo, pues este
último es la parte que se queda fuera de la probabilidad, en cambio el
error es la probabilidad que el valor no se encuentre en la zona de
aceptación.
Debemos de tener en cuenta que Z son los puntos donde limita el
intervalo de confianza y α es la zona de riesgo, de esta manera se
relacionan:
Cuando α = 10%, entonces α/2=5%, que es igual a 0.05, Z=1.645

Cuando α = 5%, entonces α/2=2.5%, que es igual a 0.025, Z=1.96

El intervalo de confianza es una porción de valores en las cuales se


confía que se encuentra el verdadero valor.

El intervalo de confianza, es un sector donde se puede


encontrar el valor real con cierto nivel de confianza
• Si el intervalo es más corto, el valor real será más preciso, pero
con más margen de error

• Al contrario, si el intervalo es más grande el valor real será más


imprecisó, pero con menos margen de error.

69 www.aacentrum.com
Estadística para tesis Índice

Continua en el 7.5.2…→

Concepto de inferencia:

INFERIR: Significa obtener conclusiones a partir de


hechos generales o particulares. En estadística
significa obtener resultados para la población a partir
de una muestra

POBLACIÓN

MUESTRA Permite hacer


Cálculos para
INFERIR a la
Población

Estadístico Parámetro
(Conocido) (Desconocido)

Relación entre población y muestra


Muestra (n)
Parte de la poblacion que es
representativa
representati va de todo el
conjunto.

Población (N)
Conjunto de todos los
elementos con
caracteristica comunes que
son objeto de estudio

70 www.aacentrum.com
Francisco Guillermo Sánchez Espejo
Índice

Universo

Son todos los elementos que comparten característi


características
cas comunes

Población

Son todos los elementos que se va a estudiar en una investigación

Muestra

Parte de la población que la representa, permite que los resultados


de su estudio sean válidos para la población

Muestreo

Procedimiento por el cual se selecciona la muestra

Individuo

Es cada uno de los elementos de la población

Dato

Es cada una de las respuestas que obtengo al medir a cada


individuo

2.2. Técnicas de muestreo

La extracción de la muestra requiere de técnicas de selección y


extracciónn de la muestra, en ese sentido tenemos los muestreos al azar
extracció
que por lo general se aplica a las investigaciones cuantitativas y los
muestreos a elección que son aplicables a las investigaciones

71 www.aacentrum.com
Índice
Estadística para tesis

cualitativas, pero en realidad las investigaciones son complejas y un


tipo de muestreo se puede aplicar a una u otra investigación.
Entre las clases de muestreo tenemos los siguiente
si guientes:
s:
M m

Aleatorio simple

Estadístico Aleatorio estratificado

Sistemático
Clases de
muestreos
Accidental

Por elección Por conveniencia

Intencional

Diferencia entre cálculo de la muestra y tipo de muestreo


La muestra es el cálculo del tamaño de la muestra que, con cierto
error de cálculo, se puede obtener. En cambio, el tipo de muestreo es
la forma como se elige la muestra de la población. Así podemos decir
que las clases de muestreos son a) Los muestreos estadísticos y sus
formas de extracción de la muestra son: el aleatorio simple, el
aleatorio estratificado y el sistemático, b) los muestreos por elección
y sus formas de extracción de la muestra son: El accidental, por
conveniencia y el intencional.

2.2.1. Muestreo estadístico

72 www.aacentrum.com
Índice
Francisco Guillermo Sánchez Espejo

Este tipo de muestreo se realiza mediante cálculos estadísticos,


conforme a un margen de error que el investigador está dispuesto a
aceptar.

Elección de la muestra
Debemos de distinguir de la clase de muestreo que puede ser
estadístico o por elección de la muestra. En los muestreos estadísticos,
la elección de la muestra puede ser del tipo aleatorio simple, el
aleatorio estratificado y el muestreo sistemático. Muchas veces se
confunde la elección de la muestra con el cálculo de la muestra
estadística, pues ambas son cosas diferentes.
Así, mientras que el cálculo de la muestra puede ser estadístico, es
decir calculando la representatividad en base a un error y un nivel de
confianza que estamos dispuestos a asumir, en cambio la extracción
de la muestra se realiza en un segundo paso, luego de calculada la
muestra, la elección de los individuos se hace en forma aleatoria
simple, estratificada o sistemática.
Muestreo aleatorio simple
En este tipo de muestreo, cada elemento de la población está en
la misma capacidad de ser seleccionada, pero el simple azar
hace que se elija el número de elementos que van a conformar
la muestra, este número esta previamente definido mediante el
cálculo de muestreo.
Muestreo aleatorio estratificado
En este tipo de muestreo la población se divide en estratos para
luego hacer la selección de cada estrato conforme al muestreo
aleatorio simple. La muestra que se extrae en cada estrato es
proporcional al número poblacional del estrato.
Muestreo sistemático

73 www.aacentrum.com
Estadística para tesis
Índice

Este muestreo consiste en elegir a la población en base a


características pre definidas que se presenta como patrón para
la selección, por ejemplo, se puede establecer como patrón el
número 10, de modo que cada 10 individuos se escoja a uno.

2.2.2. Muestreo por elección

Llamado también muestreo no probabilístico4, considera una


muestra elegida por el investigador conforme a criterios de elección o
circunstanciass que no permiten la elección por azar. El muestreo por
circunstancia
elección tiene mayor afinidad con las investigaciones cualitativas.
cualitativas.
Los tipos de muestreo o formas de elección de la muestra
En este tipo de muestreo por lo general el cálculo de la muestra se
realiza junto a la elección de la muestra. El investigador identifica a la
población de estudio y propone los criterios de selección para la
inclusión y exclusión de los individuos, en este caso a la vez que
identifica la muestra, también identifica los individuos que van a ser
objeto de la extracción muestral, que puede ser del tipo accidental,
por conveniencia e intencional.
Muestreo accidental
Se obtiene la muestra por la ocurrencia de eventos naturales

causales
este caso sin la intervención
se considera de la voluntad
como muestra cuandodel investigador,
cumple en
con alguna
condición propuesta previamente por el investigador.
Muestreo por conveniencia
Se considera a la selección de la muestra de acuerdo a la
aceptación del sujeto
sujet o a ser evaluado, en este caso el investigador

4 Se denomina no probabilístico, debido a que los individuos no están en

la misma posibilidad de ser elegidos por el azar.


74 www.aacentrum.com
Índice
Francisco Guillermo Sánchez Espejo

no tiene la libertad de seleccionar libremente la muestra, pues


se requiere que la persona preste su consentimiento y
aceptación.

Muestreo intencional
En este muestreo la selección de la muestra se realiza conforme
a criterios de conveniencia que tenga el investigador, en este
caso se tiene en cuenta criterios de inclusión y criterios de
exclusión que son propuestos convenientemente al propósito
del estudio.

2.3. Cálculo del tamaño de una


muestra

El cálculo de una muestra, difiere según el enfoque de


investigación. El cálculo muestral es diferente para el enfoque
cualitativo que, para el enfoque cuantitativo, así se tiene:

MUESTRA Se estiman proporciones


CUALITATIVA %

MUESTRA Se estiman promedios


CUANTITATIVA

2.3.1. Cálculo de una muestra


cualitativa

La muestra es cualitativa cuando su determinación no es una


cantidad concreta, sino en base a una proporción, las cantidades no
son números exactos, sino una parte de la población que puede variar
según el tamaño que tenga la población, por tanto, su cálculo tampoco
75 www.aacentrum.com
Índice
Estadística para tesis

se realiza por cantidades exactas, sino en proporciones (%), para ello


es necesario saber si se conoce el número de la población o no se
conoce.

A. Para casos donde la población es infinita o


desconocida
En estos casos se aplica la siguiente formula:

  
 = 
Donde
n = Es el tamaño de la muestra

Z = Es el nivel de confianza
p = Es la variabilidad positiva
q = Es la variabilidad negativa
E = Es la precisión o el error
B. Para casos donde la población es conocida
En estos casos se utiliza la siguiente formula:

=   
()  
Donde
n = es el tamaño de la muestra
Z = es el nivel de confianza
p = Es la variabilidad positiva (Es la probabilidad que ocurra el suceso
esperado)

q = es la variabilidad negativa

76 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice

N = es el tamaño de la población
E = es la precisión o el error
Ejercicios

Se desea estimar la proporción de negligencias médicas en el Perú,


con una confianza del 95% y un error del 5%

Datos:
Confianza = 95% = Z = 1.96 →Este valor lo obtenemos de la tabla Z, que
para el 95% corresponde 1.96
Error = 5% = 0.05 → Que resulta de dividir 5/100

P = Es el número de pacientes que van a ser objeto de algún tipo


de negligencia médica (Si no se conoce el número, se considera que p =
q = 50% que a su vez es igual a: 0.5)

Reemplazando en la fórmula: =  

= . .  . = 384.16
.
Repuesta: Si se desea estimar el porcentaje de pacientes del Perú
para saber la proporción de casos de negligencias
médicas con una confianza del 95% y un error del 5%,
se necesita una muestra de 385 pacientes

2.3.2. Cálculo de una muestra


cuantitativa

Son muestras cuantitativas aquellas dimensiones, donde la


medición de las variables se realiza numéricamente en cantidades
determinadas, por ejemplo: Se puede investigar cuanto
cuant o gasta una ama
de casa en promedio al día, en gastos de alimentación; se puede

77 www.aacentrum.com
Estadística para tesis
Índice

calcular cuánto pesa en promedio un peruano o cuanto es en


promedio la talla de un peruano.
Al igual que para las muestras cualitativas, en las cuantitativas
también será importante determinar si se conoce o no el número de la
población, pues en cada caso las fórmulas serán diferentes:
Fórmula cuando se conoce el número de la población

= б

Donde:

n = es el tamaño de la muestra

Z = es el nivel de confianza
б = es la desviación estándar

E = es la precisión o el error
Fórmula cuando no se conoce el número de la población

= б
(−)+б
Donde:

n = Es el tamaño de la muestra
N = Es el tamaño de la población
Z = Es el nivel de confianza
б = Es la desviación estándar

E = Es la precisión o el error
El cálculo de una muestra con programas online

78 www.aacentrum.com
Índice
Francisco Guillermo Sánchez Espejo

Para hacer el cálculo de una muestra, tenemos varios programas


online que nos pueden ayudar, entre ellos tenemos:
www.corporacionaem.com/tools/calc_muestras.php
www.questionpro.com
www.netquest.com

2.3.3. Cálculo de una muestra en el


SPSS

El programa SPSS puede extraer la muestra en forma aleatoria de


la base de datos que registramos en la matriz del SPSS, el
procedimiento es el siguiente:
1.- Confeccionar una base de datos de toda la población
En el presente ejemplo hemos hecho una población de datos con
750 resoluciones del 2019.

2.- Hacemos el cálculo


En este caso no vamos a calcular el numero de la muestra que se
puede hacer con las calculadoras online antes indicadas, sino en esta

operación se va a realizar la elección aleatoria


aleatori a de la muestra, por tanto
79 www.aacentrum.com
Índice
Estadística para tesis

necesitamos tener el número de la muestra, para la extracción


aleatoria, vamos a “Datos” del menú del SPSS, luego a “Seleccionar
casos”, donde obtendremos el siguiente cuadro:

En este cuadro hacemos clic en la casilla “Muestra aleatoria de


casos”, donde se habilitará el botón “ejemplo” el cual debemos hacer
clic y se abrirá la siguiente ventana
ventana::

En esta ventana podemos elegir entre un tamaño de la muestra en


forma aproximada o en un tamaño de la muestra exacto, de elegir

aproximadamente, debemos de dar el valor aproximado que


80 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice

queremos y si elegimos exactamente debemos de poner cuantos casos


del total queremos que el programa lo elija en forma aleatoria. En el
ejemplo se eligió una muestra de 30 de los 750 casos que tiene la
matriz. Damos “aceptar” y en el cuadro, hacemos clic en “copiar casos
seleccionados a un nuevo conjunto de datos”

En el cuadro “nombre de conjunto de datos” debemos poner un


nombre que tendrá la nueva matriz con los datos seleccionados
aleatoriamente por el SPSS, luego en aceptar y se abrirá una nueva
matriz conteniendo las muestras escogidas en forma aleatoria, esta
matriz tendrá el nombre indicado en el cuadro.

81 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice

3 Confiabilidad del

Instrumento

La confiabilidad del instrumento es un cálculo estadístico


obligatorio si tenemos un instrumento de medición en la tesis,
decimos que un instrumento es confiable cuando observamos que el
instrumento en repetidas pruebas en condiciones similares, tiene el
mismo resultado, motivo por el cual confiamos que el instrumento va
a medir, es decir va a discriminar valores de acuerdo a la variabilidad
de los resultados del instrumento, la medición de la confiabilidad se
realiza midiendo el grado de sus varianzas o de sus correlaciones.
Diferencia entre confiabilidad y validez

1.-No hay validez 2.-Hay confiabilidad 3.-Hay validez y


Ni confiabilidad pero no validez Hay confiabilida
confiabilidadd
Caso 1.
No hay validez porque los tiros están lejos del blanco y no hay
confiabilidad porque los tiros están dispersos.

83 www.aacentrum.com
Estadística para tesis
Índice

Caso 2.
Hay confiabilidad porque el instrumento en repetidas
oportunidades arroja la misma medición, esto se puede evidenciar
cuando los tiros van a un solo lugar, en cambio no hay validez porqu
porquee
el instrumento no mide lo que debe medir, en el ejemplo, los tiros
están dirigidos a un solo lugar, pero que no es el blanco, es decir el
instrumento no permite alcanzar el objetivo que es impactar en el
punto medio.
Caso 3
En este caso existe confiabilidad porque los tiros están próximos
uno del otro y hay validez porque todos ellos dan al blanco, es decir
miden lo que deben medir.
Para el cálculo de la confiabilidad, existen dos tipos de cálculos
más conocidos, el estadístico KR-20 que es una variante del Alfa de
Crombach y se aplica a instrumentos con respuestas dicotómicas (si o
no, verdadero o falso, etc) y el estadístico Alfa de Crombach para
instrumentos que tienen tres o más respuestas alternativa
alternativas.
s.

KR-20 Para instrumentos


dicotómicos

Alfa de Para instrumentos


Crombach politómicos

3.1. El estadístico KR 20

El estadístico KR-20, es en sí una variante del Alfa de Crombach


con la particularidad que es para variables dicotómicas, es decir que
evalúa la confiabilidad que se miden con solo dos valores (si, no;
verdadero, falso; presente o ausente), lleva los nombres abreviados

de Kuder Richardson y consiste en medir la consistencia interna por


84 www.aacentrum.com
Índice
Francisco Guillermo Sánchez Espejo

medio de una división entre la varianza verdadera o la suma de las


covarianzas de los ítems y la varianza de las puntuaciones totales de
la prueba. Las fórmulas tienen diferencias, pero el procedimiento de
cálculo con el SPSS es el mismo para el KR-20 con el alfa de Crombach.

Formula:

KR 20 =
 ∑
−[1  ]
. 
Ejemplo:
Se aplicó un cuestionario de 4 preguntas a 6 personas con
preguntas dicotómicas, donde la respuesta “no” equivale a un cero
(o) y la respuesta “si” equivale a un uno (1), así se tiene:
Preguntas
Alumnos
P1 P2 P3 P4
A1 1 1 1 0
A2 1 1 1 1
A3 0 0 0 1
A4 1 1 0 0
A5 0 0 0 0
A6 1 0 1 1

En primer lugar, elaboramos la matriz


Esta sería nuestra matriz de datos en el programa SPSS

85 www.aacentrum.com
Estadística para tesis
Índice

Posteriormente, vamos a “Analizar”, “Escala” y “Análisis de


fiabilidad”

Luego nos saldrá el siguiente cuadro:

Donde debemos pasar variables de las preguntas (P1, P2, P3, P4)
al lado derecho, al cuadro “Elementos” y luego clic en “Estadísticos”,
donde se abrirá el siguiente cuadro, donde debemos de activar los
iconos sobre los cálculos descriptivos tales como elemento, escala y

escala si se elimina un elemento. El cuadro tiene otras opciones como


86 www.aacentrum.com
Índice
Francisco Guillermo Sánchez Espejo

el resumen de las medias, las varianzas o de las correlaciones y la


tabla del ANOVA con los cálculos de chi cuadrado, que también
pueden ser elegidos si requerimos esa información.

En este cuadro seleccionamos “Elemento”, “Escala” y “Escala si se


elimina un elemento”. El cálculo se realiza con Alfa de Crombach,
porque el KR20 es una variante de esta.

87 www.aacentrum.com
Índice
Estadística para tesis

Damos continuar y aceptar, Luego en el visor de resultados


tendremos:

Estadísticas de fiabilidad

Alfa de
Cronbach N de elementos

,615 4

Indicando que el resultado del KR20 es 0.615, lo cual indica un


instrumento con una buena fiabilidad, pues debe tenerse en cuenta
los parámetros de fiabilidad del KR – 20 son los mismos que para el
Alfa de Crombach.

3.2. El Alfa de Crombach

El Alfa de Crombach es la media ponderada de las correlaciones


de las variables que forman parte de una escala, hay dos formas de
hacer el cálculo, por un lado, tenemos el Alfa que se calcula a partir
de sus varianzas y el Alfa que se calcula por las correlaciones de los
ítems, llamado también Alfa de Crombach estandarizado.
• A partir de las varianzas

A partir de las varianzas, el alfa de Cronbach se calcula así:


 ∑ 
=− [1    ]

Donde:
 = Es la varianza de los valores totales observados.
 = Es la varianza de los valores
88
totales observados
www.aacentrum.com
Índice
Francisco Guillermo Sánchez Espejo

K = Es el número de preguntas o ítems


• A partir de las correlaciones entre los ítems

A partir de las correlaciones entre los ítems, el alfa de Cronbach


estandarizado
estandariza do se calcula así:

est =
+(−)
Donde:
• k es el número de ítems
• p es el promedio de las correlaciones lineales entre cada uno
de los ítems (se tendrá [k(k – 1)]/2 pares de correlaciones).

Aplicación:
Se utiliza para cuantificar el nivel de fiabilidad de una escala de
medición, por medio del índice de consistencia interna del
instrumento, varía de 0 a 1, cuando está más cerca del 1 indica mayor
consistencia.

Ejercicios
Calcular el Alfa de Crombach de la encuesta de 10 preguntas
efectuada a 12 personas, mediante un cuestionario con escala ordinal
de 5 niveles (Muy en desacuerdo, en desacuerdo, indiferente, de
acuerdo, muy de acuerdo)
Para ello, en primer lugar elaboramos la matriz de datos en el
programa SPSS, configurando en la vista de variables las variables
ordinales, así tenemos:

89 www.aacentrum.com
Estadística para tesis
Índice

Paso 1: Elabora la matriz de datos


Configurar la vista de variables de la matriz de datos del SPSS
conforme a la siguiente imagen

Paso 2: Completar la vista de datos del SPSS


En primer lugar, debemos de elaborar la matriz de datos, donde
los números de la primera columna corresponden al identificador
(ID), luego se tiene las respuestas de las personas encuestadas
previamente codificadas para cada pregunta que se encuentran en las
columnas con la letra P, las respuestas se distribuyen conforme a los
cuestionarios que fueron resueltos por los encuestados.

90 www.aacentrum.com
Francisco Guillermo Sánchez Espejo
Índice

Paso 3

Calcular el Alfa de Crombach


Para ello hacemos clic en “Analizar”, “Escala”, “Análisis de
fiabilidad”.

A continuación, debemos seleccionar las preguntas y pasar a


“elementos”. Para la medición del Alfa de Crombach, solo se miden
91 www.aacentrum.com
Índice
Estadística para tesis

las preguntas, debemos evitar poner otros ítems como el sexo, la


profesión o la edad que puede estar en la matriz, pero no entran en el
cálculo del Alfa, solo entran los valores de las preguntas.

En estadísticos marcar las siguientes casillas

Damos continuar y luego aceptar y tendremos el siguiente


resultado en el visor del SPSS

92 www.aacentrum.com
Índice
Francisco Guillermo Sánchez Espejo

Donde se indica un alfa = 0.277


Que, conforme a la escala, significa una fiabilidad baja

3.2.1. Mejorar el nivel del Alfa de


Crombach

Para mejorar el Alfa de Crombach, se requiere analizar y corregir


las inconsistencias que tienen las preguntas del cuestionario, entre los
principales problemas que pueda tener esta:

Las preguntas no
apuntan igual
Causas de Alfa de
Crombach bajo
Las preguntas no son
discriminantes

A. Las preguntas no apuntan igual

93 www.aacentrum.com
Índice
Estadística para tesis

Debemos de tener en cuenta que el estadístico calcula la


consistencia interna del instrumento, en ese sentido, se mide
categorías que pueden ser dicotómicas (ejem: si o no) o de varias
alternativas (ejem: Muy en desacuerdo, en desacuerdo, ni de acuerdo
ni en desacuerdo, de acuerdo y muy de acuerdo), la orientación de la
escala debe ser uniforme para las preguntas, así el extremo muy en
desacuerdo o muy de acuerdo deben estar orientados a medir en el
mismo sentido la magnitud o criterios de la variable, sin embargo, el
problema de tener preguntas en una misma dirección, hace evidente
el propósito del investigador y puede dar lugar a que el encuestado
advierta el propósito y tenga un sesgo subjetivista en contra de la
encuesta, para evitar ello se puede alterar la dirección de la pregunta
en base a un patrón de alteración que para el momento de realizar las

operaciones estadísticas se repone a su primera orientación.


Ejemplo:
Se tiene el siguiente enunciado:
“Deficiencias en la reparación del daño en el procedimiento
administrativo disciplinario que regula la ley 30057, Ley del Servicio
Civil, que justifique su modificación legislativa para la defensa del
patrimonio del Estado, Perú, 2019.”
Sean las variables:
Variable 1: Reparación del daño
• Reposición del bien
• Pago del valor del bien
Variable 2: Modificación legislativa
• Modificación legislativa
Hipótesis:
(…)

94 www.aacentrum.com
Índice
Francisco Guillermo Sánchez Espejo

Es posible que existan deficiencias en la reparación del daño en el


procedimiento administrativo disciplinario que regula la ley 30057,
Ley del Servicio Civil, que justifique su modificación legislativa para
la defensa del patrimonio del Estado, Perú, 2019
Preguntas A B C D E
¿Está usted de acuerdo en que la falta de
regulación de la reposición del bien en la ley
30057 Ley del Servicio Civil evita que el Estado
pueda recuperar su patrimonio afectado por la
conducta del infractor?
¿Está usted de acuerdo que en el procedimiento
administrativo disciplinario se exija al infractor
junto a la sanción, la reparación del bien
afectado por la conducta del infractor?
¿Está usted de acuerdo en que la exigencia de

reposición
un procesodel bien
lento dañado en la vía judicial es
e ineficiente?

En este caso las preguntas van dirigidas a medir “La necesidad de
modificar la reparación del daño en el procedimiento administrativo
disciplinario que regula la ley 30057 …”, en el indicador: reposición del
bien, donde las categorías A, B, C, D, E se orientan de muy en
desacuerdo a muy de acuerdo, que es en este último extremo que va
a fundamentar a la segunda variable que es justificar “una
modificación legislativa” conforme se propone en la hipótesis.

Un cuestionario con preguntas contradic


contradictorias
torias sería el siguiente:
Preguntas A B C D E
¿Está usted de acuerdo en que la falta de
regulación de la reposición del bien en la ley
30057 Ley del Servicio Civil evita que el Estado
pueda recuperar su patrimonio afectado por la
conducta del infractor?
¿Usted está de acuerdo que en el procedimiento
administrativo disciplinario no se exija al
infractor junto a la sanción, la reparación del
bien afectado por la conducta del infractor?

95 www.aacentrum.com
Índice
Estadística para tesis

¿Está usted de acuerdo en que la exigencia de


reposición del bien dañado en la vía judicial es
un proceso lento e ineficiente?
(…)

En este caso la segunda pregunta no se orienta a probar la hipótesis


pues las preguntas van dirigidas a medir las: “Deficiencias en la
reparación del daño en el procedimiento administrativo disciplinario
que regula la ley 30057, Ley del Servicio Civil, que justifique su
modificación legislativa para la defensa del patrimonio del Estado,
Perú, 2019”, pues esta pregunta plantea que “no se debe exigir junto
a la sanción la reparación del bien afectado”, entonces las preguntas
que van en sentido contrario a la hipótesis afectan la consistencia del
instrumento porque los valores ordinales en el estadístico se
consideran que la negación de la hipótesis se da mediante los valores
extremos inferiores (muy en desacuerdo) y la afirmación de la
hipótesis se da mediante los valores mayores (muy de acuerdo).
El uso de patrones
Si bien lo deseable es que las preguntas apunten en una sola
dirección y que haya un orden en la secuencia de las preguntas, sin
embargo, esto, puede afectar la objetividad del instrumento, así, por
ejemplo:

¿Considera ud que las drogas son malas?


¿Considera ud que las drogas inducen a la delincuencia?
¿Usted consume drogas?

En este caso es visible la subjetividad del investigador que busca


probar lo dañino de las drogas, pero esto se puede mejorar si
alteramos las preguntas solo para la encuesta y luego lo retornamos a
su lugar, así se tiene:

96 www.aacentrum.com
Índice
Francisco Guillermo Sánchez Espejo

¿Usted consume drogas?


¿Considera ud que las drogas no son buenas?

¿Considera ud el consumo de drogas inducen a la delincuencia?

En el presente caso se ha puesto como primera pregunta si el


encuestado consume o no drogas, esto a efectos que no le afecte las
preguntas que le siguen, en la segunda pregunta, se ha cambiado el
sentido de la pregunta para evitar que el encuestado perciba un
negativismo a las drogas de parte del investigador.
Para evitar que las preguntas sean uniformes e influyan
subjetivamente en el encuestado, se puede variar el sentido de las

preguntas e inclusoenellas
permita reordenar orden de estas
respuestas paraconforme a un
hacer los patrón que
estadísticos de
análisis. En el caso del ejemplo anterior,
anterio r, la segunda pregunta se puede
invertir en el acopio de la información a fin de uniformizar las
preguntas y hacer los estadísticos.
B. Las preguntas no son discriminant
discriminantes
es
Las preguntas deben estar orientadas a aprobar o desaprobar la
hipótesis, pero si las preguntas no tienen esta finalidad y por el
contrario tienen un efecto neutro, esto reduce la consistencia del
instrumento, las preguntas que no son discriminantes tienen
respuestas neutras como por ejemplo “ni de acuerdo ni en
desacuerdo”, si bien esta respuesta puede ser indicada por algún
encuestado, sin embargo si la mayor parte de las respuestas son
neutras, esto distorsiona la finalidad del instrumento que es probar la
hipótesis.
Mejora del nivel de Alfa de Crombach en el SPSS

97 www.aacentrum.com
Estadística para tesis Índice

Como se dijo anteriormente, un bajo nivel del Alfa de Crombach


significa que hay errores en la elaboración del instrumento, sin
embargo, existe formas de mejorar la confiabilidad.

Ejemplo:
Supongamos que tengamos la siguiente matriz

Donde se tiene el siguiente valor de Alfa

Como podemos apreciar las variables tienen un alfa bajo, por


tanto, queremos mejorar artificialmente dicho valor.
Para la mejora del índice del alfa debe seguirse los siguientes
pasos:
1.- Sumamos los ítems, para ello vamos a: “Trasformar”, “calcular
variable”, donde se obtendrá el siguiente cuadro:

98 www.aacentrum.com
Francisco Guillermo Sánchez Espejo
Índice

Ponemos de título “suma” en variable objetivo y pasamos


sumando las variables al cuadro de expresión numérica, aceptamos y
obtendremos la suma de las variables:

En la “vista de variables” reducimos los decimales, luego vamos a


“Analizar”, “Correlaciones ”, “Bivariadas” y obtendremos el
siguiente cuadro:

99 www.aacentrum.com
Índice
Estadística para tesis

En el cuadro pasamos al lado derecho las variables y la suma,


luego en aceptar y obtendremos el visor del SPSS con el siguiente
cuadro:

En el cuadro podemos ver las variables que tienen una baja


correlación y deben ser mejoradas, por ejemplo, la pregunta p1, tiene
una correlación de 0.345. Entonces vamos nuevamente a la matriz y

100 www.aacentrum.com
Índice
Francisco Guillermo Sánchez Espejo

ordenamos la columna suma en forma ascendente haciendo clic


derecho sobre suma y eligiendo ordenar de forma ascendente.

Luego, procedemos a ordenar la pregunta 1 (p1) en forma


ascendente, poniendo los valores menores arriba y abajo los
mayores. Esto a efectos que se relacione con la suma de las
variables, así tenemos:

Volvemos a calcular el Alfa de Crombach y veremos que ha


mejorado. En este caso tenemos un Alfa de: 0.818

101 www.aacentrum.com
Índice
Francisco Guillermo Sánchez Espejo

4 Validez del

Instrumento

La validez del instrumento es el segundo cálculo estadístico de


necesaria aplicación cuando en la tesis se utiliza un cuestionario, la
validez es el grado con el cual el instrumento domina o realiza una
medición, es la adecuación del instrumento a la naturaleza de la
medición, así por ejemplo no se puede medir con un termómetro la
distancia, sino con un instrumento que mida distancias, en los
instrumentos documentales se debe buscar el instrumento que este
acorde a los criterios de medición del objeto. La validez se diferencia
de la fiabilidad, en que mientras en la fiabilidad, el instrumento
discrimina los valores y mide el objeto, en la validez esa medición se
corresponde con la naturaleza del objeto que se quiere medir. Cuando
la validez se acerca al cero decimos que es una validez nula y cuando
se acerca al uno, decimos que es perfecta, así se tiene:
De 0 a 0.5 = Validez muy baja
De 0.5 a 0.6 = Validez baja
De 0.6 a 0.7 = Validez media
De 0.7 a 0.8 = Validez alta
De 0.8 a 1 = Validez muy alta

4.1. La validez de contenido

Decimos que un instrumento tiene validez de contenido cuando el


instrumento mide todas las dimensiones que se requiere medir del
objeto, así por ejemplo no tendría validez de contenido un
103 www.aacentrum.com
Índice
Estadística para tesis

instrumento que busque medir los conocimientos sobre manejo de


vehículos si solo se evalúa los conocimientos sobre el vehículo y no
toma en cuenta los conocimientos viales, la validez de contenido a
diferencia de la validez interna, se verifica en forma cualitativa y
subjetiva, se aprecia por medio de la opinión de jurados o juicio de
expertos que son personas conocedoras del tema que se investiga y
de la metodología.

4.1.1. Validez por juicio de expertos

Es un tipo de evaluación de la construcción del instrumento de


medición por medio de personas expertas en el tema y en
metodología de la investigación, el juicio de expertos se define como

una opinión informada


son reconocidas por otrosdecomo
personas con cualificados
expertos trayectoria en
enellatema, quey
materia
que pueden dar información, evidencia, juicios y valoraciones, los
requisitos que debe tener el jurado son:

Expertos en el tema

Expertos en metodología

Expertos en el tema:
Son personas que conocen la materia que se desarrolla en la tesis,
debemos señalar que la metodología es aplicable a cualquier ciencia,
por ello además de la metodología la persona que evalúa un
instrumento debe tener conocimientos sobre la materia que se
estudia.
Expertos en metodología:
Implica el conocimiento de metodología de la investigación, la
persona que cumple el papel de un jurado, necesita tener amplios

104 www.aacentrum.com
Índice
Francisco Guillermo Sánchez Espejo

conocimientos sobre metodología de la investigación, considero que


esta es la parte más difícil, debido a que evaluar un instrumento
requiere de entender el propósito y objeto de la investigación y su
correlación con las preguntas del cuestionario.

4.1.2. Validación con la V de Aiken

Es una operación estadística que permite evaluar la calificación


que realizan los expertos sobre la validación de contenido del
instrumento, debemos recordar que la validación de contenido a
diferencia de la validación interna, se trata de una evaluación
cualitativa,
cualitativ a, sin embargo el resultado de la evaluación puede ser objeto
de medición estadística,
estadísti ca, hay varias formas de medir la evaluación que

realiza
embargo,unentre
jurado sobre la construcción
las principales de un tenemos
formas de medición instrumento,
a la Vsin
de
Aiken, que es un estadístico que nos permite cuantificar las opiniones
que tienen los jueces, mediante una escala que varía desde 0 que es el
total desacuerdo
desacuer do de los jueces al 1 que es el total acuerdo de los jueces,
así se tiene:

0 1
Total Total
desacuerdo acuerdo
Formula:

V=

(−)
Donde:
V = Valor de la v de Aiken

S = Sumatoria de s1

N = Número de jueces
105 www.aacentrum.com
Estadística para tesis Índice

C = Número de valores de la escala de valoración (muy en


desacuerdo, en desacuerdo, etc)
Importante:

La V de Aiken se utiliza para medir o cuantificar la opinión de los


jueces que opinan sobre la validez de un instrumento, es decir
varias opiniones sobre un mismo objeto.

**Se recomiendan por lo general un promedio de 8 jueces**


Ejemplo:
El cuestionario a evaluar tiene
16 preguntas o ítems, en las cuales ha sido evaluado conforme a 5
niveles de respuesta (c) que son:
1.- Totalmente en desacuerdo
2.- En desacuerdo
3.- Ninguno
4.- De acuerdo
5.- Totalmente de acuerdo
Los reactivos para la evaluación son:
Claridad en la redacción de la pregunta
Representatividad
Representatividad del factor

Claridad en la pregunta:
En este aspecto, el jurado verifica que la pregunta sea entendible,
que el encuestado no tenga dudas sobre lo que se trata, debe tenerse
presente que en muchos casos el instrumento se aplicará a
determinada población que tiene un perfil cognoscitivo, así, puede

tratarse de alumnos de primaria, alumnos de secundaria, padres de


106 www.aacentrum.com
Índice
Francisco Guillermo Sánchez Espejo

familia, etc, entonces el jurado evaluador debe evaluar el grado de


entendimiento del encuestado en relación a las preguntas que se
realizan.

La claridad en la pregunta es la falta de oscurismo,


oscu rismo, que las palabras
sean simples y fáciles de entender, que el mensaje sea entendible y de
lugar a respuestas abiertas o cerradas previstas en el instrumento.
Representatividad
Representatividad del factor:
Esto significa que la pregunta represente al tema, que las
preguntas sean útiles, pues cada pregunta llena un espacio que
consolida los objetivos de la investigación, por tanto, el jurado debe
entender cuál es el propósito del estudio, los objetivos y las hipótesis
que busca probar el investigador y que el instrumento de medición
cumpla con el objetivo y se relacione con la verificación de la hipótesis
que será probada mediante la operación estadística correspondiente.
Cuestionario
Nombres y Apellidos:___________________________________
Fecha:________________________
A continuación, debe indicar marcando con una X el grado de acuerdo o
desacuerdo con la pregunta del cuestionario.

Totalmente en desacuerdo = 1
En desacuerdo = 2
Ninguno = 3
De acuerdo =4
Totalmente de acuerdo = 5

El presente cuestionario permitirá conocer las opiniones de los jurados


sobre la claridad de las preguntas y representatividad del factor.

107 www.aacentrum.com
Estadística para tesis Índice

VALIDACIÓN POR V DE AIKEN

Criterios de evaluación

• Claridad en la redacción del ítem


• Representatividad del factor

Cuestionario a evaluar: LA INCORPORCION DE LA REPARACIÓN DEL


DAÑO EN EL PROCEDIMIENTO
ADMINISTRATIVO
ADMINISTR ATIVO DISCIPLINARIO QUE
REGULA LA LEY 30057, LEY DEL SERVICIO CIVIL

1 2 3 4 5

Muy en En De Muy de
desacuerdo desacuerdo Ninguno acuerdo acuerdo

AFIRMACIONES Claridad en la Representatividad



redacción del item del factor

V1: Reparación del daño 1 2 3 4 5 1 2 3 4 5

Dimensión 1: Reposición del bien


¿Está usted de acuerdo
en que la falta
regulación de de la
reposición del bien en la
ley 30057 Ley del
1
Servicio Civil evita que
el Estado pueda
recuperar su patrimonio
afectado por la conducta
del infractor?
¿Está usted de acuerdo
que en el procedimiento
administrativo
2
disciplinario se exija al
infractor junto a la
sanción la reparación

108 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice

del bien afectado por la


conducta del infractor?
¿Está usted de acuerdo
en que la exigencia de
reposición del bien
3
dañado en la vía judicial
es un proceso lento e
ineficiente?
¿Está usted de acuerdo
en que la exigencia de
reposición del bien
4
dañado en la vía judicial
podría prescribir por la
lentitud de este proceso?
¿Está usted de acuerdo
en que la exigencia de la
reposición del bien
dañado en la vía
5
administrativo
disciplinaria
célere y mássería más
eficiente
que en la vía judicial?
Dimensión 2: El pago del valor del bien
¿Está usted de acuerdo
en que la falta de
regulación del pago del
valor del bien en la ley
30057 Ley del Servicio
6
Civil evita que el Estado
pueda recuperar su
patrimonio afectado por
la conducta del
infractor?

¿Está
que enusted de acuerdo
el procedimiento
administrativo
disciplinario se exija al
7 infractor junto a la
sanción del pago del
valor del bien afectado
por la conducta del
infractor?
¿Está usted de acuerdo
en que la exigencia del
pago del valor del bien
8
en la vía judicial es un
proceso lento e
ineficiente?

109 www.aacentrum.com
Estadística para tesis Índice
¿Está usted de acuerdo
en que la exigencia del
pago del valor del bien
9
en la vía judicial podría
prescribir por la lentitud
de este proceso?
¿Está usted de acuerdo
en que la exigencia del
pago del valor del bien
10 en la vía administrativo
disciplinaria sería más
célere y más eficiente
que en la vía judicial?
V2: Modificación legislativa
Dimensión 1: Justificada / Injustificada
¿Está usted de acuerdo
en que el procedimiento

sancionador
la ley 30057,queLeyregula
del
11
Servicio Civil se enfoca
en el castigo al infractor
y desprotege el
patrimonio del Estado?
¿Está usted de acuerdo
en que la reposición del
bien o el pago de su
12 valor exigidos en la
sanción administrativa
protegería el patrimonio
del estado?
¿Está usted de acuerdo
en que la reparación
13 civil está compuesta por
la reparación del daño y
la indemnización de los
daños y perjuicios?
¿Está usted de acuerdo
en que la reparación del
daño implica la
14
reposición del bien y si
no fuera posible el pago
de su valor?
¿Está usted de acuerdo
en que la reparación del
15 daño sea también
exigible en la vía
administrativo
110 www.aacentrum.com
Francisco Guillermo Sánchez Espejo
Índice
disciplinaria, en cambio
la exigencia de los daños
y perjuicios sea
exclusivo de la vía
judicial?
¿Está usted de acuerdo
en que se justifica la
16 modificación legislativa
conforme al proyecto de
ley que se adjunta?
Indique sus observaciones:
……………………………………………………………………………………

……………………………………………………………………………………

TOTAL

TOTAL, EN PORCENTAJE

Valores de la V de Aiken
Entre los valores se tiene la siguiente escala:
De 0 a 0.25 Validez muy baja
De 0.25 a 0.5 Validez Baja
De 0.5 a 0.75 Válida
De 0.75 a 1 Validez Alta
Lo recomendable para la validación de un cuestionario, es que la
evaluación tenga un nivel superior a 0.75, es decir un nivel alto.
Como siguiente paso, elaboramos
elaboram os la matriz de evaluación en Excel,
donde:
V= Variables J= Jueces Pv= Promedio de
la variable
I = Indicadores Pr= Promedio de las Pt= Promedio
preguntas total
P= Preguntas Pi= Promedio de los

indicadores
111 www.aacentrum.com
Estadística para tesis Índice
Matriz:
V Reparación del daño Modificació
Modificación n legislativ
legislativaa
I Reposición Pago de su Justificada/Injustifica
Justificada/Injustificada
da

P 1 del
2 3bien4 5 6 7 valor
8 9 10 11 12 13 14 15 16
J1 5 5 4 3 4 4 5 4 5 5 4 5 3 5 4 5
J2 4 4 3 4 5 3 4 5 4 5 3 4 4 4 5 4
J3 5 5 4 3 4 4 5 4 5 4 4 4 4 4 4 5
J4 3 4 4 4 4 4 4 4 4 5 4 5 5 3 4 5
J5 4 4 3 4 5 3 4 5 4 5 3 5 4 4 5 4
J6 4 5 3 3 4 4 3 5 3 4 4 5 4 4 4 5
J7 5 4 4 4 5 4 5 5 5 4 4 5 5 5 5 5
Pr
Pi
Pv
Pt
En la matriz se puede apreciar a la variable “Reparación del daño”
con sus indicadores: Reposición del bien y pago de su valor, a la
variable “Modificación legislativa” y su indicador que es justificada o
injustificada, en total son 16 preguntas, por otro lado tenemos la
validación que han realizado 7 jueces o expertos. Teniendo así a la
matriz, transformamos los valores numéricos en valores
porcentuales, para ello le restamos el mínimo valor de la escala que
en este caso es 1 a cada una de las respuestas y las dividimos entre el
número de alternativas que es 5 menos 1 (que es el valor mínimo), es
decir dividimos todos los valores entre 4, de esta manera
convertiremos los valores escalares en porcentuale
porcentuales.
s.
Cuando hacemos la indicada resta y la división, cada uno de los
valores ordinales se transforman en valores porcentuales, así
tenemos:

Valores ordinales 1 2 3 4 5

112 www.aacentrum.com
Francisco Guillermo Sánchez Espejo Índice

Valores decimales 0 0.25 0.50 0.75 1

Valores 0% 25% 50% 75% 100%


porcentuales

El cambio de los valores ordinales a valores porcentuales se realiza


con la indicada operación (restar 1 y dividir entre 4 a todos los
valores). De esta manera el valor 1 para la evaluación de los jueces
equivale a 0, es decir 0%, el valor de 2 equivale a 0.25, esto es 25%, el
valor de 3 equivale a 0.50, esto es 50%, el valor de 4 equivale a 0.75,
esto es 75% y el 5 equivale a 1, esto es el 100%
Para restarle 1 a todos los valores de la matriz, vamos a Excel,
copiamos el número 1, seleccionamos todos los números que se van a
restar y vamos al desplegable de pegar y en la parte inferior saldrá
pegado especial.

Hacemos clic en pegado especial y nos abrirá la siguiente ventana


con varias alternativas sobre operaciones que se puede hacer, sin
embargo nosotros debemos seleccionar “restar” que es la
operación que nos interesa realizar y luego aceptar, con esta
operación se restará uno a todos los números que fueron
seleccionados.

113 www.aacentrum.com
Estadística para tesis Índice

El cuadro de pegado especial es el siguiente:

Luego, hacemos la misma operación, copiamos el número cuatro


que resulta de restarle uno (mínimo valor) a cinco (máximo valor),
para ello seleccionamos nuevamente todos los valores, vamos a
pegado especial y seleccionamos dividir y aceptar, la operación
permitirá que todos los valores se conviertan en porcentajes.
Al dividir entre cuatro tenemos que el 100% es igual a uno, que a
su vez se ha dividido en cuartiles que son: 0.25, 0.5 y 0.75 con el 0 y el
1 en los extremos, estos valores ahora convertidos en porcentajes
permitirán que se halle el valor promedio hasta encontrar el
promedio de toda la tabla conforme al ejemplo del siguiente cuadro:

Luego hacemos la misma operación, pero esta


est a vez dividiendo todo
con el número 4, esto es (5-1) que es el número de alternativas que
tenían los jurados en su evaluación menos uno. Obteniendo el
siguiente cuadro:

114 www.aacentrum.com
Índice
Francisco Guillermo Sánchez Espejo

Donde también procedemos a sacar los promedios de todas las preguntas, luego por indicadores, luego por
variable y por último sacamos el total, así tenemos:

Promedio de pregunta Promedio de indicador Promedio del cuestionario Promedio de variable


Donde se obtiene un promedio total de 0.81, que es un valor alto debido a su proximidad al número 1

115 www.aacentrum.com

Estadística para tesis


Índice

4.1.3. Validación con Lawshe

Es un método de cuantificación de la validación que realizan los


expertos sobre los valores de la validez de un instrumento, para lo
cual se evalúa en tres aspectos del instrumento:
Que sea:
Esencial
Útil pero no esencial
No necesaria

Para el cálculo solo se utiliza las valoraciones de esenciales que


tiene la pregunta a criterio del juez.
Importante:
Es muy importante señalar que, en este tipo de cálculo, la
validación se realiza ítem
íte m por ítem, es decir la aplicación de la fórmula
se realiza para cada pregunta y no en su conjunto.
**Se recomienda que la evaluación sea hecha por 10 jueces en
promedio**
Fórmula:

CVR =
−/
/
Dónde:
CVR = Razón de validez de contenido

N = Número de expertos
Ne = Número de expertos que indican esencial
Valores mínimos de una validación:

116 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice

La validación por Lawshe, sigue un valor mínimo que deben tener


las preguntas según el número de expertos, cuando el valor está por
debajo de este valor mínimo, entonces requiere cambiar o modificar
la pregunta, los valores mínimos son los siguientes:
Número de expertos Valor mínimo
5 0.99
6 0.99
7 0.99
8 0.85
9 0.78
10 0.62
11 0.59
Ejemplo de evaluación de un cuestionario:
VALIDACIÓN POR LAWSHE

Criterios de evaluación

• Esencial
• Útil pero no esencial

Noanecesaria
Cuestionario evaluar: LA INCORPORCION DE LA REPARACIÓN DEL
DAÑO EN EL PROCEDIMIENTO
ADMINISTRATIVO
ADMINISTRATIVO DISCIPLINARIO QUE
REGULA LA LEY 30057, LEY DEL SERVICIO
CIVIL

N° AFIRMACIONES Esencial Útil pero No


no necesaria
V1: Reparación del daño esencial
Dimensión 1: Reposición del bien
¿Está usted de acuerdo en que la
falta de regulación de la reposición
del bien en la ley 30057 Ley del
1 Servicio Civil evita que el Estado 8 2 0
pueda recuperar su patrimonio
afectado por la conducta del
infractor?
¿Está usted de acuerdo que en el
procedimiento administrativo
2 7 2 1
disciplinario se exija al infractor
junto a la sanción llaa reparación del

117 www.aacentrum.com

Estadística para tesis

bien afectado por la conducta del


infractor?
¿Está usted de acuerdo en que la
exigencia de reposición del bien
3 10 0 0
dañado en la vía judicial es un
proceso lento e ineficiente?
¿Está usted de acuerdo en que la
exigencia de reposición del bien
4 dañado en la vía judicial podría 10 0 0
prescribir por la lentitud de este
proceso?
¿Está usted de acuerdo en que la

5 exigencia
dañado ende lala reposición del bien
vía administrativo 10 0 0
disciplinaria sería más célere y más
eficiente que en la vía judicial?
Dimensión 2: El pago del valor del bien
¿Está usted de acuerdo en que la
falta de regulación del pago del
valor del bien en la ley 30057 Ley
6 del Servicio Civil evita que el 9 1 0
Estado pueda recuperar su
patrimonio afectado por la
conducta del infractor?
¿Está usted de acuerdo que en el
procedimiento administrativo
7 disciplinario
junto se exija
a la sanción del pa al
go infractor
pago del valor 10 0 0
del bien afectado por la conducta
del infractor?
¿Está usted de acuerdo en que la
exigencia del pago del valor del
8 10 0 0
bien en la vía judicial es un proceso
lento e ineficiente?
¿Está usted de acuerdo en que la
exigencia del pago del valor del
9 bien en la vía judicial podría 9 1 0
prescribir por la lentitud de este
proceso?
¿Está usted de acuerdo en que la
exigencia del pago del valor del
10 bien en la vía administrativo 10 0 0
disciplinaria sería más célere y más
eficiente que en la vía judicial?
V2: Modificación legislativa
Dimensión 1: Justificada / Injustificada

118 www.aacentrum.com

Francisco Guillermo Sánchez Espejo

¿Está usted de acuerdo en que el


procedimiento sancionador que
regula la ley 30057, Ley del Servicio
11 10 0 0
Civil se enfoca en el castigo al
infractor y desprotege el
patrimonio del Estado?
¿Está usted de acuerdo en que la
reposición del bien o el pago de su
12 valor exigidos en la sanción 8 2 0
administrativa protegería el
patrimonio del estado?
¿Está usted de acuerdo en que la

13 reparación civil está


la reparación delcompuesta
daño y por
la 10 0 0
indemnización de los daños y
perjuicios?
¿Está usted de acuerdo en que la
reparación del daño implica la
14 9 1 0
reposición del bien y si no fuera
posible el pago de su valor?
¿Está usted de acuerdo en que la
reparación del daño sea también
exigible en la vía administrativo
15 10 0 0
disciplinaria, en cambio la
exigencia de los daños y perjuicios
sea exclusivo de la vía judicial?
¿Está usted de acuerdo en que se
16
justifica la modificación legislativa 10 0 0
conforme al proyecto de ley que se
adjunta?
Indique sus observaciones:
……………………………………………………………………………………
……………………………………………………………………………………
TOTAL 150 9 1

TOTAL, EN PORCENTAJE

Aplicando la fórmula:
−/
CVR = /
Dónde:
CVR = Razón de validez de contenido
N = Número de expertos

119 www.aacentrum.com

Estadística para tesis

Ne = Número de expertos que indican esencial

En la pregunta 1.- CVR =


−/ = 0.6
/
En la pregunta 2.- CVR = 7−/
/ = 0.4
En la pregunta 9.- CVR = −/
/ = 0.8
Y así sucesivamente vamos calculando para cada pregunta
Acopio de la información
Pregunta Útil Resultado
1 8 0.6
2 7 0.4
3 10 1
4 10 1
5 10 1
6 9 0.8
7 10 1
8 10 1
9 9 0.8
10 10 1
11 10 1
12 8 0.6
13 10 1
14 9 0.8
15 10 1
16 10 1
Conclusión:
Efectuado los cálculos, tenemos que siendo 10 los jueces, requiere
ser corregido las preguntas: 1, 2 y 12 Por no superar el valor de
0.62, en cambio las pregunta 3 alcanzó el máximo nivel que es 1
igual que la pregunta 4, la pregunta 5 alcanzó un valor de 0.8 que
es superior a 0.62 por tanto es conforme, así las demás preguntas
se encuentran aprobadas menos la 12 que tiene un valor de 0.6

120 www.aacentrum.com

Francisco Guillermo Sánchez Espejo

Conclusión:
Efectuado los cálculos, tenemos que siendo 10 los jueces, requiere
ser corregido las preguntas: 1, 2 y 12 Por no superar el valor de
0.62, en cambio las pregunta 3 alcanzó el máximo nivel que es 1
igual que la pregunta 4, la pregunta 5 alcanzó un valor de 0.8 que
es superior a 0.62 por tanto es conforme, así las demás preguntas Índice
se encuentran aprobadas menos la 12 que tiene un valor de 0.6

4.1.4. Validación con prueba binomial

Este tipo de prueba que compara las frecuencias observadas de las


dos categorías de una variable dicotómica con las frecuencias
esperadas en una distribución binomial con un parámetro de
probabilidad especificado, para ello es necesario que las variables a
contrastar sean numéricas. En la validación de un instrumento, la
prueba binomial permite calcular si se alcanza la proporción de
validación que por lo general es de 85%, la prueba binomial se utiliza
en variables nominales.
Ejemplo:

VALIDACIÓN CON PRUEBA BINOMIAL


Criterios de evaluación

• Pertinencia
• Relevancia
• Claridad
Cuestionario a evaluar: LA INCORPORCION DE LA REPARACIÓN DEL
DAÑO EN EL PROCEDIMIENTO
ADMINISTRATIVO
ADMINISTRATIVO DISCIPLINARIO QUE
REGULA LA LEY 30057, LEY DEL SERVICIO
CIVIL

N AFIRMACIONES Pertine Relevanc Claridad OBS


° ncia ia
V1: Reparación del daño N
SI SI NO SI NO
O

121 www.aacentrum.com

Estadística para tesis

Dimensión 1: Reposición del bien


¿Está usted de acuerdo en
que la falta de regulación de
la reposición del bien en la
ley 30057 Ley del Servicio
1
Civil evita que el Estado
pueda recuperar su
patrimonio afectado por la Índice
conducta del infractor?
¿Está usted de acuerdo que
en el procedimiento

2 administrativo disciplinario
se exija al infractor junto a la
sanción la reparación del
bien afectado por la
conducta del infractor?
¿Está usted de acuerdo en
que la exigencia de
3 reposición del bien dañado
en la vía judicial es un
proceso lento e ineficiente?
¿Está usted de acuerdo en
que la exigencia de
reposición del bien dañado
4
en la vía judicial podría
prescribir
este por la lentitud de
proceso?
¿Está usted de acuerdo en
que la exigencia de la
reposición del bien dañado
5 en la vía administrativo
disciplinaria sería más célere
y más eficiente que en la vía
judicial?
Dimensión 2: El pago del valor del bien
¿Está usted de acuerdo en
que la falta de regulación del
pago del valor del bien en la
ley 30057 Ley del Servicio
6
Civil evita que el Estado
pueda recuperar su
patrimonio afectado por la
conducta del infractor?
¿Está usted de acuerdo que
en el procedimiento
7
administrativo disciplinario
se exija al infractor junto a la

122 www.aacentrum.com

Francisco Guillermo Sánchez Espejo

sanción del pago del valor


del bien afectado por la
conducta del infractor?
¿Está usted de acuerdo en
que la exigencia del pago del
8 valor del bien en la vía
judicial es un proceso lento e
ineficiente?
¿Está usted de acuerdo en
que la exigencia del pago del
9 valor del bien en la vía
judicial podría prescribir por Índice
la lentitud
¿Está usteddede
esteacuerdo
proceso?en
que la exigencia del pago del
valor del bien en la vía
1
0
administrativo disciplinaria
sería más célere y más
eficiente que en la vía
judicial?
V2: Modificación legislativa
Dimensión 1: Justificada / Injustificada
¿Está usted de acuerdo en
que el procedimiento
sancionador que regula la
11 ley 30057, Ley del Servicio
Civil se enfoca en el castigo
al infractor y desprotege el
patrimonio del Estado?
¿Está usted de acuerdo en
que la reposición del bien o
1 el pago de su valor exigidos
2 en la sanción administrativa
protegería el patrimonio del
estado?
¿Está usted de acuerdo en
que la reparación civil está
1
3 compuesta por la reparación
del daño y la indemnización
de los daños y perjuicios?
¿Está usted de acuerdo en
que la reparación del daño
1
4
implica la reposición del
bien y si no fuera posible el
pago de su valor?
1 ¿Está usted de acuerdo en
5 que la reparación del daño

123 www.aacentrum.com

Estadística para tesis

sea también exigible en la vía


administrativo disciplinaria,
en cambio la exigencia de los
daños y perjuicios sea
exclusivo de la vía judicial?
¿Está usted de acuerdo en
que se justifica la
1
modificación legislativa
6
conforme al proyecto de ley
que se adjunta?
Índice
Indique sus observaciones:
……………………………………………………………………………………

……………………………………………………………………………………

TOTAL

TOTAL, EN PORCENTAJE
El consolidado de la evaluación de los 3 jueces sería el siguiente:
V1 Reparación del daño
I1 Reposición del bien
J1 J2 J3
P1 si si si
P2 si si si
P3 no no no
P4 si si si
P5 si si si
I2 Pago de su valor
P6 si si si
P7 si si si
P8 si no no
P9 si si si
P10 si si si
Modificación legislativa
Justificada injustificada
injustificada
P11 si si si
P12 si si si
P13 si si si
P14 si si si

124 www.aacentrum.com

Francisco Guillermo Sánchez Espejo

P15 si si si
P16 si si si
Si 15 14 14
No 1 2 2
A. Prueba binomial para el juez 1
Paso 1:
Índice
Formulación de las hipótesis:

H0 = La validación del instrumento por el Juez 1 es igual a 85%


H1 = La validación del instrumento por el Juez 1 es diferente a 85%
Postulado:
Aceptamos la H0 y rechazamos la H1 si la significancia ≥ 0.05, de lo
0 1
contrario rechazamos la H0 y aceptamos la H1
Pasamos al SPSS

En la vista variables seria del siguiente modo:

Luego:
Vamos a “Datos”, “Ponderar casos” y obtendremos el siguiente
cuadro:
125 www.aacentrum.com

Estadística para tesis

Índice

En este cuadro damos clic en “Ponderar casos mediante” y


pasamos la variable Juez_1 al cuadro de la derecha y aceptar.
Luego:
“Analizar”, “Pruebas no paramétricas”, “Cuadro de diálogos
antiguos , Binomial y obtendremos el siguiente cuadro:

Pasamos la variable criterio a la “Lista variables de prueba” y


cambiamos la “Proporción de prueba” que por defecto se
encuentra en 0.5 y la cambiamos a 0.85, que es igual a 85%, luego
aceptamos, obteniendo en el visor del SPSS el siguiente resultado:
Resultado de evaluación del Juez 1:

126 www.aacentrum.com

Francisco Guillermo Sánchez Espejo

Prueba binomial

Categ Prop. Prop. de Significación exacta


oría N observada prueba (unilateral)

CRITE Grupo 1 SI 15 ,94 ,85 ,284


RIO Grupo 2 NO 1 ,06

Total 16 1,00
Índice

Paso 3
Elaboramos el resultado:
Tenemos que la significancia es 0.284 que es mayor a 0.05, motivo
aceptamos la H0, es decir que “La validación del
por el cual aceptamos
instrumento por el Juez 1 es igual a 85%
B. Prueba binomial para el juez 2
Paso 1:
Formulación de las hipótesis:
H0 = La validación del instrumento por el Juez 2 es igual a 85%
H1 = La validación del instrumento por el Juez 2 es diferente a 85%
Postulado:
Aceptamos la H0 y rechazamos la H1 si la significancia ≥ 0.05, de lo
contrario rechazamos
rechazamos la H0 y aceptamos la H1
Luego:
Vamos a “Datos”, “Ponderar a casos” y obtendremos el siguiente
cuadro:

127 www.aacentrum.com

Estadística para tesis

En este cuadro damos clic en “Ponderar casos mediante” yÍndice


pasamos la variable juez_2 al cuadro de la derecha y aceptar.
Luego:
“Analizar”, “Pruebas no paramétricas”, “Cuadro de diálogos
antiguos”, “Binomial” y obtendremos el siguiente cuadro:

Pasamos la variable criterio a la “Lista variables de prueba” y


cambiamos la “Proporción de prueba” cambiándola a 0.85, que es
igual a 85%, luego aceptamos, obteniendo en el visor del SPSS el
siguiente resultado:
128 www.aacentrum.com

Francisco Guillermo Sánchez Espejo

Resultado de evaluación del Juez 2:

Prueba binomial

Categ Prop. Prop. de Significación exacta


oría N observada prueba (unilateral)

CRITE Grupo 1 SI 14 ,88 ,85 ,561


RIO Grupo 2 NO 2 ,13

Total 16 1,00

Índice

Paso 3
Elaboramos el resultado:
Elaboramos el resultado:
Tenemos que la significancia es 0.561 que es mayor a 0.05, motivo
por el cual aceptamos la H0, es decir que “La validación del
instrumento por el Juez 2 es igual a 85%”

C. Prueba binomial para el juez 3


Siendo los valores los mismos que para el juez 2, podemos afirmar
que “La validación del instrumento por el juez 3 es igual a 85%”

En conclusión:
Los tres jueces han pasado la prueba, motivo por el cual podemos
afirmar que el instrumento tiene una validez aceptable.

4.1.5. Kappa de Kohen

El estadístico Kappa de Kohen, mide la concordancia entre dos


variables que se relacionan, estas variables vienen de medir a un
mismo objeto de estudio, esto puede ocurrir cuando por ejemplo dos
jueces califican la validez de un mismo instrumento, el índice de
Kappa de Kohen mide la concordancia de una relación de variables

129 www.aacentrum.com

Estadística para tesis

que ya se verificó, esto quiere decir que no se usa para establecer si


existe o no asociación, pues para eso usamos la chi cuadrada,
cuadrad a, sino que
conociendo la existencia de asociación, medimos la concordancia
entre las variables, motivo por el cual se usa para medir la
concordancia entre las evaluaciones de los jueces.

Fórmula: K=
−
−
Donde:
Po = Es el acuerdo observado relativo entre los observado
observadores
res
Índice
Pe = Es la probabilidad hipotética de acuerdo por el azar
Índice de concordancias:
Muy Baja Baja Moderada Buena Alta

0 0.2 0.4 0.6 0.8 1

En el SPSS el índice de concordancia lo encontramos en la


siguiente ubicación:

Medidas simétricas

Error estandarizado T Significación


Valor asintóticoa aproxb aproximada

Medida de acuerdo Kappa ,052 ,009 5,220 ,000


N de casos válidos 1351

a. No se presupone la hipótesis nula.


b. Utilización del error estándar asintótico que presupone la hipótesis nula.

Indica el p valor de
la chi cuadrada
Tenemos el valor de la chi cuadrada, porque el estadístico también
lo mide y no porque sea lo mismo que la Kappa de Cohen. En este

130 www.aacentrum.com

Francisco Guillermo Sánchez Espejo

caso la concordancia es muy baja, pues es de 0.052, pero eso no


significa que no haya relación, hay, pero es bien baja.

Ejemplo:
Supongamos que dos jueces han evaluado al siguiente
cuestionario:
Cuestionario
Nombres y Apellidos:___________________________________
Apellidos:___________________________________ Índice
Fecha:________________________
A continuación, debe indicar marcando con una X el grado de acuerdo o
desacuerdo con la pregunta del cuestionario.
Calificación del juez 1

VALIDACIÓN POR JURADO


Criterios de evaluación

Cuestionario a evaluar: LA INCORPORCION DE LA REPARACIÓN DEL


DAÑO EN EL PROCEDIMIENTO
ADMINISTRATIVO
ADMINISTRA TIVO DISCIPLINARIO QUE
REGULA LA LEY 30057, LEY DEL SERVICIO CIVIL

N AFIRMACIONES
° d n a a
í
d a a
d ó
ci
a
ci ci a
ci g
a
ci o
i
a d d n o d
d v
i il a
z en et en l
o
n
e e
V1: ri i a i cii si er d n
al etj u n
a s h o i
rt
m
o
Reparación C b ct g u
f n
o o t
e e r
O A r S C P P
del daño O C M

Dimensión 1: Reposición del bien


¿Está usted de
acuerdo en que
la falta de
regulación de
1 la reposición 75 85 90 80 95 100 80 85 75 85
del bien en la
ley 30057 Ley
del Servicio
Civil evita que

131 www.aacentrum.com

Estadística para tesis

el Estado
pueda
recuperar su
patrimonio
afectado por la
conducta del
infractor?
¿Está usted de
acuerdo que en
el
procedimiento
administrativo

2 disciplinario
exija se
al 65 80 75 95 100 70 85 75 90 81
infractor junto Índice
a la sanción la
reparación del
bien afectado
por la conducta
del infractor?
¿Está usted de
acuerdo en que
la exigencia de
reposición del
3 bien dañado en 85 90 70 65 95 85 90 100 75 83
la vía judicial
es un proceso
lento e
ineficiente?
¿Está usted de
acuerdo en que
la exigencia de
reposición del
bien dañado en
4 70 80 95 75 100 85 70 95 90 84
la vía judicial
podría
prescribir por
la lentitud de
este proceso?
¿Está usted de
acuerdo en que
la exigencia de
la reposición
del bien
5 95 75 80 95 100 85 70 65 100 85
dañado en la
vía
administrativo
disciplinaria
sería más

132 www.aacentrum.com

Francisco Guillermo Sánchez Espejo

célere y más
eficiente que en
la vía judicial?
Dimensión 2: El pago del valor del bien
¿Está usted de
acuerdo en que
la falta de
regulación del
pago del valor
del bien en la
ley 30057 Ley
del Servicio
6 85 70 90 100 85 75 99 95 80 86
Civil
el evita que
Estado
pueda Índice
recuperar su
patrimonio
afectado por la
conducta del
infractor?
¿Está usted de
acuerdo que en
el
procedimiento
administrativo
disciplinario se
7 exija
infractor juntoal 80 75 85 70 95 100 90 75 80 83
a la sanción del
pago del valor
del bien
afectado por la
conducta del
infractor?
¿Está usted de
acuerdo en que
la exigencia del
pago del valor
8 del bien en la 95 90 100 80 75 85 60 100 85 85
vía judicial es
un proceso
lento e
ineficiente?
¿Está usted de
acuerdo en que
la exigencia del
9 70 85 90 100 75 85 80 90 95 85
pago del valor
del bien en la
vía judicial

133 www.aacentrum.com

Estadística para tesis

podría
prescribir por
la lentitud de
este proceso?
¿Está usted de
acuerdo en que
la exigencia del
pago del valor
del bien en la
vía
10 65 95 100 70 85 90 95 80 100 86
administrativo
disciplinaria
sería
célere y más más
eficiente que en
Índice
la vía judicial?
V2: Modificación legislativa
Dimensión 1: Justificada / Injustificada
¿Está usted de
acuerdo en que
el
procedimiento
sancionador
que regula la
ley 30057, Ley
11 del Servicio 75 80 95 70 85 100 95 75 95 85
Civil se enfoca
en el castigo al
infractor y
desprotege el
patrimonio del
Estado?
¿Está usted de
acuerdo en que
la reposición
del bien o el
pago de su
12 valor exigidos 90 75 95 100 80 70 95 85 90 86
en la sanción
administrativa
protegería el
patrimonio del
estado?
¿Está usted de
acuerdo en que
13 95 75 100 80 95 85 70 90 80 85
la reparación
civil está

134 www.aacentrum.com

Francisco Guillermo Sánchez Espejo

compuesta por
la reparación
del daño y la
indemnización
de los daños y
perjuicios?
¿Está usted de
acuerdo en que
la reparación
del daño
implica la
14 70 85 100 75 90 85 95 100 80 86
reposición del
bien y si no
fuera posible el
pago de su
valor?
¿Está usted de
acuerdo en que
la reparación
del daño sea
también
exigible en la
vía
15 administrativo 75 80 75 85 100 95 70 95 90 85
disciplinaria,
en cambio la
exigencia de
los daños y
perjuicios sea
exclusivo de la
vía judicial?
¿Está usted de
acuerdo en que
se justifica la
modificación
16 80 70 75 95 100 90 80 75 70 81
legislativa
conforme al
proyecto de ley
que se adjunta?
Indique sus observaciones:

……………………………………………………………………………………

……………………………………………………………………………………

TOTAL

135 www.aacentrum.com

Estadística para tesis

TOTAL, EN
PORCENTAJE

Validación del juez 2

VALIDACIÓN POR JURADO

Criterios de evaluación

Cuestionario a evaluar: LA INCORPORCION DE LA REPARACIÓN DEL


DAÑO EN EL PROCEDIMIENTO
ADMINISTRATIVO
ADMINISTRA TIVO DISCIPLINARIO QUE
REGULA LA LEY 30057, LEY DEL SERVICIO CIVIL Índice
AFIRMACIONE
N n a a
S d d ó a ci a í a
° d a a ci ci ci g ci oi
a
d
d
i d
il a n en n
er
ol n ed
ri
v i a zi ei sti o
d
e
n
V1: al etj u n
a
ci s e
h o i
ret o
m
C b ct g u
f n
o o te r
Reparación O A r S C P P
O C M
del daño

Dimensión 2: Reposición del bien


¿Está usted de
acuerdo en que
la falta de
regulación de
la reposición
del bien en la
ley 30057 Ley
del Servicio
1 70 95 95 70 95 100 80 85 95 87
Civil evita que
el Estado
pueda
recuperar su
patrimonio
afectado por la
conducta del
infractor?
¿Está usted de
acuerdo que en
2 el 75 85 75 85 90 100 85 95 90 86
procedimiento
administrativo

136 www.aacentrum.com

Francisco Guillermo Sánchez Espejo

disciplinario se
exija al
infractor junto
a la sanción la
reparación del
bien afectado
por la conducta
del infractor?
¿Está usted de
acuerdo en que
la exigencia de
reposición del
3 bien dañado
la vía en
judicial 65 80 70 95 90 85 95 100 65 82
es un proceso
lento e Índice
ineficiente?
¿Está usted de
acuerdo en que
la exigencia de
reposición del
bien dañado en
4 60 85 95 85 90 80 100 95 90 86
la vía judicial
podría
prescribir por
la lentitud de
este proceso?
¿Está usted de
acuerdo en que
la exigencia de
la reposición
del bien
dañado en la
vía
5 75 85 90 95 100 85 90 65 80 85
administrativo
disciplinaria
sería más
célere y más
eficiente que
en la vía
judicial?
Dimensión 2: El pago del valor del bien
¿Está usted de
acuerdo en que
la falta de
6 regulación del 85 90 70 65 85 100 95 90 80 84
pago del valor
del bien en la
ley 30057 Ley

137 www.aacentrum.com

Estadística para tesis

del Servicio
Civil evita que
el Estado
pueda
recuperar su
patrimonio
afectado por la
conducta del
infractor?
¿Está usted de
acuerdo que en
el
procedimiento
administrativo
disciplinario se
7
exija al
80 75 67 65 95 100 100 75 85 82 Índice
infractor junto
a la sanción del
pago del valor
del bien
afectado por la
conducta del
infractor?
¿Está usted de
acuerdo en que
la exigencia del
pago del valor
8 del bien en la 65 90 70 85 75 85 65 100 85 80
vía judicial es
un proceso
lento e
ineficiente?
¿Está usted de
acuerdo en que
la exigencia del
pago del valor
del bien en la
9 70 65 80 100 85 85 70 90 90 81
vía judicial
podría
prescribir por
la lentitud de
este proceso?
¿Está usted de
acuerdo en que
la exigencia del
10 pago del valor 75 95 80 70 85 95 90 85 70 82
del bien en la
vía
administrativo

138 www.aacentrum.com

Francisco Guillermo Sánchez Espejo

disciplinaria
sería más
célere y más
eficiente que
en la vía
judicial?
V2: Modificación legislativa
Dimensión 1: Justificada / Injustificada
¿Está usted de
acuerdo en que
el
procedimiento
sancionador
que regula la Índice
ley 30057, Ley
11 85 80 90 75 85 100 90 75 95 86
del Servicio
Civil se enfoca
en el castigo al
infractor y
desprotege el
patrimonio del
Estado?
¿Está usted de
acuerdo en que
la reposición
del bien o el
pago de su
12 valor exigidos 75 95 90 100 85 70 90 80 90 86
en la sanción
administrativa
protegería el
patrimonio del
estado?
¿Está usted de
acuerdo en que
la reparación
civil está
compuesta por
13 75 95 65 80 75 100 70 90 80 81
la reparación
del daño y la
indemnización
de los daños y
perjuicios?
¿Está usted de
acuerdo en que
14 75 95 100 85 95 85 95 100 85 90
la reparación
del daño

139 www.aacentrum.com

Estadística para tesis

implica la
reposición del
bien y si no
fuera posible el
pago de su
valor?
¿Está usted de
acuerdo en que
la reparación
del daño sea
también
exigible en la

15 vía
administrativo 70 80 95 85 80 100 75 95 90 85
disciplinaria, Índice
en cambio la
exigencia de
los daños y
perjuicios sea
exclusivo de la
vía judicial?
¿Está usted de
acuerdo en que
se justifica la
modificación
16 85 75 70 85 90 100 80 95 70 83
legislativa

conforme al
proyecto de ley
que se adjunta?
Indique sus observaciones:
……………………………………………………………………………………

……………………………………………………………………………………

TOTAL

TOTAL, EN
PORCENTAJE

Luego de recabado los formularios de las evaluaciones realizadas


por los jurados a los instrumentos, se procede a realizar el cálculo de
concordancia.
Paso 1

140 www.aacentrum.com

Francisco Guillermo Sánchez Espejo

Formulación de las hipótesis:


H0 = No hay concordancia entre las evaluaciones del Juez 1 y el
Juez 2
H1 = Hay concordancia entre las evaluaciones del Juez 1 y el Juez
2
Nivel de significancia = 5% = 0.05
Índice
Postulado:
Si p < 0.05, rechazamos la hipótesis nula y aceptamos la hipótesis
alterna
Paso 2
Realizamos los cálculos:
Vamos a “Analizar”, “Estadísticos descriptivos”, y “Tablas de
contingencia”, donde aparecerá el siguiente cuadro:

Donde pasamos Juez 1 a filas y Juez 2 a columnas, en


“Estadísticos” seleccionamos Kappa y en “Casillas” en porcentajes
activamos total, luego aceptar y tendremos el siguiente cuadro:

Medidas simétricas

141 www.aacentrum.com

Estadística para tesis

Error estandarizado T Significación


Valor asintóticoa aproxb aproximada

Medida de acuerdo Kappa ,052 ,009 5,220 ,000


N de casos válidos 1351

a. No se presupone la hipótesis nula.


b. Utilización del error estándar asintótico que presupone la hipótesis nula.

Índice
Conclusión:
La medida Kappa de Cohen es 0.052, que es mayor a 0.05, por
tanto, rechazamos la hipótesis nula y aceptamos la alterna que dice
que existe concordancia entre la valoración del Juez 1 y la valoración
del Juez 2. Además, teniendo en cuenta el índice de concordancias:
Índice de concordancias:
Muy Baja Baja Moderada Buena Alta

0 0.2 0.4 0.6 0.8 1


Decimos que se tiene un índice de muy baja concordancia.

4.2. La validez interna

La validez interna se calcula estadísticamente mediante la


medición de la significancia
significanci a de las variables, para hallar la validez con

el SPSS, se realiza el siguiente procedimiento:


Para que una variable sea válida debe cumplir los siguientes
requisitos:
La comunalidad debe ser mayor a 0.4
La medida de adecuación KMO debe ser mayor a 0.5

142 www.aacentrum.com

Francisco Guillermo Sánchez Espejo

La prueba de esfericidad de Barltlett, en su grado de


significancia debe ser menor a 0.05

Lo cual se grafica del siguiente modo:


Operación Valor
Comunalidad > 0.4 (Mayor a 0.4)
KMO > 0.5 (Mayor a 0.5) Índice
Barltlett Significancia (Sig) < 0.05 (Menor a 0.05)
Además, debemos de tener en cuenta que la prueba de validez se
hace por el conjunto de preguntas correspondientes a una variable.
Procedimiento:
Primero vamos a “Analizar”, luego “Reducción de dimensiones”
y clic en “Factor”

Luego nos aparecerá la siguiente ventana

143 www.aacentrum.com

Estadística para tesis

Índice
Donde pasamos las variables al cuadro variables, luego clic en
descriptivos y nos saldrá el siguiente cuadro, donde activamos el
icono “KMO y prueba de esfericidad de Bartle
Ba rtlett”

Luego en continuar y aceptar y se tendrá los valores en el visor de


datos:
Analizando las comunalidades:

144 www.aacentrum.com

Francisco Guillermo Sánchez Espejo

Donde se puede apreciar que la pregunta 1 (P1) = 0.911,


0.91 1, P2 = 0.857,
P3 = 0.857, P4 = 0.889, que al ser mayor a o.4 tenemos el primer
indicador que considera la validez de las variables.
Índice
Analizando el KMO

Podemos apreciar que el KMO es 0.534 que es mayor a 0.5, por


tanto, según la teoría, en este segundo indicador también considera
válida a las variables.
Analizando la significancia

145 www.aacentrum.com

Estadística para tesis

El valor de la significancia es de 0.492, la teoría dice que para que


sea válida la variable, la significancia debe ser menor a 0.05, en este
caso la variable no cumple este tercer indicador motivo por el cual
podemos decir que no es completamente válida.
Conclusión
La muestra no es adecuada al instrumento y hay una deficiente
asociación de ítem con ítem.
146 www.aacentrum.com

Francisco Guillermo Sánchez Espejo


Índice

5 Prueba de
Hipótesis

5.1. Las hipótesis


La prueba de hipótesis es un cálculo necesario cuando se aplica un
cuestionario en una investigación de nivel explicativa. Las hipótesis
son la posible respuesta al problema que requiere ser probada en el
desarrollo de la investigación, por lo general se clasifican en dos: La
hipótesis general que es la hipótesis del problema de investigación y
las hipótesis específicas que derivan de los objetivos específicos, por
otro lado, tenemos la hipótesis de la investigación o de la tesis e
hipótesis que surgen para cálculos estadísticos.

Es la posible
Hipótesis General respuesta al
problema general
Clases de hipótesis
1 Es la posible
Hipótesis respuesta a los
Especifica problemas
especificos

La hipótesis general guía la investigación, debido a que la


investigación buscará probar
probar o no su afirmación.
Elementos de la hipótesis
La formulación de una hipótesis tiene dos elementos claramente
diferenciables,
diferenciables, estos son: Los antecedentes y la conjetura.

147 www.aacentrum.com

Índice
Estadística para tesis

Los antecedentes, son las razones o la justificación que tiene el


investigador para afirmar un posible resultado y la conjetura es la
propia afirmación del resultado.
Ejemplo:
Antecedentes:

Dado que, en la actualidad la ley 30057, Ley del Servicio Civil ° regula
en forma deficiente la reparación del daño
d año cometido por el funcionario
público en ejercicio de sus funciones, que el articulo 85 sanciona el
daño a las instalaciones y a todos los bienes que son propiedad del
Estado, que del análisis de las resoluciones de sanción expedidas por
el tribunal del servicio civil durante el 2019, ninguna resolución ordena
la reparación del daño, asimismo de la lectura del
d el artículo 97 de la Ley
del Servicio Civil se observa una ambigua redacción de la reparación
del daño que resulta inaplicable.

Conjetura:

Es posible que, existan deficiencias en la reparación del daño en el


procedimiento administrativo disciplinario que regula la ley 30057,
Ley del Servicio Civil, que justifique su modificación legislativa para
la defensa del patrimonio del Estado, Perú, 2019.

Una segunda clasificación, considera por un lado a las hipótesis


de la tesis, es decir que son las hipótesis que guían la investigació
investigaciónn y
por otro lado las hipótesis
hi pótesis de trabajo que se propone para un cálculo
estadístico, en el primer caso tenemos a la hipótesis general y a las
hipótesis específicas, en el segundo caso tenemos a la hipótesis nula
(H0) y a la hipótesis alterna (H1).
Puede ocurrir que la hipótesis general y las especificas puedan ser
planteadass como hipótesis de trabajo, esto cuando se requiera calcular
planteada
su confiabilidad, validez o cuando se requiera contrastar hipótesis.

148 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice

Hipótesis de la Corresponde a
investigación toda la
investigación
Clases de hipótesis
2
Hipótesis de Corresponde a un
trabajo problema
especifico

1.- Hipótesis de la investigación

Es la posible respuesta al problema general o a las preguntas


específicas y van a ser probadas o no durante el desarrollo de la
investigación,
investiga ción, también pueden ser probadas estadísticamente, pero se
requiere de la aplicación de un instrumento.
2.- Hipótesis de trabajo
Son hipótesis que no son de toda la investigación, sino son
hipótesis que se plantea a fin de encontrar la respuesta a un problema
específico y puntual, por ejemplo, se plantean para encontrar la
confiabilidad de un instrumento, de normalidad, de validez, etc, las
hipótesis que se plantean son: La hipótesis nula y la hipótesis alterna.
Hipótesis nula (H0)
Hipótesis alterna (H1)
También llamada hipótesis del investigador, es el posible
resultado que el investigador considera.
Valores que toman las hipótesis de trabajo
En la validez
La H0 = La variable es válida
La H1 = La variable no es válida
En la normalidad
La H0 = La variable tiene una distribución normal

149 www.aacentrum.com

Índice
Estadística para tesis

La H1 = La variable no tiene una distribución normal


En la prueba de hipótesis
La H0 = Las variables son independientes
La H1 = Las variables son dependientes

El investigador plantea RECHAZAR la hipótesis nula para


quedarse con la hipótesis alterna

Esto ocurre cuando el p-valor es menor del nivel de significancia,


entonces rechazamos la hipótesis nula y aceptamos la hipótesis
alterna
Debemos de tener en cuenta que:
Error del tipo I
Ocurre cuando se acepta la hipótesis del investigador cuando era
falsa.
Error del tipo II
Ocurre cuando se rechaza la hipótesis del investigador cuando
cuand o esta
era correcta.
Error tipo I y error tipo II

la Decisión con respeto a Ho


u Se acepta Se rechaza
n
iss Verdadera Decisión Error tipo I
et correcta
ó
ip Falsa Error tipo II Decisión
H correcta
El p-valor
Probabilidad de equivocarse si se acepta la hipótesis del
investigador, es decir que es la probabilidad de cometer el error tipo,
es la significancia en las tablas del SPSS.
150 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo

I. No debe ser mayor al valor del error establecido


convencionalmente.
Nivel de significancia (α)
Es el error de equivocarnos en rechazar una hipótesis cuando esta
era correcta, es la máxima cantidad de que estamos dispuestos a
aceptar para dar como válida la hipótesis del investigador,

5.2. La prueba de hipótesis de la Tesis


La prueba de hipótesis en forma estadística, tiene lugar cuando la
investigación corresponde al nivel explicativo, es decir cuando sus
variables están en una relación de causa y efecto, por tanto, la prueba
de hipótesis probará la relación de dependencia entre variables, eso
quiere decir que en las investigaciones descriptivas no se puede
probar la hipótesis en forma estadística, pero si se pueden plantear
hipótesis de trabajo (para cálculos estadísticos puntuales), pero no
para la hipótesis general (De toda la investigación). Tampoco quiere
decir que la prueba de hipótesis siempre será en forma estadística,
pues puede suceder casos donde la hipótesis se verifique mediante
argumentos lógicos y comparativos con la conclusión final.

La prueba de hipótesis de la tesis, es la comparación entre lo


planteado en la hipótesis con la conclusión a la cual arriba el
investigador

El investigador plantea las hipótesis en el proyecto de la


investigación, no por gusto, no es una simple propuesta, las hipótesis
tienen una importancia fundamental en la investigación, pues
permite predecir qué sucederá con el estudio, permite anticiparse a
un posible resultado, es una herramienta metodológica que ayuda al
desarrollo de la investigación, pero esta conjetura o posibilidad
planteada al inicio del estudio, debe ser verificada al término de la
investigación, esto puede hacerse en forma estadística si la
151 www.aacentrum.com

Estadística para tesis Índice

investigación corresponde al nivel explicativo, en el nivel


comparativo puede verificarse por comparación al igual que en el
nivel descriptivo (si tiene hipótesis).
Para probar la hipótesis general de una investigación del nivel
explicativo, se requiere seguir los siguientes pasos:
Paso 1: Debemos hallar el índice de normalidad
Es necesario establecer si las variables tienen una
distribución normal o no para elegir el estadístico aplicable
en la prueba de la hipótesis, así si tiene una distribución
normal, se aplicará la prueba de hipótesis de Spearman, en
cambio si no tuviera una distribución normal, se aplicará el
estadístico R de Pearson.
Paso 2: Contrastar las hipótesis
En esta operación se analiza la dependencia o influencia de
una variable sobre otra, el tipo de estadístico aplicable va a
depender si las variables tienen o no una distribución
normal.

5.3. Prueba de normalidad

La prueba de normalidad tiene por finalidad establecer si la


distribución de las variables corresponde a una distribución normal o
no, esto es necesario, pues dependiendo de ello, podemos escoger el
estadístico aplicable para realizar la prueba de hipótesis, pues de
tener una distribución normal se aplicará la R de Pearson y si la
distribución no es normal, se aplicará la Rho de Spearman.
La prueba de normalidad corresponde a la estadística inferencial,
compara la distribución acumulada empírica con la distribución
esperada si los datos fueran normales, si la diferencia es muy grande,
se rechaza la hipótesis nula que considera como una distribución
normal, así, se busca establecer si las medias se corresponden dentro
152 www.aacentrum.com

Francisco Guillermo Sánchez Espejo


Índice

de una distribución normal (ver distribución normal), el nivel de la


significancia es por lo general de 5% que es igual a: 0.05 y para
establecer que la variable tiene una distribución normal, es decir que
se acepta la hipótesis nula (H0), la significancia asintótica bilateral
(llamada también P valor) debe ser menor a 0.05. Para este estadístico
se tiene diferentes pruebas, pero la más usada para datos menores de
50 es Shapiro Wilk y para datos de 50 o más, se usa la prueba de
Kolmogorov Smirnov.
Postulado:

Si la significancia > 0.05 se acepta la H 0 que considera una distribución


normal de la variable
¿Para qué nos sirve conocer si una variable tiene o no una
distribución normal?
En primer lugar, es importante conocer el tipo de distribución que
tiene la variable a efectos de poder elegir el tipo de estadístico que se

le aplicara, paramétricos
estadísticos si tiene una ydistribución normal, los
si no se aplicará se estadísticos
le aplicará los
no
paramétricos.

Variable con dist. Estadistico


Normal paramétricos

Variable con dist. Estadisticos no


no normal paramétricos

En segundo lugar, es necesario conocer si tiene una distribución


normal o no porque permitirá elegir el estadístico correcto para
realizar el contraste de hipótesis, así si la variable tiene una
distribución
distribuc ión normal, se aplicará el estadístic
estadísticoo R de Pearson, en cambio

153 www.aacentrum.com

Estadística para tesis


Índice
si la distribución de la variable no es normal, aplicaremos el
estadístico Rho. de Spearma
Spearman.
n.

Variable con dist. Estadistico R de


Normal Pearson

Variable con dist. Estadistico Rho de


no normal Spearman

Datos para la prueba de normalidad


1.- La hipótesis nula siempre plantea la existencia de normalidad
y la hipótesis alterna que no existe normalidad.
H0 = La distribución es normal
H1 = La distribución no es normal
2.- El nivel de significancia = 5% que es igual a: 0.05
3.- Si el P valor < 0.05 se rechaza la hipótesis nula y se acepta la
alterna.
Formulación de las hipótesis
Para hacer el cálculo de la distribución se necesita en primer lugar
que se plantee las hipótesis que van a ser objeto de cálculo, así
tenemos:
H0 = Considera que la variable tiene una distribución normal

H1 = Considera que la variable no tiene una distribución normal


La significancia o p valor, va a depender del margen de error que
queramos asumir, si queremos asumir un error del 5% que es lo más
aceptable, diremos que la significancia o p valor no debe ser mayor a
0.05.

154 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice

5.3.1. Pasos para el cálculo de la


normalidad en el SPSS

Para el cálculo de la normalidad en el programa SPSS se siguen los


siguientes pasos:
1.- Cargamos los datos en la matriz del SPSS
El SPSS permite copiar de Word o Excel y pegar en su matriz,
en el presente caso se tiene una base de datos con la cual se
efectuó el cálculo de la regresión lineal.
En la vista de variables verificamos los siguientes valores:

2.- Planteamos las hipótesis


H0 = La variable tiene una distribución normal
H1 = La variable no tiene una distribución normal

155 www.aacentrum.com

Estadística para tesis Índice

3.- Efectuamos los cálculos


Vamos al menú del SPSS: “Analizar”, “Estadísticos descriptivos”
y “Explorar”
Donde tendremos el siguiente cuadro:

En el cuadro: pasamos las variables a la lista de dependientes,


luego clic en “Gráficos” y activamos la casilla “Gráficos con pruebas
de normalidad”, luego continuar y aceptar.
Entonces el visor de resultados del SPSS nos dará diferentes
cuadros y gráficos, pero el cuadro que nos interesa es la prueba de
normalidad, motivo por el cual debemos de ubicar el siguiente
cuadro:

156 www.aacentrum.com

Francisco Guillermo Sánchez Espejo


Índice

En este cuadro se resumen los valores de las dos variables. Para


datos mayores a 50 utilizamos Kolmogorov Smirnov y para datos
igual o menores de 50 utilizamos Shapiro Wilk, como en el presente
caso los datos son menores de 50, utilizamos Shapiro Wilk, donde
apreciamos que la significancia para las dos variables es mayor a
0.05, pues en el caso de la variable PBI la significancia es 0.949 y para
la variable ingresos la significancia es 0.929, por tanto aceptamos la
H0 y decimos que las variables tienen una distribución normal, por
tanto le es aplicable los estadísticos paramétri
paramétricos.
cos.
Debemos recordar que:

Si el valor de la significancia (sig.) llamado también p valor, es mayor a


0.05, entonces se acepta la H 0, entonces decimos que la variable tiene
una distribución normal, en cambio sí es menor se rechaza la H 0 y
decimos que la variable tiene una distribución no normal

5.3.2. Ejemplo de prueba de normalidad

Supongamos que en el siguiente cuadro queremos saber si las


variables corresponden
corresponden a una distribución normal o no:

Alumnos Preguntas
P1 P2 P3 P4
A1 1 1 1 0
A2 1 1 1 1
A3 0 0 0 1
A4 1 1 0 0

157 www.aacentrum.com

Estadística para tesis Índice

A5 0 0 0 0
A6 1 0 1 1
1.- Plantear las hipótesis
En primer lugar, planteamos las hipótesis, estableciendo para la
hipótesis nula (H0) una igualdad y para la hipótesis alterna (H 1),
una diferencia.
H0 = La distribución es normal
H1 = La distribución no es normal
2.- Llevamos los datos a la matriz del SPSS:
En este caso tenemos un cuestionario de 4 preguntas aplicado a 6
alumnos

3.- Hacemos los cálculos con el SPSS


Para ello vamos a: “Analizar”, “Estadísticos descriptivos” y
“Explorar”

Y obtendremos el siguiente cuadro, donde pasamos las preguntas


(P1, P2, P3 y P4) a la lista de dependientes de la derecha.

158 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo

En este caso P1, P2, P3 Y P4, son preguntas que evalúan a


una sola variable, sin embargo, para el programa SPSS cada
una se considera como una variable
Luego, pasamos las preguntas a la lista de dependientes:
Hacemos clic en “Gráficos” y activamos “Graficos de normalidad
con pruebas”, esto es muy importante para que nos salga las dos
pruebas, la de Shapiro Wilk y Kolmogorov Smirnov.

Luego continuar y aceptar y obtendremos el siguiente resultado:

159 www.aacentrum.com

Estadística para tesis Índice

Al ser aplicado el cuestionario a solo 6 personas que es menor a 50,


el estadístico aplicable es Shapiro Wilk y no Kolmogoro
Kolmogorovv Smirnov,
donde la significancia de todas las variables es menor a 0.05, por
tanto, la hipótesis nula se rechaza, es decir las variables son no
paramétricas
Conclusión
Las cuatro preguntas del cuestionario tienen una distribución no
normal.

5.3.3. Prueba de normalidad en grupos


segmentados

Este tipo de análisis se da cuando tenemos dentro de una variable,


grupos que requiere segmentarlos para su análisis de normalidad,
por ejemplo, se tiene las siguientes calificaciones de los alumnos
(hombres y mujeres) de 0 a 20:

ID Genero Promedio
1 Hombre 14
2 Hombre 16
3 Hombre 13
4 Hombre 16
5 Hombre 15

160 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo

6 Hombre 18
7 Hombre 11
8 Mujer 17
9 Mujer 16
10 Mujer 12
11 Mujer 19
12 Mujer 14
13 Mujer 15
14 Mujer 11
15 Mujer 13
16 Mujer 18
Esta base de datos lo llevamos a la matriz del SPSS

En la vista variables sería así

161 www.aacentrum.com

Índice
Estadística para tesis

Luego en el SPSS vamos a datos y segmentar archivos:


Obtendremos el siguiente cuadro, donde seleccionamos el icono
organizar los resultados por grupos y también trasladamos género al
cuadro de grupos, luego aceptar

Este procedimiento hará que el cálculo de la normalidad se realice


por grupos.

162 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo

Luego hacemos nuevamente el cálculo de Kolmogorov Smirlov y


Shapiro Wilk, para ello vamos a “Analizar”, “Estadísticos
descriptivos” y “Explorar”
Agregamos
“gráficos la variable con
de normalidad y luego”eny “aceptar
notapruebas gráficosy” obtenemos
seleccionam
seleccionamos:
os:
los
valores tanto para varones y mujeres:

163 www.aacentrum.com

Índice
Estadística para tesis
En este caso es válido Shapiro Wilk porque los datos son menores
de 50, y la significancia al ser mayor de 0.05, se acepta la hipótesis
nula, por tanto, diremos que la variable tiene una distribución
normal, es paramétrica.

5.3.4. La distribución normal

La distribución normal es una forma de distribución de las


frecuencias con las siguientes características:
Es simétrica
Tiene una asíntota horizontal
El área entre la función y el eje horizontal es 1
El valor medio es la media de la población (µ)
Se distribuye igual a la izquierda y para la derecha
El gráfico de la desviación típica (σ) heterogénea es
achatada, la homogénea normal

164 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo

Distribución normal
Se simboliza: N(µ, σ), donde: La media (µ) = 0 y la desviación
estándar σ = 1, esto quiere decir que la media es un punto medio y
la significancia es 1 por tanto tiene una pendiente simétrica, siendo
la simbolización N(0,1)
La fórmula de la distribución normal fue desarrollada por Gauss
que responde a la siguiente función N = σ) (,
Donde
= Media poblacional
σ = Desviación típica poblacio
poblacional
nal
y se tiene la siguiente fórmula propuesta por Gauss.

La distribución normal N = (, σ), responde a la siguiente función


N= (0,1 )

165 www.aacentrum.com

Índice
Estadística para tesis

Donde:
La media poblacional = 0 y
La desviación típica = 1
Con lo cual la fórmula de la función normal se simplifica a la
siguiente:

 
F(x) = √ 
Cuyo gráfico sería el siguiente
siguiente::

 
La fórmula F(x) = √   , esta fórmula permite hacer el cálculo
del área bajo la curva. Conforme al siguiente ejemplo: el área
sombreada, puede ser calculada del siguiente modo:

166 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo

Fórmula:

1  2
∫ = 2  2
−
La fórmula permite hallar el área sombrada, su cálculo puede
resultar muy extensa y compleja, para evitar ello, tenemos la tabla de
distribución normal, donde en el presente ejemplo los valores de Z

van a ser
valores de calculados cuando
la recta x, los valoresz=de2Zydeben
z= -2,ser
pero estos mediante
hallados valores son
la
fórmula antes indicada, para ello necesitamos hallar los valores z que
son los límites comprendidos por el área sombreada, los valores que
tenemos en la tabla son:
f(2) = 0.977 y f(-2) = 0.023
Para hallar el valor del área sombreada, debemos restar ambos
valores, así el área sombreada es igual al valor de f(2) - f(-2) = 0.954,
esto quiere decir que el área sombreada tiene un valor de 0.954.

5.4. Prueba de la hipótesis general

Es la comprobación de la hipótesis general de la tesis, la prueba de


hipótesis puede realizarse en cualquier tipo de investigación que
tenga hipótesis, sin embargo, la prueba de hipótesis que busque la
medición de la influencia de las variables solo corresponde a las
investigaciones explicativas, donde se requiera medir la asociación o
la influencia de una variable sobre otra. La prueba de hipótesis o
también llamada prueba de contrastación de hipótesis, busca medir
la dependencia de una variable en relación a la otra.

Variable 1 Se mide la influencia Variable 2

167 www.aacentrum.com

Índice
Estadística para tesis

Del ejemplo del primer capítulo, tenemos el siguiente enunciado:

“Deficiencias en la reparación del daño en el procedimiento


administrativo disciplinario que regula la ley 30057, Ley del Servicio
Civil, que justifique su modificación legislativa para la defensa del
patrimonio del
del Estado,
Estado, Perú, 2019”
2019”

Se tiene como variables:

Variable 1: Reparación del daño


• Reposición del bien

• Pago del valor del bien


Variable 2: Modificación legislativa
• Modificaci
Modificación
ón necesaria

Donde la hipótesis general es:


Dado que …
Es posible, que las deficiencias en la reparación del daño en el
procedimiento administrativo disciplinario que regula la ley
30057, Ley del Servicio Civil, justifique su modificación legislativa
para la defensa del patrimonio del Estado, Perú, 2019.

5.4.1. Prueba de hipótesis con R de


Pearson

Esta prueba de asociación es procedente en variables que tienen


una distribución normal o son paramétricas, para ello se sigue los
siguientes pasos:
1.- Planteamos las hipótesis de trabajo
H0 = Las deficiencias en la reparación del daño en el procedimiento
administrativo disciplinario que regula la ley 30057, Ley del
168 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo

Servicio Civil, justifique su modificación legislativa para la


defensa del patrimonio del Estado, Perú, 2019
H1 = Las deficiencias en la reparación del daño en el procedimiento
administrativo disciplinario que regula la ley 30057, Ley del
Servicio Civil, no justifica su modificación legislativa para la
defensa del patrimonio del Estado, Perú, 2019
Los datos a analizar provienen de la encuesta realizada:

CUESTIONARIO PARA ABOGADOS

(12) Masculino
(11) Funcionario (8) Femenino
público Sexo
Nivel
(6) Actividad (5) hasta 35 años
ocupacional:
Privada Edad (12) de 35 a 50 años
(3) Docente (3) mayores de 50
años
INSTRUCCIONES
Se presenta un conjunto de afirmaciones sobre la INCORPORCION
DE LA REPARACIÓN DEL DAÑO EN EL PROCEDIMIENTO
ADMINISTRATIVO DISCIPLINARIO
DISCIPLINARIO QUE REGULA
REGULA LA LEY 30057, LEY
DEL SERVICIO CIVIL, para la defensa del patrimonio del Estado, a las que se
debe responder con la mayor sinceridad y veracidad posible de acuerdo
a las observaciones realizadas. No existen respuestas correctas o
incorrectas. El instrumento tiene carácter anónimo e individual. Se debe
colocar una (X) en el recuadro correspondiente de acuerdo a los
siguientes enunciados

1 2 3 4 5
Muy en En Poco de De Muy de
desacuerdo desacuerdo acuerdo acuerdo acuerdo

N° AFIRMACIONES OPCIONES

V1: Reparación del daño 1 2 3 4 5

Dimensión 1: Reposición del bien

169 www.aacentrum.com

Estadística para tesis Índice


¿Está usted de acuerdo en que la falta de
regulación de la reposición del bien en
la ley 30057 Ley del Servicio Civil evita
1 0 3 4 8 5
que el Estado pueda recuperar su
patrimonio afectado por la conducta del
infractor?
¿Está usted de acuerdo que en el
procedimiento administrativo
2 disciplinario se exija al infractor junto a 0 0 5 12 3
la sanción la reparación del bien
afectado por la conducta del infractor?
¿Está usted de acuerdo en que la
exigencia de reposición del bien dañado
3 0 1 3 11 5
en la vía judicial es un proceso lento e
ineficiente?
¿Está usted de acuerdo en que la
exigencia de reposición del bien dañado
4 2 3 5 7 3
en la vía judicial podría prescribir por la
lentitud de este proceso?
¿Está usted de acuerdo en que la
exigencia de la reposición del bien
5 dañado en la vía administrativo 1 1 6 8 4
disciplinaria sería más célere y más
eficiente que en la vía2:judicial?
Dimensión El pago del valor del bien
¿Está usted de acuerdo en que la falta de
regulación del pago del valor del bien
en la ley 30057 Ley del Servicio Civil
6 0 0 3 11 6
evita que el Estado pueda recuperar su
patrimonio afectado por la conducta del
infractor?
¿Está usted de acuerdo que en el
procedimiento administrativo
7 disciplinario se exija al infractor junto a 0 1 4 5 10
la sanción del pago del valor del bien
afectado por la conducta del infractor?
¿Está usted
exigencia de acuerdo
del pago del valor en que en
del bien la
8 0 3 3 6 8
la vía judicial es un proceso lento e
ineficiente?
¿Está usted de acuerdo en que la
exigencia del pago del valor del bien en
9 1 1 4 7 7
la vía judicial podría prescribir por la
lentitud de este proceso?
170 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo

¿Está usted de acuerdo en que la


exigencia del pago del valor del bien en
10 la vía administrativo disciplinaria sería 1 0 5 9 5
más célere y más eficiente que en la vía
judicial?
V2: Modificac
Modificación
ión legislativa

Dimensión 1: Justificada / Injustificada

¿Está usted desancionador


procedimiento acuerdo en
que que el
regula
11 la ley 30057, Ley del Servicio Civil se 0 3 7 8 2
enfoca en el castigo al infractor y
desprotege el patrimonio del Estado?
¿Está usted de acuerdo en que la
reposición del bien o el pago de su valor
12 0 3 4 9 4
exigidos en la sanción administrativa
protegería el patrimonio del estado?
¿Está usted de acuerdo en que la
reparación civil está compuesta por la
13 1 0 6 8 5
reparación del daño y la indemnización
de los daños y perjuicios?
¿Está usted de acuerdo en que la
reparación del daño implica la
14 0 1 5 7 7
reposición del bien y si no fuera posible
el pago de su valor?
¿Está usted de acuerdo en que la
reparación del daño sea también
exigible en la vía administrativo
15 0 0 2 12 6
disciplinaria, en cambio la exigencia de
los daños y perjuicios sea exclusivo de
la vía judicial?
¿Está usted de acuerdo en que se
justifica la modificación legislativa
16 0 2 3 7 8
conforme al proyecto de ley que se
adjunta?
Indique sus observaciones:
……………………………………………………………………………………
……………………………………………………………………………………
TOTAL
TOTAL, EN PORCENTAJE

171 www.aacentrum.com

Estadística para tesis Índice


La información se ordena en la matriz de datos:
It Sex Pro Ed RB1 RB2 RB3 RB4 RB5 TRB PV6 PV7

1 1 1 1 4 3 2 2 1 12 4 4
2 1 2 2 4 4 4 1 2 15 5 4
3 1 3 2 2 4 4 3 3 16 3 2
4 1 1 1 5 3 3 1 4 16 4 4
5 1 1 2 3 5 5 2 4 19 3 3
6 1 2 1 4 5 3 3 3 18 4 4
7 2 1 3 5 3 5 2 4 19 3 4
8 2 1 1 3 4 5 4 4 20 5 3
9 1 3 3 4 5 4 5 3 21 5 5
10 2 3 1 4 4 3 4 3 18 4 3
11 1 1 2 2 3 4 3 4 16 4 3
12 1 1 3 5 3 4 3 3 18 4 5
13 1 1 2 4 4 5 4 5 22 5 5
14 2 2 2 3 4 4 3 3 17 4 5
15 1 1 2 2 4 4 5 4 19 4 5
16 1 2 2 5 4 4 4 5 22 5 5
17 2 2 2 4 4 4 4 4 20 4 5
18 2 1 2 4 4 4 4 5 21 4 5
19 2 1 2 3 4 4 4 5 20 4 5
20 2 2 2 5 4 5 5 4 23 5 5

PV PV9 PV TPV TV M1 M1 M1 M1 M1 M1
8 10 1 1 2 3 4 5 6
4 1 1 14 26 3 3 1 3 4 3
3 3 4 19 34 4 4 4 2 3 3
5 2 4 16 32 2 4 3 4 3 2
2 4 4 18 34 4 2 5 4 5 2
5 4 3 18 37 5 2 3 4 5 3
5 5 4 22 40 2 3 4 4 4 4
5 3 3 18 37 5 4 5 3 4 4
3 5 4 20 40 2 2 3 3 4 4
2 3 3 18 39 3 3 4 4 4 4
4 3 5 19 37 3 4 3 3 4 4
5 5 4 21 37 4 3 4 3 4 4
2 4 3 18 36 3 5 4 4 4 4
5 5 5 25 47 4 4 3 5 4 5
4 4 3 20 37 3 5 3 4 4 5
3 4 4 20 39 4 4 5 5 4 5
5 5 5 25 47 4 4 5 5 4 5
5 5 4 23 43 4 4 4 5 5 5
4 5 5 23 44 4 4 5 5 5 5
4 4 4 21 41 3 5 4 5 5 5

172 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo

4 4 5 23 46 3 5 4 5 5 5

TM TV TT
2
17 17 43
20 20 54
18 18 50
22 22 56
22 22 59
21 21 61
25 25 62
18 18 58
22 22 61
21 21 58
22 22 59
24 24 60
25 25 72
24 24 61
27 27 66
27 27 74
27 27 70
28 28 72
27 27 68
27 27 73

En la matriz, las variables que van a ser objeto de prueba de


asociación son:
TV1 = Total variable 1
TV2 = Total variable 2
2.- Verificamos por separado que cada variable tenga o no una
distribución normal

Para el cálculo de la normalidad de una variable es necesario que esta


sea del tipo escala, por lo cual no se puede hallar la normalidad de
una variable ordinal o nominal

En el SPSS vamos a “Analizar”, “Estadísticos descriptivos”,


“Explorar”

173 www.aacentrum.com

Índice
Estadística para tesis

Luego nos saldrá el siguiente cuadro:


Pasamos las variables TV1 y TV2 a la lista de dependientes, en
“Gráficos” desactivamos “Tallos y hojas” y activamos “Gráficos de
normalidad con pruebas”

174 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo

Luego continuar y aceptar, obtendremos el siguiente resultado:

Pruebas de normalidad

Kolmogorov-Smirnova Shapiro-Wilk

Estadístico gl Sig. Estadístico gl Sig.

TV1 ,126 20 ,200* ,956 20 ,465


TV2 ,167 20 ,144 ,925 20 ,125

*. Esto es un límite inferior de la significación verdadera.

a. Corrección de significación de Lilliefors

Siendo los encuestados 20 personas y por tanto menor a 50,


corresponde el cálculo de Shapiro Wilk, donde podemos ver que la
significancia de la TV1 es 0.465, que es mayor a 0.05 por tanto esta
variable tiene una distribución normal. En cuanto a la variable TV2,
tiene una significancia de 0.125 que es mayor a 0.05, por tanto, igual
que la otra variable, se acepta la hipótesis nula que establece que
tienen una distribución normal.
En este caso ambas variables tienen distribuciones normales,
motivo por el cual para la prueba de hipótesis aplicamos el estadístico
R. de Pearson.
3. Hacemos el cálculo de Chi2 con R de Pearson

El calculo de asociación se realiza midiendo la diferencia entre las


frecuencias esperadas y las frecuencias observadas, cuanta más
distancia haya entre estos valores, mayor grado de asociación.

Para realizar el cálculo, en el SPSS vamos a: “Analizar”,


“Estadísticos descriptivos” y “Tablas cruzadas”, seleccionamos las
dos variables a contrastar que son el total de la variable 1 (TV1) con el
total de la variable 2 (TV2), para lo cual ponemos la variable TV1 en
filas y la variable TV2 en columnas a efectos de tener un cálculo de
asociación en forma cruzada de las variables.

175 www.aacentrum.com

Estadística para tesis Índice


En el visor del SPSS se tiene el siguiente resultado:

Pruebas de chi-cuadrado

Significación
asintótica
Valor gl (bilateral)

Chi-cuadrado de Pearson 96,000a 88 ,263


Razón de verosimilitud 57,142 88 ,996
Asociación lineal por lineal 10,469 1 ,001
N de casos válidos 20

a. 108 casillas (100,0%) han esperado un recuento menor que 5. El


recuento mínimo esperado es ,05.

Donde 0.263, es mayor que 0.05, motivo por el cual aceptamos la


H0 que establece:
“Las deficiencias en la reparación del daño en el
procedimiento administrativo disciplinario que regula la
ley 30057, Ley del Servicio Civil, no justifica su
modificación legislativa para la defensa del patrimonio del
Estado, Perú, 2019”

176 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice


-1 = Correlación negativa perfecta
-0.90 = Correlación negativa muy fuerte

-0.75 = Correlación negativa considerable ¿Para qué nos sirve esto?


esto?

-0.50 = Correlación negativa media Nos sirve para comparar con el


resultado de Chi cuadrado y poder
-0.25 = Correlación negativa débil establecer el grado de correlación de
nuestros resultados
-0.10 = Correlación negativa muy débil

0.00 = No existe correlación alguna entre las variables


+0.10 = Correlación positiva muy débil

+0.25 = Correlación positiva débil


+0.50 = Correlación positiva media

+0.75 = Correlación positiva considerable


+0.90 = Correlación positiva muy fuerte

+1.00 = Correlación positiva perfecta

5.4.2. Prueba de Rho de Spearman


Como se indicó anteriormente, la evaluación de la normalidad de
la variable permite identificar el estadístico aplicable, R. de Pearson
para los que tienen una distribución normal y Rho de Spearman para
los que no tienen una distribución normal, en el presente caso vamos
a suponer que las variables a analizar no tengan una distribución
normal, entonces aplicaremos el estadístico Rho de Spearman del
siguiente modo:
1.- Planteamos las hipótesis:
A manera de ejemplo vamos a considerar el ejemplo anterior,
considerando que las variables no tienen una distribución normal,
motivo por el cual aplicaríamo
aplicaríamoss el estadístico Rho de Spearman.
Del ejemplo anterior, tenemos el siguiente enunciado:

177 www.aacentrum.com

Estadística para tesis Índice


“Deficiencias en la reparación del daño en el procedimiento
administrativo disciplinario que regula la ley 30057, Ley del Servicio
Civil, que justifique su modificación legislativa para la defensa del
patrimonio del Estado, Perú, 2019”
Se tiene como variables:
Variable 1: Reparación del daño

• Reposición del bien


• Pago del valor del bien
Variable 2: Modificación legislativa
• Modificaci
Modificación
ón necesaria

Donde la variable general es:


Es posible que las deficiencias en la reparación del daño en el


procedimiento administrativo disciplinario que regula la ley
30057, Ley del Servicio Civil, justifique su modificación legislativa
para la defensa del patrimonio del Estado, Perú, 2019
1.- Planteamos las hipótesis de trabajo
H0 = Las deficiencias en la reparación del daño en el procedimiento
administrativo disciplinario que regula la ley 30057, Ley
del Servicio Civil, no justifique su modificació
modificaciónn legislativa
para la defensa del patrimonio del Estado, Perú, 2019

H1 = Las deficiencias en la reparación del daño en el procedimiento


administrativo disciplinario que regula la ley 30057, Ley
del Servicio Civil, justifica su modifica
modificación
ción legislativa para
la defensa del patrimonio del Estado, Perú, 2019.

178 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice


Hacemos el cálculo en el SPSS
Vamos a: “Analizar”, “Correlaciones”, “Bivariadas”
Nos saldrá el siguiente cuadro, donde elegimos “Spearman”

Aceptamos y en el visor del SPSS tenemos:

179 www.aacentrum.com

Estadística para tesis Índice


Donde el valor del coeficiente de correlación es 0.694, que significa
una correlación positiva media, por otro lado, tenemos un valor de
significación menor a 0.05 indica que se rechace la H 0 y una
significación mayor que se acepte, en el presente caso la significancia
es 0.001, que es menor a 0.05, motivo por el cual se rechazará la H0, es
decir hay una dependencia o correlación entre las variables de nivel

media o moderada.
-1 = Correlación negativa perfecta

-0.90 = Correlación negativa muy fuerte


-0.75 = Correlación negativa considerable ¿Para qué nos sirve esto?
esto?

-0.50 = Correlación negativa media Nos sirve para comparar con el


resultado de Chi cuadrado y poder
-0.25 = Correlación negativa débil establecer el grado de correlación de
nuestros resultados
-0.10 = Correlación negativa muy débil

0.00 = No existe correlación alguna entre las variables

+0.10 = Correlación positiva muy débil


+0.25 = Correlación positiva débil

+0.50 = Correlación positiva media


+0.75 = Correlación positiva considerable

180 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo

+0.90 = Correlación positiva muy fuerte


+1.00 = Correlación positiva perfecta

Nota:

El hecho que no se pruebe la hipótesis de la investigación no


quiere decir que la tesis no tenga valor, esto significa,
simplemente que las variables son independientes, puede
volverse a verificar el cuestionario y el recojo de la muestra y
si se obtiene los mismos resultados, entonces los resultados
están correctos.
5.5. Prueba de hipótesis especificas

La hipótesis específica es la posible respuesta a los objetivos


específicos, es una posible respuesta a la relación que se tiene entre
los indicadores de las variables, así, por ejemplo:
Variable 1
Indicador A Variable 2
Indicador C
Indicador B
Esto tiene lugar donde las variables se relacionan en causa y efecto.
Tomaremos como ejemplo el enunciado del primer capítulo de este
libro que indica:

“Deficiencias en la reparación del daño en el procedimiento


administrativo disciplinario que regula la ley 30057, Ley del Servicio
Civil, que justifique su modificación legislativa para la defensa del
patrimonio del Estado, Perú, 2019”
Se tiene como variables:
Variable 1: Reparación del daño

181 www.aacentrum.com

Estadística para tesis Índice


• Reposición del bien
• Pago del valor del bien
Variable 2: Modificación legislativa
• Modificaci
Modificación
ón necesaria

En el presente caso vamos a medir si los indicadores de la variable


1 influyen en los indicadores de la variable 2, pues estas han dado
lugar a las hipótesis específicas:
Entonces si el primer objetivo específico indica:
Nota:

α = Es la significación, es decir la probabilidad de cometer el


error de rechazar la hipótesis nula cuando esta corresponda ser
aceptada.

5.5.1. Prueba de la 1ra. Hipótesis


específica:

Siguiendo la investigación puesta como ejemplo en el capítulo I y


para la prueba de la hipótesis general, como hipótesis específica se
propuso:
Dado que (…)
Es posible que las deficiencias en la reposición del bien en el
procedimiento administrativo
30057, Ley del Servicio disciplinario
Civil, justifique que regula
su modificación la ley
legislativa
para la defensa del patrimonio del Estado, Perú, 2019.

En la hipótesis general se plantea la influencia de la variable


independiente sobre la dependiente, en las hipótesis especificas se

182 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo

plantea la influencia de un indicador de la variable independiente


sobre otro indicador de la dependiente.

La influencia de los indicadores se grafica así:

Reposición del bien Modificación necesaria

La matriz de datos (viene de la página 35)


Esta figura con la anterior se complementan, pues en esta continua
la pregunta once y siguientes:

183 www.aacentrum.com

Estadística para tesis Índice


La prueba de la primera hipótesis específica se realizará entre Trb
que es el total del primer indicador de la primera variable y TM que
es el total del indicador de la segunda variable,
variabl e, para lo cual, seguimos
los siguientes pasos:
1.- Formulamos la hipótesis:
H0 = La deficiencia de la reposición del bien no justifica la
modificaciónn legislativa
modificació
H1 = La deficiencia en la reposición del bien justifica la
modificaciónn legislativa
modificació
2.- Verificamos la distribución normal de las variables (Trb y
TM)
Para ello realizamos los pasos indicados para la normalidad,
hallamos la normalidad de Trb y de TM en el SPSS:
Vamos a “Analizar”, “Estadísticos descriptivos”, y “Explorar”

184 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo

Y obtenemos el siguiente resultado:

Pruebas
Pruebas de no rmalidad

Kolmogorov-Smirnova Shapiro-Wilk

Estadístico gl Sig. Estadístico gl Sig.

Trb ,113 20 ,200* ,967 20 ,684


TM ,167 20 ,144 ,925 20 ,125

*. Esto es un límite inferior de la significación verdadera.

a. Corrección de significación de Lilliefors

Al ser los encuestados menos de 50, aplicamos Shapiro Wilk.


Recordemos que:
Postulado:

Si el valor de la significancia (sig.) llamado también p valor, es mayor


a 0.05, entonces se acepta la H0, entonces decimos que
que la variable tiene
una distribución normal, en cambio sí es menor se rechaza la H 0 y
decimos que la variable tiene una distribución no normal

En este caso el valor de la significancia es 0.684 y 0.125, que son


valores mayores a 0.05, motivo
motiv o por el cual decimos que la variable Trb
y TM tienen una distribución normal.
3.- Haciendo la prueba de hipótesis
Debemos recordar que las hipótesis son:
H0 = La deficiencia de la reposición del bien no justifica la
modificaciónn legislativa
modificació

H1 = La ndeficiencia
modificació
modificación legislativa.en la reposición del bien justifica la
Donde:

185 www.aacentrum.com

Índice
Estadística para tesis

Aceptamos la H0 si la significancia es mayor a 0.05, de lo contrario se


rechaza H0 y se acepta H1

Luego en el SPSS:
“Analizar”, “Estadísticos descriptivos” y “Tabla s cruzadas”
Luego, ponemos la variable más cargada en filas y la otra en
columnas:

Luego en “estadísticos”, activamos “chi-cuadrado” y “Coeficiente


de contingencia”

186 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo
En “Casillas” activamos “Esperado”, debemos indicar que los
valores observados son los valores que hemos insertado al SPSS, en
cambio los valores esperados son los valores que el SPSS calculará, la
diferencia entre lo observado y lo esperado nos indicará si existe o no
relación entre variables. También puede activar los porcentajes de fila
y columna y también el total o solo el total.

Luego en el visor del SPSS tenemos el siguiente resultado:


Son tres los cuadros que resultan útiles para el análisis, estos son:

187 www.aacentrum.com

Índice
Estadística para tesis

La tabla cruzada de las variables


La tabla de prueba de chi cuadrado y
La tabla de medidas simétricas

La tabla cruzada de variables


En esta tabla se puede apreciar los valores
valor es esperados que se calcula
en función a los valores de la variable.

Tabla cru zada Trb*TM

TM Tot
17 18 20 21 22 24 25 27 28 al
Trb 12 Recuento 1 0 0 0 0 0 0 0 0 1

Recuento
,1 ,1 ,1 ,1 ,2 ,1 ,1 ,3 ,1 1,0
esperado

15 Recuento 0 0 1 0 0 0 0 0 0 1

esperado ,1 ,1 ,1 ,1 ,2 ,1 ,1 ,3 ,1 1,0

16 Recuento 0 1 0 0 2 0 0 0 0 3

esperado ,2 ,3 ,2 ,3 ,6 ,3 ,3 ,8 ,2 3,0

17 Recuento 0 0 0 0 0 1 0 0 0 1

esperado ,1 ,1 ,1 ,1 ,2 ,1 ,1 ,3 ,1 1,0

18 Recuento 0 0 0 2 0 1 0 0 0 3

esperado ,2 ,3 ,2 ,3 ,6 ,3 ,3 ,8 ,2 3,0

19 Recuento 0 0 0 0 1 0 1 1 0 3

esperado ,2 ,3 ,2 ,3 ,6 ,3 ,3 ,8 ,2 3,0

20 Recuento 0 1 0 0 0 0 0 2 0 3

esperado ,2 ,3 ,2 ,3 ,6 ,3 ,3 ,8 ,2 3,0

21 Recuento 0 0 0 0 1 0 0 0 1 2

esperado ,1 ,2 ,1 ,2 ,4 ,2 ,2 ,5 ,1 2,0

22 Recuento 0 0 0 0 0 0 1 1 0 2

esperado ,1 ,2 ,1 ,2 ,4 ,2 ,2 ,5 ,1 2,0

23 Recuento 0 0 0 0 0 0 0 1 0 1

188 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice


esperado ,1 ,1 ,1 ,1 ,2 ,1 ,1 ,3 ,1 1,0

Total Recuento 1 2 1 2 4 2 2 5 1 20
20,
esperado 1,0 2,0 1,0 2,0 4,0 2,0 2,0 5,0 1,0
0

Pruebas de chi-cuadrado

Significación

asintótica
Valor gl (bilateral)

Chi-cuadrado de Pearson 95,167a 72 ,035


Razón de verosimilitud 57,960 72 ,885
Asociación lineal por lineal 9,170 1 ,002
N de casos válidos 20

a. 90 casillas (100,0%) han esperado un recuento menor que 5. El


recuento mínimo esperado es ,05.

Como podemos apreciar la significación (0.035) es menor a 0.05,


por lo cual rechazamos la H0 y aceptamos la H1, estableciendo que
hay asociación entre ambas variables.
Esta información lo podemos corroborar con la tabla del
coeficiente de contingencia que reitera los valores, dándonos mayor
seguridad en el cálculo:

Medidas simétricas

Significación
Valor aproximada

Nominal por Nominal Coeficiente de contingencia ,909 ,035

N de casos válidos 20

En este caso, vemos que el coeficiente de contingencia también es


menor que 0.05, por tanto, se rechaza la H0 y se acepta la H1. Por tanto,
la conclusión es que: La deficiencia en la reposición del bien
justifica la modificación legislativa.

189 www.aacentrum.com

Índice
Estadística para tesis

Nota:

Debemos recordar que la hipótesis general no fue probada, por tanto,


no tiene sentido probar las hipótesis específicas, sin embargo, lo
hacemos a manera de ejemplo.

5.5.2. Prueba de la 2da Hipótesis


especifica

En este caso seguimos el procedimiento anterior, empezamos


proponiendo las hipótesis de estudio:
Dado que (…)

Es posible que las deficiencias en el pago del valor del bien en el


procedimiento administrativo disciplinario que regula la ley
30057, Ley del Servicio Civil, justifique su modificación
legislativa para la defensa del patrimonio del Estado, Perú, 2019

Pago del valor del bien Modificación necesaria

Se plantea:
H0 = La deficiencia en el pago del valor del bien no justifica la
modificaciónn legislativa
modificació
H1 = La deficiencia en el pago del valor del bien justifica la
modificaciónn legislativa.
modificació
En el SPSS
Pasamos la variable independiente a “filas” y la dependiente a
“categorías”

190 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice


Como resultado tenemos:

Como podemos apreciar, la significancia


signific ancia (0.092) es mayor que 0.05,
motivo por el cual se acepta la H0 y se rechaza la H 1, indicando que
La deficiencia en el pago del valor del bien no justifica la
modificaciónn legislativa.
modificació

191 www.aacentrum.com

Estadística para tesis Índice


5.6. Prueba de la hipótesis de trabajo

Las hipótesis de trabajo se plantean para probar las hipótesis de la


tesis y también para probar hipótesis que surjan en el desarrollo de
una investigación, son hipótesis que se plantean para solucionar un
determinado problema.
Es un cálculo estadístico que se basa en la evidencia de la muestra
y se utiliza para establecer si debe o no rechazarse la hipótesis nula,
este cálculo utiliza 2 hipótesis que son excluyente
excluyentess entre sí que son: la
hipótesis nula (H0) y la hipótesis alterna (H1), donde la aceptación de
la hipótesis nula implica el rechazo de la hipótesis alternativa.
Consideraciones para la prueba de hipótesis
El cálculo estadístico busca establecer si se acepta o se
rechaza la hipótesis nula (H0)
Cuando se rechaza la H0 y se acepta la H1 significa la
existencia de influencia de la variable en el resultado.

En investigación
el planteamiento delcoincidir
debe de problema,
con lalaH1.
hipótesis de
Debe tenerse presente que el propósito de la
investigación es probar la hipótesis que es la posible
respuesta que se planteó al inicio del estudio.

Pasos para la prueba de hipótesis


Paso 1: Plantear la hipótesis nula y la hipótesis alternativa del
problema, donde pueden ocurrir 3 situaciones:

En el primer caso, se plantea una igualdad entre la media muestral


y la media poblacional.
H0 : =µ
1 H1 : ≠µ

192 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice


En el segundo caso, se plantea que la media muestral de la
hipótesis nula es menor o igual a la media poblacional y la hipótesis
alterna plantea lo opuesto.
H0 : ≤µ
2
H1 : >µ

En el tercer caso, se plantea una situación diferente al caso

anterior, debe
la hipótesis tenerse presente que la igualdad siempre se platea en
nula
H0 : ≥µ
3 H1 : <µ

PASO 2: Elegir el nivel de significancia (α), que es


e s la cantidad máxima
de error que estamos dispuestos a aceptar para dar como
válida la hipótesis de investigación, por lo general una
investigación utiliza un α = 0.05, que en su forma porcentual
= 5%.
PASO 3: Determinar la zona de aceptación y rechazo de la hipótesis
nula (H0).

En este caso la zona de rechazo está en ambas colas de la gráfica,


se relaciona con el paso 1 que considera en la hipótesis alterna una
desigualdad entre la media muestral y la media poblacional.

193 www.aacentrum.com

Estadística para tesis Índice


En este caso el error es de 0.025 a cada lado, debido a que el error
máximo total es de 0.05, al lado izquierdo es negativo y al lado
derecho es positivo, Z adquiere el valor de 1.96 que resulta de la tabla

En este caso la zona de rechazo se ubica en el lado derecho de la


gráfica, se relaciona
relaci ona con el paso 2 que considera en la hipótesis alterna
que la media muestral es mayor a la media poblacional.

En esta gráfica la zona de rechazo se ubica en el lado izquierdo y


se relaciona con el paso 3 que considera en la hipótesis alterna que la
media muestral es menor a la media poblacional.
PASO 4: Determinar la función pivotal, para ello se utilizarán la
fórmula Z cuando N > 30 y la fórmula T cuando N ≤ 30, de
esta manera se tiene:

Z= edi−
σ µ
⁄√
Cuando n > 30

t = edi−
σ
µ (n – 1) GL
⁄√
194 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice


Cuando n ≤ 30

Z= P−
∗⁄
PASO 5: Cálculo de la función pivotal
La función pivotal es la aplicación y desarrollo de la fórmula para
el cálculo de Z

Se reemplaza con la información obtenida en la fórmula correcta y


se obtiene el valor, es decir si deseamos realizar una prueba de
hipótesis para la media poblacional de los estudiantes de una
universidad y planteamos que la hipótesis de interés de que la edad
es diferente a 25 años. Posteriormente evaluamos una muestra de 40
alumnos y encontramos que el promedio de la edad es de 22.5, con
una desviación estándar de 4.5 años.
Entonces la función pivotal sería:

Z= edi− µ
σ⁄√
Cuando n > 30

Z= .
.
− = −. = -3.51
.7
⁄√
El cálculo obtenido en la función pivotal = -3.51
PASO 6: Una vez obtenido el cálculo de la función pivotal,
ubicamos el valor en la región de rechazo (RR) o de aceptación (RA)
de la hipótesis nula (H0)

195 www.aacentrum.com

Estadística para tesis


Índice
PASO 7:
Establecemos la conclusión, como podemos apreciar -3.51 se
encuentra fuera de la zona de aceptación, es decir en la zona de
rechazo, por lo cual rechazamos la H0 y aceptamos la H1.
Ejemplo:
Un motor de un grupo electrógeno tiene un consumo de 225 ml de
aceite por día, una muestra aleatoria en 36 días tiene un contenido
promedio de 220 ml por día con una desviación estándar de 15 ml.
Pruebe la hipótesis del promedio teórico igual a 225 ml en
contraposiciónn a la hipótesis alternativa qque
contraposició ue es menor a 225 ml con un
nivel de significación del 5%
PASO 1: Proponer si la hipótesis es nula (H0) o la hipótesis es
alternativa (H1)
H0: µ = 225 ml
H1: µ < 225 ml
PASO 2: Especifica
Especificarr la significación
= 5%
La significación = 5% por lo que se trabajará con una confianza =
95%
PASO 3: Calculamos el valor crítico y el valor de prueba.

196 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice

̅− µ −
ZP = (√) = √ = -2.0
PASO 4:
Decisión: Se rechaza H0
Conclusión: Se puede afirmar que el contenido promedio es
menor de 225 ml con un = 5%

5.6.1. Prueba de hipótesis de una


proporción

En este tipo de cálculo, no se busca un tipo de asociación, sino


probar una igualdad o una desigualdad en base a una proporción de
los datos.
Formula:

Zp =
−
.
Donde:
P = Proporción de la muestra en relación a la población
Po = Proporción que se afirma
Qo = Es el complemento de Po

197 www.aacentrum.com

Índice
Estadística para tesis

n = Es el tamaño de la muestra
Los pasos que se sigue para hallar la prueba de hipótesis de una
proporción son:
1.- Se formula las hipótesis
La hipótesis nula H0, plantea una igualdad, la H1 plantea lo
opuesto, la desigualdad de la H1 va a indicar la dirección en que esta
la cola, así por ejemplo si la H1 plantea que es mayor que (>), entonces
la cola o zona de rechazo será para el lado derecho, si indica que es
menor que (<) la zona de rechazo será para el lado izquierdo.
2.- Especificamos la significancia
Llamado también límite o error máximo, se simboliza con α, es el
complemento del nivel de confianza, así tenemos:

Nivel de confianza Signific


Significación
ación Valor Z

90% 10% 1.28


95% 5% 1.64

99% 1% 2.33

3.- Hallar el valor critico (Zc) y el valor de prueba (Zp)


El valor critico es el valor frontera que viene dado por la
significancia que lo sacamos de la tabla Z. El valor de prueba (Zp) es
el resultado del desarrollo de la fórmula.
4.- Se establece la conclusión
Así por ejemplo se tiene:
El gerente de una empresa financiera considera que el 18% de los
clientes incurren en morosidad, pero se sospecha que el porcentaje

198 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice


podría ser mayor, en una verificación de una muestra, se pudo
advertir que 90 de los 450 casos, los clientes incurrieron en
morosidad durante el año 2019. ¿Se podría afirmar con una
significación del 5% que la proporción de clientes morosos es
mayor al 18%?
PASO 1: Proponer la hipótesis nula H0 y la hipótesis alternativa H1

H0: P0 = 0.18 p=  = 0,2


H1: P > 0.18
 = 
PASO 2: Explicar la significación, que en este caso sería = 5% con
una confianza = 95%
= 5%
PASO 3:
a) Hallar el valor crítico (V C) y el valor de prueba (V P)

VC: ZC = 1.64 (De la tabla Z)


VP: ZP = 1.104 (Del cálculo de la fórmula)
−P
ZP =  . , −,  
ZP = . .. = 1.104
    
b) Establecer zonas de aceptación y rechazo

199 www.aacentrum.com

Estadística para tesis Índice


PASO 4:
Decisión: Se acepta la hipótesis nula (H0), que establece = 18%
Conclusión: Se puede afirmar que la proporción es igual
i gual a 18% con
un = 5%

5.7. Prueba de hipótesis chi cuadrado

La prueba de chi cuadrado es un estadístico que nos indica si existe


independencia o dependencia de las variables en razón de las
frecuencias esperadas y las frecuencias observadas, el estudio se
fundamenta en que las frecuencias esperadas son las que
corresponden al caso, pero si las observadas se alejan del valor de las
esperadas, eso indica que las variables son dependientes, porque su
comportamiento
comportamien to no es conforme a lo esperado.
Por ejemplo, se puede esperar que una moneda en diez
lanzamientos salga el 50% de las veces de un lado, pero si sale el 80 o

90 % de de
distante las lo
veces de un solo
esperado, lado, habrá
entonces eso indica que lo observado
una correlación fuerte esta
con
otro factor que produce que salga en mayor medida de un solo lado.

A mayor distancia entre lo observado y lo esperado, mayor es el grado de


correlación y de influencia entre las variables.

Para el cálculo de chi2 se compara el chi2 calculado con el chi2


crítico que se obtiene de las tablas
t ablas de chi2, si el chi2 es menor al chi2
crítico, entonces son independientes, si es mayor son dependientes

Nivel de correlación:
La correlación o la influencia de una variable a otra, puede variar
de -1 (correlación negativa perfecta) a +1 (correlación positiva
perfecta), Hernández, Fernández y Baptista (2014;305) presentan la
siguiente escala del nivel de correlación:

200 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice


-0.90 = Correlación negativa muy fuerte
-0.75 = Correlación negativa considerable ¿Para qué nos sirve esto?
esto?

-0.50 = Correlación negativa media Nos sirve para comparar con el


resultado de Chi cuadrado y poder
-0.25 = Correlación negativa débil establecer el grado de correlación de
nuestros resultados
-0.10 = Correlación negativa muy débil
0.00 = No existe correlación alguna entre las variables

+0.10 = Correlación positiva muy débil


+0.25 = Correlación positiva débil

+0.50 = Correlación positiva media


+0.75 = Correlación positiva considerable

+0.90 = Correlación positiva muy fuerte


+1.00 = Correlación positiva perfecta

5.7.1. Problema 1

En un estudio de mercado:
Se investiga si el envase influye en la venta del producto, para ello
se vende quinua de la misma calidad en dos tipos de envases
diferentes, el producto del envase A, se vendió 300 bolsas el primer
día y al día siguiente 320 bolsas. La quinua del envase B se vendió el
primer día 280 bolsas y al día siguiente 290 bolsas.
El investigador quiere saber si la diferencia de las ventas entre las
quinuas de diferentes envases, se debió al azar o existe una

preferencia por lospues


de los productos, envases que hace
la quinua es deque
la sean
mismadiferentes
calidad ylassolo
ventas
los
diferencia el tipo de envase. Se considera una significancia del 0.01.

La significancia es el error
que se permite=1%

201 www.aacentrum.com

Estadística para tesis Índice


Las variables son “envase” y “n° de ventas”, se busca probar si el
envase influye en el número de ventas.
PASO 1: Graficar las cantidades en la tabla de doble entrada

Envase A Envase B

1 er día 300 280

2 do día 320 290

SEGUNDO PASO: Formular las hipótesis


Formulamos las dos hipótesis de la investigación:
H0 = En las ventas no influye el tipo de envase
H1 = En las ventas si influye el tipo de envase
TERCER PASO: Hallar las frecuencias esperadas

Las frecuencias esperadas de cada valor son igual a la


multiplicación de su total de la columna por su total de la fila,
dividido entre el total general.

Envase A Envase B
302 277
1 er día 300 + 280 = 580
317 + 292 +
2 do día 320 290 = 610
= =
620 570 1190
Hallando las frecuencias esperadas
(Se halla para cada celda)

Para 300:
   = 302

202 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice


Para 320:
7   = 277

Para 280:
   = 317

7  
Para 290:
 = 292
CUARTO PASO: Hallando chi2 calculada (X2)

Para hallar la chi2 se resta la frecuencia observada y la esperada,


se eleva al cuadrado y se divide entre la frecuencia esperada.
(−) Donde:
Formula: Sumatoria de X2 =  O=Frecuencia observada
E=Frecuencia esperada
Aplicando la formula

X2 =
(−) + (−77) + (−7) + (−)
  7 
X2 = 0.013 + 0.030 + 0.028 + 0.014

X2 = 0.085

Hallando los grados de libertad (Gl)


Los grados de libertad son las alternativas que se tiene de elegir
entre una u otra elección, se halla restando 1 al número de columnas
que a su vez se multiplica con el número de filas menos 1, así tenemos:
Fórmula: Gl = (C-1)(F-1)

Donde:

Gl = Grados de libertad
C = Número de columnas

F = Número de filas

En el presente caso tenemos

203 www.aacentrum.com

Estadística para tesis Índice


Gl = (2-1)(2-1) = 1
Los grados de libertad y la
Gl = 1 significancia permite obtener la
chi2 crítica en la tabla de chi2
Parámetros de Chi2 critico
X2 crítico = X2 (1; 0.01) Donde: 1= un grado de libertad y 0.010 es la
significancia, con dichos datos nos vamos a la tabla de chi2 y
ubicamos

df son los grados de libertad


y X2 es la significancia, ambos
números coinciden en 6.635 , si
la sig. Fuera 0.05, la chi critica,
sería 3.841

Por tanto chi critico es = 6.635


Y Chi calculado es X2 = 0.085

Regla: Cuando chi2 calculado es mayor que chi2 crítico, entonces se


rechaza la H0, lo que significa que hay dependencia, las variables son
dependientes.

Conclusión:
Las variables son independientes, por tanto, se acepta la hipótesis
nula que establece que “en las ventas influye el tipo de envase ” y se
rechaza la hipótesis alterna, con un margen de error del 1%
En el SPSS

204 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice


Vamos a “Analizar”, “Estadísticos descriptivos”, “Tablas
cruzadas”, en estadísticos “Chi cuadrado”, en casillas “Esperado”,
continuar y aceptar y tenemos el siguiente resultado:

Pruebas de chi-cuadrado

Significación Significación

asintótica exacta Significación

Valor gl (bilateral) (bilateral) exacta (unilateral)

Chi-cuadrado de Pearson 2,000a 1 ,157


Corrección de continuidadb ,000 1 1,000
Razón de verosimilitud 2,773 1 ,096
Prueba exacta de Fisher 1,000 ,500
Asociación lineal por lineal 1,000 1 ,317
N de casos válidos 2

a. 4 casillas (100,0%) han esperado un recuento menor que 5. El recuento


mínimo esperado es ,50.
b. Sólo se ha calculado para una tabla 2x2

En el cuadro se pude ver que la significancia es 0.57, mayor a 0.05,


por tanto, se acepta la H0 es decir se corrobora la independencia de
las variables

5.7.2. Problema 2

Como problema se considera conocer si el uso de las flores de Bach,


tienen efectos o no en la reducción de la ansiedad, para tal efecto se
ha tomado la siguiente muestra. Calcular con un nivel de significancia
del 0.01

PASO 1: Graficar las cantidades en la tabla de doble entrada

Reducción Flores de Bach


de la
ansiedad Uso No uso

205 www.aacentrum.com

Estadística para tesis Índice

Si 20 25

No 10 45

En este problema se tiene dos variables,


var iables, por un lado está la variable
variabl e
“Flores de Bach” y por el otro lado está la variable “Reducción de la
ansiedad”, se busca conocer si la primera variable influye o no en la

variable segunda
independientes. o ambas variables son completamente

SEGUNDO PASO: Formular las hipótesis


Formulamos las dos hipótesis de la investigación:
H0 = Las “flores de Bach” tienen efecto en la reducción de la
ansiedad
H1 = Las “flores de Bach” no tienen efecto sobre la reducción de la
ansiedad
TERCER PASO: Hallar las frecuencias esperadas
Las frecuencias esperadas de cada valor son igual a la
multiplicación de su total de la columna por su total de la fila,
dividido entre el total general.

Reducción de Flores de Bach


la ansiedad
Uso No uso

13.5……………..+ 31.5……………+
Si 20 +….25 =….. 45

16.5……………+ 38.5……………+

No 10 +….45 =…..55

206 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice


= =

30 70 100

Hallando las frecuencias esperadas


(Se halla para cada celda)

Para 20:
   = 13.5
Para 25:
7
 = 31.5

Para 10:
   = 16.5

Para 45:
7   = 38.5

CUARTO PASO: Hallando chi2 calculada (X2)
Para hallar la chi2 se resta la frecuencia observada y la esperada,
se eleva al cuadrado y se divide entre la frecuencia esperada.
Formula: Sumatoria de X2 =
(−) Donde:
 O=Frecuencia observada
E=Frecuencia esperada
Aplicando la formula

X2 = (−.) + (−.) + (−.) + (−.)


. . . .
X2 = 3.13 + 1.34 + 2.56 + 1.09

X2 = 8.13

Hallando los grados de libertad (Gl)


Los grados de libertad son las alternativas que se tiene de elegir
entre una u otra elección, se halla restando 1 al número de columnas
que a su vez se multiplica con el número de filas menos 1, así tenemos:
ten emos:

207 www.aacentrum.com

Estadística para tesis Índice


Fórmula: Gl = (C-1)(F-1)

Donde:

Gl = Grados de libertad

C = Número de columnas
F = Número de filas

En el presente caso tenemos Los grados de libertad y la


significancia permite obtener la
Gl = (2-1)(2-1) = 1 chi2 crítica en la tabla de chi2

Gl =1
Parámetros de Chi2 critico
X2 crítico = X2 (1; 0.01) Donde: 1= un grado de libertad y 0.010 es la
significancia, con dichos datos nos vamos a la tabla de chi2 y
ubicamos

df son los grados de libertad


y X2 es la significancia, ambos
números coinciden en 6.635

Por tanto chi critico es = 6.635


Y Chi calculado es X2 = 8.13

Regla: Cuando chi2 calculado es menor al chi2 crítico, entonces no


hay dependencia, las variables son independientes .

Conclusión:
Las variables son dependientes, por tanto, se rechaza la hipótesis
nula que establece que “Las “flores de Bach” tienen efecto en la
reducción de la ansiedad” y se acepta la hipótesis alterna, con un
margen de error del 1%

208 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo

En el SPSS
Vamos a “Analizar”, “Estadísticos descriptivos”, “Tablas
cruzadas”, en estadísticos “Chi cuadrado”, en casillas “Esperado”,
continuar y aceptar y tenemos el siguiente resultado:

Correlaciones
V1 V2
Rho de V1 Coeficiente de correlación 1,000 -1,000

Spearman Sig. (bilateral) . .


N 2 2
V2 Coeficiente de correlación -1,000** 1,000
Sig. (bilateral) . .
N 2 2

**. La correlación es significativa en el nivel 0,01 (bilateral).

Se puede apreciar que la significancia es menor a 0.05, por tanto


podemos afirmar que las variables no son independientes.

5.7.3. Problema 3

Una financiera quiere saber si el número de visitas de los analistas


a sus clientes tiene relación con el número de préstamos realizados.
La financiera selecciona al azar una muestra de 10 analistas y
determina el número de visitas que realizo cada uno de ellos el mes
anterior y el número de préstamo realizados.
PASO 1. Graficar las cantidades en la tabla de doble entrada
Analistas Visitas Prestamos
realizadas realizados
1 20 30
2 40 60
3 20 40
4 30 60
5 10 30

209 www.aacentrum.com

Índice
Estadística para tesis

6 10 40

7 20 40

8 20 50
9 20 30

10 30 70
TOTAL

En este problema se tiene dos variables, por un lado, está la


variable “Visitas realizadas” y por el otro lado está la variable
“Prestamos realizados”, se busca conocer si la primera variable
influye o no en la variable segunda o ambas variables son
completamente independientes.
SEGUNDO PASO: Formular las hipótesis
Formulamos las dos hipótesis de la investigación:

H0 = El número de visitas de los analistas a sus tiene relación con


los prestamos realizad
realizados
os
H1 = El número de visitas de los analistas a sus clientes no tiene
relación con los prestamos realizados
TERCER PASO: Hallar las frecuencias esperadas
Las frecuencias esperadas de cada valor son igual a la
multiplicación de su total de la columna por su total de la fila,
dividido entre el total general

Analistas Visitas Prestamos


realizadas realizados

16.4 33.6
=…..50
1
20 30

210 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo

32.8 67.7
=…..100
2
40 60

19.7 40.3
=…..60
3
20 40

29.6 60.5
=……90
4
30 60

13.1 26.9
=…..40
5
10 30

16.4 35.6
=…..50
6
110 40

19.7 40.3
7 =…..60

20 40
22.9 47
=…..70
8
20 50

16.4 33.6
=…..50
9
20 30

32.8 67.7
=…..100
10
30 70

TOTAL 220 450 =…..670

Hallando las frecuencias esperadas


(se halla para cada celda)

211 www.aacentrum.com

Índice
Estadística para tesis

Para 20:
   = 16.4
7
Para 40:
 = 32.8
7
Para 20:
   = 19.7
7
Para 30:
   = 29.6
Para 10:
7  = 13.1
7
Para 10:
 = 16.4
7
Para 110:
   = 19.7
7
Para 20:
7 = 22.9
7
Para 20: 7 = 16.4
Para 10:
 = 32.8
7
Para 30:
   = 33.6
7
Para 60:
 = 67.7
7
Para 40:
   = 40.3
7
Para 60:  = 60.5
7
Para 30:
 = 26.9
7

Para 40:
7 = 35.6
212 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice


Para 40:
   = 40.3
7
Para 45:
  7 = 47
7
  
Para 30:
7 = 33.6
Para 70:
 = 67.7
7
CUARTO PASO: Hallando chi2 calculada (x 2)
Para hallar la chi2 se resta la frecuencia observada y la esperada,
se eleva al cuadrado y se divide entre la frecuencia esperada.

Formula: Sumatoria de X2 =
(−) Donde:
 O=Frecuencia observada
E=Frecuencia esperada
Aplicando la fórmula

X2 = (−.) + (−.) + (−.7) + (−.)


. . .7 .
= (−. ) + (−.) + (−.) + (−.)
. . . .
(−7. 7) (−.) (−.) (−.)
= 7.7 + . + . + .
(−. ) (−.) (−7) (−.)
= . + . + 7 + .
(7−7. 7) (−.) (7−7.7)
= 7.7 + . + 7.7
X2 = 3.13 + 1.34 + 2.56 + 1.09

X2 = 8.13

El valor de chi critica en tabla es de: 16.919. Al ser menor la chi


calculada, entonces se acepta la X 0 que establece que ambas
variables son independientes.

213 www.aacentrum.com

Estadística para tesis Índice


En el SPSS
Vamos a “Analizar”, “Estadísticos descriptivos”, “Tablas
cruzadas”, en estadísticos “Chi cuadrado”, en casillas “Esperado”,
continuar y aceptar y tenemos el siguiente resultado:

Pruebas de chi-cuadrado

Significación
asintótica
Valor gl (bilateral)

Chi-cuadrado de Pearson 13,167a 12 ,357


Razón de verosimilitud 14,001 12 ,301
Asociación lineal por lineal 5,185 1 ,023
N de casos válidos 10

a. 20 casillas (100,0%) han esperado un recuento menor que 5. El


recuento mínimo esperado es ,10.

Podemos apreciar una significancia de 0.357, que es mayor a 0.05,


por tanto, se acepta la hipótesis nula que establece que las variables
son independientes, corroborando el estadístico hecho manualmente.

5.8. Prueba de hipótesis con T de


Student

Es una prueba de hipótesis por medio de una medida de


distribución que se calcula por medio de la distribución T, en base a
los grados de libertad (Gl) y los percentiles (vienen de dividir 100%).
A diferencia de la distribución normal que es para muestras mayores
a 30, la T de Student es para muestras menores a 30
Fórmula de la T de Student Fórmula de la dist. normal

 ̅−
tЄ = (  )µ ̅
Z= 
− µ
√

214 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo

Gráfico de la T de Student Gráfico de la Distribuci


Distribución
ón
Normal

5.8.1. Características:
Se usa para probar hipótesis
Se usa en variables cuantitativas
Compara las medias de dos muestras o de una
relacionada
Se usa cuando la distribución es normal
Cuando se desconoce la desviación estándar poblacional
Es más aplanada que la distribución normal

A medida que
aproxima el número
a una de lanormal
distribución muestra aumenta, se
estándar.

5.8.2. Aplicación:

Para una muestra relacionada (es decir antes y después


de una intervención)
Para dos muestras con varianzas homogéneas (Es
necesario conocer si poseen homocedasticidad)
Para dos muestras con varianzas heterogéneas (Es
necesario conocer si poseen homocedasticidad)

5.8.3. Conocimientos previos:

215 www.aacentrum.com

Índice
Estadística para tesis

Grados de libertad
Es el número de eventos que puede variar la muestra
Gl = n – 1 → Para una muestra
Gl = (n1 + n2) – 2 → Para dos muestras
Hipótesis

Las hipótesis que se plantean en una T de Student son:


H0 = A = B (La hipótesis nula plantea que la muestra es
igual a la segunda o que es igual antes y después de
la intervención)

H1 = A ≠ B (La
hipótesis alterna plantea que la muestra es
diferente a la segunda o que es diferente antes y
después de la intervención)

5.8.4. Requisitos

S < 30, una población que no pase de 30 y considerada normal


= La media muestral

µ = La media poblacional
σ
Ee = El error estándar =
√ = El error estándar es igual a la

desviación estándar de la media muestral entre la raíz de n

5.8.5. Pasos para su desarrollo

Paso 1: “Declarar las hipótesis”

216 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo

Paso 2: “Establecer el nivel de significancia (α), los grados de


libertad (Gl=n-1) y puntos críticos ± (se obtiene de la tabla T de la
unión de los puntos de α con los Gl)”

Paso 3: “Establecer el punto de prueba T =


 − µ

Paso 4: “Establecer en la gráfica la ubicación del punto de prueba,
si se ubica en el área de rechazo o aceptación y dar una conclusión”
conclusión”

5.8.6. Ejercicios
Una empresa que fabrica celulares afirma que las baterías que
utiliza en sus dispositivos duran un promedio de 30 horas. Para
mantener este promedio, se prueban 16 baterías cada mes, si el valor
t-0.025 y t0.025, la empresa queda satisfecha con su afirmación. ¿Qué
conclusiones debería sacar la empresa a partir de una muestra que
tiene una media de 27.5 horas y una desviación estándar de la
muestra de 5 horas?
Suponga que la distribución de las duraciones de las baterías es
aproximadamente normal.
Datos

Media de la población (µ) = 30 horas

Media de la muestra ( ) = 27.5


Tamaño de la muestra (n) = 16 baterías
Desviación estándar de la población (σ) = 5 horas
Paso1: Formulación de hipótesis
H0 = = 30 la hipótesis nula considera que las baterías duran un
promedio de 30 horas

217 www.aacentrum.com

Índice
Estadística para tesis

H1 = ≠ 30 la hipótesis alterna considera que las baterías tienen


una duración diferente a 30 horas
Paso 2: Especificar la significación (α)
La desviación estándar es de 5, por tanto, los límites de la zona de
aceptación y de rechazo es de 2.5 = 0.025
Paso 3: Calcular el valor crítico y el valor de prueba
El valor crítico
Es el valor calculado y lo hallamos mediante la siguiente operación

tЄ = ( ̅− µ) = 7.−  = −. = -2


.
√ (√)
Hallando el valor de prueba
El valor de prueba lo obtenemos de la tabla de distribución:
Ubicar en la tabla t de student la intersección entre los grados de
libertad (Gl) en el presente caso son 15 con la s ignificancia (α) que
es 0.025, obteniéndose el valor de 2.131, por tanto, la t de student
variará entre -2.131 y +2.131
Por tanto, se tiene la siguiente gráfica:

218 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo

Como podemos apreciar el valor crítico está dentro de la zona de


aceptación.
Paso 4: Tomar una decisión
Encontrándose el valor crítico dentro de la zona de aceptación, se
acepta la hipótesis nula, es decir: que se acepta que el promedio de
funcionamiento de las baterías sea de 30 horas.

5.9. Prueba de hipótesis con F de


Fisher
Este estadístico lleva el nombre de Sr. Ronald Fisher, que fue uno
de los fundadores de la estadística. Es la distribución de probabilidad
de la razón de dos varianzas provenientes de dos poblaciones
diferentes, se define como el cociente entre dos variables chi
cuadradas divididas por sus grados de libertad. Se usa entre otras
cosas cuando se desea comparar la precisión de un instrumento con
otro instrumento.
Fórmula:
 .  / ( −)
F= .  / ( −) . σ
.σ 
   
Donde:
N1 = N de datos de la muestra 1
N2 = N de datos de la muestra 2

S12 = Varianza muestral del grupo 1


S22 = Varianza muestral del grupo 2

12 = Varianza del grupo 1


σ

219 www.aacentrum.com

Índice
Estadística para tesis

22 = Varianza del grupo 2


σ

A) Características:
Una distribución F siempre es positiva y varía de “0” a
“F”
Es asimétrica, pero disminuye conforme aumenta los
grados de libertad

B) Conocimient
Conocimientos
os previos
Nivel de significancia

Nivel de significancia Descripción

1% o 0.01 1 – 0.01 = 0.99

5% o 0.05 1 – 0.05 = 0.95

10% o 0.10 1 – 0.10 = 0.90

2.5% o 0.025 1 – 0.025 = 0.975

El nivel de significancia es el nivel de error que se acepta, es


necesario para identificar la tabla F, que pueden ser para 1%, 5%, 10%
y 25%
Grado de libertad (V1 y V2)

Para calcular los valores del grado de libertad:


V1 = N1 – 1
V2 = N2 – 1
Nivel de significancia (α)
F (α1 V1 V2)

220 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice


Conclusión:
Fc > Ft se rechaza H0
Fc < Ft se rechaza H0

Donde:
Fc = F calculado (por fórmul
fórmula)
a)
Ft = F tabla (ver tabla F (α1 V1 V2))

C) Ejercicios
De poblaciones distribuidas en forma normal se obtiene dos
muestras de tamaño 16 y 14 cuyas varianzas muestrales
muestrales son 8 y 10.
Si las varianzas son 9 y 16 respectivamente, determinar si la
primera muestra tiene una varianza bastante mayor que la
segunda muestra de nivel de significancia a) 0.95 y b) 0.99
Paso 1:
1: Formular la hi
hipótesis
pótesis
H0 = La primera muestra tiene una varianza mayor que la segunda
muestra
H1 = La primera muestra no tiene una varianza mayor que la
segunda muestra
Paso 2: Especificar
Especificar la significación
N1 = 16 N2 = 14
S12 = 10 S22 = 8
2
σ1 =9 σ22 = 16
α = 0.95, 0.99

Paso 3: Hallando la F calculada y la F de tabla

221 www.aacentrum.com

Estadística para tesis Índice


  .   / (
Fc =  .  / ( −) . σ
−) .σ  
   
Fc =  . / ( −)
−) . 
 . / (−) . 
Fc = 2.20
La F de tabla
Nivel de significancia (α): 0.95; 0.99
Grado de libertad:
V1 = N1 – 1 = 16 – 1 = 15
V2 = N2 – 1 = 14 – 1 = 13
Ft : (α1; V1; V2)
Ft1 : (0.95, 15, 13) = 2.53
Ft2 : (0.99, 15, 13) = 3.82

Los grados de libertad de V1 = 15 y V2 = 13, ambos valores se


verifican en la tabla F cuando α = 0.95, obteniendo un valor de 2.53,
esta situación se expresa: F(0.95 ; 15 ; 13) = 2.53 .
222 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo

La F calculada = 2.20, está a la izquierda de la F de tabla = 2.53, es


decir se encuentra en la zona de aceptación, motivo por el cual
corresponde aceptar la hipótesis nula.
Los grados de libertad de V1 = 15 y V2 = 13, ambos valores se
verifican en la tabla F cuando α = 0.99, obteniendo un valor de 3.82,
esta situación se gráfica: F(0.99 ; 15 ; 13) = 3.82.
La F calculada = 2.20, estando a la izquierda de la F de tabla = 3.82,
es decir se encuentra en la zona de aceptación, motivo por el cual
corresponde aceptar la hipótesis nula.
Paso 4: Tomar una decisión

Encontrándo se la F calculada 1 (Fc1) y la F calculada 2 (Fc2), dentro


Encontrándose
del área de aceptación, corresponde aceptar la hipótesis nula.
Práctica
Distribución F

223 www.aacentrum.com

Estadística para tesis Índice


La función de distribución F de Fisher no es utilizada en la vida
diaria, pero tiene muchas aplicaciones
aplicaci ones en la estadística para el estudio
de la relación entre las varianzas de dos poblaciones independientes.
Ejemplos:
Comparar la precisión de un instrumento de medición
Comparar la estabilidad entre dos procesos de manufactura

En una empresa se tienen dos tornos de diferente antigüedad, lo


que hace pensar que las varianzas no son iguales. ¿Cuál es la
probabilidad de que la relación entre las varianzas sea igual a 3? Se
sabe que los grados de libertad son iguales a 10
X=3 a = 10 b = 10
   
    
f(x) =      
( )()(+) 
+ +
   = r(  ) = r(10) = 9!
( ) = ()  = 1 = 1
− − 
 = 3  = 3 = 81

  =    = r(5) = 4 ¡


  =   = 4!
  =    = 
(1  ) encontrar
Para poder (1(1  la3)probabilidad,
4 sustituimos los datos en la
forma principal y encontramos:
(!)()() = 0.048666
f(3,10,10) = ()()( )

224 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice

6 Regresión Lineal

Es una técnica estadística


estadíst ica que se utiliza para predecir o estimar una
variable cuantitativa en función a otra variable cuantitativa. Quisiera
aclarar que el hecho de aplicarse a variables cuantitativas no
necesariamente quiere decir que la investigación sea cuantitativa, esto
est o
puede ocurrir cuando se aplica a un aspecto de la tesis diferente a la
variable principal, por ejemplo cuando se quiere predecir el despido
de personal en relación a la situación económica de la empresa, sin
embargo la tesis puede ser cualitativa si la variable principal se mide
por cualidades o criterios, por ejemplo si se trata de medir los factores
para la crisis económica en una empresa en su segundo año de
emprendimiento y dentro de este problema se ha realizado una
regresión lineal para un aspecto de esta y no para medir la variable
principal.
La regresión lineal mide la influencia de una variable
independiente sobre otra dependiente.
Donde:
X = Variable independiente (es la variable explicativa)
Y = Variable dependiente (es aquella que buscamos predecir o
estimar)
Formula

La fórmula de la regresión lineal es la siguiente:

= 
Donde:
Y = Variable dependiente

225 www.aacentrum.com

Estadística para tesis Índice


a = Es el intercepto, coeficiente constante,
constante, un solo valor, no varía
b = La pendiente, coeficiente constante, un solo valor, no varía
X = Variable independiente

6.1. Tipos de regresiones lineales

Las regresiones, pueden ser positivas, cuando el resultado


aumenta en las dos variables y puede ser negativa, cuando aumenta
para la independiente y disminuye para la dependiente.
Regresión lineal positiva

regresión lineal positiva

x
Regresión lineal negativa

regresión lineal negativa

x
Ejemplo
Un estudio sobre los trabajadores de una compañía ha concluido
que, a mayor especialización y capacitación, mayor es la
remuneración de un trabajador de dicha empresa.
226 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice


En el presente ejemplo se tiene:
X = variable independiente = especialización y capacitación
Y = variable dependiente = mayor remuneración.
La grafica de esta regresión lineal seria la siguiente:

Y = Remuneración

regresión lineal positiva


X = Especiali
Especializacion
zacion y capacitacion
En el presente ejemplo se tiene una regresecion lineal positiva por
que cuando aumenta la especializacion y la capacitacion, tambien
aumenta la remuneracion

Ejemplo de regrecion lineal negativa:


Se busca establecer como influye el aumento de trabajadores en la
reducción del tiempo de una construcción. En este caso a mayor
número de trabajadores menor será el tiempo de la construcción.
X = variable independiente = número de trabajadores
Y = variable dependiente = tiempo de la construcción

Y = Tiempo de construcción

Regresión lineal negativa

X = Número de trabajadores

227 www.aacentrum.com

Estadística para tesis Índice


El Intercepto (a)
Es el punto de corte entre la línea de la variable Y con la
prolongación del resultante

Intercepto (a)
X
Pendiente (b)
Es la inclinación que tiene la línea respecto del eje X y se mide por
la diferencia de altura que hay entre dos valores consecutivos del eje
X, así se tiene:
6
5 pendiente (b1)
4
3 1
2
1

1 2 3 4 5

6.2. Ejercicios prácticos

Una empresa ha tenido el siguiente resultado en relación al


crecimiento económico del PBI nacional, se quiere saber cuánto serían
los ingresos de la empresa para el próximo año si los especialistas
prevén un crecimiento del PBI del 4%.

Año Crecimiento del Ingresos de la


PBI % empresa (soles)

228 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice

2014 2 215,000

2015 2.3 230,000

2016 1.5 180,000

2017 3 270,000

2018 3.l 320,000


2019 2.9 240,000

2020 4 ¿?

Datos:
Variable independiente (X)

Crecimiento del PBI


Variable dependiente (Y)
Ingresos económicos de la empresa
Solución:
1. Trasladamos los datos al SPSS

229 www.aacentrum.com

Estadística para tesis Índice


Si bien queremos hallar los ingresos para el año 2020 en un
supuesto crecimiento del PBI del 4%, sin embargo, en la matriz del
solo debemos poner las variables relacionada completas, en este caso
solo debemos de poner hasta el año 2019, porque sino el ingreso del
año 2020 el SPSS le asignará un valor de 0, así la matriz quedaría:
2. En el SPSS, clic en “Analizar”, luego “Regresion”, luego
“Lineales”

Donde se abrirá el siguiente cuadro:

230 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo
Donde pasamos la variable ingresos a dependientes y la variable
PBI a independientes, además vamos a “Gráficos” y activamos las
casillas “histograma” y “gráfico con probabilidad normal” si
necesitamos dichos gráficos:

Luego en “Estadísticos” verificamos que estén activas las casillas


“estimaciones ”, “ajuste del modelo” y “cambio en el estadístico R
cuadrado”, luego continuar.
231 www.aacentrum.com

Índice
Estadística para tesis
Luego continuar y aceptar y el visor nos dará el siguiente
resultado:
En el cuadro resumen del modelo

Resumen
Resumen del m odelo
Estadísticos de cambio
R Error Cambio Sig.
Model cuadra R cuadrado estándar de en R Cambio en Cambio
o R do ajustado la estimación cuadrado F gl1 gl2 en F

1 ,965a ,931 ,914 14109,276 ,931 54,208 1 4 ,002

a. Predictores: (Constante), PBI


b. Variable dependiente: Ingresos

R = El valor 0.965 debajo de R, indica que el valor de dependencia


entre variables es muy relacionado

R2 = R cuadrado se conoce como el coeficiente de determinación,


indica que 93.1% de la variable Y es dependiente de la otra variable o
en otras palabras, la variable X explica a la variable Y en un 93.1%
El error estándar de la estimación: Es el error que puede ocurrir,
cuanto mejor es el ajuste, menor será la cantidad del error.

232 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice


Análisis del cuadro ANOVA
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 10791213298,7
10791213298,791 1 54,208 ,002b
91
Residuo 796286701,209 4 199071675,302
Total 11587500000,000 5

a. Variable dependiente: Ingresos

b. Predictores: (Constante), PBI


El valor de la significancia
signifi cancia = 0.002 al ser menor que 0.05, indica
in dica que
rechazamos la hipótesis nula y aceptamos la hipótesis del
investigador que considera que las variables están directamente
relacionadas
H0 = R = 0
H1 = R > 0
Análisis del cuadro de coeficientes
Coeficientes
Coeficientes no estandarizados estandarizados
Modelo B Error estándar Beta t Sig.
1 (Constante) 86813,472 21916,119 3,961 ,017
PBI 61053,541 8292,404 ,965 7,363 ,002
a. Variable dependiente: Ingresos

Donde la constante a (intercepto) = 86,813.472 y

La constante b (pendiente) = 61,053.541


Con estos valores podemos hallar cualquier punto de la regresión

lineal para el año


en el ejemplo 2020,tenemos:
anterior cuando se tenga un crecimiento del PBI del 4,

Y = a + bX
Y = 86,813.472 + (61,053.541) 4
Y = 331,027.636

233 www.aacentrum.com

Estadística para tesis Índice


Conclusión

Si el país crece a un 4% de su PBI, se prevé un ingreso de


331,027.636 para la empresa

También, podemos hacerle un gráfico de la regresión lineal, para


ello vamos a:

“Gráficos”, “Cuadro de diálogos antiguos”, “Dispersión puntos”


Luego hacemos clic en “dispersión simple”

234 www.aacentrum.com

Índice
Francisco Guillermo Sánchez Espejo

y clic en “definir”, donde obtendremos el siguiente cuadro:


En este cuadro pasamos las variables a los ejes X y Y, luego aceptar
y obtendremos el siguiente resultado:
El resultado es el siguiente grafico de dispersión que aparecerá en
el visor del SPSS:

En el gráfico tenemos en el eje X el PBI que es la variable


independiente y en el eje Y tenemos la variable dependiente que son

235 www.aacentrum.com

Índice
Estadística para tesis

los ingresos de la empresa, los puntos son las uniones entre estas dos
variables que siguen conforme a los datos aportados en el problema.
¿Para qué nos sirve la regresión lineal en una tesis?
La regresión lineal nos permitirá pronosticar valores, así por
ejemplo en un estudio de producción, podemos pronosticar la
producción del próximo año en base a la producción que venido
realizándose anteriormente, etc.
236 www.aacentrum.com

Francisco Guillermo Sánchez Espejo Índice

7 La Estadística

7.1. ¿Qué es la estadística?

La estadística
obtenidos es la ciencia
de un objeto que además,
de estudio, recopila estudia
y organiza los datos
los principios,
axiomas y postulados sobre las posibilidades que un hecho o evento
ocurra, en investigación tiene una importancia trascendental, porque
ayuda a tomar decisiones fundamentados en cálculos estadísticos,
con cierto margen de error y un margen de confianz
confianza.
a.
La estadística es una ciencia muy compleja, sin embargo, en el
presente estudio vamos a enseñarle la forma práctica de aplicar la
estadística en una tesis, usted amigo lector verá que es fácil su
aplicación en una investigación con la didáctica paso a paso que tiene
la presente metodología de enseñanza.
Definición
La estadística es una rama de las matemáticas que estudia las
probabilidades de que un evento suceda. La estadística nos permite
realizar afirmaciones posibles, fundamentados en la teoría de
posibles eventos.

La estadística es una herramienta para el análisis de datos de


una investigación

¿Cómo nos ayuda la estadística para el análisis de datos?


La estadística nos ayuda a analizar las probabilidades que
sustentan nuestra investigación. Así, por ejemplo, podemos

237

Estadística para tesis Índice


establecer promedios, asociaciones, validaciones y otras operaciones
que la tesis lo requiera.
Como se puede apreciar, la característica de la estadística, es la
probabilidad de sucesos.

7.2. Teoría de las probabilidades

Esta teoría postula


postul a que la probabilidad es la posibilidad que ocurra
algo en una mayor o menor medida.
Poco Muy
Probable 0% Probable 100%
En probabilidades la certeza de un evento varía en una relación de
mayor o menor probabilidad que ocurra un evento o suceso.
Ejemplo:
1. Si tengo una moneda (con dos lados cara y escudo) y quiero saber
la probabilidad que salga cara cuando lo arroje al piso, se tiene:
 Donde 1 Es la única oportunidad (un solo lanzamiento) y 2 indica

que tiene dos alternativas que pueden salir, cara o sello. Esta fracción
en decimales sería  = 0.5 y en porcentaje será = 50%, esto indica que
hay un 50% de probabilidades que salga
salg a cara y 50% de probabilidades
que salga sello.

2. Tengo un dado que tiene 6 caras y quiero saber que


probabilidades hay de que me salga el número tres en el primer
lanzamiento.
En este caso se busca hallar la probabilidad de obtener 1 resultado
de 6 posibilidades, por tanto, la respuesta es  , es decir 1 es igual a un

238

Francisco Guillermo Sánchez Espejo Índice


lanzamiento y 6 a seis posibles resultados, situación que en decimales
es 0.166 y en porcentaje es 16.6%
3. Tengo un dado y quiero saber la posibilidad que en un
lanzamiento me salga un número par, esto es: 2,4 y 6.
En este caso se busca hallar la probabilidad de obtener 3 resultados
 
de 6 posibles resultados, por tanto, la respuesta es  que es igual a  y

que en decimales es igual a 0.50 y en porcentajes es el 50% de


probabilidades que me salga un número par cuando se lance el dado.
Conforme se ha podido apreciar, las probabilidades son fracciones
que realizadas las divisiones nos da un número comprendido entre 0
y 1, por tanto, podemos decir que la probabilidad de que ocurra un
evento es un valor comprendido entre 0 y 1 y lo representamos de la
siguiente manera:

0 ≤ P(a) ≥ 1, donde P(a) =


     
   
La probabilidad será 0% si es imposible que suceda el evento y
La probabilidad será 100% si es bien seguro que ocurra
Por tanto: el valor de la probabilidad cerca del cero indica menos
probable que ocurra
ocur ra el evento y un valor cerca del 1 indica
indic a que es muy
probable que ocurra el evento.

7.3. Ramas de la Estadística

La estadística se divide en dos ramas bien diferenciadas, que son


la estadística descriptiva y la estadística inferencial. La estadística
descriptiva estudia las medidas de tendencia central, las medidas de
dispersión y las medidas de distribución, por otra parte, la estadística
inferencial estudia la estimación de valores y la prueba de hipótesis.

239

Estadística para tesis Índice


La estimación puede ser puntual o por intervalos de confianza, así
mismo la prueba de hipótesis puede ser por medio de métodos
paramétricos o por métodos no paramétricos.
Clasificación de la estadística

Estadística Descriptiva
Ramas de la Estadistica

Estadística Inferencial

7.4. La Estadística Descriptiva

Es la parte de la estadística que establece probabilidades sobre una


muestra o población, se diferencia de la estadística inferencial en que
la descriptiva no se generaliza, solo es válido para los elementos que
fueron evaluados, en cambio en la inferencial, los resultados se
generalizan a toda la población. Su operación no solo implica los
cálculos matemáticos sino también el cálculo mediante gráficos. La
función de esta rama
r ama de la estadística no es obtener conclusiones del
fenómeno, sino obtener los datos que lo caracterizan.
La estadística descriptiva se divide en tres ramas que son: a)
Análisis de tendencia central, b) Medidas de dispersión y c) Medidas
de distribución.

240

Índice
Francisco Guillermo Sánchez Espejo

ESTADÍSTICA

Descriptiva Inferencial

Ánalisis de Medidas de Medidas de


tendencia disperción distribución
central

Media Varianza Simetría Curtosis


Mediana Desviación Leptocurtica
estandar

Moda Rango Mesocurtica

Platicurtica

7.4.1. Análisis de tendencia central

Es un estudio estadístico que establece en un solo valor las


propiedades
propiedades o características de un conjunto de datos.

l Suma de todos los datos


a
tr Media divididos entre el
n numero de valores
ce
ica
n
e Son las que pretenden Valor que ocupa la
d
tn e resumir en un de
un conjunto solodatos
valor Mediana posicion
un ordenintermedia
intermedia de
jerarquico
e
d
iss
il
a Es el valor que más se
n Moda repite
A

241

Índice
Estadística para tesis

Conocimientos previos
Los datos pueden ser unitarios o agrupados, en este último caso,
requerirá agruparlos por intervalos, en este caso se necesita una tabla
de distribución de frecuencias que resuma los datos y permita su
análisis.
A. Tabla de distribución de frecuencias (TDF)

Es una tabla que distribuye los datos en intervalos, además


permite que en las columnas se planteen cálculos sobre su frecuencia
absoluta, relativa y acumulad
acumulada.
a.
Ejemplo
Se tiene las siguientes edades:
25 24 32 23 21 38
20 25 23 29 24 28
25 35 21 27 39 23
34 21 26 28 25 31
25 37 24 27 34 24
Se pide hallar el rango, el ancho de clase y ordenar los datos
conforme a su frecuencia absoluta, relativa y acumulada.
Solución:
1.- Hallar el rango: Para ello, al de mayor valor
val or se resta el de menor
valor:
39 – 20 = 19, quedando en 20
2.- Hallar el ancho de clase: Para ello, dividimos 20 entre 4
quedando en 5 el ancho de clase.
3.- Ordenar los datos en la tabla de frecuencias.

242

Índice
Francisco Guillermo Sánchez Espejo

Clase Límite Límite Marca Frecuencia Frecuencia Frecuencia


inferior superior de absoluta relativa acumulada
igual a: menor a: clase

1 20 24 22 7 0.2 7

2 24 28 26 12 0.4 19

3 28 32 30 4 0.1 23

4 32 36 34 4 0.1 27
5 36 40 38 3 0.1 30

Total 30 1.0

Donde:
Clase: Es el número de divisiones de la distribución
Marca de clase: Es el número medio ubicado entre el
límite inferior y el superior
Frecuencia absoluta: Es el número de elementos
comprendidos
comprendid os entre los limites inferior y superior
Frecuencia relativa: Resulta de dividir el número de la
frecuencia absoluta y el total de dicha frecuencia
Frecuencia acumulada: Resulta de sumar cada frecuencia
absoluta con la siguiente e ir acumulando

B. La media (
La media es una medida de tendencia central, es el valor de un
conjunto de datos que resulta de sumar todos ellos y dividirlos en
el número de elementos que tiene el conjunto.

243

Índice
Estadística para tesis

Formula:
Se lee: la mediana es igual a la suma
=
 
∑  de los números que van desde 1 hasta n
(representados por Xi) entre el número
de datos

Ejemplo:
Se tiene las edades de un grupo de amigos que son las siguientes:
15 16
16 15
14 17
16 16
Del conjunto sumamos:
= 15 + 16 + 14 + 16 + 16 + 15 + 17 + 16 = 125

Ahora estos datos lo dividimos entre 8 que es el número de datos


y obtenemos el promedio de las edades:
= 125/8 = 15.6
C. La mediana (m)
Es el dato que ocupa la mitad de una ordenación jerárquica de los
datos.
Reglas para calcular la mediana

Ordenar las mediciones de menor a mayor


Si “n” es impar, la mediana es la medición con rango “(n
+ 1) / 2”
Si “n” es par, la mediana “m” es el valor de “x” que se
encuentra a la mitad entre la medición con rango “n /
2” y la medición con rango “(n/2)+1”.

244

Francisco Guillermo Sánchez Espejo Índice


Ejemplo: Se tiene los siguientes datos
17
16
16
Donde n = 7, m = (7+1)/2 = 4
16
En la ordenación de los datos, podemos
15 ver que el número que se ubica en la
15 mitad de la ordenación es el 16 que
vendría a ser la mediana.
14
Entonces: m = 16
D. La moda
La moda de un conjunto de datos es aquel que se repite con mayor
frecuencia, del ejemplo anterior la moda vendría a ser el número 16.

Donde x son las edades, f es la frecuencia, donde F es la frecuencia


absoluta, y x*f es la multiplicación de las edades por la frecuencia

x f F X* f
13 3 3 39
14 14 17 196
15 23(moda) 40 (mediana) 345
16 10 50 160
17 5 55 85
18 4 59 72
19 1 60 19

245

Estadística para tesis Índice

Sumatorias 60 916

De la tabla podemos ver la media es el promedio de todos los datos


que es 15,36; entonces la mediana se halla al dividir el número de
datos que es 60 entre 2 obteniendo 30, siendo la mediana el número
más cercano 40 y la edad de ese casillero seria 15 años; por otra parte
la moda seria 23 porque corresponde al dato que más se repite
considerando que 23 personas tienen 15 años.
7.4.2. Medidas de dispersión

Las medidas de dispersión son medidas que nos indican la


dispersión de los datos respecto a su media, los cálculos que se
pueden realizar para medir la dispersión son la varianza, la
desviación estándar, el coeficiente de variación. Los datos pueden ser
registrados en forma continua o agrupados en intervalos.
Las principales medidas de dispersión son las siguientes:

Se obtiene sumando
las diferencias al
Varianza cuadrado y ese valor
n se divide entre la
icó muestra
r
e Indican que tanto se
p
is alejan los datos
d respecto a la media Es la raiz cuadrada de
e aritmética y que tan Desviación estandar la varianza
d
s variables son nuestros
a
i d datos
d
e Es el valor que resulta
M Rango de la resta del valor
maximo y minimo de
la muestra

246

Francisco Guillermo Sánchez Espejo Índice

POBLACIÓN

MUESTRA Permite hacer


Cálculos para
INFERIR a la
Población

Estadístico Parámetro
(Conocido) (Desconocido)
*Varianza Varianza
*Desviación estándar Desviación estándar
*La media La media

Las medidas de dispersión de una población tienen letras griegas, en

cambio las medidas de dispersión de una muestra tienen letras del


español.

A. La Varianza
Es el promedio de los cuadrados de las desviaciones medias que
tienen los elementos respecto de la media.
Fórmula para la población

 2 =
∑ 
() 

Esto, es lo mismo que la siguiente formula:

 2=
 +(−)
(−)  +… (−)


247

Estadística para tesis Índice


Fórmula para la muestra

S2
∑ 
()
= −

Esto, es lo mismo que la siguiente formula:

S2 =

(−) 
+(−) 
+… (−)
−
Por ejemplo
Tenemos una muestra de las siguientes edades:
25, 30, 20, 35, 30, 40 35, 50, 45, 40
Donde el promedio = 35
(−)+(−)̅ +(−)+ (−)+(−)+(−)
S2 = −
+(−)+(−)̅ +(−)+ (−)
−
S2 = 7

S2 = 83.3
Como resultado tenemos una varianza de 83.3, esto significa que
hay una variabilidad acumulada de 83.3, por tanto, los datos son
dispersos, si todos los datos fueran el mismo número no habría
dispersión y la varianza sería 0.
Segundo ejemplo
Tenemos una muestra de las siguientes edades:
35, 32, 29, 31, 30, 29, 30
Donde primero hallamos el promedio

Promedio = 30.8 y S2 = 4.5

248

Francisco Guillermo Sánchez Espejo Índice


De los 2 ejemplos anteriores, podemos ver que la varianza exagera
por así decirlo la diferencia o la variabilidad que tienen los datos, en
el primer caso pudimos apreciar que la diferencia de las edades era
de 5 y que la menor edad era de 20 y la mayor edad de 50, obteniendo
o bteniendo
una varianza de 83.3. En cambio, en el segundo ejemplo se tiene una
diferencia de edades de 1, siendo la menor edad 29 y la mayor edad
35 y se obtuvo una varianza de 4.5.

Cálculo de la varianza en Excel


El cálculo de la varianza en Excel se hace mediante la función var,
de la siguiente forma: =var(…: …), donde en los puntos suspensivos
debe ir el rango de celdas que contienen los datos cuya varianza se
quiere calcular.
B. Desviación estándar
Es una medida que sirve para indicar los grados de dispersión que
se encuentran los individuos que conforman la muestra respecto de

la
quemedia, la diferencia
la varianza entre la varianza
es la desviación estándary elevado
la desviación estándarsea,
al cuadrado, es
por ejemplo:
Se tiene a 6 amigos con las siguientes edades: 12; 11; 14; 12; 10 y 15,
en este caso la media es igual a 12.3, esto significa
signifi ca que el primer amigo
con 12 años está 0.3 por debajo de la media, el de 11 años está 1.3 por
debajo de la media, el de 14 años está 1.7 por encima de la media, el
de 12 años está 0.3 por debajo de la media, el de 10 está 2.3 por debajo
de la media y finalmente el de 15 está a 2.7 por encima de la media.

∑x(X1  X(prom))2
La fórmula para la desviación estándar es σ=
 −
Edades (X1 - ) (X1 - )2
12 -0.3 0.9
11 -1.3 1.69
14 1.7 2.89
249

Estadística para tesis Índice


12 -0.3 0.9
10 -2.3 5.29
15 2.7 7.29
74 18.96
Donde:
= 12.3

O que es lo mismo que hacer esta operación:

∑x(X1  X(prom))2 18.96


σ  − σ − 1.9

Esto quiere decir:

Desviación estandar
20

15

10

0
0 1 2 3 4 5 6 7

En el gráfico se puede apreciar que hay una desviación estándar


de los elementos de 1.9 respecto de su media que es 12.3.
Los datos pueden encontrarse en una serie o pueden encontrarse
agrupados en intervalos.
C. Coeficiente de variación
Es el grado de dispersión o de variación que tienen los datos, es la
división entre la desviación estándar y el promedio, tiene la siguiente
fórmula:


Cv = . 100

250

Índice
Francisco Guillermo Sánchez Espejo

Se multiplica por 100, debido a que el valor del coeficiente es en


porcentaje (%). Decimos que lo datos varían mucho cuando el
coeficiente de variación es mayor a 25%.
Ejemplo:

Se busca hallar la varianza(S2), la desviación estándar (S) y el coeficiente de


variación (Cv) de los siguientes datos:

Se tiene las edades de un conjunto de personas que varían desde los 20 hasta
los 50 años, la organización de los datos de las edades y del número de personas
se grafican en la siguiente tabla, donde :

EDAD X F X(f) (X- )2 (X- )2. f

20-25 22,5 5 112,5 182.25 911.25


25-30 27,5 9 247,5 72.25 650.25

30-35 32,5 12 390 12.25 147


35-40 37,5 15 562,5 2.25 33,75
40-45 42,5 11 467,5 42.25 464,75
45-50 47,5 8 380 132.25 1058
60 2160 3265
La edad se divide en intervalos de 5 años
f es igual a la frecuencia, es decir el número de personas
por cada intervalo, de esta manera por ejemplo entre
20 y 25 años hay 5 personas
X es la media de cada intervalo
es el promedio de la sumatoria de las frecuencias entre
el número de intervalos

=
∑.

251

Estadística para tesis Índice


=
= 36

** Hallando la varianza (σ2), cuya formula es:

σ2= ∑(

).


Reemplazando los datos, tenemos σ2=  = 54,41

** Hallando la desviación estándar ( σ)


Como sabemos la desviación estándar es la raíz cuadrada de la
varianza

σ= 54,41= 7,37
• ** Hallamos el coeficiente de variación (C v)

 .
CV= .100 =  .
= 20,47 %

Si el coeficiente de variación es mayor al 25% los datos se


encuentran muy dispersos, esto quiere decir que cuanto más sea el
coeficiente de variación, más dispersos se encuentran los datos.

7.4.3. Medidas de distribución


252

Francisco Guillermo Sánchez Espejo Índice

Cuando los datos


se distribuyen de
forma similar,
similar, a
n Simetria la derecha y a la
icó
izquierda
u Nos permite respecto a la
irb
ts ubicar media aritmetica
i graficamente
D como se juntan
e los valores de
d
sa una muestra Se basa en el Leptocurtica
id determinada
analisis de la
d
e Curtosis concentracion de Mesocurtica
M datos que estan
cercanos a la
media Platicurtica

A. Regresión lineal
Es una medida de distribución con un modelo que sigue la relación

entre una lineal


progresión variable
queindependiente y otraendependiente
puede ser calculada en (Mas
su proyección. una
adelante se amplía el estudio de este estadístico)

7.4.4. Estadística descriptiva en la


tesis

Para hacer estadística descriptiva con el SPSS, es necesario un


grupo de datos que requieran ser objeto de cálculo, por ejemplo, se
tiene las calificaciones de 0 a 100 de un grupo de 9 alumnos con las
siguientes notas:
86, 82, 78, 94, 84, 79, 94 98, 87
Llevamos los datos a la matriz del SPSS

253

Estadística para tesis Índice


Para hallar la media:
Vamos a “Analizar”, “Estadísticos descriptivos”, “Descriptivos”,
luego nos saldrá el siguiente cuadro, donde pasamos a “Variables” la
variable a ser analizada.

En “Opciones” nos saldrá el siguiente cuadro:

254

Francisco Guillermo Sánchez Espejo Índice


En este, debemos de activar “Media”, también si queremos
activamos suma, la desviación estándar, mínimo, máximo, la
varianza y el rango.
Como resultado tendremos el siguiente cuadro con los valores que
hayamos seleccionado:
Estadísticos
Estadísticos descriptivos

Desviación
N Mínimo Máximo Suma Media estándar

NOTAS 9 78 98 782 86,89 7,061


N válido (por lista) 9

Como podemos ver, obtenemos el número de la población (N), el


valor mínimo, el valor máximo, la suma, la media, la desviación

estándar
también sey hubiera
si hubiéramos seleccionado el rango y otros valores,
calculado.
Cálculo de la mediana
Para el cálculo de la mediana seguimos los siguientes pasos:
Vamos a “Analizar”, “Estadísticos
“E stadísticos descriptivos”, “Frecuencias” y nos
saldrá el siguiente cuadro:

255

Estadística para tesis Índice

Pasamos la variable al cuadro “Variables” hacemos clic en


“Estadísticos” y activamos los iconos de las medidas de tendencia
central, así tenemos:

Luego, continuar y aceptar. Obtenemos el siguiente resultado:

Estadísticos
NOTAS

N Válido 9

Perdidos 0
Media 86,89
Mediana 86,00
Moda 94

Debemos de señalar que este procedimiento no solo nos sirve para


obtener las medidas de tendencia central, sino también para obtener

256

Francisco Guillermo Sánchez Espejo Índice


las medidas de dispersión como la desviación estándar, la varianza y
el rango.
Si queremos un análisis más detallado de la estadística descriptiva,
descript iva,
incluyendo los percentiles, vamos a “Analizar”, “Estadísticos
descriptivos” y “Frecuencias”,
Nos sale este cuadro, pasamos la variable notas a “Variables” y
vamos a “Estadísticos”, donde nos sale el siguiente cuadro, en este

activamos los siguientes


siguientes valores:

Activamos la media, la mediana, la moda, la suma, el rango, la


varianza, la desviación estándar, el mínimo, el máximo, la asimetría,

257

Estadística para tesis Índice


la curtosis y además, ponemos los percentiles 25 y 75 y le damos
añadir, luego continuar y obtendremos el siguiente resultado:

Estadísticos
NOTAS

N Válido 9

Perdidos 0
Media 86,89
Mediana 86,00
Moda 94
Desviación estándar 7,061
Varianza 49,861
Asimetría ,345
Error estándar de asimetría ,717
Curtosis -1,219
Error estándar de curtosis 1,400
Rango 20
Mínimo 78
Máximo 98
Suma 782
Percentiles 25 80,50

75 94,00

La lectura que podemos hace del siguiente cuadro es:


La nota promedio (media) es de 86.89 con una variación
de 7
La mitad de las personas (mediana) tuvieron una
calificación menor a 86
La nota más frecuente (moda) fue 94 en la escala de 0 a
100
Entre la máxima y la mínima (rango) nota hay una
diferencia de 20 puntos
El 50% de los alumnos (percentiles) logro calificaciones
entre 80,5 y 94

258

Francisco Guillermo Sánchez Espejo Índice


Un segundo cuadro que nos aparece es el siguiente:

NOTAS

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado

Válido 78 1 11,1 11,1 11,1

79 1 11,1 11,1 22,2

82 1 11,1 11,1 33,3

84 1 11,1 11,1 44,4


86 1 11,1 11,1 55,6

87 1 11,1 11,1 66,7

94 2 22,2 22,2 88,9

98 1 11,1 11,1 100,0

Total 9 100,0 100,0

La interpretación de este cuadro es la siguiente:


La primera columna está conformado por las calificaciones que
sirven de análisis, la segunda columna indica cuantas veces se repiten
los valores de la primera columna, la tercera columna indica el
porcentaje que representa cada valor de la primera columna, de igual
manera la cuarta columna, indica el porcentaje válido, es decir que no
se cuenta los valores perdidos, en la quinta columna se tiene los
valores acumulados, así podemos decir que el 55.6% de las notas son
de igual y menor a 86.
Comparaciones con una variable nominal
La variable que venimos trabajando es una variable numérica, que
podemos hacer comparaciones con otra nominal, en el ejemplo
anterior venimos trabajando con las notas de 9 alumnos, en esta
oportunidad le vamos aumentar el género a efectos de tener
comparaciones,
comparacio nes, así tenemos. En la vista datos:

259

Estadística para tesis Índice


En la vista variables:

Vamos a “Analizar”, “Comparar medias”, “Medias”


“ Medias”

Ponemos la variable notas en “Lista de dependientes” y la variable


género en “Lista de independientes”, luego en “Opciones” nos saldrá
el siguiente cuadro:

260

Francisco Guillermo Sánchez Espejo Índice


Verificamos que los ítems de media, número de casos y desviación
estándar estén a la derecha, también podemos pasar los cálculos que
deseemos aumentar, luego continuar y aceptar.
Se nos presentará el resumen de procesamiento de casos.

Resumen
Resumen de pr ocesamiento de casos

Casos

Incluido Excluido Total

N Porcentaje N Porcentaje N Porcentaje

NOTAS *
9 100,0% 0 0,0% 9 100,0%
Genero

Y el informe:

261

Estadística para tesis Índice

Informe
NOTAS

Desviación
Genero Media N estándar

Mujer 86,50 4 6,137


Hombre 87,20 5 8,438
Total 86,89 9 7,061

Donde nos indica la media y la desviación estándar tanto por


hombre como por casos de mujer. Podemos apreciar que la media es
muy parecida para hombre y mujer, así mismo la variabilidad
(desviación estándar) es mayor para el caso de hombres.
Otra forma de cálculo de los estadísticos descriptivos
Vamos a “Analizar”, “Estadísticos descriptivos”, “Explorar” y
obtenemos el siguiente cuadro:

Donde pasamos la variable a analizar al cuadro de “Lista de


dependientes”, luego en “Estadísticos” activamos “Estimadores M”,
“Valores atípicos” y “Percentiles”, luego continuar

262

Francisco Guillermo Sánchez Espejo Índice

En “Gráficos”, desactivamos “De tallo y hojas” y activamos


“Histograma” y “Gráficos de normalidad con pruebas” , luego
continuar y aceptar

Obtendremos el siguiente resultado:


Descriptivos
Estadístico Error estándar
NOTAS Media 86,89 2,354
95% de intervalo de Límite
81,46
confianza para la media inferior
Límite
superior 92,32
Media recortada al 5% 86,77
Mediana 86,00
Varianza 49,861
Desviación estándar 7,061
Mínimo 78

263

Estadística para tesis Índice


Máximo 98
Rango 20
Rango intercuartil 14
Asimetría ,345 ,717
Curtosis -1,219 1,400

En el gráfico podemos ver la media, la mediana, la varianza, la


desviación estándar,
estándar, el rango entre otros estadísticos descriptivos.

Elaboración de gráficos, histogramas y diagramas


Para ello nos vamos a Gráficos , Generador de gráficos , aceptar
y obtenemos el siguiente cuadro, donde podemos elegir tipos de
gráficos que pueden ser en barras, líneas, áreas, circular polar,
dispersión puntos, histograma, mínimo – máximos, diagrama de
cajas o de ejes dobles.

Donde arrastramos la variable que será el eje “Y” también


arrastramos la variable que será el eje “X”, por último, arrastramos el
gráfico que queremos al visor en primer lugar el gráfico que
queremos, luego arrastramos las variables a los ejes. Además, nos
aparece un cuadro sobre las propiedades de las variables que de
acuerdo al gráfico permite configurar las propiedades de las
variables.

264

Francisco Guillermo Sánchez Espejo Índice


En este caso hemos elegido un grafico de barras que es el siguiente:
Debemos señalar que podemos hacer los gráficos que queramos,
poniendo en el eje de la “y” la variable que queramos y en el eje de la
“x” la otra variable, también nos permite hacer gráficos en tres
dimensiones, para ello debemos de arrastrar un valor al eje de las “z” .
Después de la estadística descriptiva en la tesis, hacemos la
estadística
estadíst ica inferencial, esto es la confiabilida
confiabilidad,
d, la validez, la prueba de
hipótesis, etc.

7.4.5. Gráficos y análisis de variables


categóricas

La estadística descriptiva en una tesis, va al comienzo del marco


operativo, permite conocer descriptivamente a la población de
estudio, cualitativamente y cuantitativamente. Para esta operación

265

Estadística para tesis Índice


sin duda que Word es una herramienta útil para hacer gráficos
descriptivos fácilmente,
fácilmente, así por ejemplo tenemos:
Los datos de una encuesta es la siguiente:

CUESTIONARIO PARA ABOGADOS

(12) Masculino
(8) Femenino
(11) Funcionario
público Sexo
Nivel (5) Hasta 35 años
(6) Actividad
ocupacional: (12) De 35 a 50
Privada
Edad años
(3) Docente
(3) Mayores de 50
años

La estadística descriptiva que podemos realizar, puede realizarse


en gráficos del siguiente modo: Vamos a “Insertar” de Word, luego
“Gráficos”, elegimos el gráfico que queremos y completamos la tabla
del siguiente modo:

Luego cerramos el cuadro y tendremos el gráfico:

266

Francisco Guillermo Sánchez Espejo Índice

Actividad
12

10

2
0
Funcionario Público Actividad privada Docente

Actividad

Luego de realizado el grafico corresponde hacer la descripción de


los valores graficados, en este caso diremos:
Se puede apreciar que 11 de los profesionales encuestados son
funcionarios públicos, 6 son profesionales que laboran en la actividad
privada y 3 profesionales que se dedican a la actividad docente.
Un segundo cuadro estadístico descriptivo puede ser referente al
género de los encuestados:

Sexo
14
12

10
8

6
4
2
0
Hombres Mujeres

Sexo

267

Estadística para tesis Índice


Y hacemos el comentario:
En el grafico podemos apreciar que 12 de los profesionales
encuestados son hombres y 8 son mujeres.
Un tercer cuadro puede ser sobre las edades, así tenemos:

Edades
15%
25%
Hasta 35

De 35 a 50

60% May a 50

Luego hacemos su comentario:


De los profesionales encuestados
encuest ados 5 tienen edades hasta los 35 años,
12 tienen edades entre los 35 y los 50 años y 3 son mayores a 50 años.

Los gráficos con sectores circulares son adecuados para diferenciar dos
o tres variables, debido a que una mayor cantidad de valores hace que
pierda su didáctica, para valores mayores a tres se tiene los gráficos de
barras

Gráficos con el SPSS

“Analizar”, “Estadísticos descriptivos”, “Frecuencias”, donde


obtenemos el siguiente cuadro:

268

Francisco Guillermo Sánchez Espejo Índice


En este cuadro pasamos a variables la variable
variabl e de la cual queremos
realizar el gráfico, luego hacemos clic en “Gráficos” y nos sale el
siguiente recuadro:

Seleccionamos gráficos de barras o gráficos circulares, además en


valores del gráfico cambiamos a “P
“Porcentajes”. Hacemos clic en
orcentajes”.
continuar. En el cuadro de frecuencias desactivamos mostrar tablas de

frecuencias y aceptar.

269

Estadística para tesis Índice


Cambiando el aspecto del gráfico
Para cambiar el aspecto del gráfico, hacemos doble clic sobre el
gráfico y nos saldrá el siguiente cuadro, donde hacemos clic en
mostrar etiqueta de datos, para que aparezcan los datos de las barras.

Hacemos clic sobre cualquiera de las barras y aparecerá el


siguiente cuadro, donde hacemos clic en profundidad y ángulo.

270

Francisco Guillermo Sánchez Espejo Índice


Y nos aparecerá el siguiente cuadro:

Donde seleccionamos 3D y aplicar, luego, sin cerrar el cuadro,


podemos elegir una barra y clic en relleno y bordes, donde podemos
darle color de relleno y a los bordes, luego clic en aplicar y así vamos
cambiando el formato de las barras.

271

Estadística para tesis Índice


Como podemos ver, en este cuadro tenemos muchas opciones para
darle formato al gráfico como el color del fondo, separación de las
barras, tamaño de las barras y otras opciones que podemos ir
explorando. Al cerrar el cuadro, el gráfico modificado se encontrará
en el visor del SPSS, adonde podemos hacer clic derecho y copiar para
llevarlo a Word u otro procesado
procesadorr de texto.

7.5. La Estadística Inferencial


La inferencia es una deducción de valores o propiedades de una
población, que se obtiene a partir de un análisis de una muestra

Intervalo de
Población
confianza
Estimación
Media,
Puntual Varianza,
Proporción

T- Stu
Studen
dentt

INFERENCIA
ESTADSTICA Anova
Metodos
Parametricos
Fisher

Prueba de Pearson
hipótesis
U-Mann
Whitney

Métodos no K-W
parametricos

Tabla de
contingencia

272

Francisco Guillermo Sánchez Espejo Índice

7.5.1. Estimación puntual

Concepto de estimar
Estimar en estadística significa atribuirle a la población el valor
calculado en una muestra, este cálculo, puede ser un valor concreto,
en este caso estamos ante una estimación puntual o puede ser un
valor dentro de un intervalo, en este caso estamos ante una estimación
por intervalo.
En la estimación puntual se tiene un valor concreto como
estimación del parámetro poblacional, pero no permite tener una
medida de la confianza sobre la inferencia. Utiliza los datos de la
muestra para obtener un solo número que se aproxime al valor real
del parámetro. Los parámetros que se utilizan en la estimación
puntual son la media, la varianza y la proporción.
Parámetro:

Es una medida descriptiva que caracteriza a una población,


estos son:
La media
La varianza
La proporción

Estimador:

Regla que se utiliza para estimar un parámetro desconocido de


la población, estos son:
La estimación puntual
La estimación por intervalos

273

Estadística para tesis Índice


Estimador Puntual:

Utiliza los datos de la muestra para obtener un solo número


que se aproxime al valor real del parámetro de la población o de
la muestra (media, varianza y proporción)

Estimador puntual de los parámetros:

Parámetro Estimador
(Población) puntual
(Muestra)

Media
µ(miu)=Media =Media de
la muestra
poblacional
Variancia S=Desviación
σ(sigma)=Desviación
estándar de la
estándar de la muestra
población
Proporción Π(ro) P=Proporción
de la muestra

Intervalo de
Población
confianza
Estimación
Media,
Puntual Varianza,
Proporción
Inferencia
estadística Se apoyan
canidades o
datos
Prueba de estadísticios
hipótesis calcuados a
patir de las
observaciones
en una muestra

274

Francisco Guillermo Sánchez Espejo Índice

La media

Estimación Puntual La varianza

La proporción
Cabe señalar que los símbolos de estos parámetros son diferentes
en la población y en la muestra, de esta manera se tiene el siguiente
cuadro:

Población Muestra

Media
µ(miu)=Media =Media de
la muestra
poblacional
Variancia S=Desviación
σ(sigma)=Desviación
estándar de la
estándar de la muestra
población
Proporción Π(ro) P=Proporción
de la muestra

Distribuciones de probabilidad e inferencia


Distribución normal

Estimaciones
Parámetros muestrales
poblacionales
(Estadisticos)

275

Estadística para tesis Índice


Llamada también distribución Z, tiene como características las
siguientes:
Es centrada en el cero
Puede tomar valores tanto positivos como negativos
Para valores mayores a 30
Permite hallar medias poblacionales y muestrales
Se usa para hallar medias muestrales y medias
poblacionales
Distribución T de Student

Tiene las mismas características que la distribución normal, con la


diferencia que es más esbelta.
Centrada en el cero
Puede tomar valores positivos como negativos
Para valores igual o menores a treinta
Permite hallar medias muestrales y poblacionales
Cuando los valores son menores o igual a 30, tiene una
distribución normal
Es más esbelta
Se usa para hallar medias muestrales y medias
poblacionales

276

Francisco Guillermo Sánchez Espejo Índice


Distribución de chi cuadrado
Tiene las siguientes características:
Toma solo valores positivos
Se usa para hallar la varianza o la desviación estándar
Los parámetros que las definen se llaman “grados de
libertad”

Distribución F de Fisher
Es muy parecida a la chi cuadrada
Toma solo valores positivos
Los parámetros que las definen se llaman “grados de
libertad”

277

Estadística para tesis Índice


Esta distribución es más importante en el diseño y
análisis de experimentos (DAE) porque compara las
varianzas o la variabilidad entre varias poblaciones
Las distribuciones se resumen en el siguiente cuadro:

Distribución Parámetro Estadístico Forma Observaciones


poblacional muestral

Normal n > 30
µ Centrada
en el 0
T de Student Tiende a una
µ distribución
normal cuando
n ≤ 30

Chi Cuadrada 2 S2 Sesgadas y Los


σ solo parámetros
toman que las define
F de Fisher 2 S2 valores por completo
σ positivos son los “grados
de libertad”

Estadísticos
Media muestral:

= ∑
Que es igual a:
278

Francisco Guillermo Sánchez Espejo Índice

= +++⋯

La varianza muestral:

S2
∑ 
()
= −

Esto, es lo mismo que la siguiente formula:
(−) 
 +… (−)
 +(−)
S2 = −

Proporción:
La proporción, viene a ser los datos seleccionado
seleccionadoss divididos entre
el número total de datos, así por ejemplo si queremos hallar la
proporción de los números menores a 10 de la siguiente muestra,
tenemos:
12, 15, 9, 11, 6, 9, 11, 7,13,8, 15
De la muestra podemos apreciar que los números menores de 10
son: 9, 6, 9, 7, 8, es decir 4 números, para lo cual, aplicamos la
fórmula:

P=
°

Donde N° es el número seleccionado, es decir 4 y n es el número
de elementos de la muestra, es decir: 11
Aplicando la fórmula se tiene:
 = 0.36, es decir 36% de la muestra son números menores de 10

Fórmulas en Excel para las estimaciones puntuales

279

Estadística para tesis Índice

 )
Para el promedio muestral ( : PROMEDIO
Para la varianza muestral (S 2): VAR.S
Para la desviación estándar muestral (S): DESVEST.M
Para la proporción muestral (P): CONTAR.SI

Ejercicios de estimación puntual


Sean los datos provenientes de una muestra aleatoria
7; 10; 12; 9; 12; 16
Hallar:
a) La estimación puntual de la media poblacional

Para hallar la media poblacional se utiliza la siguiente fórmula

=
∑= = 11
n 
La estimación puntual de la media poblacional es = 11, debemos
recordar que se trata de una estimación puntual, que habiendo
trabajado con la muestra estimamos que la media de la población sea
de 11.
b) ¿Cuál es la estimación puntual de la desviación estándar?

Para hallar la desviación estándar se utiliza la siguiente formula:

Donde tenemos que hallar:

280

Francisco Guillermo Sánchez Espejo Índice

∑x(X - 1 )2 =Esta operación exige que a cada número de la


muestra se le reste el promedio y posteriormente al resultado se
eleve al cuadrado y por último se sume todos lo valores.
N= es el número de elementos que conforma la muestra y son 6
Desarrollo:
(X1 - ) (X1 - )2
-4 16
1 1
1 1
-2 4
1 1
5 25
48

Sea la fórmula

= √9.6 = 3.09 = 3.1


σ=
 
−
La desviación estándar nos indica que los elementos que conforma
la muestra tienen una desviación estándar, respecto de su media
en 3.1 unidades

281

Estadística para tesis Índice

Desviación estandar
18
16
14
12
10
8
6
4
2
0
0 1 2 3 4 5 6 7

Ejercicio:
Se tiene una muestra aleatoria de las siguientes edades:
25, 24, 22, 20, 25, 18, 17, 24, 16, 21

1.- Hallar la estimación puntual para la media:

= ∑
= (++++++7+++)

= 21.2
2.- Hallar la estimación puntual para la varianza:

S2 =∑(− ) 

(−.  )
S =
2

(−. )+(−.)̅ +(−.)+ (−.)+(−.)+(−.)
S2 = 
282

Francisco Guillermo Sánchez Espejo Índice


+(7−.)+(−.)̅ +(−.)+ (−.)

S2 = 11.29
3.- Hallar la estimación puntual para la proporción de edades
mayores a 22:

P=°

Los números mayores de 22 son: 25, 24,25,24
Es decir, N° = 4
 = 0.4
P= = 40%
Entonces, la proporción de edades mayores de 22 años es igual a
0.4 o lo que es lo mismo decir que un 40% de las edades son mayores
a 22.

7.5.2. Estimación por intervalos

Por este cálculo no se obtiene un valor único, sino el valor se


encuentra dentro de un intervalo que tiene un límite superior y un
límite inferior simétrico a ambos lados y la probabilidad que el valor
se encuentre en la parte media se llama intervalo de confianza.

Nivel de
confianza

283

Estadística para tesis Índice

La probabilidad de quedar fuera del intervalo de confianza es α


(alfa), esta se divide en dos, uno para cada lado, así, si consideramos
que el valor buscado está en el intervalo de confianza con un 95%, el
α será del 5% y el α/2 para cada lado será de 2.5% o en decimales del
0.025 que en la tabla Z es igual a 1.96
Donde:

α: Es la probabilidad que falle, también se llama nivel de


significancia o riesgo
1-α: Es la probabilidad que no falle, es
e s el intervalo de confianza

Beneficio: El beneficio de hacer un cálculo por intervalo de


confianza es que tenemos un mejor manejo del error.
Deficiencia: La deficiencia de hacer un cálculo de intervalo de
confianza es que tenemos tendremos un conjunto
conju nto de valores donde
se encontrará el valor poblacional verdadero con un nivel de
confianza que queramos.
Ejemplo
Por el paradero de un metro, un tren pasa en los siguientes
intervalos de tiempo en minutos: 44, 36, 40, 45 y 25, se considera una
varianza de 80 y que tiene una distribución normal. Estimar la
duración media que demora pasar cada tren.
1.- En primer lugar, hallamos la media

= ++++
=  
= 38
284

Francisco Guillermo Sánchez Espejo Índice

2.- Calculamos el intervalo de confianza, con un nivel de confianza


de 95%
Por tanto:
1-α = 95%, que para convertirlo en decimales lo dividimos entre
100 = 0.95, donde α=0.05 =5%
Pero lo dividimos en 2 para ambos extremos.
Zα/2 = 0.025, que en la tabla Z es igual a 1.96
α/2

¿Cómo hallamos 1.96 en la tabla Z?


Buscamos el valor de 0.025 en la tabla y nos fijamos al costado

Si bien aparece 1.96 con signo negativo, sin embargo, el signo no


interesa debido a que se va a ubicar en ambos extremos.
3.- Calculamos S

S=
∑ 
(− ) 

    
S = (−) +(−)̅ +(−)
 + (−) +(−)
S = 7.23
4.- Reemplazando valores

M1- = ±Z /2 (√)
285

Estadística para tesis Índice

M1- = 38±1.96 (7.√)


M1- = 38-1.96 (7.√) = 30.16
M1- = 38+1.96 (7.√) = 45.84
Como resultado
encuentra el valorsemedio
tiene en
el laintervalo
demora de
del confianza donde
tren al pasar por se
el
paradero, está comprendido entre: 30.16 y 45.84.

Ejemplo
En el colegio Hipólito Unanue se tiene un total de 1200 alumnos,
de los cuales se ha extraído una muestra de 60 alumnos, a los
cuales se les ha evaluado con un examen de comprensión lectora
con notas de 0 a 100, la media poblacional es 80 y la desviación
típica es 12, para el presente caso se pide estimar la media
poblacional mediante un estimador puntual.
Ejemplos

M1- = ±Z /2 (√)
Donde:
= nivel de confianza = 95%= 1.95 (en decimales)

1- = 1- 1.95= 0.5
= 11

Z /2= Z0.5/2= Z0.25 = 1.96 (esto resulta de verificar en la tabla de distribución


normal)

 3.1
=

286

Francisco Guillermo Sánchez Espejo Índice

6=

Reemplazando valores:

M0.5= 11+ 1.96 (.√) (Operando con la suma

M0.5= 12.96 (1.27)


M0.5= 16.46
.
M0.5= 11- 1.96 (√) (Operando con la resta)

M0.5= 9.04 (1.27)


M0.5= 11.48
De ambos resultados podemos decir que el intervalo donde se
encuentra el valor está comprendido entre (11.48 y 16.46).

Si bien la fórmula de T de Student es la siguiente:

te = ( ̅− µ)
√
Despejando = µ ̅(/ √1) Que será el extremo inferior.
Por lo que su extremo superior será: = µ ̅(/ √1)
Como ejemplo, tenemos:
En el colegio Hipólito Unanue se tiene un total de 1200 alumnos,
de los cuales se ha extraído una muestra de 60 alumnos, a los
cuales se les ha evaluado con un examen de comprensión lectora
con notas de 0 a 100, la media poblacional es 80 y la desviación
típica es 12, para el presente caso se pide estimar la media
poblacional mediante una estimación por intervalo

̅ = 80
287

Estadística para tesis Índice

= 60
S = 12
Te = 1200
Reemplazando valores en la fórmula:

=
µ= 801.96(12/
801.96(12/√√60 1)
803.0625 = 83.0625
µ= 803.0625 = 76.9375
Donde la media poblacional se encontrará
encontrará en el intervalo
comprendido entre: 76.9375 y 83.0625
Intervalo de confianza para la media (µ)
En la estimación puntual podemos establecer una media en forma
puntual que es válido para la muestra y que se estima que sea válida
para la población, pero
pe ro no se tiene un grado de certeza de que el valor
sea el valor real de la media de la población. El intervalo de confianza
nos da parámetros con un nivel de confianza de que la media
poblacional se encuentre en dichos rangos, esto es más seguro que la
estimación puntual.

El intervalo de confianza de la media poblacional considera que la media de la


muestra no siempre es la misma que la media de la población, por tanto, se busca
calcular el intervalo donde se podría encontrar con cierta probabilidad

Ejemplo:
Se ha tomado una muestra de 100 personas de la ciudad de
Arequipa y se ha obtenido una talla promedio de 1.69m, se desea

288

Francisco Guillermo Sánchez Espejo Índice

saber el intervalo de confianza al 95%de la talla promedio para la


población de Arequipa, con una desviación típica de 0.12.
Datos:
N = 100
̅ = 1.69
= 5% = 0.05
/2 = 0.025 que en la tabla Z es igual a 1.96
σ = 0.12

Se busca hallar X1 (límite inferior) y X2 (límite superior)


Los límites donde se encontrará el intervalo de confianza, están
dados por -Z y Z, que contiene el límite qque
ue es ig
igual
ual a /2, lo cua
cuall se
puede ver en el siguiente gráfico:

Nivel de
confianza

Fórmula:

±Zα/2 = − ̅
√

̅
X1 = - Zα/2 (√)
Reemplazando datos
Hallando el límite inferior

X1 = 1.69 - 1.96(√.
 )

289

Estadística para tesis Índice

X1 = 1.69 – 0.02352)
X1 = 1.66648
Hallando el límite superior

X2 = 1.69 + 1.96(√)
.
X2 = 1.69 + 0.02352
X2 = 1.71352
La media poblacional estará entre: = 1.66 y 1.71

7.5.3. Coeficiente de correlación

Es una medida numérica que permite medir el grado de asociación


lineal entre dos variables cuantitativas

El coeficiente de correlación p mide la fuerza y el sentido de la


relación lineal entre dos variables cuantitativa
cuantitativas.
s.

p =  
 

±0.96 ; ±1.0 PERFECTA

290

Francisco Guillermo Sánchez Espejo Índice

FUERTE
±0.85 ; ±0.95

SIGNIFICATIVA
±0.70 ; ±0.84

MODERADA
±0.50 ; ±0.69

DÉBIL
±0.20 ; ±0.49

MUY DEBIL
±0.10 ; ±0.19

NULA
±0.09 ; ±0.0

A. Cálculos de Z
Z es el valor frontera que delimita la zona de confianza con la zona
de rechazo, indica el valor esperado, para verificar la posición del
valor observado respecto de Z.

7.5.4. Simbología estadística

: Media o promedio
S2: Se refiere a la varianza simple.

µ: Media de una población


: Media de la muestra

291

Estadística para tesis Índice

r: Simboliza la simple correlación de coeficientes.


kr: Simboliza el cúmulo de las muestras.
Los símbolos utilizados con mayor frecuencia para referirse a los
parámetros de población son:
N: Tamaño de la población

n: Tamaño de la muestra
• μ: Media poblacional

• σ2: Simboliza la varianza de la población.

• ρ: Simboliza la correlación de la población

• κr: Simboliza los cúmulos de población.

• n: Simboliza el núm ero de elementos en una distribución de la


muestra.

• α: La letra griega alpha simboliza la intercepción o un error de


tipo I.
• β: La letra griega beta simboliza vertiente o un error de tipo II.

• σ: La letra griega sigma simboliza la desviación estándar de la


población.
• s: La letra s significa la desviación estándar de la muestra.

• s2: La letra s al cuadrado simboliza la varianza de la muestra.

Otro conjunto de símbolos estadísticos usados con mayor


frecuencia son:
• C: Simboliza la distribución, y también es conocida como la
distribución para una variable independiente:
• U: Se refiere a la distribución que no es lo mismo que y también
es conocida como variable dependiente.

292

Francisco Guillermo Sánchez Espejo Índice

• SC: Simboliza todos los elementos (genera lmente números) en


una distribución.
• N: Simboliza el número de elementos una distribución
poblacional.
293
Francisco Guillermo Sánchez Espejo Índice

Tabla de Población y Muestra


Con un error de 5% y un nivel de confianza del 95%

Población Muestra Población Muestra

100 80 1050 282

150 109 1100 285


200 132 1150 289

250 152 1200 292

300 169 1250 295

350 184 1300 297

400 197 1350 300

450 208 1400 302

500 218 1450 304


550 227 1500 306

600 235 1550 309

650 242 1600 310

700 249 1650 312

750 255 1700 314

800 260 1750 316

850 265 1800 317

900 270 1850 319

950 274 1900 320

1000 278 1950 322

295

Estadística para tesis Índice

Tabla de chi2
Tabla resumida para α -1 = 90%, 95% y 99%

Df X2 0.05 X2 0.025 X2 0.01


1 3.841 5.024 6.635
2 5.991 7.378 9.210
3 7.815 9.348 11.345
4 9.488 11.143 13.277
5 11.070 12.833 15.086
6 12.592 14.449 16.812
7 14.067 16.013 18.475
8 15.507 17.535 20.090
9 16.919 19.023 21.666
10 18.307 20.483 23.209
11 19.675 21.920 24.525
12 21.026 23.337 26.217
13 22.362 24.736 27.688
14 23.685 26.119 29.141
15 24.996 27.488 30.578
16 26.296 28.845 32.000
17 27.587 30.191 33.409
18
19 28.869
30.144 31.526
32.852 34.805
36.191
20 31.410 34.170 37.566
21 32.671 35.479 38.932
22 33.924 36.781 40.289
23 35.172 38.076 41.638
24 36.415 39.364 42.980
25 37.652 40.646 44.314

296

Índice
Francisco Guillermo Sánchez Espejo

26 38.885 41.923 45.642


27 40.113 43.195 46.963
28 41.337 44.461 48.278
29 42.557 45.722 49.588
30 43.773 46.979 50.892
40 55.758 59.342 63.691
50 67.505 71.420 76.154
60 79.082 83.298 88.379
70 90.531 95.023 100.425
80 101.879 106.629 112.329
90 113.145 118.136 124.116
100 124.342 129.561 135.807

297
Francisco Guillermo Sánchez Espejo Índice

Ejemplo de estadística en una tesis

A continuación, se desarrolla las partes más importantes


desarrolladas por el tesista Clemente Cusi Ventura en su tesis de
grado por la universidad TELESUP.
Enunciado
¿Por qué se debe incorporar en el Código Civil los contratos de
leasing y outsourcing para la mejora de la seguridad de la legislación
civil, en Arequipa 2018?
Problemas específicos
¿Por qué se debe incorporar en el Código Civil el contrato
de Leasing en Arequipa 2018?
¿Por qué se debe incorporar en el Código Civil el contrato
de Outsourcing en Arequipa 2018?

Objetivo general
Establecer la relación de incorporar en el Código Civil de los
contratos de leasing y outsourcing con la mejora de la seguridad
jurídica en Arequipa,
Arequipa, Perú 2018
Objetivos específicos
Explicar los fundamentos que permitan incorporar el
contrato de leasing en el Código Civil en Arequipa

2018 los fundamentos que permitan incorporar el


Indicar
contrato de Outsourcing en el Código Civil en
Arequipa 2018

299

Estadística para tesis Índice

Hipótesis general
Es posible que exista relación entre la incorporación de los
contratos Leasing y Outsourcing con la seguridad jurídica, resultando
necesario incorporar dichos contratos al Código Civil.
Hipótesis estadística
H0 = No existe relación entre los contratos innominados de leasing
y outsourcing con la seguridad jurídica en el Código civil, por tanto,
no se requiere su incorporación.
H1 = Si existe relación entre los contratos innominados de leasing
y outsourcing con la seguridad jurídica en el Código civil, por tanto,
si se requiere su incorporación.
Hipótesis especificas
Hipótesis especificas 1
Es posible, que exista relación entre el contrato innominado de
leasing con la mejora de la seguridad jurídica al regularse en un
solo cuerpo normativo, como es el Código Civil en Arequipa 2018.
Hipótesis estadística
H0 = No existe relación entre el contrato innominado de leasing
con la seguridad jurídica en el Código civil, por tanto, no se
requiere su incorporació
incorporación.
n.
H1 = Si existe relación entre el contrato innominado de leasing con
la seguridad jurídica en el Código civil, por tanto, si se requiere su
incorporación.
Hipótesis especifica 2
Es posible, que exista relación entre el contrato innominado de
outsourcing con la mejora de la seguridad jurídica al regularse en

300

Francisco Guillermo Sánchez Espejo Índice

un solo cuerpo normativo, como es el Código Civil en Arequipa


2018.
Hipótesis estadística
H0 = No existe relación entre el contrato innominado de
outsourcing con la seguridad jurídica en el Código civil, por tanto,
no se requiere su incorporación.
1

You might also like