You are on page 1of 42

Universidad Nacional de Huancavelica

Facultad de Ciencias de Ingeniería


Departamento Académico de Ciencias Básicas
Escuela Académico Profesional de Ingeniería Civil

Estatistics and
Probability

First Week: Generalities

Ing. Jorge Luis Huere Peña


Master in Computer Science
PhD Student in Information System – UMINHO. Portugal
Docente Principal del Departamento Académico de Ciencias Básicas FCI
Web Page : www.unh.edu.pe e-mail : jhuere@unh.edu.pe
"Statistical thinking will one day be as necessary
for efficient citizenship as the ability to read and
write."

“El pensamiento estadístico algún día será tan


necesario para la ciudadanía como la capacidad
de leer y escribir...”

Herbert George Wells


100 years ago

2
Scientific Research
La investigación científica

¿Qué es la investigación científica?

Es la búsqueda sistematizada y objetiva de nuevos


conocimientos (new knowledge). Investigar es un proceso
de buscar, indagar o pesquisar.

El método científico (The scientific method),


comprende la realización de la investigación en forma
sistematizada y objetiva, organizada y coherente.

3
Phases of Scientific Research
Etapas de la investigación científica

A.Planificación: Elaboración del proyecto. Abarca


una descripción detallada y fundamentada de cada
una de las actividades a desarrollarse en la
investigación.
B. Ejecución: Es la etapa en la cual se lleva a
cabo al investigación. Recolección de datos,
análisis e interpretación.
C. Informe: Escrito donde se presentan los
hallazgos encontrados.
4
STATISTIC
ESTADISTICA
La estadística es la ciencia que proporciona un
conjunto de métodos que se utilizan para:

RECOLECTAR COLLECT

ORGANIZAR ORGANIZE DECISION


DATA MAKING
DATOS TOMA DE
DECISIONES
ANALIZAR ANALYZE

INTERPRETAR INTERPRET
THE STATISTICAL PROCESS
A esta secuencia se llama proceso
estadistico.
5
¿Qué es la RECOLECCIÓN de datos ?

Es el registro de características
(medición, observación, conteo) a una
unidad elemental (o de análisis).

6
¿Qué es la ORGANIZACIÓN de datos ?

Es el ordenamiento para una mejor


comprensión y facilitar sus análisis.
(tablas, gráficos y figuras)

Los datos sin organizar se llaman datos


brutos, y son de poca utilidad.

7
Por ejemplo, los siguientes datos sobre días de permanencia de
materiales en almacén pues no están organizados

231 199 209 236 259 248 183 269 212 194 191 260 197 265 261 238
159 227 245 214 275 186 234 262 230 212 163 220 202 221 223 243
203 180 292 198 201 174 223 186 200 192 236 186 188 234 230 170
304 197 216 214 189 138 269 197 222 202 213 163 241 218 242 197
248 228 154 218 243 192 191 243 230 248 231 262 177 207 276 230
238 189 212 200 179 249 225 223 289 280 235 220 194 205 206 194
209 233 222 223 267 212 263 159 243 230 253 192 200 232 222 227
193 195 259 186 229 184 215 254 233 229 263 163 212 271 216 230
225 252 218 265 218 155 222 173 228 214 266 172 203 262 213 249
244 177 242 180 241 261 221 222 189 204 229 212 192 257 248 243
190 166 216 197 250 224 257 220 255 241 245 212 225 201 209 155
192 249 216 250 248 187 222 195 247 161 188 229 194 174 184 215
209 250 180 228 196 254 208 265 234 219 203 230 232 212 236 191
161 258 252 169 249 231 170 233 161 189 191 209 229 246 274 215
206 218 234 248 222 175 202 154 249 189 171 263 238 177 261 265
224 249 252 220 199 239 221 221 221 232 218 239 205 196 211 221
276 251 189 286 258 227 236 167 184 245 243 218 173 220 231 196
196 200 221 217 270 261 248 254 232 231 219 225 265 222 226 208
219 189 226 292 192 172 186 264 211 240 237 156 228 241 171 223
185 199 188 263 208 199 259 272 202 214 201 231 210 223 210 209
239 203 212 295 202 195 218 218 253 239 272 216 221 208 225 175
239 191 214 215 227 221 208 224 208 181 187 179 234 262 216 221
152 180 193 244 184 183 226 266 242 220 266 269 223 198 204 179
209 215 222 196 228 195 160 261 177 232 224 203 265 238 247 225
169 172 187 199 245 183 171 246 187 222 278 212 250 174 220 188
223 241 200 193 226 243 206 142 277 244 210 258 207 267 254 136
231 253 229 240 204 187 202 209 238 240 190 253 203 271 281 226
244 182 146 251 277 184 240 239 185 201 259 234 174 226 246 222
205 211 216 230 220 201 231 183 214 219 206 276 215 195 209 258
287 182 176 275 204 183 212 237 249 142 256 258 213 208 202 244 6

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


8
¿Qué es el ANALISIS de datos ?

Es el cálculo de MEDIDAS
REPRESENTATIVAS (o de resumen)
tales como promedios, medidas de
variabilidad y medidas de la forma de
la distribución.
También se analizan datos cuando se
establecen relaciones entre ellos
(regresión y correlación).

9
10
¿Qué es la INTERPRETACIÓN de datos ?

Es darle un sentido práctico o útil a los


resultados obtenidos en el análisis.

11
La Estadística es la Ciencia de la

• Sistematización, recogida, organización y


presentación de los datos referentes a un fenómeno
que presenta variabilidad o incertidumbre para su
estudio metódico, con objeto de

• deducir las leyes que rigen esos fenómenos,

• y poder de esa forma hacer previsiones sobre los


mismos, tomar decisiones u obtener conclusiones.

12
Utilidad e Importancia

 Se usa la descripción de datos recolectados


reduciéndolos a un pequeño número de características
que concentra la parte más importante y significativa
de la información proporcionada por los datos.

 Estudio y conocimiento de la población a través de una


muestra, lo que conlleva a hacerla factible, disminuir
costos, tiempo y espacio.

 Conocimiento de eventos probabilísticos y


pronósticos, para la ayuda en la toma de decisiones
con gran posibilidad de aciertos.
13
Division of Statistics
División de la Estadística

DESCRIPTIVE
 ESTADISTICA DESCRIPTIVA STATISTIC

PROBABILITIES
PROBABILIDADES

 ESTADISTICA INFERENCIAL INFERENTIAL


STATISTICS

14
DESCRIPTIVE STATISTIC
ESTADISTICA DESCRIPTIVA

Es el conjunto de métodos que implican la


recolección, organización, presentación y resumir un
conjunto de datos a fin de describir en forma
apropiada las diversas características de estos. Es
bastante usado en trabajos de tipo exploratorio..

15
PROCESOS DE LA ESTADISTICA DESCRIPTIVA
MEJORAR O
RECOLECCION

Recolectar NO
datos
BUENA NO FIN DEL
RECOLECCIÓN?
PROCESO
RE-CRITICA
SI
MALO
Validación y NIVEL DE
consistencia CRITICA

BUENO

EN BASE A
CARACTERISTICAS,
TABLAS Y GRAFICOS
Procesamiento

1. Colección de datos
2. Crítica de datos
3. Procesamiento. SINTESIS
4. Análisis.
16
INFERENTIAL STATISTICS
ESTADISTICA INFERENCIAL

Es el conjunto de métodos o técnicas por


medio de las cuales se toman decisiones
sobre una población basadas en una
muestra y en el juicio de los expertos.
Debido a que esas decisiones se toman en condiciones
de incertidumbre, se requiere el uso de conceptos de
probabilidad. Es decir, un estudio estadístico se
considera “inferencial” cuando se pretende llegar a
conclusiones o generalizaciones que involucran a toda
la población en base a una información parcial
17
FLUJOGRAMA DE LA ESTADISTICA INFERENCIAL

18
Population and Sample
Población y muestra

 Población (‘population’)
Es el conjunto de personas, animales o cosas que poseen
características especiales, que pueden cuantificarse y sobre
el que estamos interesados en obtener conclusiones (hacer
inferencia).

 Normalmente es demasiado grande para poder abarcarlo.


 Debe delimitar espacio y tiempo,

 Muestra (‘sample’) es un subconjunto suyo al que tenemos


acceso y sobre el que realmente hacemos las observaciones
(mediciones)
 Debería ser “representativo”
 Esta formado por miembros “seleccionados” de la
población (individuos, unidades experimentales).

19
Population
POBLACION

Se obtienen datos
representativos
Sample
MUESTRA

Muchos datos, difíciles


de poder, lleva mucho
tiempo poder
conseguirlos además
que consume mucho
presupuesto

Conocemos
la población

20
21
PARAMETER
PARÁMETRO

Es una medida de resumen que nos


describe una o más características de la
población.Tales como: media poblacional
(), Varianza poblacional ( 2), Desviación
estándar poblacional (),

22
STADIGRAPH
ESTADÍGRAFO

Es una medida de resumen que nos


describe alguna característica de interés y
cuyo valor es calculado usando sólo los
valores de los elementos o unidades de una
muestra. Algunos estadísticos conocidos
son: media muestral ( x ), varianza muestral
(S2 ), proporción muestral (p)

23
ANALYSIS UNIT
UNIDAD DE ANÁLISIS

Es el objeto o elemento indivisible que


será estudiado en una población, sobre la
cual se obtendrán los datos de interés
para la investigación.

La unidad de análisis no es el fenómeno


investigado sino el que genera el fenómeno

24
DATA
DATO

Es el valor o respuesta que adquiere la


variable en cada unidad de análisis. El
dato es el resultado de la recopilación
de información.

Los datos son la materia prima de la


estadística

Un dato es el registro de una característica.


25
Ejemplo :
Unidad de
Características Datos
medida
Edad del trabajador 27 años
Peso del material 3,750 Kg.
Tiempo permanencia 5 días
Temperatura corporal 37,5 °C
Profesión Topógrafo ---
Si un DATO es útil para tomar decisiones se
convierte en INFORMACIÓN.
26
A la parte de la estadística que se dedica al cálculo
de estas medidas se le llama ESTADÍSTICA
DESCRIPTIVA, ella nos aporta las bases para la
ESTADÍSTICA INFERENCIAL. cuyo objetivo es
obtener conclusiones sobre la población, de donde
se extrajo la muestra, utilizando dos medios:

a) La estimación, que nos aproxima a las


características de la población llamadas
PARAMETROS
b) Realizando pruebas de hipótesis
27
28
VARIABLE
VARIABLE

Las variables son características de las


personas u objetos que pueden tomar
diferentes valores los cuales pueden ser
cuantificables.

29
Ya sea que estudiemos muestras o poblaciones,
nuestro interés se centra en una propiedad
particular de sus miembros. La propiedad que se
mide o cuenta se designa usualmente con la letra X u
otras generalmente las últimas del Abecedario. Se le
llama VARIABLE y es una característica que puede
tomar diferentes valores entre los elementos de un
conjunto.

30
Por ejemplo: si representamos con X la temperatura del
Aire, veremos que en las estaciones tendremos en un día
24 observaciones horarias tomadas de una variable
continua, y cada una de ellas puede tener valores
diferentes, por eso decimos que X es una variable

31
VARIABLES TYPES
TIPOS DE VARIABLES

 Qualitative variables
Variables Cualitativas

 Quantitative variables
Variables Cuantitativas

32
VARIABLES CUALITATIVAS
NO ES POSIBLE
ORDENARLOS

NOMINAL
Variables cuyas categorías no pueden ser ordenas
sea en forma ascendente o descendente.
ORDINAL
Variables cuyas categorías pueden ser ordenas sea
en forma ascendente o descendente. SE PUEDEN
ORDENAR

VARIABLES CUANTITATIVAS

DISCRETA
PROVIENEN DE
Variables cuyas valores son de tipo numérico y
CONTADAS
entero. Generalmente provienen de conteos
CONTINUA
USO DE INSTRUMENTOS PARA Los valores son de numericos y pueden ser fraccionarios.
MEDIRLOS Provienen de mediciones con instrumentos.

33
Qualitative variables
VARIABLES CUALITATIVAS

Son atributos de una población los cuales no


pueden ser representados numéricamente.
(no se pueden hacer operaciones algebraicas con ellos)

Nominales: Si sus valores no se pueden ordenar


Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar
(Sí/No)

Ordinales: Si sus valores se pueden ordenar


Calidad de un producto, Grado de satisfacción,
Intensidad del dolor
34
Quantitative variables
VARIABLES CUANTITATIVAS

Son variables cuantitativas aquellas


características de la población que pueden
representarse numéricamente.
Discrete (Discretas) : Si toma valores enteros
Número de hijos, Número de cigarrillos, Num. de
“cumpleaños”

Continuous (Continuas) : Si entre dos valores, son


posibles infinitos valores intermedios.
Altura, Presión intraocular, Dosis de medicamento
35
administrado, edad
EJEMPLO
Población Unidad de Variables Datos
análisis

Trabajadores Peso, 65 Kg
en una Género, Femenino
Cada
empresa de Edad, 26
trabajador
Lima Salario, S/. 1500
Metropolitana Religión Católica

36
PROGRAMAS ESTADISTICOS
COMPUTARIZADOS

13

37
38
39
40
41
42

You might also like