You are on page 1of 80

Graphs,  Charts,  and  Tables  –

Describing  Your  Data


REVIEW:  Multiple  Choice  

1. Statistics  is  a
a.  Method  for  organizing  and  analyzing  data
b.  Method  for  describing  data
c.  Method  for  making  educated  guesses  based  on  limited  data                                      
d.  Method  for  summarizing  data
e.  All  of  the  above  

2. Descriptive  statistics  can  be  used  to


a.  Compare  different  sets  of  data
b.  Compare  one  observation  to  a  set  of  data
c.  Make  inferences  about  unknown  events
d.  Make  guesses  about  a  population  using  a  sample                                                    
e.  Both  a  and  b  
REVIEW:  Multiple  Choice
3. If  you  were  interested  in  predicting  the  outcome  of  the  presidential  
election,  you  would  use
a.  Descriptive  statistics
b.  Inferential  statistics  
c.  Deductive  statistics  
d.  Inductive  statistics  
e.  A  census  

4. Using  the  Nielsen  television  ratings  to  estimate  the  number  of  television  
viewers  represents  
a.  Descriptive  statistics                                                                                                                                                                                            
b.  Inferential  statistics  
c.  Deductive  statistics  
d.  Inductive  statistics  
e.  A  population  
True/False  (If  false,  explain  why)  

1. When  we  use  the  Nielsen  television  ratings  to  estimate  the  
number  of  television  viewers,  we  are  using  descriptive  statistics.  
2. The  average  salary  for  a  graduating  senior  majoring  in  finance  is  a  
descriptive  statistic.  
3. Descriptive  statistics  can  be  useful  in  contract  negotiations.  
4. Inferential  statistics  can  be  used  to  compare  two  sets  of  data.  
5. Descriptive  statistics  is  used  to  make  educated  guesses  about  
unknown  events.  
6. Depending  on  the  method  of  sampling,  a  sample  can  have  more  
observations  than  the  population.  
7. In  a  population  with  10  objects,  if  the  simple  random  sampling  
method  is  used  to  sample  3  objects,  1000  possible  samples  can  
be  generated.  
Frequency  Distributions

What  is  a  Frequency  Distribution?


n A  frequency  distribution  is  a  list  or  a  table …
n containing  the  values  of  a  variable (or  a  set  of  
ranges  within  which  the  data  falls)  ...
n and  the  corresponding  frequencies with  which  
each  value  occurs  (or  frequencies  with  which  
data  falls  within  each  range)
Why  Use  Frequency  Distributions?

n A  frequency  distribution  is  a  way  to  


summarize  data
n The  distribution  condenses  the  raw  data  
into  a  more  useful  form...  
n and  allows  for  a  quick  visual  interpretation  
of  the  data
Frequency  Distribution:  
Discrete  Data
n Discrete  data: possible  values  are  countable
Number  of  days  
Example: An   read
Frequency
advertiser  asks   0 44
200  customers   1 24
how  many  days   2 18
per  week  they   3 16
read  the  daily   4 20
newspaper. 5 22
6 26
7 30
Total 200
Relative  Frequency
Relative  Frequency:  What  proportion  is  in  each  category?
Number  of  days   Relative
Frequency
read Frequency
44
0 44 .22 = .22
1 24 .12 200
2 18 .09 22%  of  the  
people   in  the  
3 16 .08
sample  report  
4 20 .10 that  they  read  
5 22 .11 the  newspaper  
0  days  per  week
6 26 .13
7 30 .15
Total 200 1.00
Frequency  Distribution:  
Continuous  Data

n Continuous  Data: may  take  on  any  value  in  


some  interval
Example: A  manufacturer  of  insulation  randomly  selects  
20  winter  days  and  records  the  daily  high  temperature

24,  35,  17,  21,  24,  37,  26,  46,  58,  30,  
32,  13,  12,  38,  41,  43,  44,  27,  53,  27

(Temperature  is  a  continuous  variable  because  it  could  


be  measured  to  any  degree  of  precision  desired)
Grouping  Data  by  Classes

Sort  raw  data  in  ascending  order:


12,  13,  17,  21,  24,  24,  26,  27,  27,  30,  32,  35,  37,  38,  41,  43,  44,  46,  53,  58

n Find  range:      58  -­ 12  =  46


n Select  number  of  classes:  5 (usually   between   5  and  20)
n Compute  class  width:  10 (46/5  then  round  off)
n Determine  class  boundaries:10,  20,  30,  40,  50
n Compute  class  midpoints:  15,  25,  35,  45,  55
n Count  observations  &  assign  to  classes
Frequency  Distribution  Example
Data  in  ordered  array:
12,  13,  17,  21,  24,  24,  26,  27,  27,  30,  32,  35,  37,  38,  41,  43,  44,  46,  53,  58

Frequency  Distribution

Class Frequency Relative


Frequency
10  but  under  20                          3                                     .15  
20  but  under  30 6                                      .30    
30  but  under  40 5                                      .25  
40  but  under  50                          4                                      .20  
50  but  under  60 2                                      .10  
Total 20                                  1.00
Histograms

n The  classes or intervals are  shown  on  the  


horizontal  axis
n frequency is  measured  on  the  vertical  axis

n Bars  of  the  appropriate  heights  can  be  used  


to  represent  the  number  of  observations  
within  each  class    

n Such  a  graph  is  called  a  histogram


Histogram  Example

Data  in  ordered  array:


12,  13,  17,  21,  24,  24,  26,  27,  27,  30,  32,  35,  37,  38,  41,  43,  44,  46,  53,  58

Histogram
7 6
6 5
5 4 No  gaps  
Frequency

4 3 between  
3 2 bars,  since  
2
continuous  
1 0 0 data
0
5 15 25 36 45 55 More
Class  Midpoints
Questions  for  Grouping  Data  
into  Classes

n 1. How  wide  should  each  interval  be?


(How  many  classes  should  be  used?)

n 2. How  should  the  endpoints  of  the


intervals  be  determined?
n Often  answered  by  trial  and  error,  subject  to  
user  judgment
n The  goal  is  to  create  a  distribution  that  is  
neither  too  "jagged"  nor  too  "blocky”  
n Goal  is  to  appropriately  show  the  pattern  of  
variation  in  the  data
How  Many  Class  Intervals?

n Many  (Narrow  class  intervals) 3.5

n may  yield  a  very  jagged   3


2.5

Frequency
distribution  with  gaps  from  empty   2
1.5

classes   1
0.5

n Can  give  a  poor  indication  of  how   0

4
8
12
16
20
24
28
32
36
40
44
48
52
56
60
More
frequency  varies  across  classes Temperature

12

10

Few  (Wide  class  intervals) 8

Frequency
n
6

n may  compress  variation  too  much   4

2
and  yield  a  blocky  distribution 0
0 30 60 More

n can  obscure  important  patterns  of   Temperature

variation. (X  axis  labels  are  upper  c lass  endpoints)


General  Guidelines

n Number  of  Data  Points              Number  of  Classes


under  50                                                 5  -­ 7  
50  – 100                                                              6  -­ 10
100  – 250                                                              7  -­ 12
over    250                                                          10  -­ 20

n Class  widths  can  typically  be  reduced  as  the  


number  of  observations  increases
n Distributions  with  numerous  observations  are  more  
likely  to  be  smooth  and  have  gaps  filled  since  data  
are  plentiful
Class  Width

n The  class  width  is  the  distance  between  the  


lowest  possible  value  and  the  highest  possible  
value  for  a  frequency  class

n The  minimum  class  width  is


Largest  Value   Smallest  Value
W    =
Number  of  Classes
Histograms  in  Excel

1
Select
Tools/Data  Analysis
Histograms  in  Excel
(continued)

2
Choose  Histogram

3
Input  data  and  bin  ranges

Select  Chart  Output


Stem  and  Leaf  Diagram

n A  simple  way  to  see  distribution  details  in  a  


data  set

METHOD:  Separate  the  sorted  data  series


into  leading  digits  (the  stem)  and
the  trailing  digits  (the leaves)
Example:
Data  in  ordered  array:
12,  13,  17,  21,  24,  24,  26,  27,  27,  30,  32,  35,  37,  38,  41,  43,  44,  46,  53,  58

n Here,  use  the  10’s  digit  for  the  stem  unit:


Stem      Leaf
n 12  is  shown  as 1                2

n 35  is  shown  as 3                5


Example:
Data  in  ordered  array:
12,  13,  17,  21,  24,  24,  26,  27,  27,  30,  32,  35,  37,  38,  41,  43,  44,  46,  53,  58

n Completed  Stem-­and-­leaf  diagram:


Stem Leaves
1 2    3    7
2 1    4    4    6    7    8
3 0    2    5    7    8
4 1    3    4    6
5 3    8
Using  other  stem  units

n Using  the  100’s  digit  as  the  stem:


n Round  off  the  10’s  digit  to  form  the  leaves

Stem        Leaf
n 613  would  become                          6            1
n 776  would  become                          7            8
n .  .  .
n 1224  becomes                                    12            2
Bar  and  Pie  Charts

n Bar  charts  and  Pie  charts  are  often  used  


for  qualitative  (category)  data

n Height  of  bar  or  size  of  pie  slice  shows  the  
frequency  or  percentage  for  each  
category
Pie  Chart  Example
Current  Investment  Portfolio  
Investment                Amount              Percentage Savings  
Type (in  thousands  $)
15%
Stocks                            46.5                       42.27 Stocks
Bonds 32.0                              29.09 42%
CD  
CD 15.5                                14.09 14%
Savings                       16.0                           14.55
Total 110 100

Bonds   Percentages  
(Variables  are  Qualitative) are  rounded  to  
29% the  nearest  
percent
Bar  Chart  Example

Investor's  Portfolio

Savings
CD
Bonds
Stocks

0 10 20 30 40 50
Amount  in  $1000's
Bar  Chart  Example

Number  o f   Frequency
days  read Newspaper  readership  per  week
0 44
1 24 50
2 18 40
Freuency

3 16
30
4 20
20
5 22
6 26 10
7 30 0
Total 200 0 1 2 3 4 5 6 7
Number  of  days  newspaper  is  read  per  week
Line  Charts  and  
Scatter  Diagrams

n Line  charts show  values  of  one  variable  


vs.  time
n Time  is  traditionally  shown  on  the  horizontal  axis

n Scatter  Diagrams show  points  for  bivariate  


data  
n one  variable  is  measured  on  the  vertical  axis  and  
the  other  variable  is  measured  on  the  horizontal  
axis
Line  Chart  Example

Inflation  
Year

1985
Rate
3.56
U.S.  Inflation  Rate
1986 1.86 6
1987 3.65
5
Inflation  Rate  (%)
1988 4.14
1989 4.82 4
1990 5.40
1991 4.21 3
1992 3.01
1993 2.99 2
1994 2.56
1
1995 2.83
1996 2.95 0
1997 2.29
1984 1986 1988 1990 1992 1994 1996 1998 2000 2002
1998 1.56
1999 2.21 Year
2000 3.36
2001 2.85
2002 1.58
Scatter  Diagram  Example

Volume   Cost  per  


Production  Volume  vs.  Cost  per  Day
per  day day
23 125 250
26 140 200
Cost  per  Day  

29 146
150
33 160
38 167 100
42 170 50
50 188 0
55 195 0 10 20 30 40 50 60 70
60 200
Volume  per  Day
Types  of  Relationships

n Linear  Relationships

Y Y

X X
Types  of  Relationships
(continued)

n Curvilinear  Relationships

Y Y

X X
Types  of  Relationships
(continued)

n No  Relationship

Y Y

X X
Describing  Data  Using  
Numerical  Measures
Summary  Measures

Describing  Data  Numerically

Center  and  Location Other  Measures   Variation


of  Location
Mean Range
Percentiles
Median Interquartile  Range
Quartiles
Mode
Variance
Weighted  Mean
Standard  Deviation

Coefficient  of  
Variation
Mean  (Arithmetic  Average)

n The Mean is  the  arithmetic  average  of  data  


values
n Sample  mean n  =  Sample  Size
n

∑x i
x1 + x 2 + ! + x n
x= i=1
=
n n
n Population  mean N  =  Population  Size
N

∑x i
x1 + x 2 + ! + xN
i=1
µ= =
N N
Mean  (Arithmetic  Average)
(continued)

n The  most  common  measure  of  central  tendency


n Mean  =  sum  of  values  divided  by  the  number  of  values
n Affected  by  extreme  values  (outliers)

0    1      2      3      4      5      6      7      8      9      10 0    1      2      3      4      5      6      7      8      9      10

Mean  =  3 Mean  =  4
1 + 2 + 3 + 4 + 5 15 1 + 2 + 3 + 4 + 10 20
= =3 = =4
5 5 5 5
Median
n Not  affected  by  extreme  values

0    1      2      3      4      5      6      7      8      9      10 0    1      2      3      4      5      6      7      8      9      10

Median  =  3 Median  =  3
n In  an  ordered  array,  the  median  is  the  “middle”  
number
n If  n  or  N  is  odd,  the  median  is  the  middle  number
n If  n  or  N  is  even,  the  median  is  the  average  of  the  
two  middle  numbers
Mode
n A  measure  of  central  tendency
n Value  that  occurs  most  often
n Not  affected  by  extreme  values
n Used  for  either  numerical  or  categorical  data
n There  may  may  be  no  mode
n There  may  be  several  modes

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6

Mode  =  5 No  Mode
Measures  of  Center  and  Location
Overview
Center  and  Location

Mean Median Mode Weighted  Mean

∑x ∑ wx i i
x= i=1
i
XW =
n ∑w i
N
∑ wx
∑x i µW = i i

µ= i=1
N ∑w i
Weighted  Mean

n Used  when  values  are  grouped  by  frequency  or  


relative  importance

Example:  Sample  of  


26  Repair  Projects
Weighted  Mean  Days  
Days  to   Frequency to  Complete:
Complete
5 4 ∑ wx
i i (4 × 5) + (12 × 6) + (8 × 7) + (2 × 8)
XW = =
6 12 ∑w i 4 + 12 + 8 + 2
7 8 164
 =    =    6.31    days
8 2 26
Review  Example

n Five  houses  on  a  hill  by  the  beach


$2,000  K
House  Prices:  

$2,000,000
500,000 $500  K
300,000 $300  K
100,000
100,000

$100  K

$100  K
Summary  Statistics

House  Prices:  
n Mean: ($3,000,000/5)    
$2,000,000
=    $600,000
500,000
300,000
100,000
100,000 n Median: middle  value  of  ranked  data  
Sum    3,000,000
=  $300,000

n Mode: most  frequent  value  


=  $100,000
Which  measure  of  location  
is  the  “best”?

n Mean is  generally  used,  unless  


extreme  values  (outliers)  exist
n Then  median is  often  used,  since  
the  median  is  not  sensitive  to  
extreme  values.
n Example: Median  home  prices  may  be  
reported  for  a  region  – less  sensitive  to  
outliers
Shape  of  a  Distribution
n Describes  how  data  is  distributed
n Symmetric or  skewed

Left-­Skewed Symmetric Right-­Skewed

Mean  < Median  < Mode Mean  = Median  = Mode < Median  < Mean
(Longer   tail  extends  to  left)
Mode (Longer   tail  extends  to  right)
Other  Location  Measures
Other  Measures  
of  Location

Percentiles Quartiles

The  pth percentile  in  a  data  array: n 1st quartile  =  25th percentile
n p%  are  less  than  or  equal  to  this  
value
n 2nd quartile  =  50th percentile
n (100  – p)%  are  greater  than  or   =  median
equal  to  this  value    
(where  0  ≤  p  ≤  100)
n 3rd quartile  =  75th percentile
Percentiles

n The  pth percentile  in  an  ordered  array  of  n  


values  is  the  value  in  ith position,  where
p
i= (n + 1)
100
n Example: The  60th percentile  in  an  ordered  array  of  19  
values  is  the  value  in  12th position:
p 60
i= (n + 1) = (19 + 1) = 12
100 100
Quartiles

n Quartiles  split  the  ranked  data  into  4  equal  


groups
25% 25% 25% 25%

Q1 Q2 Q3
n Example:  Find  the  first  quartile
Sample  Data  in  Ordered  Array:    11      12      13      16      16      17      18      21      22
(n  =  9)
25
Q1  =  25th percentile,   so  find  the                              (9+1)  =  2.5  position
100
so  use  the  value  half  way  between   the  2nd and  3rd values,
so        Q1  =  12.5
Box  and  Whisker  Plot
n A  Graphical  display  of  data  using  5-­number  
summary:
Minimum  -­-­ Q1  -­-­ Median  -­-­ Q3  -­-­ Maximum

Example:

25%                                        25%                            25%                      25%

Minimum                                        1st                          Median            3rd                            Maximum


                                                                 Quartile                                                Quartile
Shape  of  Box  and  Whisker  Plots

n The  Box  and  central  line  are  centered  between  the  


endpoints  if  data  is  symmetric  around  the  median

n A  Box  and  Whisker  plot  can  be  shown  in  either  vertical  
or  horizontal  format
Distribution  Shape  and  
Box  and  Whisker  Plot

Left-­Skewed Symmetric Right-­Skewed

Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3
Box-­and-­Whisker  Plot  Example

n Below  is  a  Box-­and-­Whisker  plot  for  the  following  


data:
Min                    Q1                                        Q2                                        Q3                    Max
0        2          2            2          3          3          4          5          5        10        27

       0      2  3    5                                                                                      27
n This  data  is  very  right  skewed,  as  the  plot  depicts
Measures  of  Variation
Variation

Range Variance Standard  Deviation Coefficient  of  


Variation
Population Population
Interquartile  
Variance Standard
Range
Deviation

Sample   Sample  
Variance Standard  
Deviation
Variation

n Measures  of  variation  give  information  on  


the  spread  or variability of  the  data  
values.

Same  center,  
different  variation
Range
n Simplest  measure  of  variation
n Difference  between  the  largest  and  the  smallest  
observations:
Range  =  xmaximum – xminimum

Example:

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Range  =  14  -­ 1  =  13


Disadvantages  of  the  Range
n Ignores  the  way  in  which  data  are  distributed

7 8 9 10 11 12 7 8 9 10 11 12
Range  =  12  -­ 7  =  5 Range  =  12  -­ 7  =  5

n Sensitive  to  outliers


1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
Range  =  5  -­ 1  =  4

1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
Range  =  120  -­ 1  =  119
Interquartile  Range

n Can  eliminate  some  outlier  problems  by  using  


the  interquartile  range

n Eliminate  some  high-­and  low-­valued  


observations  and  calculate  the  range  from  the  
remaining  values.

n Interquartile  range  =  3rd quartile  – 1st quartile


Interquartile  Range

Example:
X Median X
minimum Q1 (Q2) Q3 maximum

25%                                  25%                              25%                    25%

12                                          30                                  45                      57                        70

Interquartile  range  
=  57  – 30  =  27
Variance

n Average  of  squared  deviations  of  values  from  


the  mean
n Sample variance: n
2

2
∑ (x − x)
i
s = i=1
n  -­ 1

n Population variance: N
2

2
∑ (x − μ)
i
σ = i=1
N
Standard  Deviation

n Most  commonly  used  measure  of  variation


n Shows  variation  about  the  mean
n Has  the  same  units  as  the  original  data
n
n Sample standard  deviation: 2
∑ (x − x)
i
s= i=1
n -­ 1

n Population standard  deviation: N


2
∑ (x − μ) i
σ= i=1
N
Calculation  Example:
Sample  Standard  Deviation
Sample  
Data    (Xi)  :          10          12          14          15        17        18        18        24
n  =  8                        Mean  =  x  =  16

(10 − x )2 + (12 − x )2 + (14 − x )2 + ! + (24 − x )2


s =
n −1

(10 − 16)2 + (12 − 16)2 + (14 − 16)2 + ! + (24 − 16)2


=
8 −1

126
= = 4.2426
7
Comparing  Standard  Deviations

Data  A
Mean  =  15.5
11        12        13        14        15        16        17        18        19        20      21 s    =  3.338

Data  B
Mean  =  15.5
11        12        13        14        15        16        17        18        19        20      21 s  =  .9258
Data  C
Mean  =  15.5
11        12        13        14        15        16        17        18        19        20      21 s  =  4.57
Coefficient  of  Variation
n Measures  relative  variation
n Always  in  percentage  (%)
n Shows  variation  relative  to  mean
n Is  used  to  compare  two  or  more  sets  of  data  
measured  in  different  units  

Population Sample
⎛ σ ⎞ ⎛ s ⎞
CV = ⎜ ⎟ ⋅ 100%
⎜ μ ⎟ CV = ⎜ ⎟ ⋅ 100%
⎜ x ⎟
⎝ ⎠ ⎝ ⎠
Comparing  Coefficient  
of  Variation
n Stock  A:
n Average  price  l ast  y ear  =  $50

n Standard  deviation  =  $5

⎛ s ⎞ $5
CVA = ⎜⎜ ⎟⎟ ⋅ 100% = ⋅ 100% = 10%
⎝ x ⎠ $50 Both  stocks  
n Stock  B: have  the  same  
standard  
n Average  price  last  year  =  $100 deviation,  but  
stock  B  is  less  
n Standard  deviation  =  $5 variable  relative  
to  its  price
⎛ s ⎞ $5
CVB = ⎜⎜ ⎟⎟ ⋅ 100% = ⋅ 100% = 5%
⎝ x ⎠ $100
The  Empirical  Rule
n If  the  data  distribution  is  bell-­shaped,  then  
the  interval:
n μ ± 1σ   contains  about  68% of  the  values  in  
the  population  or  the  sample
X

68%

μ
μ ± 1σ
The  Empirical  Rule
n μ ± 2σ   contains  about  95% of  the  values  in  
the  population  or  the  sample
n μ ± 3σ   contains  about  99.7% of  the  values  
in  the  population  or  the  sample

95% 99.7%

μ ± 2σ μ ± 3σ
Standardized  Data  Values

n A  standardized  data  value refers  to  


the  number  of  standard  deviations  a  
value  is  from  the  mean

n Standardized  data  values  are  


sometimes  referred  to  as  z-­scores
Standardized  Population  Values

x −μ
z =  
σ
where:    
n x =  original  data  value

n μ =  population  mean

n σ =  population  standard  deviation

n z =  standard  score  

(number  of  standard  deviations  x  is  from  μ)


Standardized  Sample  Values

x−x
z =  
s
where:    
n x =  original  data  value

n x =  sample  mean

n s  =  sample  standard  deviation

n z =  standard  score  

(number  of  standard  deviations  x  is  from  μ)


Using  Microsoft  Excel

n Descriptive  Statistics  are  easy  to  obtain  


from  Microsoft  Excel

n Use  menu  choice:


tools  /  data  analysis  /  descriptive  statistics

n Enter  details  in  dialog  box


Using  Excel

n Use  menu  choice:


tools  /  data  analysis  /  
descriptive  statistics
Using  Excel
(continued)

n Enter  dialog  box  


details

n Check  box  for  


summary  statistics

n Click  OK
Excel  output

Microsoft  Excel  
descriptive  statistics  output,  
using  the  house  price  data:
House  Prices:  

$2,000,000
500,000
300,000
100,000
100,000
GROUP  EXERCISE
Suppose  you  are  given  the  following  sales  of  12  
car  dealers  for  last  month.
38,  41,  67,  63,  32,  50,  58,  74,  28,  69,  43,  63  
1. Compute  the  mean,  median,  and  mode.  
2. Compute  the  population  variance,  standard  
deviation,  and  coefficient  of  variation.  
GROUP  EXERCISE
3. You  are  given  the  following  grades  from  a  midterm  exam  in  
English:  95,  34,  83,  92,  94,  88,  99.  Find  the  median  and  range  of  
the  scores.  
4. You  are  given  the  following  two  groups  of  numbers
1,000  2,000  3,000
and  1,000,000  2,000,000  3,000,000
Is  it  true  that  the  second  group  of  numbers  has  a  higher  
dispersion  because  it  has  a  higher  standard  deviation?  
GROUP  EXERCISE
n When  examining  the  desirability  of  a  business  
venture,  we  sometimes  use  the  variance  of  the  
profits  to  measure  the  risk  of  the  project.  Briefly  
explain  why  the  variance  may  not  be  a  good  
measure  of  business  risk.  
GROUP  EXERCISE
Suppose  you  are  given  the  following  sales  of  12  car  dealers  for  last  month.
38,  41,  67,  63,  32,  50,  58,  74,  28,  69,  43,  63  
1. Compute  the  mean,  median,  and  mode.  

• mean  =  (38  +  41  +  67  +  63  +  32  +  50  +  58  +  74  +  28  +  69  +  43  +  63)  /  12  =  
52.167  
• The  median  is  the  number  in  the  middle.  When  the  number  of  observations  
is  an  even  number,  the  median  is  the  mean  of  the  middle  two  numbers.  To  
find  the  median,  we  first  rank  the  data  from  the  smallest  to  the  largest.  The  
middle  two  numbers  in  our  example  are  50  (5th  observation)  and  58  (6th  
observation).  Their  mean  is  (50+58)/2=54.  
• The  mode  is  the  number  that  occurs  most  frequently.  Since  each  number  
occurs  only  once  in  this  problem,  there  is  no  mode.  Note  that  the  mean  and  
median  are  equal  to  each  other  in  this  example  merely  by  coincidence.  
GROUP  EXERCISE
Suppose  you  are  given  the  following  sales  of  12  car  dealers  for  last  month.
38,  41,  67,  63,  32,  50,  58,  74,  28,  69,  43,  63  
2. Compute  the  population  variance,  standard  deviation,  and  coefficient  of  
variation.  

s2  =  [(38−52.17)2   +(41−52.17)2   +(67−52.17)2   +(63−52.17)2   +(32−52.17)2  


+(50−52.17)2   +(58−52.17)2   +(74−52.17)2   +(28−52.17)2   +(28−52.17)2
+  (28  −  52.17)2   +  (69  −  52.17)2   +  (43  −  52.17)2   +  (63  −  52.17)2   ]/(12  −1)  =  241.24  

s=  σ2  =  114=15.53  

CV  =  15.53   /  52.17  =  .2977  


GROUP  EXERCISE
3. You  are  given  the  following  grades  from  a  midterm  exam  in  
English:  95,  34,  83,  92,  94,  88,  99.  Find  the  median  and  range  of  
the  scores.  
4. You  are  given  the  following  two  groups  of  numbers
1.000,    2.000,    3.000
and  1.000.000,    2.000.000,    3.000.000
Is  it  true  that  the  second  group  of  numbers  has  a  higher  
dispersion  because  it  has  a  higher  standard  deviation?  
GROUP  EXERCISE
n When  examining  the  desirability  of  a  business  
venture,  we  sometimes  use  the  variance  of  the  
profits  to  measure  the  risk  of  the  project.  Briefly  
explain  why  the  variance  may  not  be  a  good  
measure  of  business  risk.  
n When  we  use  variance  as  a  measure  of  risk,  we  
consider  values  above  the  mean  to  be  as  
undesirable  as  values  below  the  mean.  
Because  profits  that  lie  above  the  mean  are  
desirable,  rather  than  risky,  the  variance  may  
not  be  an  appropriate  measure  of  business  risk.  

You might also like