You are on page 1of 8

Scatter Diagrams and Linear Correlation

Temperature Number of Jellyfish
It is thought that the number of 
20 135 observed specimens of jelly fish in an 
21 138 atoll depend on the temperature.  A 
22 150 record of the temperature and the 
19 135 number of jellyfish was kept over a 
24 162 two­week period.
26 201
31 263 Plot these points on a scatter diagram 
27 221 and comment on the type of 
24 168 correlation.
21 155
21 149
(draw on paper and save for later)
20 152
21 148
19 124

1
Scatter Diagrams and Linear Correlation

A mathematics teacher wanted to check if there was a correlation between her predicted grades and the 
actual grades of her mathematical studies class.

Draw a scatter diagram to represent the data and comment on the correlation.

Predicted 5 6 4 5 4 3 7 7 6 4 4 2 5 7
Obtained 4 7 2 3 5 5 7 6 7 5 3 4 3 5

(draw on paper and save for later)

2
Scatter Diagrams and Linear Correlation

The Line of Best Fit, by eye, passing through the mean point

• First, find the mean of both sets of data and plot this point on the scatter diagram.
• Then draw a line that passes through this plotted point and is close to all the other points with about 
equal points above and below the line.  The line of best fit does not need to go through the origin, and in 
most cases, it will not.

3
Scatter Diagrams and Linear Correlation
Bivariate data is a set of data where there are two variables for each observation.

Pearson's product­moment correlation coefficient

It is useful to know the strength of the relationship between any two sets of data that are thought to be 
related.  The formula for Pearson's product­moment correlation for two sets of data x and y is

where  is the covariance and  are the standard deviations of 

of x and y respectively.

4
Scatter Diagrams and Linear Correlation

Interpretation of positive, zero and negative correlations

r­values

­1 strong negative
­0.75 moderate negative
­0.5 weak negative
­0.25 very weak negative
0 very weak positive
0.25 weak positive
0.5 moderative positive
0.75 strong positive

The degree of correlation will depend on the number of pairs in the sample.  The more pairs there are, 
the lower the correlation has to be for a good fit.  Another method to use would be the p­value on the 
GDC.  A very small p­value means a strong correlation

5
Scatter Diagrams and Linear Correlation

Coefficient of Determination

On your GDC you will also be given  r2 , the coefficient of determination.  This is an indication of how 
the variation in the one set of data, y, can be explained by the variation in the other set of data, x.

Example:  If  r2 =0.866, we say the 86.6% of the variation in set y is caused by the variation in set x.  For 
this value of r2, r = 0.930, which indicates a strong positive linear relationship.

Example These data are for the Dutch football first division, and they show the position of the
team and the number of goals scored.  Given that   , calculate the

correlation coefficient, r, and comment on this value.

Position Goals
1 69
2 62
3 58
4 49
5 44
6 43
7 43
8 41
9 39
10 38
11 35
12 33
13 28
14 27
15 27
16 24
17 20
18 8

6
Scatter Diagrams and Linear Correlation

Example For the data in the table, calculate the correlation coefficient, r, and comment on your result.

Height, x cm 148 151 152 158 159 160 160 163 168 172 175 183
Weight, y kg 42 48 53 54 62 61 63 65 59 70 73 75

7
Scatter Diagrams and Linear Correlation

Example Ivan thought that there would be a strong correlation between the distance his classmates
lived from the school and the time it took them to travel to school.  After he gathered the
information, Ivan calculated that the covariance was 20.3, the standard deviation of the
time was 8.12 minutes, and the standard deviation of the distance was 6.83 km.

Find the correlation coefficient, r, and comment on the result

You might also like