You are on page 1of 7

직선 그림표 그리기와 최소자승법에 의한 일차회귀분석

오 병성
충남대학교 물리학과 교수

그림표는 실험 자료를 제시하고 분석하는 좋은 방법이다. 특히 그림표가 직선이라면 그림표

의 x-변량과 y-변량의 관계를 쉽게 이해할 수 있다. 최소자승법을 사용하여 이 직선의 기

울기와 절편 등을 수학적으로 구하는 방법을 선형 회귀 분석(linear regression)이라 한다.

그림표의 기본

그림표는 자료들의 무엇이고 어떠한 관계인지를 쉽게 알아볼 수 있도록 그려야 한다. 따라

서 그림표를 그릴 때 따라야할 지침이 있다.

o 각 축에 나타낸 변량의 이름과 단위를 적어야 한다. 예를 들면 ‘Time (s)’ ‘거리 (km)’

등.

o 각 축에는 균등한 간격으로 적절한 수의 표시가 있는 눈금이 있어야 한다. 표시가 너무

많으며 그림표가 복잡해져 알아보기 어렵다. 표시가 너무 적으면 자료점의 값을 추정하

기 어렵다. 보통 2/5/10의 배수 간격으로 5 개 전후를 표시하는 것이 좋다.

o 보통 그림표는 설명(caption)이 붙어야 한다.

독립 변수(independent variable)와 종속 변수(dependent variable)

자료를 그림표로 나타낼 때 독립 변수에 대한 종속 변수를 그리는 것이 보통이다. 독립 변

수는 x-축으로, 종속 변수는 y-축으로 한다.

독립 변수(independent variable)는 독자적인 변수로 측정하고자 하는 다른 변수에 의하여

바뀌지 않는다. 예를 들면 역학에서 시간은 종종 독립변수이다. 거리, 속도 및 가속도는 시

간에 따라 변하지만 시간에 영향을 주지는 않는다.

종속 변수(dependent variable)는 다른 변수에 의존하는 양이다. 예를 들어 등가속도 운동


에서 물체의 위치는 시간에 따라 변하기에 물체의 위치는 시간에 종속되어 있고 따라서 종

속 변수이다.

자료를 직선으로 나타내기

x-y 축에 그림표를 그릴 때 직선이 자료점의 가장 간단한 관계이다. 자료점이 직선 위에

있는지는 쉽게 알 수 있기에 자료점들을 직선으로 나타나게 그림표를 그리는 것은 매우 유

용하다. 직선이 되면 x-축과 y-축의 두 가지 양의 관계를 이해하기 쉽다.

자료를 그림표에서 직선으로 나타내면      의 식에서 그 기울기 은 x-값의 변화에

대한 y-값의 변화의 척도, 즉    이고 절편 는 직선이 y-축과 만나는 점( = 0)

의 y-값이다.

직선의 그림표

시간  에 따른 변위 가         와 같이 변할 것이라고 예상한다면 그림표를 그려


확인하고 그림표의 기울기와 절편으로부터  와  또 각각의 불확도를 구할 수 있다.

우선 x-축을 시간  로 하고 y-축을 변위 로 하여 측정 결과를 그려본다, 즉 측정결과를


점으로 하여 불확도와 같이 그려본다.

Time (s)

이 그림표의 점들이 일직선 위에 놓였다고 생각하면 이 점들의 관계를 가장 잘 나타내는


최선의 직선(best line)을 그린다.
Time (s)

• 최선의 직선은 직선으로부터 각 점까지의 거리를 최소로 하는 직선을 의미한다.


• 어떤 경우에는 이 직선은 자료 점을 하나도 지나지 않을 수도 있다
• 예상이 올바르고 오차 막대가 적당하다면 최선의 직선은 오차 막대의 약 2/3와 만나게
된다
• 직선의 기울기와 절편을 구한다. (기울기 6.82 cm/s, 절편 0.0 cm)

기울기와 절편의 오차는 보조선(alternative line)을 그려서 구할 수 있다.

Time (S)

보조선의 기울기 6.19 cm/s, 절편 0.5 cm으로부터 직선의 기울기와 절편의 불확도를 구
한다. 기울기의 불확도는 두 기울기의 차이 즉 |6.82 - 6.19| = 0.63 ≈ 0.7 cm/s (불확도
는 유효숫자 하나로 올림할 것을 권장), 절편의 불확도는 |0.0 - 0.5| = 0.5 cm라 할 수
있다. 이로부터 다음과 같은 결론을 내릴 수 있다.
1. 예상한 대로 직선을 볼 수 있었다. 즉 변위 는 시간  의 일차함수 꼴이다.
2. 기울기 즉 수레의 속도  = 6.8±0.7 cm/s이다
3. 그림표의 절편 즉  = 0.0±0.5 cm이다.

최소자승법(least square method)과 일차 회귀분석(linear regression)

그림표를 그려서 살펴 본 결과 두 물리량의 관계가 직선적이라면 최소자승법(least square


method)을 사용하는 일차 회귀분석(linear regression)을 사용하기도 한다.

최소자승법(least square method)은 측정값 ( ,  )가      의 직선의 관계라면  (=


   )와  의 거리의 제곱의 합을 최소로 하는 와  값을 찾는 방법이다. 즉
 
 
 
        
 
 

를 최소로 하는 와  값은 찾는 방법이다. 이는  를 와 로 편미분한 결과가 0이 되는

와  값을 찾아 결정한다. 그 결과는

   
     
  
 
     

 
 
    

         


  
 

    
 
이 된다. 이 식에서

     
 

이며 은 측정 자료의 개수이다. 또한 와 의 불확도의 제곱은

  

     

이며 이 식에서

         
 

이다.

상관계수(correlation coefficient)는 독립 변수  와 종속 변수  사이의 상관의 척도로


         

            



 
 
 

와 같이 구한다.    값이 1에 가까우면 직선에 가깝다는 뜻이며  이 음수일 때는 음의

상관관계 즉 기울기가 음수임을 가리킨다.


Software를 이용한 일차회귀분석

spreadsheet (MS office의 Excel), 무료프로그램인 gnuplot, Octave 또는 상용 프로그램


인 Origin, MATLAB 등을 사용하여 일차 회귀분석을 할 수 있다.

Spreadsheet을 활용한 regression 방법 1

① Spreadsheet(Excel)의 워크시트 셀에 실험 데이터  와  를 기입하고 자료의 범위를


선택

② 메뉴에서 [삽입] (- [차트]) - [분산형]을 차례로 선택


③ 메뉴에서 표식만 있는 분산형 또는 차트 레이아웃 중 9번 선택

④ 그림표 위에서 마우스 오른 단추로 자료점을 클릭하고 [추세선 추가]를 선택하면


추세선(trendline)을 그려준다.
⑤ 축 제목, 차트 제목 등을 수정한다.

Spreadsheet을 활용한 regression 방법 2

앞에서 살펴본 최소자승법의 수식을 이용한다.

* Linear_regression.xls를 참조한다. Linear_regression.xls에는 최소자승법 수식을 이용


한 linear regression과 추세선을 사용하는 TrendLine 두 가지가 들어 있다.

연습문제) 어떤 폐수 중에 인산염인의 농도를 분석하기 위하여 다음과 같은 흡광도


측정결과를 얻었다. 이 데이터로부터 검량선을 작성하시오

• 위 data로 부터 표준액에 대하여 흡광도를 plotting 한 다음 추세선을 그리면 다음과


같다.
• 혹은 앞의 수식 사용하여 기울기 a 및 절편 b 구해도 된다
흡광도 = 0.0936 × [표준액(ml)] – 0.134

자료의 직선화

자료의 두 변수가 직선의 관계가 아니더라도 그림표를 그릴 때 두 변수의 형태를 바꾸어

직선으로 그릴 수 있다. 방법 중 하나는 적당한 치환으로      의 선형 관계가 되도록

관계를 바꾸는 것이다. 의 거듭 제곱의 경우 두 변수는      의 관계일 것이다. 이

자료를 직선화하려면 를 ′으로 치환하면   ′   로 직선 관계가 될 것이다. 운동 에

너지  와 속도 는    의 관계이기에 x-축을 속도로 나타낸 다음 그림표 (a)에

서는 포물선이 된다. 그러나 x-축을  대신  으로 하면 그림표는 그림 (b)처럼 직선이 된

다.

(a) (b)

운동에너지를 (a) 속도와 (b) 속도의 제곱으로 나타낸 그림표

You might also like