You are on page 1of 226

Yong-Jung Kim

25 Lectures for
Undergraduate Calculus I
February 27, 2024

카이스트 수리과학과
To the ones who question
Foreword

오래 전부터 1학년 미적분학 교과목에 대한 개편의 필요성이 제기되어 왔다. 미적


분학 자체의 변화보다는 현 교육과정이 신입생들이 경험한 고등학교 교육 내용의
변화를 반영하지 못하고 최근의 기술 발전이 수학을 활용하는 타 학과 구성원들
의 수요를 바꾼 측면이 교과목 개편의 필요성이 제기되는 주요 이유이다.
미적분학은 일단 대학에 진학해서 처음 대하는 주요 수학 과목인 만큼 학업
에 대한 관심과 의욕을 높이는데 주안점을 두었다. 이를 위해서 수학적 사실의
나열이 아니라 핵심 목표를 가지고 이를 성취해 나가는 과정을 통하여 수학적 사
실들을 습득해 나가는 새로운 구조를 취하기로 했다. 이를 위해 미적1의 전반부는
케플러의 법칙을 수학적으로 이해하는 것을 핵심 목표로 삼았다. 사실 뉴턴이 미
적분을 발명한 것도 이를 위한 것이었다. 이 과정을 통해 미적분의 기본 개념을
익히고 3차원 공간에서의 속도, 가속도, 중력 등 벡터의 개념을 익힌다. 특히 최
근 누리호 3차 발사에 성공하면서 위성과 행성의 궤도와 관련한 기본적인 사항을
익히는 것은 이제 대한민국의 과학도에게 꼭 필요한 핵심 교육 주제가 되었다.
미적1의 후반부는 근사기법의 개발과 이해를 핵심 목표로 삼았다. 적분과 미분
의 수학적인 핵심 기술을 Part III에서 학습한 후에 수열과 급수에 대한 학습을
근사기법이라는 관점에서 Part IV에서 진행한다. 특히 공학도들에게 꼭 필요한
근사기법에 대한 수학적 이해라는 목적의식을 가지고 학습한다.
과학적 목표를 긴 호흡으로 성취해 나가는 연습은 중고등학교 과정에서는 경
험이 없기에 아마도 더 어렵게 느껴질 수도 있다. 하지만 과학적인 목표를 이루기
위해 여러 가지 수학적 사실들을 적용하고 개발하는 연습은 좋은 경험이 되고
과학도로서의 연구 생활에 도움이 될 것으로 기대한다.

2023년 8월 대전, 미적교과개편위원회

vii
Preface

대학의 교과목에 대한 학술 서적과 그 교과목을 가르치는 강의록은 근본적인 차


이가 있다. 학술 서적은 관련 내용을 전부 포함하지는 못한다고 하더라도 필수
부분은 반드시 포함해야 하는 완결성과 이에 대한 정확한 설명을 핵심으로 한다.
또한 교과목의 진행과 별도로 다음에도 쉽게 필요한 부분에 접근할 수 있게 만드
는 접근성도 중요하다. 가령 한 부분을 다시 보려고 했는데 그를 이해하기 위해서
앞부분을 전부 다시 봐야 한다면 접근이 힘들어진다.

반면에 강의록은 강의를 위해 만들어진다. 전 과정을 함께 공부하는 학생들을


염두에 두고 만들어진다. 따라서 학술 서적과의 큰 차이는 학생들이 전 과정을
따라 올 수 있게 하는 학생들을 이끄는 방식이다. 마치 강의실에서 강의자와 학
생들이 대화하는 것 같은 소통이 필요하다. 학생들이 생각할 수 있게 하는 적절한
질문과 동기부여가 학습의 효과를 높일 수 있다. 때로는 구체적인 설명보다는 적
절한 힌트와 동기부여로 학생 스스로가 답을 찾아가게 하는 것이 더 효과적일 수
있으며 이를 통해 강의가 지식의 전달을 넘어 사고와 창의력에 대한 자극이 되게
할 수 있다.

“25 Lectures for Undergraduate Calculus I”는 강의록의 특성에 충실하여 학생


들과 강의자가 소통하는 형식으로 만들어졌다. 적절한 질문과 스스로 이해하는
과정을 통해 성취를 이루어 갈 수 있도록 구성하려고 노력 했다. 또한 현재 많은
수의 대학에서 한 학기 코스가 최대 75분 강의 28개로 이루어지지만 휴일 등을
감안하여 25개의 강의로 본 강의록을 구성하였다.

질문은 학습을 이끄는 원동력이자 창조적 사고의 시작이다. 그것이 Question을


강조하는 QAIST 교육 철학이다. 본 강의록의 구성은 질문과 풀이의 형식으로 정
리와 증명 을 대신하려고 했다. 최소한의 핵심 정리들만 정리의 형식으로 남았다.
설명을 이해하려고 노력하기 전에 문제들을 형상화하고 스스로 답하려는 시간
을 먼저 갖기를 바란다. 그리고 지속적으로 질문을 던지고 있다. 이러한 질문에
답하려는 시도를 통해서 핵심으로 다가서고 자신의 질문을 만들어 갔으면 한다.
질문을 하는 것은 새로운 것을 창조하는 시작이다.

김용정

ix
x Preface
Preface xi

수업에 참가하는 KAIST 학생들에게

한 학기는 모두 25번 정도의 강의로 구성되고 이 강의록도 25개의 강의로 구성


되었다. 수업에 들어가기 전에 강의 내용을 읽어보고 질문할 것을 가지고 오면
학업에 도움이 된다. 시간이 없더라도 수업 목표는 확인하고 수업에 들어가자. 각
강의를 구성하고 있는 Problem의 경우 해답를 보기전에 스스로 대답해 보려는
시도를 해보자. 그 이후에는 해답에 대한 이해를 주도적으로 할 수 있을 것이다.
각 강의에는 몇 개의 Question이 있는데 한번쯤 생각을 해보자. 수학하는 템포는
약간 느린 것이 좋다. 여유를 가지고 생각하면 더 효과를 발휘할 수 있다. 각 25개
강의 끝 부분에는 Exercise 문제들이 주어 졌다. 많지는 않은 문제이지만 배운 것
을 확인하고 다시 이해하는데 도움이 된다. 연습 문제가 부족하게 느껴지면 다른
일반 미적책에 있는 문제들도 풀어보길 바란다.
강의록은 일단 한글로 만든 후에 챗 GPT의 도움을 받아 영어로 번역하였다.
공식으로 사용하는 것은 영어판이지만 한글판을 사용해도 좋다.
Contents

Part I Differentiation: Mathematical Description of Motion

1 Limit and continuity #1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3


1.1 Common language definitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Quality control and ε-δ arguments . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2 Limit and continuity #2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11


2.1 Rigorous definitions using ε-δ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2 Examples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3 Limits as x → ∞ and f (x) → ∞ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

3 Differentiation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.1 Rate of increase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2 Differentiation rules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.3 Intermediate and mean value theorem . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.4 Derivative of trigonometric functions . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.5 Velocity and acceleration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

4 Chain rule and implicit differentiation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27


4.1 Chain rule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.2 Implicit differentiation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

5 Integration & fundamental theorem of calculus . . . . . . . . . . . . . . . . . . . . 35


5.1 Antiderivative . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
5.2 Integral as the area bounded by a graph . . . . . . . . . . . . . . . . . . . . . . . . 37
5.3 Riemann sum and area . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

6 Inverse functions and their derivatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43


6.1 Bijection (one-to-one and onto function) . . . . . . . . . . . . . . . . . . . . . . . 43
6.2 Derivative of inverse functions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
6.3 Natural logarithm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

xiii
xiv Contents

6.4 Exponential function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

Part II Kepler and Newton’s Laws of Motion

7 Rectangular coordinate system and curves in R3 . . . . . . . . . . . . . . . . . . . 55


7.1 Coordinate system . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
7.2 Projection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.3 Moving particle and trajectory curves in space . . . . . . . . . . . . . . . . . . 58
7.4 Cross product, inner product, and outer product . . . . . . . . . . . . . . . . . 60

8 Polar coordinates in R2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
8.1 Variable change with polar coordinates . . . . . . . . . . . . . . . . . . . . . . . . 65
8.2 Motion in polar coordinates . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
8.3 Ellipses in polar coordinates . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
8.4 Curves in polar coordinates . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

9 Differential Equations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
9.1 First order differential equations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
9.2 Separation of variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
9.3 Integrating factor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
9.4 Second Order Differential Equations . . . . . . . . . . . . . . . . . . . . . . . . . . 78
9.5 Equation for two-body problem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

10 Newton’s law on Earth . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81


10.1 Newton’s law of motion and gravitation . . . . . . . . . . . . . . . . . . . . . . . . 81
10.2 Work and energy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
10.3 Gravity force and potential energy . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
10.4 Projectile motion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

11 Newton’s law in space: Two-body problem . . . . . . . . . . . . . . . . . . . . . . . . 89


11.1 Kepler’s laws . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
11.2 Two-body problem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
11.3 Center of mass . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
11.4 Displacement vector . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
11.5 Kepler problem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

12 Kepler’s law and the energy of planets . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97


12.1 Energy of circular orbits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
12.2 Energy of elliptical orbits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
12.3 Circular orbit of satellites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
12.4 Elliptical orbits of satellites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
12.5 Interstellar and solar system object . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

Part III The Arts of Calculus

13 Curves and particle trajectories in R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107


Contents xv

13.1 arclength as a variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107


13.2 Parametrization with arclength . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
13.3 TNB coordinate system . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
13.4 Computation formulas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
13.5 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

14 Linearization and differentials . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115


14.1 Linearization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
14.2 Differentials . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
14.3 Differentials for linear approximation . . . . . . . . . . . . . . . . . . . . . . . . . . 118

15 Inverse trigonometric and hyperbolic functions . . . . . . . . . . . . . . . . . . . . 121


15.1 Inverse trigonometric functions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
15.2 Hyperbolic functions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

16 L’Hopital’s rule, big-oh, and little-oh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129


16.1 L’Hopital’s rule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
16.2 Big-oh and Little-oh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

17 Integration Techniques # 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135


17.1 Substitution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
17.2 Integration by parts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

18 Integration Techniques # 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141


18.1 Trigonometric substitution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
18.2 Integration of rational functions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142

19 Integration Techniques # 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147


19.1 Improper integrals . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
19.2 Integration with software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150

Part IV Approximation Techniques and Series

20 Numerical Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153


20.1 Numerical integration and Riemann sum . . . . . . . . . . . . . . . . . . . . . . . 153
20.2 Convergence order . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
20.3 Numerical integrals and Gaussian quadrature . . . . . . . . . . . . . . . . . . . 157

21 Sequences and series . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161


21.1 Sequence of real numbers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
21.2 Series of real numbers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
21.3 Power series . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167

22 Tests for absolute convergence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171


22.1 Integral test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
22.2 Comparison test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
22.3 Ratio test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
xvi Contents

22.4 Root test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176

23 Power series . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179


23.1 Convergence of a power series . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
23.2 Radius of convergence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
23.3 Alternating series . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
23.4 Rearrangement and conditional convergence . . . . . . . . . . . . . . . . . . . . 184

24 Taylor Series . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187


24.1 Taylor series . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
24.2 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

A Second Order Differential Equations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195


A.1 Second order homogeneous linear equation . . . . . . . . . . . . . . . . . . . . . 195
A.2 Second order inhomogeneous linear equation . . . . . . . . . . . . . . . . . . . 199
A.3 Equation for two-body problem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200

B Elliptical orbits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203


B.1 Eccentricity and focus of an ellipse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
B.2 Directices and ellipses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
B.3 Polar equations of an ellipse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207

C Numerical experiments for Taylor series . . . . . . . . . . . . . . . . . . . . . . . . . . 209

Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
Part I
Differentiation: Mathematical Description
of Motion
뉴턴(1643-1727) 당시 가장 관심이 있던 과학적인 주제는 천체의 움직임이었다.
갈릴레오(1564-1642)에 의해 천동설이 무너지고 지동설이 받아들여지기 시작했
으며 케플러(1571-1630)에 의해 천체의 궤도와 움직임이 설명되는 때였다. 따라
서 천체의 움직임에 대한 연구는 당시에 가장 뜨거운 주제였다. 그러나 이들에
대한 설명은 관측한 자료에 기반을 둔 것이었을뿐 그 원인을 설명하지 못하였
다. 무엇보다도 이러한 천체의 움직임을 설명하는 데 쓰일 수학적인 수단 마저도
없었다. 피타고라스의 정리와 같이 정적인 것을 설명하던 수학에서 동적인 것을
설명하는데 적합한 수학적인 수단을 만들어 낸 사람이 뉴턴이었고 그 결과물이
미적분이다. 뉴턴은 이 미적분을 사용하여 천체의 움직임을 설명하였다.
Part I에서 우리가 하고자 하는 것은 이러한 동적인 움직임을 나타내는 수단인
미분의 개념을 발전 시키는 것이다. 마치 미분을 만들어 나가는 뉴턴의 시각에서
공부해 나가면 그 가치를 더 잘 알 수 있을 것이다. 다음 장인 Part II에서는 이를 이
용해서 행성과 위성의 궤도를 수학적으로 표현하고 증명하며 이를 이용해 Kepler
의 법칙을 포함한 천체의 움직임을 설명한다. 우리는 그 과정에서 미분의 개념을
익히고 어떻게 구체적인 상황에 사용할 수 있는지를 경험한다.
물론 미분은 천체의 움직임 외에도 훨씬 다양한 곳에 사용된다. 천체의 움직임
을 염두에 두고 공부하는 것은 우리를 매우 흥미롭게 하겠지만 우리는 그 관점
에만 머물러서는 안되고 이 외에도 유용한 미적분의 기본적인 것들을 함께 배워
나갈 것이다. 따라서 다양한 관점에서 미분의 의미를 이야기 할 것이다. 특히 우
리는 수렴성, 연속성 그리고 미분 가능성을 ε-δ 기법을 사용하여 보다 엄밀하게
다룬다. 이 기법은 뉴턴 이후에 개발 된 것으로 아마도 우리는 뉴턴 보다 더 엄밀
하게 미분을 다루고 있는 것인지도 모른다.
Lecture 1
Limit and continuity #1

미적분에서는 극한(limit)을 많이 사용한다. 미분과 적분을 극한으로 정의 할 뿐


아니라 보다 기본적인 수렴성(convergence)이나 연속성(continuity)을 극한을 통
해 이해한다. 실제에서도 정확한 참값보다는 대략적인 근삿값을 얻을 수 있는
경우가 많다. 이 경우 핵심 질문 중의 하나는 “정확도를 높이면 근삿값이 참값
에 수렴하는지 아니면 다가가지 못하는 한계가 있는지”의 여부이다. 극한 또는
수렴은 미적분 뿐만 아니라 많은 분야에서 반복해서 등장하는 핵심 개념이어서
명확하게 이해하는 것이 매우 중요하다.
이번 강의에서는 일상어를 사용하여 극한(limit), 수렴(convergence), 연속성
(continuity)을 배운다.

문자의 사용

수학은 수를 다루는 학문이라고 하지만 실제 수 보다는 문자로 많은 것을 표현


한다. 함수를 나타내기 위해 f , g 등을 사용하고 변수를 나타내기 위해 x, y, z등을
사용하며 상수를 나타내기 위해 a, b, c 등 다양한 문자를 구분하여 사용한다. 그
러나 알파벳 문자만으로는 충분하지 않아서 그리스 문자를 자주 사용한다. 많이
쓰이는 그리스 소문자로 다음과 같은 것이 있다.
1. α alpha 알파, β beta 베타, γ gamma 감마, ω omega 오메가, σ sigma 시그마, θ
theta 세타, ρ rho 로, φ phi 피,
2. ε epsilon 엡실론, δ delta 델타, λ lambda 람다, τ tau 타우
많이 쓰이는 그리스 대문자로 다음과 같은 것이 있다.
1. Ω 오메가, Σ 시그마, ∆ 델타

1.1 Common language definitions

일상어를 사용하여 극한과 연속에 대한 성질을 알아보자. 실수 값을 가지는 함수


f 가 interval [a, b] ⊂ R에서 정의 되었다고 하자. 기호로는 다음과 같이 표기한다:

f : [a, b] → R.

우리는 [a, b]를 closed interval 이라고 부르며, a와 b를 포함하고 그 사이에 있는


모든 실수로 이루어졌다. 즉, [a, b] = {x ∈ R : a ≤ x ≤ b}이다. 여기서 양 끝 값을

3
4 1 Limit and continuity #1

제외한 집합을 open interval 이라고 부르고 (a, b)로 표기한다. 만약 변수 x ∈ [a, b]
가 특정한 값 c ∈ (a, b)로 접근할 때 함수 값 f (x)가 특정한 값 L로 접근하면 우리
는 L을 x가 c로 접근할 때의 함수 f (x) 의 극한 또는 limit이라고 부르며, 기호로
다음과 같이 표기한다:
lim f (x) = L.
x→c

우리는 또한 변수 x가 c로 다가갈때 f (x)가 L로 수렴한다 또는 converge한다고 말


한다. 이렇게 수렴한다고 말할 때는 x가 c로 어느 방향에서 접근 하든지 상관 없이
항상 같은 극한 L로 수렴한다는 뜻이다. 1차원 공간 R에서는 단 두 개의 방향만
존재한다, 즉 왼쪽과 오른쪽이다. 우극한 (right limit) 은 오른쪽에서 접근하는
것이고 표기는 다음과 같다.
lim f (x) = L.
x→c+

이 표기법에서 c+ 는
x가 c로 접근하지만 항상 c보다 큰 상태에서 접근한다는 의
미로 + 를 붙인다. 비슷한 이유로 좌극한 (left limit)은 limx→c− f (x) = L처럼 표
기한다. 결론적으로 극한 limx→c f (x) = L의 의미는 좌극한과 우극한 모두 L로
수렴한다는 뜻이다. 즉,

lim f (x) = lim f (x) = L.


x→c+ x→c−

극한과 수렴을 이야기할 때는 함수 값 f (c)가 무엇인지는 아무런 상관이 없다는


것을 유의하자. 변수 x가 c로 접근할 때의 함수의 행동만 이야기 할 뿐이다.
반면에 함수 f 의 c에서의 연속 여부는 함수값 f (c)와 관련있다. 만약 x가 c로
접근할 때 그 극한이 존재하고 그 극한 값 L과 함수 값 f (c)가 같을 때 우리는
함수 f 가 점 c에서 연속이라고 또는 continuous 하다고 말한다. 정리하면, f 가
continuous at c라는 말은 다음 네 가지가 존재하고 모두 일치한다는 뜻이다. 즉,

lim f (x) = lim f (x) = lim f (x) = f (c).


x→c+ x→c− x→c

다음은 이 강의록의 첫 번째 Problem이다. 일반적으로 수학 교재에는 Example,


Theorem 등이 주어지는데 이 대부분을 우리는 Problem 형식으로 고려한다. 그
이유는 설명이나 증명이 주어지기 전에 그 의미나 원리를 문제를 풀어본다는 입
장에서 스스로 생각해 보라고 유도하기 위해서다. 뿐만 아니라 질문의 형식을
취하면 오히려 그 의미가 더 분명해지는 효과가 있다. Problem 들은 한번 풀고
잊어도 되는 대상들이 아니라 앞으로도 계속 이용해야 할 것들이 대부분다. 물론
반드시 Theorem, Rule, Law 등으로 불려야 할 것들이 있다. 그것들은 그렇게 부를
것이다.

Problem 1.1. 다음에 주어진 함수의 좌극한과 우극한을 주어진 점 c에서 구하고
그 함수가 그 점에서 연속인지를 앞에서 말한 정의에 따라서 판별하시오.
2 −1 1
(1) sin x at c = 0. (2) cos x at c = 0. (3) xx−1 at c = 1. (4) x−1 at c = 1.
(5) f (x) at c = 0, where f (x) is the Heaviside function given by
1.1 Common language definitions 5
(
0, if x < 0
f (x) =
1, if x ≥ 0.

문제에 대한 답을 해보려고 시도한 후에 풀이를 보는 것이 오히려 더 빠르게


이해할 수 있고 수학적 능력을 발전 시킨다.

Solution 1.1 함수의 그래프를 알면 one-sided limit이 무엇인지 쉽게 말할 수 있다.


(1) lim sin x = 0. (2) lim cos x = 1. (이 두 예제의 극한은 c = 0에서 함수의 값과 동
x→0 x→0
−1 2 x2 −1 −1 2
일하다.) (3) limx→1 xx−1 = 2. (참고로 x = 1일 때 분모가 0이므로 몫 xx−1
x−1 는
1
은 정의되지 않는다. 그러나 극한은 존재한다.) (4) lim 의 극한이 존재하지
x→1 x − 1
않다. (x → 1로 수렴함에 따라 함수의 값이 발산하는 것을 볼 수 있다. 따라서 극한
에 해당할 숫자 L이 없다.) (5) 극한 lim f (x)는 존재하지 않는다. 함수 f (x)는 x가
x→0
우측에서 0에 접근하면 1로 수렴하고 x가 좌측변에서 0에 접근하면 0로 수렴한다.
우극한과 좌극한이 다르므로 극한은 존재 하지 않는다고 말한다. ⊔ ⊓

수학적 정리나 법칙들은 조건과 결과로 이루어 진다. 수학뿐만 아니라 대부분
의 과학은 그렇다. 그러나 때론 그 결론을 보면 무엇이 조건이어야 하는지 구체
적으로 말하지 않아도 그 결론이 의미하는 바에 따라 분명한 경우가 있다. 다음의
법칙들을 보면서 수학적 법칙을 읽는 연습을 해보자.

Problem 1.2 (Rules of limits). 아래에는 극한과 관련한 몇 가지 법칙을 관계식


으로 적었다. 이러한 관계식이 의미를 가지기 위해서는 무엇이 조건이고 무엇이
결론인지 읽을 수 있어야 한다. 이를 구분해서 법칙의 의미를 설명하시오.

(1) lim ( f (x) + g(x)) = lim f (x) + lim g(x).


x→c x→c x→c
(2) lim ( f (x) − g(x)) = lim f (x) − lim g(x).
x→c x→c x→c
(3) lim (k f (x)) = k(lim f (x)), k is a constant number.
x→c x→c
(4) lim ( f (x)g(x)) = (lim f (x))(lim g(x)).
x→c x→c x→c

Solution 1.2 위의 식들이 의미를 가지기 위한 당연한 조건과 결론을 생각해 보


자. 첫번째 식 (1)이 의미를 가지기 위한 조건은 “ 두 개의 극한 limx→c f (x)와
limx→c g(x)가 존재한다” 정도이다. 첫번째 식 (1)이 말하고자 하는 결론은 “함수
f + g의 극한도 존재하며 그 극한은 두 극한의 합 limx→c f (x) + limx→c g(x)이다”
정도이다. 이것 말고 다르게 의미를 줄 수도 있지만 그다지 자연스럽지는 않다.
자연스럽지 않은 것을 주장하는 것은 유익하지 않다. 이제 나머지 세 경우에 대해
서도 비슷하게 조건과 결과를 말해보자. ⊔ ⊓

다음은 Question이다. Problem과는 달리 수학적인 답이 있기 보다는 원리를


생각해 보거나 동기를 부여하거나 때로 약간은 철학적인 질문을 할 때 Question
이라고 하였다. 그에 대한 나름의 답을 아래에 적기도 하였고 적지 않은 것도 있다.
6 1 Limit and continuity #1

Question 1.1. 위의 4가지 법칙을 증명 해보았으면 하는데 증명과 설명은 무슨 차


이가 있나?

자신이 사용하는 일상의 언어로 수학적인 사실들을 설명하고 이해하는 것은


매우 중요하다. 그 것은 수학을 이해하는 핵심 과정의 하나이다. 그러나 일상 언
어를 사용해서 설명을 했지만 이를 증명이라고 하기에는 무언가 모자라다는 생각
을 지울 수 없다. 다음 강의에서 다루는 ε-δ 논법을 사용하면 보다 엄밀한 접근이
가능하다.

Problem 1.3 (Limit of quotient). 극한과 관련한 quotient rule은 다음과 같다:

lim f (x)
f (x) x→c
lim = .
x→c g(x) lim g(x)
x→c

이 법칙이 의미를 가지기 위해서는 조건이 필요하다. 필요한 조건을 제시하고 결


론을 설명하시오.

Solution 1.3 Problem 1.2의 4가지 경우와는 차이가 있어서 따로 나누었다. 만


약 앞의 경우와 같은 방법으로 이야기 하면 조건은 limx→c f (x)와 limx→c g(x)가
f (x)
존재 한다는 것이고 결론은 quotient로 주어진 g(x) 의 극한도 존재하며 그 극한은
limx→c f (x)
limx→c g(x) 이라는 것이다. 그러나 여기에는 문제가 있다. 분수꼴로 주어진 경우에
는 분모는 0이 되면 안된다. 따라서 조건 부분에 추가해야 할 것이 있다. 첫째
limx→c g(x) ̸= 0 이어야 오른쪽 항이 의미를 가지며 또한 x가 c에 접근했을 때는
g(x) ̸= 0를 만족해야 왼쪽 항이 의미를 가진다. 이 두 조건이 추가로 필요하다. ⊔ ⊓

가장 많이 사용하고 중요한 함수 중의 하나는 멱함수 또는 power function 이


다. power에 해당하는 실수 α ∈ R가 정해지면 함수는 f (x) = xα 로 주어진다. base
에 해당하는 x가 함수의 변수이다. 합성 함수로 F(x) = ( f (x))α 의 꼴도 자주 등장
한다. 이러한 함수의 극한을 다룰 때 주의해야 할 점을 생각해 보자. 반대로 지수
함수 (exponential 함수)는 base가 상수이고 power가 변수로 f (x) = 2x 또는 일반
적으로 f (x) = ax 의 꼴이다.

Problem 1.4 (Limit of power functions (멱함수)). 다음 power rule의 의미와 rule
이 성립하기 위해 필요한 조건을 제시하시오.
 α
lim ( f (x))α = lim f (x) .
x→c x→c

Solution 1.4 문제에서와 같이 power 함수가 주어지면 그 power α에 따라서 추가


되는 조건이 달라진다.
(1) 만약 α가 양의 정수이면 앞의 product rule을 α번 사용하는 것이므로 필요한
조건은 극한limx→c f (x)이 존재이다.
(2) 만약 α가 음의 정수이면 분수꼴이므로 그 극한이 0이 아니고 f (x)가 c 근방에
서 0이 아니라는 것이 추가 된다.
(3) 만약 α가 양의 실수이면 극한 limx→c f (x)이 존재한다는 조건에 f (x)는 0이
거나 양의 값을 가져야 한다는 조건이 추가 되어야 한다. 왜냐하면 음수의 실수
1.2 Quality control and ε-δ arguments 7

제곱은 일반적으로 정의 되지 않기 때문이다.


(4) 만약 α가 음의 실수이면 limx→c f (x)이 존재한다는 조건에 f (x)는 양의 값을
가지고 그 극한 limx→c f (x)도 양의 값을 가진다는 조건이 추가 되어야 한다. 분모
가 0이 되면 안되기 때문이다. ⊔ ⊓

함수가 연속인지 아닌지를 아는 것은 중요하다. 위의 극한을 택하는 법칙들은


다음 함수들의 연속 여부를 판별하는데 곧바로 쓰인다.

Problem 1.5 (Rules of continuity). 두 함수 f 와 g가 점 c에서 연속이고 k ∈ R는


실수라고하자. 그러면 다음의 6가지의 함수는 c에서 연속이라는 것을 보이시오.
단, 이중에는 조건을 추가해야 되는 경우가 있으니 어떤 경우인지 그리고 어떤
조건이 추가 되야 하는지 제시하시오.
(1) f + g (2) f − g (3) k f (4) f g (5) f /g (6) f k

Solution 1.5 (1-4) 처음 네 경우는 추가 조건없이 Problem 1.2의 네 경우와 같


이 성립한다. (5) 분수 함수 f /g의 경우에는 분모가 0이 되면 안되므로 g(c) ̸= 0
이라는 추가 조건이 필요하다. (6) 제곱 함수 f k 의 경우에는 k에 따라 필요 조건
이 추가 된다. 만약 k가 양의 정수이면 추가 조건이 필요 없다. 만약 k가 음수이면
f (c) ̸= 0이라는 조건이 추가되고, 만약 k가 실수이면 f 가 음수가 아니라는 조건이
추가된다. ⊔ ⊓

Question 1.2. 위의 (6)의 답에서는 k가 음수일 때 f 가 c근방에서 0이 아니라는 조


건을 추가하지 않았다. (5)의 경우도 비슷하다. 극한을 설명할 때는 추가했는데
연속을 설명할 때는 추가하지 않아도 되는 이유는 무엇인가?

Problem 1.6 (Continuity of a composition). Let g : R → R be continuous at c ∈ R


and f : R → R be continuous at g(c) ∈ R. Then, a composition function ( f ◦g)(x) :=
f (g(x)) is continuous at c. 맞는 주장 처럼 보이나? 자신의 말로 설명하시오.

Solution 1.6 함수 g가 c에서 연속이므로 x가 c로 다가가면 g(x)는 g(c)로 다가간


다. 그리고 g(x)가 g(c)로 다가가면 f 가 g(c)에서 연속인 함수 이므로 f (g(x))는
f (g(c))로 다가간다. 따라서 합성함수 f (g(x))는 c에서 연속이다. ⊔⊓

1.2 Quality control and ε-δ arguments

이번 절은 ε-δ argument를 이해하는데 도움이 되려고 만들었다. 실제 ε-δ argu-


ment는 매우 자연스러운 개념으로 누구나 친해질 수 있다. 예를 들어 공장에서
상품을 생산하거나 또는 어떤 상황을 조정하거나 하는 경우 적절한 출력을 생성
하려면 적절한 입력이 있어야 한다. 이러한 경우 출력의 품질을 유지하기 위해서
는 입력의 품질을 유지해야 한다.

Problem 1.7 (Quality control). 어떤 공장이 제품을 생산하는데 재료가 되는 입력


물질에 불순물이 하나도 없을 때는 불량율이 0% 라고 한다. 그리고 불순물이 입력
8 1 Limit and continuity #1

물질 1g당 xµg이 섞였을 때의 불량율은 x%이다. (1) 공장장은 사장에게 불량률
을 4% (ε = 4%) 이하로 줄이라는 지시를 받았다. 이를 위해서는 불순물의 양을
얼마 아래로 유지해야 하는가? (2) 만약 불량률을 0.4%이하로 줄이라는 지시가
내려 오면 불순물의 양을 얼마 아래로 유지해야 하는가?

Solution 1.7 (1) 불량율 상한 관계인 x < 4는 x < 16를 제공한다.
√ 따라서 1g당
16µg(= δ ) 이하로 불순물을 관리해야 한다. (2) 비슷하게 x < 0.4는 x = 0.16를
제공한다. 따라서 1g당 0.16µg(= δ ) 이하로 불순물을 관리해야 한다. 주어진 문
제의 상황에서는 불량률을 10분의 1로 줄이기 위해서는 불순물의 양을 100분의
1로 줄여야 했다. ⊔ ⊓

위의 문제에서 불량률을 얼마 이하로 내리라는 지시가 내려오면 공장장은 이를


위해서 불순물의 양을 얼마 이하로 내려야 하는지 알아야 한다. 이와 같은 상황은
우리 주변에 얼마든지 있다. 이와 같이 결과물의 원하는 오차 범위는 전통적으로
ε > 0 으로 표기 하고 그를 이루기 위한 입력량의 조절 범위는 δ > 0로 표기한
다. 많은 경우 불순물의 양을 0으로 하는 것은 불가능하다. 할 수 있는 것은 조절
범위를 최대한 줄이는 것 뿐이다. 실제 이러한 상황은 우리 주변에 많다.

Problem 1.8 (Quality control with continuity). 전통 발효공법을 사용하는 어떤


식초 공장에서 가장 원하는 산도는 pH 3이다. 이를 위해서는 적절한 정도로 재
료를 발효를 시켜야 하는데 이 공장의 제조 환경에서는 발효율이 36%일 때 pH
가 3이 된다. y로 표시한 산도 pH는 x로 표시한 발효율 percentage에 의해 결정
된다면√ 우리는 이를 함수 y = f (x)로 나타낼 수 있다. 이 공장에서 둘의 관계는
y = x/2이라고 한다. 사장이 공장장에게 산도를 pH 3에서 위아래로 0.1 범위
내로 맞추라고 지시했다. 그러면 공장장은 발효율을 어느 범위로 맞추어야 하나?

Solution 1.8 일단 발효율의 상한은 y = x/2 < 3.1의 관계로
√ 주어지고 따라서
발효율의 상한은 x < (6.2)2 = 38.44 이 된다. 하한은 y = x/2 > 2.9의 관계로 주
어지고 따라서 발효율의 하한은 x > (5.8)2 = 33.64가 된다. 즉, 최적의 발효율인
36% 보다 2.44% 만큼 크거나 2.36%만큼 작은 것은 허용 되지만 그 범위를 넘으면
안된다. ⊔ ⊓

위의 예에서는 최적의 발효도 36%와 상한과의 차이는 하한과의 차이와 다른데


대부분의 경우가 그렇다. 그 중 더 작은 값을 택해서 δ = 2.36로 잡고 사장실에서
나온 산도의 오차 허용 벙위를 택해서 ε = 0.1로 잡으면 우리는 다음과 같이 적을
수 있다.
| f (x) − 3| < ε if |x − 36| < δ . (1.1)
상한과 하한의 경계가 다를 경우 그중 작은 것을 잡는 것이 정보를 잃는 것 같
기도 하지만 때론 이렇게 하는 것이 더 편하거나 이렇게 할 수밖에 없는 경우가
많다. 우리는 위와 같은 관계를 이용하여 많은 것을 정의하는데 이것들을 ε-δ 논
법(argument)이라고 총칭한다.

Question 1.3. 위의 문제에서는 사장실에서 아무리 작은 오차 허용 범위 ε > 0를


주더라도 그 에 해당하는 조정 허용 범위 δ > 0를 잡을 수 있다. 과연 그럴까?
어떻게 증명할 수 있나?
1.2 Quality control and ε-δ arguments 9

숫자가 아니라 임이의 ε (0 < ε < 3) 이 주어 졌다고 하고 위에서와 비슷한 계


산을 하여 δ 를 잡으면 된다. 해보자.√출력 y가 3을 기준으로 ±ε의 범위에 있어야
하니까 3 − ε < y < 3 + ε 이다. y = x/2를 사용해서 다시 정리하면

3 − ε < x/2 < 3 + ε ⇒ 36 − (24ε − 4ε 2 ) < x < 36 + (24ε + 4ε 2 ).

따라서 δ 를 (24ε − 4ε 2 ) 로 잡던지 이보다 더 작게 잡으면 된다. 여기에서 처럼


보통 한계 오차 ε이 주어지면 조절 오차 δ 는 ε에 따라 결정된다.

Question
√ 1.4. 위의 문제에서 모든 ε > 0에 대해 δ > 0를 잡을 수 있는 것은 f (x) =
x/2가 c = 36에서 연속이기 때문이다. 그 이유가 보이나?

다음 문제에서는 불순물이 전혀 없을 때와 조금이라도 있을 때 다른 관계에


의해 불량품이 발생하는 경우다.

Problem 1.9 (Quality control with discontinuity).


√ 불순물이 입력 물질 1g당 xµg
이 섞였을 때의 불량품이 될 가능성은 1 + x%이고 불순 물이 전혀 없으면 불량
품이 나올 가능성은 0이라고 하자 (그림참조). 이 경우에 Problem 1.7의 (1)과 (2)
를 다시 풀어보자.

Solution 1.9 (1) 불량율 상한 관계 1 + x < 4는 x < 9를√준다. 따라서
√불순물의
양은 9µg/g(= δ√ )로 조절되어야 한다. (2) 비슷하게 1 + x < 0.4는 x < −0.6
를 준다. 그러나 x는 음수가 될 수 없다. 따라서 제어 구간이 없다. 즉, 해당하는
δ > 0가 없다. ⊔ ⊓

위의 문제에서는 제품의 오차 한도를 ε = 4로 주었을 때는 조절 한도 δ 를 잡을


수 있었지만 ε = 0.4로 주었을 때는 해당하는 δ 를 잡을 수 없었다. 이는 불량률
함수 f (x)가 x = 0에서 불연속이기 때문이다. 연속이었다면 이런 일이 발생하지
않는다.

Problem 1.10. Problem 1.8의 경우에도 함수 f (x)가 c에서 불연속인 경우 사장은


공장장에게 불가능한 임무를 줄 수 있다(그림 참조). 사장은 공장장이 (1.1)을 만
족시키는 δ > 0를 잡을 수 없도록 ε > 0을 제시할 수 있다. ε > 0을 얼마보다 작게
제시하면 되는가?
10 1 Limit and continuity #1

Solution 1.10 함수 f (x)가 c에서 불연속이면 우극한 또는 좌극한이 함수 값 f (c)


와 다르다. 만약 ε을 그 값들과 함수 값의 차이보다 작게 잡으면 δ > 0를 아무리
작게 잡아도 오차를 ε 보다 작게 유지할 수가 없다. ⊔ ⊓

Exercises

1. 다음 극한을 찾으시오.
x2 − c2
(1) lim (2) lim xπ (3) lim π x
x→c x − c x→0 x→0

2. 입력량이 x 일 때 출력량은 f (x) = x2 라고 하자. 원하는 출력량이 100이고 오


차 한도가 ε = 1 이면 입력량을 x = 10을 중심으로 최대 어느 범위까지 조절해
주어야 하나? (Find δ > 0 such that | f (x) − f (10)| < ε whenever |x − 10| < δ .)
3. lim f (x) = f (c) 이면 아무리 작은 오차한도 ε > 0이 주어져도 조절범위 δ > 0
x→c
가 존재한다는 것을 설명하시오.
4. 함수 f (x)가 x = c에서 연속이라는 것과 아무리 작은 오차 범위 ε > 0이 주
어 졌어도 f (x)가 f (c)와 오차 범위 안에 들어가도록 하는 x를 조절하는 범위
|x − c| < δ 가 존재한다는 것은 동치라는 것을 보이시오.
Lecture 2
Limit and continuity #2

설명이 아니라 증명을 하려면 그에 합당한 정의가 필요하다. 이번 강의에서는 극


한, 수렴, 연속의 개념을 ε-δ 용법을 사용하여 정의한다. ε-δ 용법은 출력 f (x)의
오차 범위를 ε 이내로 콘트롤하기 위한 입력의 조정 범위를 δ 를 찾을 수 있는지의
여부를 가지고 정의한다. 일상의 어법과 그다지 다르지도 않다. 처음에는 어색할
수 있지만 약간의 노력으로 익숙해 질 수 있다.

2.1 Rigorous definitions using ε-δ

이제는 ε-δ 논법을 이용해서 보다 엄밀하게 limit, convergence, continuity를 정의


하려고 한다. ε > 0이라고 하는 허용 오차가 주어지면 그를 만족시키는 조정 범위
δ > 0를 찾을 수 있는 가의 여부를 가지고 정의한다. 이러한 정의가 일상어를 사
용한 정의와 그다지 다르지 않다는 것을 자신의 생각과 언어로 확인하고 익숙해
지는 것이 필요하다.
연속성은 어디에나 나타나는 기본 개념이다. c 지점에서 함수 f (x)의 연속이라
는 고전적인 정의 중 하나는 “c 지점 근처에서 x의 미세한 변화가 f (c) 근처에서
함수 값 f (x)의 미세한 변화 만을 생성한다” 이다. 그러나 이것은 여전히 설명적인
정의이며 엄밀한 증명에 사용하기에는 충분하지 않다. 다음의 엄밀한 정의는 ε-δ
논법으로 주어진다.

Definition 2.1 (Limit and continuity). Let a function f : R → R and a point c ∈ R


be given. We say that the limit of f (x) as x → c is the number L such that if, for any
given ε > 0, there exists a corresponding number δ > 0 such that

| f (x) − L| < ε whenever 0 < |x − c| < δ . (2.1)

We denote the limit as lim f (x) = L. We also say that f (x) is continuous at c if
x→c
lim f (x) = f (c). We can also directly define continuity without using limit, i.e.,
x→c
there exists δ > 0 for any given ε > 0 such that

11
12 2 Limit and continuity #2

| f (x) − f (c)| < ε whenever |x − c| < δ . (2.2)

If f is continuous at all c ∈ (a, b), we say f is continuous in (a, b).

Definition 2.1를 잘 읽고 생각하고 이해했으면 그 다음 단계는 이 정의를 이용해


서 간단한 계산을 해보는 것이다. 다음 문제는 내용도 당연하고 답도 당연하지만
직접 해보면서 위의 정의가 그 당연한 것을 정말로 의미한다는 것을 느끼는 것이
목적이다. 익숙해 지기 까지는 노력이 필요하다.

Problem 2.1. 함수 f (x) = 2x + 1에 대해서 다음을 보이시오.


(1) lim f (x) = 5. (2) lim f (x) ̸= 2. (3) f 는 임이의 점 c ∈ R에서 연속이다.
x→2 x→1

Solution 2.1 함수 f (x) = 2x + 1의 그래프를 그려보고 일상의 언어를 써서 위에


답하는 것은 쉽다. 여기서 하는 것은 ε-δ argument를 사용해서 설명 하는 것이다.
그래프를 그리면 도움이 된다. 하나씩 해보자. (1) (극한을 보이는 것은 임이의
ε > 0에 대해 그에 맞는 δ > 0를 잡아주는 작업이다.) 임의의 ε > 0가 주어졌다고
하자. 그러면 f (2) = 5이니까,

| f (x) − f (2)| = |2x + 1 − 5| = |2(x − 2)| = 2|x − 2| < ε

if and only if
|x − 2| < ε/2.
따라서 δ 를 ε/2로 잡아주면 된다. (최대한 δ 를 크게 잡으라고 하지는 않았으니까
이보다 작게 잡아 주어도 된다.)
(2) 극한 limx→1 f (x)이 2가 아니라는 것을 보이라는 것은 어떤 ε > 0에 대해
서는 δ > 0를 잡을 수 없다는 것을 의미하므로 일단 어떤 ε > 0을 제시해야 한다.
f (1) = 3이므로 차이 1이나 이 보다 작게 잡아주면 된다. ε = 0.5라고 하자. 그러면

| f (x) − 2| = |2x + 1 − 2| = |2(x − 1) + 1| = 2|x − 1| + 1 > 0.5

for any x > 1. 따라서 아무리 δ > 0를 작게 잡아도 |x − 1| < δ 를 만족하는 x중에
| f (x) − 2| > ε인 x가 있으므로 limx→1 f (x) ̸= 2이다. (논리에 익수해 지기 전에는
이해하는데 시간이 필요할 수 있다.)
(3) 임이의 c ∈ R를 잡자. 함수 f (x) = 2x + 1가 이 점에서 연속이라는 것을 보
이자. ε > 0이 주어 졌다고 하자. 그러면 우리는 δ = ε2 라고 잡자. (이 문제에서와
같은 1차 함수는 어느 점에서든지 같은 δ 를 잡아도 된다. 다른 대부분의 경우는
위치에 따라 δ 를 다르게 잡아주어야 한다.) 그리고 |x − c| < δ 라고 하자. 그러면,
ε
| f (x) − f (c)| = |2x + 1 − 2c − 1| = 2|x − c| < 2 = ε.
2
즉,모든 오차한도 ε > 0에 대해 조절 한도 δ 를 잡아 줄 수 있으므로 f 는 c에서
연속이다. ⊔⊓

Question 2.1. Definition 2.1에서 정의한 연속성은 우리가 일반적으로 생각하는


연속의 개념과 일치하는가?
2.1 Rigorous definitions using ε-δ 13

ε-δ 논법은 역동적인 표현 (dynamical expression)이다. 마치 게임을 하는 것과


같다. 당신이 오차 한계 ε > 0을 제시하면 나는 항상 (2.1) 또는 (2.2)를 만족하는
조정 범위 δ > 0를 찾아낼 수 있다는 가능성이 함수의 수렴성, 또는 연속성을 말
한다. 따라서 증명을 한다는 것은 그에 해당하는 δ > 0를 찾아 내서 (2.1)과 (2.2)
같은 관계를 만족한다는 것을 보이는 작업이다. 다시말해 사장이 임이의 불량률
ε > 0를 제시하면 공장장이 이를 수행할 수 있는 입력량의 조정 범위 δ > 0를 찾아
낼수 있다는 것이다. 따라서 증명은 그 것을 찾아내는 작업이지 더이상 설명하는
작업이 아니다. 어떤 ε > 0에 대해서는 그런 δ > 0 를 찾아 낼 수 없다는 것을 보
이는 것은 연속이 아니거나 수렴하지 않는다는 것을 보이는 것이다. 이제 증명은
설명을 잘해야 하는 언변의 세계가 아니라 무엇인가를 찾아 내는 기술의 세계가
된 것이다.
큰 ε > 0를 주면 보통 δ > 0를 더 쉽게 찾을 수 있다. 그러나 연속이거나 수렴
하는 경우이면 아주 작은 ε > 0를 주더라도 δ > 0를 찾을 수 있다. 그래서 우리는
임이의 ε > 0이 주어졌다고 하고 그에 해당하는 δ > 0를 찾는다. 그리고 이러한
δ > 0를 찾을 수 있다는 것이 L이 f (x)의 극한 이거나 f 가 c에서 연속이라는 것을
의미한다. L이 극한이 아니거나 f 가 연속이 아닌 경우에는 ε이 충분히 작을 때 δ
를 찾지 못한다.

Problem 2.2. 앞의 극한에 대한 정의에서 함수는 실수 R 전체에서 정의된 것으로


가정했다. 그러나 정의를 살펴보면 f 가 작은 interval에서만 정의 되었더라도 해당
도메인의 모든 c에서 극한이 잘 정의됨을 알 수 있다. 그 이유를 설명 하시오.

Solution 2.2 관계식 (2.1)를 보면 f 가 열린 구간 (a, b)에서만 정의되어 있고 c ∈


(a, b)이면 정의가 유효하든 것을 알 수 있다. 그 이유는 δ 가 충분히 작으면 |x −
c| < δ 를 만족하는 점이 (a, b)안에 들어가고 여기서 f 가 정의되면 되기 때문이다.
그러나 도메인이 닫힌 구간 [a, b]이고 c가 두 끝점 중 하나라면 이러한 δ > 0를 찾
을 수 없다. 따라서 결론적으로 f 가 닫힌 구간에서 정의되어 있고 c가 두 끝점 중
하나라면 좌극한 또는 우극한으로 극한을 정의해야 한다. 그리고 극한을 고려할
경우에는 |x − c| = 0의 경우를 제외하고 모든 0 < |x − c| < δ 에 대해서 (2.1)가 충
족되면 된다. 따라서 f 가 (a, b)에서 정의되고 c가 두 끝점 중 하나라도 one-sided
limit은 정의된다. ⊔ ⊓

이제는 일상 언어로 정의된 우극한과 좌극한을 엄밀하게 정의할 수 있다. 정의


를 만들어 보자. 정의를 만들어 보는 것은 유용한 연습이다.

Problem 2.3. ε-δ 논법을 사용하여 우극한과 좌극한을 정의하시오.

Solution 2.3 조금씩 다르게 정의 할 수도 있다. 그러나 그 핵심은 포함되어야 한


다. (i) 좌극한에 대한 정의: Let f : (a, b) → R and c ∈ (a, b). We say L is the left
limit of f (x) as x → c− and write

lim f (x) = L,
x→c−

if, for any ε > 0, there exists δ > 0 such that


14 2 Limit and continuity #2

| f (x) − L| < ε whenever 0 < c−x < δ.

(ii) 우극한에 대한 정의는 약간 다르게 해보자. Let f : (c, b) → R for some c < b.
We say L is the right limit of f (x) as x → c+ and write

lim f (x) = L,
x→c+

if, for any ε > 0, there exists δ > 0 such that

| f (x) − L| < ε whenever 0 < x−c < δ.

이 정의가 우극한과 좌극한의 의미를 옳게 반영하는지 확인해 보자. ⊔


Problem 2.4 (Left continuity and right continuity). ε-δ 논법을 사용하여 좌연속
과 우연속 (left continuity and right continuity)을 정의하시오.

Solution 2.4 앞에 정의한 우극한과 좌극한을 이용해서 우측 연속과 좌측 연속을


정의하면 다음과 같다.
Definition A: Let f : (a, b) → R and c ∈ (a, b). We say that f (x) is left-
continuous at c if limx→c− f (x) = f (c). We say f (x) is left-continuous on (a, b)
if f is left-continuous at all c ∈ (a, b). The right-continuity is defined similarly.
우극한과 좌극한을 이용하지 말고 ε-δ 논법을 사용하여 정의 할 수 있다. 0만
표함하면 된다.
Definition B: Let f : (a, b) → R and c ∈ (a, b). We say that f (x) is left continuous
at c if, for any given ε > 0, there exists δ > 0 such that

| f (x) − f (c)| < ε whenever 0 ≤ c−x < δ.

We say that f (x) is right continuous at c if, for any given ε > 0, there exists δ > 0
such that
| f (x) − f (c)| < ε whenever 0 ≤ x − c < δ .
We say f is left (right) continuous in (a, b), if it is left (right) continuous at all
c ∈ (a, b). 두 정의의 차이점은 L을 f (c)로 치환한 것과 0 < x − c < δ 대신에 0 ≤
x − c < δ 를 써서 0 = x − c인 경우를 포함시킨 것이다. ⊔ ⊓

2.2 Examples

ε-δ 논법을 사용하여 Problems 1.2와 1.5의 극한 및 연속성 법칙을 증명할 수 있다.
그러나 이를 수행하려면 몇가지 기교가 필요하다. 4번은 까다롭고 다른 경우는 비
교적 간단하다.

Problem 2.5 (Sum law). (1) 다음 극한 사이의 관계를 보이시오:


2.2 Examples 15

lim ( f (x) + g(x)) = lim f (x) + lim g(x).


x→c x→c x→c

(2) 함수 f 와 g가 c ∈ R에서 연속이면 f + g도 c ∈ R에서 연속임을 보이시오.

Solution 2.5 (1)을 보이는 것과 (2)를 보이는 것은 거의 같은 문제이다. 일단


ε > 0 이 주어졌다고 하자. 목표는 ε > 0에 따라 정해지는 δ > 0를 찾는 것이다.
limx→c f (x) = L 및 limx→c g(x) = M 라고 하자. 정의에 따라서 δ1 > 0 및 δ2 > 0가
존재해서 다음을 만족한다:

| f (x) − L| < 0.5ε whenever 0 < |x − c| < δ1 ,

|g(x) − M| < 0.5ε whenever 0 < |x − c| < δ2 .


여기서 주의할 것은 정의의 ε 대신 0.5ε에 해당하는 δ 를 찾았다. 두 경우에 해당
하는 δ 가 다를 수 있으므로 δ1 과 δ2 로 표시했다. 둘 중 더 작은 δ = min(δ1 , δ2 )를
사용한다. 그런면 물론 δ > 0 이고 만약 0 < |x − c| < δ 이기만 하면

| f (x) + g(x) − (L + M)| ≤ | f (x) − L| + |g(x) − M| < 0.5ε + 0.5ε = ε.

그러므로, 극한의 정의에 따라서 L + M이 합으로 만든 함수 f (x) + g(x)의 극한이


고 따라서
lim ( f (x) + g(x)) = L + M = lim f (x) + lim g(x).
x→c x→c x→c

f 와 g가 c에서 연속이면 L = f (c) 이고 M = g(c) 이다. 그러므로,

lim ( f (x) + g(x)) = L + M = f (c) + g(c).


x→c

따라서 f + g는 c ∈ R에서 연속이다. ⊔


위의 수렴에 대한 증명은 두 개의 함수 f 와 g가 연속일 때 그 합인 f + g도 연속


이라는 것을 의미한다. 이번에는 합성함수의 연속성을 증명해 보자.

Problem 2.6 (Continuity of a composition). f : R → R이 c ∈ R에서 연속이고


g : R → R가 f (c) ∈ R에서 연속이라고 가정하자. 그러면 합성함수 (g ◦ f )(x) :=
g( f (x))는 c에서 연속이다.

Solution 2.6 Let ε > 0 be given. Then, we have to find δ > 0 that satisfies (2.2).
Since g is continuous at f (c), there exists δ1 > 0 such that
일단 ε > 0 이 주어졌다고 하자. 목표는 ε > 0에 따라 정해지는 (2.2)을 만족하는
δ > 0를 찾는 것이다. g는 f (c)에서 연속이므로 다음과 같은 δ1 > 0이 존재한다:

|g( f (x)) − g( f (c))| < ε whenever | f (x) − f (c)| < δ1 .

이 단계에서 핵심은 |g(x) − g( f (c))| < ε로 하지 않았다는 것이다. 다음 단계에서


핵심은 δ1 을 함수 f 의 연속성을 말할 때의 ε처럼 사용하는 것이다. f 가 c에서
연속이므로 다음을 만족하는 δ2 > 0가 존재한다:
16 2 Limit and continuity #2

| f (x) − f (c)| < δ1 whenever |x − c| < δ2 .

이제 정의의 δ 를 δ2 로 잡으면 증명이 끝난다. (이러한 증명은 많은 생각 후에 만들


어 지긴 했지만 매우 간단했다. 그러나 Lecture 1에서 합성 함수의 연속성에 대한
증명을 일상의 언어를 사용하여 하고자 했을 때의 불완전성을 넘어선다. ε-δ 논
법이 매우 영리한 것임을 알알 수 있다.) ⊔ ⊓

Problem 2.7. Let (


x, if x < 1
f (x) =
2x, if x ≥ 1.
Show that (1) limx→1+ f (x) = 2 and (2) limx→1− f (x) = 1.

Problem 2.8 (One-sided limits). Show that

lim f (x) = L if and only if lim f (x) = L = lim f (x).


x→c x→c− x→c+

Problem 2.9 (Sandwich Theorem). Let f , g, h : (a, b) → R, g(x) ≤ f (x) ≤ h(x) on


(a, b), and c ∈ (a, b). Show limx→c f (x) = L if

lim g(x) = lim h(x) = L.


x→c x→c

위의 세 문제 모두 ε > 0이 주어졌을 때 해당하는 δ > 0를 잡아야 한다. Problem


2.7의 경우는 함수를 보고서 잘 정해야 하고, Problems 2.8과 2.9의 경우는 조건을
이용해서 δ > 0를 만들어 내야 한다.

2.3 Limits as x → ∞ and f (x) → ∞

때론 변수가 무한대로 움직이는 x → ∞나 x → −∞ 일 때 함수의 수렴이나 함수


가 수렴하지 않고 무한대로 발산하는 경우가 생긴다. 그러한 경우에 대한 정의도
쉽게 생각할 수 있다. 한번 스스로 정의를 만들어보고 아래 주어진 예와 비교해
보자.

Problem 2.10. 함수 f : R → R에 대하여 다음의 경우에 해당하는 ε-δ 논법의 정의


를 만드시오. (1) lim f (x) = L. (2) lim f (x) = L. (3) lim f (x) = ∞. (4) lim f (x) =
x→∞ x→−∞ x→c x→c
−∞. (5) lim f (x) = ∞. (6) lim f (x) = ∞. (7) lim f (x) = −∞. (8) lim f (x) = −∞.
x→c+ x→c+ x→c− x→c−

Solution 2.10 일단 먼저 정의를 만들어 보고 아래의 정의와 비교하면 좋은 연습


이 된다. 아래의 정의가 뜻하는 바가 원하는 상황인지를 생각해 보자.
1. We say lim f (x) = L if for any ε > 0, there exists N ∈ R such that | f (x) − L| < ε
x→∞
whenever x > N.
2.3 Limits as x → ∞ and f (x) → ∞ 17

2. We say lim f (x) = L if for any ε > 0, there exists N ∈ R such that | f (x)−L| < ε
x→−∞
whenever x < N.
3. We say lim f (x) = ∞ if for any N ∈ R, there exists δ > 0 such that f (x) > N
x→c
whenever 0 < |x − c| < δ .
4. We say lim f (x) = −∞ if for any N ∈ R, there exists δ > 0 such that f (x) < N
x→c
whenever 0 < |x − c| < δ .
5. We say lim f (x) = ∞ if for any N ∈ R, there exists δ > 0 such that f (x) > N
x→c+
whenever 0 < x − c < δ .
6. We say lim f (x) = ∞ if for any N ∈ R, there exists δ > 0 such that f (x) > N
x→c+
whenever 0 < c − x < δ .
7. We say lim f (x) = −∞ if for any N ∈ R, there exists δ > 0 such that f (x) < N
x→c−
whenever 0 < x − c < δ .
8. We say lim f (x) = −∞ if for any N ∈ R, there exists δ > 0 such that f (x) < N
x→c−
whenever 0 < c − x < δ .

Exercises

1. 다음의 극한을 정의에 따라 보이시오.


(1) lim x−1 = 0 (2) lim x−1 = ∞ (3)
x→∞ x→0+

2. 다음 극한이 존재하면 찾으시오.


x3 − 1
(1) lim 2 (2) (3)
x→1 x − 1

3. 다음 함수가 주어진 점에서 연속임을 보이시오.


(1) f (x) = 1x at c ̸= 0 (2) (3)

4. 다음 함수가 x = 0 에서 연속인지 확인 하시오.


= x sin(1/x) with f (0) = 0 (2) f (x) = x2 sin(1/x) with f (0) = 0
(1) f (x)p (3)
f (x) = |x|

5. (2)다음 함수의 그래프를 그리시오.


(
0 if x <≤ 0,
f (x) = −1
cos(x ) if x ≥ 1.
18 2 Limit and continuity #2

(2) 이 함수가 c ̸= 0인 점에서는 연속이고 c = 0에서는 불연속임을 보이시오.


(함수 cos x는 연속 함수이고 두 연속합수의 합성함수는 연속임을 사용하시오.)
Lecture 3
Differentiation

미분이 움직임을 서술하는 수학적 수단이라는 말은 움직임과 관련한 법칙을 표


현할 수 있다는 뜻이다. 움직이는 물체는 속도를 가지고 있다. 속도는 위치가 매
순간에 얼마나 어느 방향으로 변하는가를 나타낸다. 그러나 물체가 순간 이동을
한다면 속도를 생각할 수는 없다. 우리가 수학적으로 나타내고자 하는 움직임은
위치가 연속적으로 변화하는 움직임이다. 우리는 이미 연속이라는 매우 중요한
수학의 개념을 익혔다. 이제 속도나 가속도와 같은 움직임과 관련된 양을 나타낼
수 있는 미분을 배운다.

3.1 Rate of increase

함수 f (x)가 다음과 같이 주어졌다:

f : R → R, x ∈ R.

여기서 변수는 x로 나타내고 실수 값을 가진다 (x ∈ R). 함수는 f 로 나타내고 역시


실수 값을 가진다 ( f ∈ R). 이 함수로 1차원 직선 위를 움직이는 물체의 위치를
나타낼 수도 있고 보다 일반적인 양을 나타낼 수도 있다. 상황에 따라 변수를 나
타내는 기호로 x 대신에 다른 것을 쓸 수도 있다. x를 시간을 나타내는 변수로 쓸
수도 있지만 매우 자주 t ∈ R를 사용해서 시간을 나타낸다. f (t)가 출발한지 t초
이후의 달리기 선수의 위치를 의미한다면 움직임에 대한 것이지만 만약 t시간 동
안의 특정 상품의 생산량과 같은 다양한 것을 나타낼 수 있다. 우리는 실제 매우
다양한 상황을 다룬다. 입력 변수가 시간이 아닌 다른 양을 뜻할 수 있으며 그 경
우 t를 시간이 아닌 다른 양으로 간주하거나 x ∈ R와 같이 다른 기호를 사용할 수
있지만 무엇을 사용하던 차이는 없다. 의미를 혼동하지 않게 만드는 것이 좋은
기호법이다.

19
20 3 Differentiation

변수 x가 a에서 b까지 증가했을 경우 함수의 값이 f (a)에서 f (b)까지 증가했다


고 하자. 이때 증가한 양을 각각 △x = b − a와 △ f = f (b) − f (a)라고 표기 하자.
그 증가량의 비율, 즉
f (b) − f (a) △ f
≡ 평균 증가율
b−a △x
를 mean growth rate 평균 증가율 이라고 부른다. 가령 평균 증가율이 10이라는
말은 x가 a에서 부터 △x만큼 증가 할 때 함수 값은 f (a)에서 부터 이것의 열배
10△x만큼 증가한다는 뜻이다. 물론 x가 감소하면 함수 값은 그만큼 감소한다. 이
비율이 양의 값을 가질 경우는 변수 x가 증가할 때 함수 f 의 값이 증가하고 x가
감소할 때 함수 f 의 값이 감소 한다는 뜻이다. 평균 증가율이 음의 값 -10 이라
는 말은 x가 증가 할때 f 는 10배 감소하며 x가 감소 할때 f 가 10배 증가한다는
의미이다. 위의 정의에서 a는 c로 b는 c + h로 치환하면 위의 평균 증가율은

f (c + h) − f (c)
평균 증가율
h
로 쓸 수도 있다. 여기서 h는 양수 음수 다 될 수 있다. 이 표현도 많이 쓰이며
유용하다.
만약 h가 0으로 접근할 때 평균 증가율의 극한이 존재하면 그 극한을 f ′ (c)로
표기 한다. 즉,

f (c + h) − f (c)
f ′ (c) = lim . 미분 (순간 증가율)
h→0 h
이 극한은 c에서의 instantaneous growth rate (순간 증가율)이 되고 이를 함수 f
의 c에서의 derivative (미분)라고 부른다. 기하적으로는 그래프 위의 점 (c, f (c))
에서의 접선의 기울기가 된다.

Problem 3.1 (접선 공식). 함수 f 가 x = c에서 미분 가능하다고 하자. 이 함수의


그래프에 x = c에서 접하는 접선의 식을 구하시오.

Solution 3.1 기울기가 a 이고 점 (x0 , y0 )를 지나는 직선의 식은 y − y0 = a(x − x0 )


라는 것을 이용한다. 접선은 기울기가 f ′ (c)이고 접점은 (c, f (c))이므로 접선은

y − f (c) = f ′ (c)(x − c) 또는 y = f ′ (c)(x − c) + f (c) 접선 공식

이다. ⊔

위의 표현 대신에 다음의 표현을 사용해도 둘은 같은 것이다:

f (b) − f (c)
f ′ (c) = lim . 미분 (순간 증가율)
b→c b−c
때론 f 라는 함수를 x라는 변수로 미분한다는 것을 명확하게 표현하고자 할때는
다음과 같이 표기한다
df
(c) = f ′ (c).
dx
3.1 Rate of increase 21

이 표기법은 Leibnitz notation 표기법이라고 하고 복잡해서 불편할 것도 같지만


앞으로 배울 미분의 여러 성질들과 결합하여 사용하면 매우 편리하다.

Remark 3.1. 많은 사람들이 미분을 변화율 (rate of change) 이라고 부르는데 미분


은 변화율이 아니다. 변화했다는 말 속이는 증가했는지 감소했는지 방향이 없다.
따라서 변화율이 3 이라고 하면 증가 하는지 감소 하는지는 아직 모른다. 그러나
미분이 3 이라고 하면 증가 한다는 의미이다. 또한 변화율이 -3 이라는 것은 이상
한 말이다. 변화율이 0인 경우보다 더 작게 변했다는 말인가? 부적절한 표현이다.
아마도 변화율이라고 쓰고 증가율로 이해하기 때문이다.

모든 함수에 대해서 이러한 극한(limit)이 존재하는 것은 아니다. 위의 순간 증


가율이 존재 하기 위해서는 평균 증가율의 좌극한과 우극한이 모두 존재해야 하고
그 두 값이 같아야 한다. 그리고 이러한 극한이 존재하면 함수 f 는 c에서 미분 가
능하다고 한다. 따라서 어떤 함수가 미분 가능하고 어떤 함수는 불가능한지 구별
할 수 있어야 한다.

Problem 3.2 (Examples). (1) 함수 f (x) = |x|는 x = 0에서 미분가능하지 않다는


것을 보이시오. (2) 함수 f (x) = x2 는 x = 1 에서 미분 가능하다는 것을 보이시오.
(3) 함수 f 의 불연속 점에서는 미분이 가능하지 않다는 것을 보이시오.

Solution 3.2 (1) 평균 증가율의 우극한과 좌극한이 다르다는 것을 보이자. 우극


한과 좌극한은 다음과 같다:

f (0 + h) − f (0) |h| h
lim = lim = lim = lim 1 = 1.
h→0+ h h→0+ h h→0+ h h→0+

f (0 + h) − f (0) |h| −h
lim = lim = lim = lim −1 = −1.
h→0− h h→0 h
− h→0 − h h→0+

서로 다르므로 극한이 존재하지 않고 따라서 미분이 가능하지 한다.


(2) 극한은 다음과 같이 주어진다.

f (1 + h) − f (1) (1 + h)2 − 1 h2 + 2h
lim = lim = lim = lim (h + 2) = 2.
h→0 h h→0 h h→0 h h→0

극한은 2이고 따라서 미분은 존재하며 미분값은 2이다.


(3) 함수 f 가 c에서 불연속이라고 하자. 그러면 어떤 ε > 0에 대해서는 δ > 0를
잡을 수 없다는 말이다. 즉, 모든 자연수 n > 0에 대해 0 < |hn | < 1n 가 존재해서

| f (c + hn ) − f (c)| > ε
M
을 만족한다. 따라서 임이의 M > 0에 대해서 n > ε 이면

| f (c + hn ) − f (c)| ε
≥ ≥ εn ≥ M.
|hn | |hn |

따라서 hn 은 0으로 가까이 가지만 이때 평균 증가율은 얼마든지 커질 수 있고 따


라서 극한은 존재하지 않는다. ⊔ ⊓
22 3 Differentiation

Problem 3.3 (Continuity of a differentiable function). 함수 f (x)가 x = c에서 미


분 가능하면 f (x)는 x = c에서 연속이라는 것을 보이시오.

Solution 3.3 여러가지 방법으로 보일 수 있는데 Problem 3.2(3) 도 그 중 하나이


다. 그 외에 최소 한 가지를 더 생각해 보자. ⊔ ⊓

3.2 Differentiation rules

함수를 미분할 일은 무척 많다. 따라서 몇가지 경우를 잘 이해하고 기억해서 실


수 하지 않고 미분을 하는 것은 중요하다. 본 절에서는 8가지의 경우로 나누어서
미분의 방법들을 익힌다.

Question 3.1 (숫자는 함수인가?). 함수 f : R → R에 실수 x를 대입하면 다른 실수


값 f (x)를 제공한다. 만약 모든 x ∈ R에 대하여 항상 동일한 실수 값 3을 제공하는
상수 함수를 표기하는 가장 좋은 방법은 f 대신에 그냥 3을 쓰는 것이다. 숫자는
그냥 숫자일 뿐이다. 그러나 함수를 나타내는 표기법으로 쓸 수도 있다. 하나의
표기를 이중적 의미로 사용하는 것은 매우 편리하고 앞으로 그런 표기법을 여러
가지 경우에 사용하게 된다.

Problem 3.4 (Rules of differentiation). 다음의 미분 법칙을 보이시오. 그런데 다


음의 미분 법칙이 성립하기 위한 조건도 제시하시오.
1. 상수 함수의 미분은 0이다.
2. f (x) = x ⇒ f ′ (x) = 1.
3. f (x) = xn for n ∈ N ⇒ f ′ (x) = nxn−1 .
4. f (x) = 1
x ⇒ f ′ (x) = −x−2 .
Sum Rule 5. ( f + g)′ (x) = f ′ (x) + g′ (x).
Product Rule 6. ( f g)′ (x) = ( f ′ g + f g′ )(x).
 f ′ f ′ g − f g′
Quotient Rule 7. (x) = (x).
g g2
Power Rule 8. f (x) = xα for α ∈ R ⇒ f ′ (x) = αxα−1 .

Solution 3.4 위의 8개의 Differentiation Rule은 가장 기본이 되는 룰이다. 일단


위의 룰들이 사용될 수 있는 조건을 살펴보자. 처음 세개의 Differentiation Rule은
아무런 조건이 필요 없다. (4)는 x ̸= 0의 조건이 필요하다. 분모가 0이 아니라는
조건은 모든 경우에 필요하다. (5,6,7)은 모두 두 개의 함수 f , g가 미분 가능하다
는 조건 아래서만 의미가 있다. 그런데 (7)은 하나의 조건이 더 필요한데 분모가
0이 아니어야 한다. 즉 g(x) ̸= 0라는 조건이 추가 되어야 한다. Power Rule (8)은
세심한 주의가 필요하다. 승수 α가 양의 정수가 아닐 경우는 xα 와 xα−1 가 잘 정의
되는 x에 대해서만 성립한다. 일단 α − 1이 음수이면 x ̸= 0의 조건이 필요하다.
그리고 α가 정수가 아니면 x ≥ 0의 조건이 필요하다.
3.2 Differentiation rules 23

자 이제 증명을 해 보자. 첫 4개의 법칙은 (8)번 Power Rule의 특수한 경우이다.


(1) f 가 상수 함수이면 f (x) = f (x + h) 이다. 따라서

f (x + h) − f (x) 0
f ′ (x) = lim = lim = lim 0 = 0.
h→0 h h→0 h h→0

(2) f (x) = x 이면 f (x + h) − f (x) = h이다. 따라서

f (x + h) − f (x)
f ′ (x) = lim = lim 1 = 1.
h→0 h h→0

(3) f (x) = xn 이면, f (x + h) − f (x) = (x + h)n − xn = nxn−1 h + n(n+1)


2 x
n−2 h2 + · · · +
n
h . 따라서

nxn−1 h + n(n+1)
2 x
n−2 h2 + · · · + hn
f ′ (x) = lim = nxn−1 .
h→0 h
1
(4) f (x) = x 이고 x ̸= 0 이면,

1 1 1 1 x − (x + h) 1
f ′ (x) = lim − = lim = − 2.
h→0 h x + h x h→0 h x(x + h) x

(5) 합의 미분은 쉽게 보일 수 있다. f 와 g가 각각 미분 가능하면

f (x + h) + g(x + h) − f (x) − g(x)


( f + g)′ (x) = lim
h→0 h
f (x + h) − f (x) g(x + h) − g(x)
= lim + lim = f ′ (x) + g′ (x).
h→0 h h→0 h
(6) 곱의 미분은 약간 더 어렵지만 매우 중요하다. 이 증명에서 쓰는 기법은 “더하
고 나서 더한 것 다시 빼기”이다. f 와 g가 각각 미분 가능하다고 가정하면

f (x + h)g(x + h) − f (x)g(x)
lim
h→0 h
f (x + h)g(x + h) − f (x + h)g(x) + f (x + h)g(x) − f (x)g(x)
= lim
h→0 h
f (x + h)g(x + h) − f (x + h)g(x) f (x + h)g(x) − f (x)g(x)
= lim + lim
h→0 h h→0 h
g(x + h) − g(x) f (x + h) − f (x)
= lim f (x + h) + lim g(x)
h→0 h h→0 h
= f (x)g′ (x) + f ′ (x)g(x).

따라서 극한은 존재하고 ( f g)′ (x) = f (x)g′ (x) + f ′ (x)g(x)를 만족한다.


(7) 분수꼴의 미분은 곱의 미분과 같은 방법으로 보일 수 있는데 분수꼴이라 조금
더 주의를기울여야 한다. 조건은 f 와 g가 각각 미분 가능해야 하고 분모인 g(x)가
24 3 Differentiation

0이 아닌 x에 대해서만 성립한다. gf = f 1g 로 생각할 수 있다. 따라서 1g 의 미분을


계산한 후에 product rule을 사용해도 좋다(계산은 생략).
(8) Power rule은 가장 많이 쓰인는 미분 법칙이다. α가 정수가 아닐 때는 증명에
강의 6에서 배울 로그함수를 사용해서 하게 되는데 이미 알고 있다고 생각하고 아
래 적어 두겠다. 로그 함수를 배운후에 다시 보면 이해가 잘 될 것이다. 일단 y = xα
라고 하고 양변에 로그 함수를 씌우면

ln y = ln xα = α ln x.

로그 함수의 미분을 이용하여 양변을 x로 미분하면

y′ α
= ⇒ y′ = αx−1 y = αxα−1 . ⊔

y x
Problem 3.5. 다음 함수의 미분을 구하시오.
(1) f (x) = 3xα . (2)

Solution 3.5 (1) 상수 함수 3과 지수 함수 xα 의 곱으로 이해하고 곱의 미분을


사용하면
(3xα )′ = 0xα + 3αxα−1 .
즉, 상수의 미분은 0이므로 상수 계수는 무시하고 나머지 함수 부분만 미분해서
상수 계수를 그냥 곱하면 된다. ⊔⊓

3.3 Intermediate and mean value theorem

Theorem 3.1 (Intermediate Value Theorem). 함수 f : [a, b] → R가 연속이고 상


수 m ∈ R 이 f (a)와 f (b) 사이의 값이다. 그러면

f (c) = m

을 만족하는 c가 개구간 (a, b)안에 존재한다.

Theorem 3.2 (Mean Value Theorem). 함수 f : [a, b] → R가 연속이고 모든 x ∈


(a, b)에 대해 미분 가능하다고 하자. 그러면

f (b) − f (a)
f ′ (c) =
b−a
을 만족하는 c ∈ (a, b)가 존재한다.

Proof. Intermediate Value Theorem 3.1를 이용하여 증명한다.

Theorem 3.3 (Cauchy’s Mean Value Theorem). 함수 f , g : [a, b] → R가 연속이


고, 모든 x ∈ (a, b)에 대해 미분 가능하고 하자. 그리고, 모든 x ∈ (a, b)에 대해
g′ (x) ̸= 0 다고 하자. 그러면
3.5 Velocity and acceleration 25

f ′ (c) f (b) − f (a)



=
g (c) g(b) − g(a)

을 만족하는 c ∈ (a, b)가 존재한다.

Proof. Mean Value Theorem 3.2를 이용하여 증명한다.

평균값은 중간값의 하나이고 평균값 정리는 중간값 정리와 비슷하게 들린다.


그러나 위의 평균값 정리는 사실 평균값에 대한 것이 아니고 평균 증가율에 대
한 것이다. 그런 이유로 평균 증가율 정리 (Mean Growth Rate Theorem)이라고
불렀으면 좋았겠지만 이미 평균값 정리라는 이름으로 정착되었다.

3.4 Derivative of trigonometric functions

삼각함수는 많이 쓰이고 앞으로도 많이 등장한다. 잘 기억하자.

Problem 3.6. 다음을 보이시오.


(1) sin′ x = cos x (2) cos′ x = − sin x (3) tan′ x = sec2 x

(4) cot x = −csc x 2 ′
(5) sec x = sec x tan x (6) csc′ x = − csc x cot x

Solution 3.6 (1) sin 함수의 합의 법칙을 사용하면 다음과 같다:

sin(x + h) − sin x sin x cos h + cos x sin h − sin x cos h − 1 sin h


= = sin x + cos x
h h h h
여기에 h → 0 limit을 택한다. cos′ 0 = 0이고 sin′ 0 = 1을 사용하면 sin′ x = cos x를
얻는다.
(2)는 cos x 함수의 합의 법칙을 사용하여 비슥하게 할 수 있다. 나머지는 미분의
quotient rule을 사용하여 얻는다. 기억할 수 있으면 기억하는 것이 좋다. ⊔

3.5 Velocity and acceleration

뉴턴은 미분을 행성의 움직임을 설명하는 수학적인 도구로 개발하였다. 일차원


공간에서의 위치와 속도 그리고 가속도와의 관계를 생각해 보자. 함수

x:R→R 위치

를 위치 함수라고 하자. 여기서 x(t)는 직선 위를 (또는 x축 위를) 움직이는 물체의


시간이 t일때의 위치 또는 x 좌표라고 하자. 여기서 기호 x의 의미를 이중적으로
사용하고 있다. 점의 x축 좌표를 나타내다가 이제 위치를 나타내는 함수로 사용
하고 있다. 그러면 x(t + h) − x(t)는 위치의 차이이고 x(t+h)−x(t)
h 는 h 시간 동안의
평균 속도이고 그 미분
26 3 Differentiation

x(t + h) − x(t)
x′ (t) = lim
h→0 h
은 시간이 t일 때의 순간 속도이다. 특별히 시간에 대한 미분을 x′ 대신에 ẋ로 나타
내기도한다. 속도를 v로 표기하면 v = ẋ이다. 속도의 순간 증가율은 가속도 이며
a = v̇ = ẍ로 표기한다.

Remark 3.2 (Part II 미리보기). 우주 공간은 3차원이다. 행성의 위치를 표현 하려


면 x, y, z 총 3개의 좌표를 나타내는 3개의 실변수 함수가 필요하다. 이 함수들을
그냥 x(t), y(t), z(t)로 표기하면 위치를 r(t) = (x(t), y(t), z(t))로 나타낼 수 있다. 속
도와 가속도는 이러한 위치 벡터 함수의 1차와 2차 미분이 된다. 즉, v(t) = ṙ(t) =
(ẋ(t), ẏ(t), ż(t)), a(t) = v̇(t) = r̈(t) = (ẍ(t), ÿ(t), z̈(t)). 물체의 질량을 m, 이 질량에
가해지는 힘을 F로 표기하면 뉴턴의 운동 제2법칙은 다음과 같이 표현된다.

F = ma = mv̇ = mr̈. (뉴턴의 제2운동법칙)

Exercises

1. 다음 함수의 그래프 위에 주어진 점 에서의 접선을 구하시오. √


(1) y = 4 + x2 at (1, 5) (2) y = x−2 at√(2, 0.25) (3) y = x3 at (4, 8)
x
(4) f (t) = t 3 −t 2 at t = 2 (5) f (x) = t 2 + 1 at x = 2 (6) f (x) = x−2 at x = 1
3 0.5 1 x−2
(7) f (s) = s − s at s = 1 (8) f (t) = t−1 at t = 2 (9) f (x) = x+1 at x = 2
2. f (0) = 0 일때 다음 함수가 x = 0 에서 미분 가능한지 확인p 하시오.
(1) f (x) = x sin(1/x) (2) f (x) = x2 sin(1/x) (3) f (x) = |x|
3. 반지름이 x인 원의 둘레는 2πx, 면적은 πx2 , 구의 표면적은 4πx2 , 그리고 부피
는 34 πx3 이다. 반지름이 x = r 일때의 각각의 순간 증가율을 계산하시오.
4. 다음p함수가 정의 되는p구간과 미분이 가능하지 않은 점들을 찾으시오.
2 +1
(1) |x|2 + 1 (2) |x| + 1 (3) xx−1 (4) √ 12
x −1

5.
Lecture 4
Chain rule and implicit differentiation

chain rule (연쇄법칙)은 미분 법칙의 꽃이다. 유용하고 강력하다. chain rule의


진짜 강력한 모습은 미적분학 2에서 공부할 변수가 여럿이고 함수 값은 벡터일 때
볼 수있다. 미적분학 1에서는 다음과 같이 가장 간단한 1차원 함수를 고려한다.

g : (a2 , b2 ) → R, f : (a1 , b1 ) → R, c ∈ (a2 , b2 ), g(c) ∈ (a1 , b1 ).

chain rule이 말하는 것은 함수 g가 c라는 점에서 미분 가능하고 함수 f 는 g(c)에서


미분 가능하면 합성 함수 f ◦ g는c에서 미분 가능하며 그 미분값은 다음과 같다.

( f ◦ g)′ (c) = f ′ (g(c))g′ (c). (4.1)

Question 4.1. 수학적 관계식인 (4.1)의 의미를 일상의 언어로 읽을수 있을까?

세상에는 다양한 언어가 있는데 때론 수학은 과학의 언어라고 한다. 가령 식


(4.1)은 수학이라는 언어로 무엇인가를 말하고 있다. 그 의미를 자신의 언어로
설명하는 것은 그 수학적인 식을 이해하는 첫 단계이다. 그 결과 식의 의미가 당연
하다는 생각이 들면 그 것을 직관이라고 부른다. 가령 g′ (c) = 10이라는 말은 x가
c 근방에서 약간 증가 했을 때 함수 값 g는 10배 더 증가한다는 의미이다. 그리고
f ′ (g(c)) = 10이라는 말은 x가 g(c) 근방에서 약간 증가할 때 f 는 10배 더 증가한
다는 의미이다. 따라서 그 합성 함수 f (g(x))는 x가 c 근처에서약간 증가 할 때 10
배의 10배 즉 100 배가 더 증가 한다는 것이 연쇄 법칙 (4.1) 이다. 수학적 언어를
일상의 언어로 설명하는 것은 매우 유용하다.

4.1 Chain rule

함수 f 의 미분은 다음과 같이 극한으로 정의했다:

27
28 4 Chain rule and implicit differentiation

f (z) − f (c)
f ′ (c) = lim .
z→c z−c

오른쪽은 비율 f (z)− f (c)


z−c 의 극한이다. 변수 x가 c 지점 근방에서 △x만큼 증가하면
함수 f (x)는 △x에 f ′ (c)을 곱한것 만큼 증가한다. 미분 f ′ (c)의 기하학적 의미는
점 (c, f (c))에서 그래프 y = f (x)에 접하는 직선의 기울기이다. 라이프니츠 표기
법을 사용하면 다음과 같다:
df
f′ = .
dx
이 표기법은 미분이 변수 x의 증가에 대한 함수 f 의 증가 비율이라는 것을 더 명
확하게 보여준다.
Chain Rule은 합성 함수에 대한 미분 법칙이므로 합성함수에 대해 먼저 생각해
보자. 두 함수
g : (a1 , b1 ) → R 와 f : (a2 , b2 ) → R
에 대해 두 함수 사이의 합성 함수를 다음과 같이 정의할 수 있다.

( f ◦ g)(x) = f (g(x)), x ∈ Ω. (4.2)

Problem 4.1. (4.2)에 주어진 합성함수 f ◦ g는 일반적으로 모든 x ∈ (a1 , b1 )에 대


해 정의되지 않는다. 왜 그럴까? 이 합성 함수가 가질 수 있는 쵀대 도메인 Ω 는
무엇인가?

Solution 4.1 만약 g(x) ̸∈ (a2 , b2 ) 이면 f (g(x))는 정의 되지 않는다. 따라서 합성


함수의 최대 가능 영역은 Ω := {x ∈ (a1 , b1 ) : g(x) ∈ (a2 , b2 )}이다. ⊔

편의상 합성 함수를 고려 할 때 두 함수 f , g가 다음과 같이 주어 졌다고 하자:

g : (a1 , b1 ) → (a2 , b2 ), f : (a2 , b2 ) → R. (4.3)

그러면 정의역에 대한 고민 없이이 f ◦ g : (a1 , b1 ) → R이 된다.

Problem 4.2. (4.3)의 두 함수 f 와 g를 고려하자. 함수 g가 c ∈ (a1 , b1 ) 에서 미분


가능하고, 함수 f 가 g(c) ∈ (a2 , b2 )에서 미분 가능하다고 가정하자. 이 경우 변수
x가 △x만큼 증가할 때 합성함수 f ◦ g는 몇 배나 더 증가하는지 f 와 g의 미분을
사용하여 설명하시오.

Solution 4.2 변수x가 c 근방에서 약간 변할 때 함수 g는 그 변동을 g′ (c) 배로 확대


한다. 반면에 함수 f 는 g(c)에서의 변수의 변동을 f ′ (g(c)) 배로 확대한다. 따라서
합성 함수 f ◦ g는 c 근방에서의 변동을 f ′ (g(c))g′ (c) 배 만큼 확대한다. ⊔

Theorem 4.1 (Chain Rule). 두 함수 g : (a1 , b1 ) → (a2 , b2 ) 및 f : (a2 , b2 ) → R가


주어졌다. 함수 g는 c ∈ (a1 , b1 )에서 미분 가능하고 함수 f 는 g(c) ∈ (a2 , b2 )에서
미분 가능하다고 하자. 그러면 합성 함수 f ◦ g는 c에서 미분 가능하며 그 미분은
다음과 같다:
( f ◦ g)′ (c) = f ′ (g(c))g′ (c). (4.4)
4.1 Chain rule 29

Proof. 연쇄법칙의 의미를 직관적으로 이해했어도 증명하려면 직관과는 별도로


기술이 필요하다. 우리가 쓸 기술의 이름은 ”나누고 다시 곱하기”이다:

f (g(z)) − f (g(c)) f (g(z)) − f (g(c)) g(z) − g(c)


= .
z−c g(z) − g(c) z−c

분모가 0이 되면 안된다는 것을 기억하자. g(z) − g(c) = 0이면 문제가 된다. 따라


서 일단 0 < |z − c| < δ 이면 g(z) ̸= g(c)인 δ > 0가 존재하는 경우와 아닌 경우로
나누어서 증명한다. 일단 이를 만족하는 δ > 0 가 존재한다고 가정하자. 그러면
분모가 0이 되지 않는다.
함수 g가 c에서 미분 가능하므로 함수 g는 c에서 연속이다. 따라서

g(z) → g(c) as z → c.

또한 f 가 g(c)에서 미분 가능하므로,

f (g(z)) − f (g(c)) f (g(z)) − f (g(c))


lim = lim = f ′ (g(c)).
z→c g(z) − g(c) g(z)→g(c) g(z) − g(c)

따라서 곱의 극한은 극한의 곱과 같으므로

f (g(z)) − f (g(c)) f (g(z)) − f (g(c)) g(z) − g(c)


lim = lim lim = f ′ (g(c))g′ (c)
z→c z−c z→c g(z) − g(c) z→c z−c

이다. 이제 위를 만족하는 δ > 0가 존재하지 않는다는 가정에서 g′ (c) = 0 와 ( f ◦


g)′ (c) = 0를 보이면 되는데 그 부분은 연습문제로 해보자. ⊔

Problem 4.3. 다음과 같이 f 와 g가 주어 졌을 때 합성 함수 ( f ◦ g)(x)의 미분을


chain rule을 사용해서 계산해보고 또한 직접 합성함수를 구해서 미분한 것과 비
교하시오.
(1) f (x) = x2 , g(x) = 2x+1 (2) f (y) = y2 , g(x) = 2x+1 (3) f (g) = g2 , g(x) = 2x+1
(4) f (x) = x4 , g(x) = x3 (5) f (x) = x10 , g(x) = x2 + 1 (6) f (x) = x2 , g(y) = cos y

Solution 4.3 (1,2,3)은 모두 같은 문제이다. 함수 f (x)의 x와 합성함수 ( f ◦ g)(x)


의 x는 다른 것이다. 오히려 ( f ◦ g)(x)의 g 가 f (x)의 x에 해당한다. (5)은 chain
rule을 사용하는 것은 가능하지만 직접 합성 함수를 만들어서 미분하는 것은 비
현실적인 경우이다. (6)은 chain rule을 사용해야만 한다. ⊔ ⊓

식 (4.4)는 chain rule을 Newton의 표기법으로 적은 것이다. Leibnitz의 표기법


으로 다시 적으면 다음과 같다:
df d f dg
= . (4.5)
dx dg dx

이 식에는 다른 종류의 이중적 표기법이 들어 있다. 이전에는 x를 변수로도 쓰고


함수로도 쓰는 정도의 이중성 이었다면 위의 표기에서는 f 를 x에 대한 함수로도
쓰고 g에 대한 함수로도 쓴다. 실제 (4.5) 왼쪽의 ddxf 는 f 를 x의 함수로 보아서 미
30 4 Chain rule and implicit differentiation

분 한다는 의미이다. 반면에 오른 쪽의 ddgf 은 f 를 g의 함수로 보고 dg


dx 는 g를 x의
함수로보아서 미분한다는 의미다. 즉, 왼쪽의 f 는 실제 f 와 g의 합성 함수이고
오른쪽의 f 는 한단계 만의 함수로 g를 변수처럼 간주해서 g의 함수로 보겠다는
의미이다. 이와 같은 표기의 이중성에 익숙해 지도록 연습이 필요하다. 반면에 식
(4.4)는 이런 이중성이 없는 표기이다.
그런데 이렇게 (4.5)으로 표기하고 나면 Chain Rule은 마치 분수의 소거처럼
보인다. 다시 말해서
d f dg d f
= .
dg dx dx
위의 미분 표기에서 dg는 약분 할 수 있는 숫자가 아니라 미분의 의미지만 Chain
Rule이 의미하는 것은 dg를 마치 숫자를 소거하는 것 처럼 보인다는 것이다. 이를
소거하는 과정은 Chain Rule을 사용하는 과정이다.

Question 4.2 (Butterfly effect and chain-reaction). 작은 변화가 큰 변화를 유발


하는 경우를 흔히 나비 효과라고 한다. n개의 함수의 합성으로 하나의 현상이 주
어진다고 가정하면 이를 다음과 같은 합성 함수로 이해할 수 있다:

H(x) = ( f1 ◦ f2 ◦ · · · ◦ fn )(x) = f1 ( f2 (· · · ( fn (x)) · · · )).

나비 효과를 일으키는 상황은 언제 벌어질까? chain rule은 이를 설명할 수 있을


까?

나비 효과가 일어나는 것은 H ′ (c)가 매우 클 때이다. 그렇한 경우에는 변수 x가


c 주변에서 약간만 변해도 결과물인 H(x)는 매우 크게 변한다. 언제 그러한 일이
벌어지나? 연쇄법칙을 반복적으로 사용하면

H ′ (c) = f1′ ( f2 (· · · ( fn (c)) · · · )) × f2′ (· · · ( fn (c)) · · · ) × · · · × fn′ (c)

이다. 따라서 각 미분, fn′ (c), fn−1


′ ( f (c)), · · · , f ′ ( f (· · · , ( f (c)) · · · ))가 큰 값을 가
n 1 2 n
지도록 하는 c가 있다면 그 점에서는 나비효과가 최대가 된다. 가령 c가 fn 에 의해
fn−1 의 미분이 큰 값으로 대응 되고, fn (c)는 다시 fn−1 에 의해 fn−2 의 미분이 큰
값으로 대응 되고 계속 이러한 상황이 연쇄적으로 벌어지면 H ′ (c)가 매우 커질 수
있고 그때 나비효과가 일어날 수 있다.
연쇄 법칙과 그 증명을 이해하는 것만으로는 충분하지 않다. 상황이 주어졌을
때 f 와 g에 해당하는 것을 선택할 줄 알아야 한다.

Problem 4.4. (1) h(x) = (3x2 + 1)2 일 때 h′ (x)를 구하시오. (2) h(x) = (3x2 + 1)6 일
때 h′ (x)를 구하시오. (3) x(t) = cos(t 2 + 1)일 때 x′ (t)를 구하시오.

Solution 4.4 (1) 먼저, 연쇄 법칙을 사용하지 않고 이 작업을 수행하자. 전개하면


h(x) = 9x4 + 6x2 + 1이 된다. 그러면 h′ (x) = 36x3 + 12x 이다. 다음으로 연쇄 법
칙을 사용하자. 외부 함수를 f (g) = g2 로 설정하고 내부 함수를 g(x) = 3x2 + 1로
설정하자. 그러면 f ′ (g) = 2g 이고 g′ (x) = 6x 이다. 그러므로 연쇄 법칙에 의해

h′ (x) = ( f ◦ g)′ (x) = f ′ (g)g′ (x) = 2(3x2 + 1)6x = 36x3 + 12x.


4.2 Implicit differentiation 31

둘은 일치한다. 그런데 이 경우는 연쇄법칙을 사용하는 것이 직접 전개하는 것 보


다 약간 더 복잡해 보인다. 그러나 간단한 경우만 그렇고 대부분의 경우는 그렇지
않다.
(2) (3x2 + 1)6 를 전개하는 것은 너무 많은 작업이므로 대신 연쇄 법칙만 사용
하자. 이제 f (g) = g6 그리고 g(x) = 3x2 + 1 라고 하면 f ′ (g) = 6g5 이고 g′ (x) = 6x
이다. 따라서 h′ (x) = 6(3x2 + 1)5 6x이다.
(3) f (g) = cos(g) 그리고 g(t) = t 2 + 1라고 두자. 그러면 f ′ (g) = − sin(g) 이고
g′ (t) = 2t 이다. 따라서 x′ (t) = f ′ (g(t))g′ (t) = − sin(t 2 + 1)2t 이다. ⊔

Problem 4.5. (1) h(x) = sin(x2 + x)일 때 h′ (x)를 구하시오. (2) h(t) = tan(5 −
sin(2t))일 때 h′ (t)를 구하시오.

Solution 4.5 (1) 이 경우 f (g) = sin(g) 그리고 g(x) = x2 + x 라고 하자. 그러면


h′ (x) = ( f ◦ g)′ (x) = f ′ (g(x))g′ (x) = cos(x2 + x)(2x + 1) 이다.
(2) 이 경우 f (g) = tan(g) 그리고 g(t) = 5 − sin(2t) 라고 하자. 그러면 g′ (t) =
− cos(2t)2 이고 f ′ (g) = sec2 (g) 이다. 따라서 h′ (t) = − sec( 5 − sin(2t)) cos(2t)2
이다. ⊔ ⊓

4.2 Implicit differentiation

implicit differentiation은 chain Rule의 가장 중요한 적용 중의 하나이다. 예를 들어


두 개의 변수로 이루어진 하나의 식이 있으면 하나의 변수를 다른 변수의 함수로
생각해서 미분을 하는 것을 Implicit differentiation이라고 한다. 전체를 함수로 볼
수는 없어도 부분적으로는 함수로 볼 수 있다. 이 방법은 매우 중요하고 유용하다.
chain rule의 핵심 원리를 포함하고 있다. 예를 들어 설명해 보자.
두 개의 변수 x와 y가 다음을 만족한다고 하자:

x2 + y2 − 25 = 0.

그러면, 두 개의 변수 x와 y 중 하나를 독립변수 나머지 하나를 그 변수에 대한


함수로 고려할 수 있다. 예를 들어 x를 독립변수라고 하면 위의 식으로 부터,
p p
y2 = 25 − x2 ⇒ y = 25 − x2 또는 y = − 25 − x2

를 얻는다. 그러면 미분은 다음과 같이 주어진다:


dy x x
=√ 또는 − √ for − 5 < x < 5.
dx 25 − x 2 25 − x2
p
만약 x를 y에 대한 함수로 보고 싶으면 비슷하게 x = ± 25 − y2 를 얻는다.
dy
그러나 위에서 처럼 명시적으로 y를 x함수로 작성한 후 dx 를 계산하는 것은
불편하다. 더구나 많은 경우 x에 대한 함수로 y를 적는 것이 쉽지 않으며 불가능하
32 4 Chain rule and implicit differentiation

다 무의미한 작업이다. 우리는 훨씬 더 간단하고 강력한 implicit differentiation


통해 쉽게 계산할 수 있다. 예를 들어

x3 + 2y3 − 9xy = 1 (4.6)

을 고려해 보자. 이 경우 x를 변수로 해서 함수 y를 명시적으로 작성하는 것은 쉽지


않다. 그러나 y를 x의 함수 y = y(x)로 마음 속으로만 간주하여 (implicit function)
방정식을 다음과 같이 볼 수 있다:

x3 + 2(y(x))3 − 9xy(x) = 1.

2(y(x))3 와 같은 항은 두 함수의 합성으로 간주 한다. 이제 좌변과 우변을 x 변수에


대해 미분하면 다음을 얻는다:
d 3 dy dy
(x + 2y3 − 9xy) = 3x2 + 6y2 − 9y − 9x = 0.
dx dx dx
dy
위를 계산할 때 연쇄법칙과 곱의 미분법칙을 사용했다. dx 에 대한 관계를 다시
쓰면 다음을 얻는다:
dy 9y − 3x2
= . (4.7)
dx 6y2 − 9x
dy
Problem 4.6. x와 y가 (4.6)을 만족할 때 dx 를 x = 1인 점에서 계산하시오.

Solution 4.6 위의 계산한 식 (4.7)에 x = 1을 대입하면 되는데 y에 무엇을 대입할


지를 찾아야 한다. (4.6)을 만족하는 모든 y를 찾아야 하니까 x = 1을 (4.6)에 대입
하면 2y3 − 9y = 0 얻는다. 3차식을 풀면 y = 0 와 y = ± 92 를 얻는다. 이 세 경우의
y 값을 대입하면 3개의 가능한 미분 값을 얻는다. (잠간만 생각해 보자. 함수는 하
나의 x 값에 하나의 값만 가져야 하는데 3개의 값을 가진다는 것은 y는 x의 함수는
아니라는 것이다. 국소적으로만 함수이고 전체적으로는함수가 아니다. 그럼에도
불구하고implicite differentiation 기법은 그 미분값을다 찾아낸다.) ⊔ ⊓

Problem 4.7. x와 y가 x2 + y2 = 25를 만족한고 하자. 간접미분 Implicit differenti-


ation을 사용하여 dx dy 을 구하시오. 점 (5, 0)에서의 값은?

d 2
Solution 4.7 이번에는 x를 y를 변수로하는 함수로 고려하자. 그러면, dy (x +
y2 ) = 2x dx
dy + 2y = 0이다. 따라서,

dx y y
=− = p .
dy x ± 25 − y2

점 (5, 0)를 대입하면


dx
= 0.
dy x=5,y=0

주어진 식에서 x와 y는 차이가 없다. (둘을 바꾸어 써도 식은 바뀌지 않는다.) 따라


서 미분이 같은 함수로 주어진다. ⊔ ⊓
4.2 Implicit differentiation 33

Problem 4.8. 점 (3, −4)를 지나는 원점을 중점으로하는 원이 있다. 이 점에서 원


에 접하는 직선의 기울기를 구하시오.
p
Solution 4.8 원의 반경은 32 + (−4)2 = 5이며 원는 x2 + y2 = 25을 만족한다.
변수를 x로해서 implicit differentiation을 하면,

dy
2x + 2y = 0.
dx
dy 3 3
따라서 점 (3, −4)에서의 접선의 기울기는 dx = − xy = − −4 = 4 이다. ⊔

Problem 4.9. 원점을 중점으로하는 점 (5, 0)를 지나는 원이 있다. 이 점에서 원에


접하는 직선의 기울기를 구하시오.

Solution 4.9 원의 반지름은 5이다. 따라서 x2 + y2 = 25을 만족한다. 변수를 x로


해서 implicit differentiation을 하면 다음을 얻는다:

dy
2x + 2y = 0.
dx
dy
따라서 점 (5, 0)에서의 접선의 기울기는 dx = − xy = 50 이다. 그런데 무언가 잘못
되었다. 숫자가 나오지 않는다. 아, 이 경우는 주어진 점 (5, 0) 근방에서는 y를 x의
dy
함수로 볼 수 없고 dx 를 계산할 수 없다. 그림 상으로는 vertical line이 나온다. 그
냥 기울기를 무한대라고 해도 좋겠지만 더 정확히는 y는 이점에서 미분 가능하지
않다고 말하는 것이 더 옳다. ⊔ ⊓

Question 4.3. 2개의 변수에 대한 1개의 식이 주어진 경우를 고려했다. 그러면, (1)
만약 3개의 변수를 가지는 1개의 식이 주어 졌다면 어떻게 될까? (2) 만약 3개의
변수를 가지는 2개의 식이 주어 졌다면 어떻게 될까?

미적 2에서는 이러한 경우를 고려한다. 그런데 (1)의 경우 한개의 변수를 택


해서 나머지 두개의 변수를 이 한개의 변수의 함수로 생각할 수 있을까? 없다.
왜일까? (2)의 경우에는 한개의 변수를 택해서 나머지 두개의 변수를 이 한개의
변수의 함수로 생각할 수 있다. 왜일까? 여기서 일반적으로 가능하다는 것이지 항
상 가능하다는 것은 아니다. Problem 4.9과 같이 미분이 가능하지 않거나 함수로
생각할 수 없는 경우도 있다. 이 질문에 스스로 답을 해보자.

Exercises

1. chain rule을 사용해서√합성함수 f ◦ g의 미분을 √ 구하시오.


(1) f (u) = u2 , g(x) = x + 1 (2) f (x) = x2 − 1, g(x) = sin x
(3) f (u) = u12 , g(t) = t 3 − t (4) f (u) = sec u, g(t) = cost

(5) f (x) = x, g(u) = cos u (6) f (s) = 2s2 , g(u) = 5u − 1
34 4 Chain rule and implicit differentiation

2. chain rule을 사용해서√다음을 미분 하시오.


(1) (2x + 1)3 (2) t 3 − 2t + 1 (3) cos3 x
1
(4) 3(cos x)−3 (5) sin(3πx) + cos(2x2 ) (6)
cost + sint
3. chain rule을 사용해서 다음을 q 미분 하시오.
p √
4 2 (3) sin3 (cos2 t)

(1) 1 + tan (t ) (2) 2t + 1 + 1 − t
dy
4. implicit differentiation을 사용해서 dx 를 구하시오.
2 2
(1) x + y = 4 2
(2) x + y = 1 (3) sin x + y2 = 1
2 2
(4) xy + x = 3 (5) xy = sin(xy) (6) (2xy + y2 )2 = x2 − y2
dy
5. implicit differentiation을 사용해서 dx 와 dx
dy 를 주어진 점에서 구하시오.
2 2
(1) x + y = 4 at x = 1 2
(2) y − x + x = 4 at x = 1 (3) xy + x2 + y2 = 1
at x = 1 2
(4) x + y − 2y = 4 at x = 1
dy dx
6. 위의 계산 결과를 이용해서 같은 점에서의 dx 와 dy 의 곱을구하시오.
7. Chain rule의 증명에서 마무리 하지 않은 부분을 해보자.
Lecture 5
Integration & fundamental theorem of calculus

3번째 강의에서는 미분을 4번째 강의에서는 미분 기법을 공부했다. 이제 적분을


공부한다. 적분은 미분 이전의 함수로 돌아가는 작업이다. 적분을 하려면 연습이
필요하다. 적분의 기술은 Part III에서 조금 더 자세히 다룬다.

5.1 Antiderivative

어떤 주어진 함수 f (x)에 대한 antiderivative는 미분을 한 후에 결과가 f (x)가 되는


함수를 말한다. 즉,
F ′ (x) = f (x)
를 만족하는 함수 F(x)를 함수 f (x)의 antiderivative라고 한다. antiderivative를 찾
는 과정은 미분을 하는 과정을 반대로 돌리는 과정이다. 그러나 실제 antiderivative
를 찾는 것은 쉽지 않다. Problem 3.4 에는 rules of differentiation이 주어졌다. 이
rule을 반대로 잘 이용하면 antiderivative를 찾을 수 있는 경우가 있다.
첫 번째로 주의할 것은 antiderivative는 하나가 아니라는 것이다. 아무 상수든
지 더하더라도 미분은 같기 때문에 항상 general constant가 등장한다. 다음 문제를
풀어보자.

Problem 5.1. 다음 함수들의 antiderivative를 (모두) 찾으시오.


(1) f (x) = 0. (2) f (x) = 1. (3) f (x) = xα , α ̸= −1. (4) f (x) = x−1 .

Solution 5.1 그냥 찾으라고 해도 모두 찾으라는 의미로 이해 한다. (1) 상수를


미분하면 0 이므로 모든 상수 함수는 0의 antiderivative가 된다. 즉, F(x) = C for
any constant C ∈ R. 여기서 C는 임이의 상수 generic constant 라고 부른다. 그런데
generic constant C에 상수를 곱하고나 더해도 generic constant가 된다. 따라서 때
론 3C가 있으면 이를 다시 C로 고쳐 쓰기로 하자.
(2) F(x) = x라고 하면 F ′ (x) = 1이 된다. 따라서 F(x) = x는 상수 1의 antiderivative
이다. 그러나 상수의 미분은 0이므로 모든 상수 C ∈ R에 대하여 F(x) = x + C는
모두 f (x) = 1의 antiderivative가 된다.

35
36 5 Integration & fundamental theorem of calculus

(3) 미분을 하면 차수가 하나 내려간다는 것을 보았다. ((xα )′ = αxα−1 ). 그러면


antiderivative의 차수는 하나 올라갈 것이고 계수도 맞춰주고 또 상수를 더해 주면
1
F(x) = α+1 xα+1 + C 가 된다. 그러나 문제가 있다. 계수의 분모가 0이되면 안된
다. 즉 α ̸= −1 경우에만 된다. 또한 이 antiderivative는 모든 x에 대한 함수가 아닐
수 있다. 미분을 하면서 보았듯이 α와 α + 1에 따라 모든 x 또는 x ≥ 0, x > 0의
범위로 정해진다.
(4) 그렇다면 α = −1인 경우 즉 f (x) = x−1 의 antiderivative는 무엇이 될까? −1을
제외한 모든 승수 α에 대해서는 antiderivative를 쉽게 찾을 수 있는데 α = −1의
경우만은 안된다. f (x) = x−1 은 특별한 의미가 있는 경우라는 느낌이 왔으면 한
다. 실제로 이 경우는 매우 중요하다. 이 함수의 antiderivative와 그 antiderivative
의 역함수는 아마도 수학에서 가장 중요한 함수중의 하나이다. ⊔ ⊓

위의 경우 말고도 더 다양한 함수의 antiderivative를 구하는 연습이 필요하다.


Problem 5.1에서 구한 antiderivative는 항상 상수항 C가 더해져 있다. 이 상수를
generic constant라고 부르는데 모든 가능한 antiderivative를 구하기 위해서는 거의
자동적으로 붙는다.

Question 5.1 (0의 antiderivative). 위에서 구한 antiderivative 이외에는 정말 더 없


을까? 다시 말해 generic constant인 C를 더하기만 하면 모든 가능한 antiderivative
를 다 얻은 것인가?

위의 질문은 0의 antiderivative는 상수 함수 외에는 없는가 하는 질문과 같다.


이유는 다음과 같다. F와 G가 함수 f 의 서로 다른 antiderivative라고 하면

(F − G)′ = F ′ − G′ = f − f = 0.

즉 두 antiderivative의 차이 F − G는 0의 antiderivative이고 따라서 0의 antideriva-


tive는 상수 함수 외에 없다는 말은 generic 상수 C를 더하기만 하면 모든 an-
tiderivative가 포함 된다는 말과 같다.
그러면 상수 이외에는 0의 antiderivative가 없는가 다시 말해서 어떤 이상한 함
수가 존재해서 미분하면 0이 되는 일이 벌어질 수 있는가에 대한 조금은 철학적
인(?) 미스테리한 질문이다. Mean Value Theorem을 이용해서 보일 수 있다. 일단
antiderivative는 미분 가능한 함수이어서 정리를 사용할 수 있다. 만약 미분 가능한
함수 F가 F ′ (x) = 0를 만족 한다고 하자. F가 상수 함수가 아니라면 F(x) ̸= F(y)
인 두 점 x ̸= y가 존재하고 따라서 그 평균 증가율은 F(x)−F(y) x−y ̸= 0이다. 따라서
Mean Value Theorem에 의하면 이 평균 증가율을 가지는 점 c 가 x와 y 사이에
존재한다, 즉 F ′ (c) = F(x)−F(y)
x−y 이 되어야 해서 F는 0의 antiderivative라는 사실에
모순이 된다. 따라서 0의 antiderivative는 상수 뿐이다.

Problem 5.2.

Solution 5.2 ⊔

5.2 Integral as the area bounded by a graph 37

5.2 Integral as the area bounded by a graph

f : R → R를 주어진 함수라고 하고, F(t)를 그림에서와 같이 x = a와 x = t > a


구간에 있는 x축과 f 의 그래프 사이의 넓이라고 하자. 영역이 x 축 아래에 있는
경우에는 ( f < 0인 경우) 영역은 음의 부호를 갖는 것으로 간주한다. a는 고정 상
수로, t는 변수로 간주한다. 이 면적 함수는 보통 다음과 같이 적분 기호를 써서
나타낸다. Z t
F(t) = f (x)dx.
a
이와 같이 면적으로 정의한 면적 함수 area function F(t)의 미분을 생각해 보자.
그 미분은 다음과 같이 주어진다

F(t + h) − F(t)
F ′ (t) = lim .
h→0 h
이제 이 면적 함수의 미분이 무엇인지 알아보자.

Problem 5.3. 함수 F(t)가 위에 주어진 f (t)의 면적 함수 일때 다음을 보이시오:

F ′ (t) = f (t). (5.1)

그런데 항상 이 식이 만족하지는 않는다. 이 식을 만족하는 함수 f 의 조건도 제시


하시오.

Solution 5.3 위의 분자에 해당하는 F(t + h) − F(t)는 그림에서 핑크 색을 가진


영역에 해당하는 넓이이다. 이를 폭에 해당하는 h로 나누어 주면 폭 h가 작을 수
록 높이에 해당하는 값인 f (t)에 가까운 값을 얻을 것이다. 수렴한다는 것을 보
이기 위해서는 함수 f 가 t에서 연속이라는 것이 필요하다. 불연속이면 좌극한과
우극한이 다르게 된다. 따라서 f 가 t에서 연속이라는 조건이 필요하다. (이 증명은
일상어를 사용한 증명이다. Problem 5.4에서는 ε-δ 논법을 써서 증명한다.) ⊔ ⊓

Question 5.2 (면적함수의정의). 논의를 진행하기 위해서 해야하는 자연스러운


질문이 있다. 함수 f (x) 가 주어지면 면적 함수가 잘 정의 되나?

일단 면적을 어떻게 계산 할지를 정해야 그 방법에 따라 어떤 함수의 면적함수


가 잘 정의 되는지의 여부가 결정 된다. 그 것은 적분을 어떻게 할지에 대한 문제
이다. 우리는 부분 구적법 Riemann sum을 이용하여 면적을 정할 것이다. 그런데
38 5 Integration & fundamental theorem of calculus

어떻게 면적을 정의 하든지 간에 어떤 함수는 면적함수를 정의 할 수 없다. 크게


두가지 이유이다. 면적이 무한대로 발산하는 경우와 함수가 너무 삐뚤 빼뚤 해서
도저히 계산이 안되는 경우이다. 일단 미적분 과목에서는 유한개의 점을 제외하
고는 연속이고 모든 유한 구간에서 유한의 값을 가지는 함수만을 고려한다. 이
조건아래서는 함수가 bounded이어서 면적이 무한대로 발산하지 않으며 연속성
때문에 그다지 이상하지 않아 면적을 계산할 수 있다.

Problem 5.4 (면적함수의 미분). 면적함수가 잘 정의 되었다고 생각하고 f (x)가


연속인 경우에 (5.1)을 ε-δ 논법을 써서 증명하시오.

Solution 5.4 임이의 ε > 0가 주어졌다. 함수 f 는 x = t에서 연속이기 때문에 모든


|h| < δ 에 대해서 | f (t) − f (t + h)| < ε를 만족하는 δ > 0가 존재한다. 따라서

F(t + h) − F(t) ( f (t) + ε)h


< < f (t) + ε
h h

F(t + h) − F(t) ( f (t) − ε)h
> > f (t) − ε
h h
F(t+h)−F(t)
를 만족한다. 따라서, |h| ≤ δ 이기만 하면 h − f (t) ≤ ε를 만족한다.
미분의 정의에 의해서 F는 t에서 미분 가능하며

F(t + h) − F(t)
F ′ (t) = lim = f (t)
h→0 h
을 만족한다. ⊔

5.3 Riemann sum and area

이 절에서는 Riemann integral을 구분 구적법을 사용하여 정의하며 이를 사용하여


적분 ab f (x)dx을 정의한다. 함수 f : [a, b] → R가 폐구간 [a, b]에서 정의된 연속함
R

수라고 하자. 우선, 점들의 집합,

π = {x0 , x1 , · · · , x p },

를 폐구간 [a, b]의 partition이라고 부르는 것은 다음을 만족하는 경우이다:

a = x0 < x1 < x2 < · · · < x p = b.

기호 π는 원주율에 많이 쓰이지만 꼭 원주율로만 쓰일 필요는 없다. 여기서는


partition을 나타내기 위해 쓰였다. 어떤 파티션은 많은 점들로 구성되어 있고 다
른 파티션은 적은 점들로 구성되어 있을 수 있지만 x0 = a로 시작하고 x p = b로
끝나야 한다. 또한 모두 올바르게 정렬되어야 한다. k 번째 소구간의 크기를 다음
과 같이 나타낸다:
△xk = xk − xk−1 , k = 1, · · · , p.
5.3 Riemann sum and area 39

partition π의 gauge라는 것은 가장 큰 소구간의 크기로 정의하고 다음과 같이 표


기한다:
∥π∥ := max △xk .
1≤k≤p

그런후에 각각의 소구간에서 한 점씩 ck ∈ [xk−1 , xk ] 선택한 후에 Riemann sum을


다음과 같이 정의한다:
p
∑ f (ck )△xk , ck ∈ [xk−1 , xk ]. Riemann Sum
k=1

몇가지 예를 통해 Riemann sum을 이해해 보자.

Problem 5.5. 다음에 주어진 함수와 partition에 대해서 Riemann sum을 계산하시
오. k 번째 소구간의 점 ck 는 계산이 편하게 골라서 계산하시오.
1. 상수함수 f (x) = c, interval [0, 1], partition π = { ni : 0 = 0, 1, · · · , n}일 때 Rie-
mann sum을 한 경우 구하고 면적과 비교하시오.
2. 함수 f (x) = x, interval [0, 1], partition π = { ni : 0 = 0, 1, · · · , n}일 때 Riemann
sum을 한 경우 구하고 면적과 비교하시오. 구한 Riemann sum의 n → ∞일 때의
극한을 구하시오.
3. 함수 f (x) = x2 , interval [0, 1], partition π = { ni : 0 = 0, 1, · · · , n}일 때 Riemann
sum을 한 경우 구하고 면적과 비교하시오.

Solution 5.5 ⊔

Definition 5.1. (1) A number I is called the integral of f over [a, b] if


p
lim
∥π∥→0
∑ f (ck )△xk = I
k=1
Rb
for any choice of ck ∈ [xk−1 , xk ]. We denote I = a f (x)dx.
(2) If the limit Rexists, f is called integrable.
(3) We denote ba f (x)dx = − ab f (x)dx.
R

Theorem 5.1. (1) 함수 f : [a, b] → R가 연속이면 integrable 하다. (2) 함수 f :


[a, b] → R가 유한개의 점을 제외하고 연속이고 또 유한 함수이면 integrable 하다.

유한개의 점을 재외하고는 연속이라는 것은 함수가 integrable 하기위해 필요


하다. 다음 문제는 그 이유를 보여준다.

Problem 5.6. 함수 f : R → R을 다음과 같이 정의 하자:


(
1, x is a rational number,
f (x) =
0, x is an irrational number.

이 함수 f 는 유한 구간 [a, b]에서 integrable하지 않다는 것을 보이시오.


40 5 Integration & fundamental theorem of calculus

Solution 5.6 어떠한 subinterval [xk−1 , xk ]에도 유리수와 무리수는 존재한다. 따라


서 ck 를 항상 유리수로만 잡으면 Riemann sum은 1이 되고 무리수로만 잡으면 0이
된다. 정의에서는 어떻게 잡던지 같은 수 I로 수렴해야 하는데 그렇지 않다. ⊔ ⊓

Problem 5.7. 함수 f 와 g는 구간 [a, b]에서 정의된 integrable한 함수이다. 다음을


보이시오.
Ra
1. a f (x)dx = 0.
Rb Rb
2. a k f (x)dx = k a f (x)dx for any constant k.
Rb Rb Rb
3. a ( f + g)dx = a f (x)dx + a g(x)dx.
Rb Rc Rb
4. a f (x)dx = a f (x)dx + c f (x)dx for any c ∈ [a, b].
Rb Rb
5. If f (x) ≤ g(x) for all x in [a, b], then a f (x)dx ≤ a g(x)dx.

Solution 5.7 ⊔

이제 the fundamental theorem of calculus를 두 개의 형태로 소개하자.

Theorem 5.2 (Fundamental Theorem of Calculus). 함수 f 가 폐구산 [a, b]에서


연속이고 모든 x ∈ [a, b] 에 대해서F(x) = ax f (t)dt라고 하자. 그러면, F(x) 는
R

differentiable하고 F ′ (x) = f (x)이다.

Proof. 이 정리를 증명하려면 적분의 성질을 잘 이용해야 우리는 증명없이 받아


드린다. ⊔ ⊓

위의 Fundamental Theorem of Calculus는 연속인 함수는 적분 가능하고 연속


인 함수를 적분해서 만든 함수는 미분가능하며 미분을 하면 원래의 함수로 돌아
온다는 의미다. 즉, 적분과 미분은 서로 역의 과정이라는 의미이다.

Theorem 5.3 (Cauchy’s Fundamental Theorem of Calculus). 함수 f 가 폐구산


[a, b]에서 연속이고 F ′ (x) = f (x)라고 하자. 그러면, ab f (x)dx = F(b) − F(a)를
R

만족한다.

Proof. 첫 번째 버전을 사용하여 증명해 보자. G(x) = ax f (t)dt로 두자. 그러면


R

G(x)도 f 의 antiderivative이다. 따라서 (F −G)′ (x) = F ′ (x)−G′ (x) = f (x)− f (x) =


0이다. F − G는 0의 antiderivative 이므로 상수이다. 즉, 어떤 상수 C > 0에 대해
F − G = C이다. 따라서 F = G +C이고
Z b
F(b) − F(a) = G(b) − G(a) = f (x)dx.
a


Cauchy의 버전은 적분 또는 면적을 계산하는 방법을 보여준다. 일단 antideriva-


tive가 되는 F를 하나 찾고 F(b) − F(a)를 계산하면 적분 값 ab f (x)dx을 얻는다.
R
5.3 Riemann sum and area 41

적분을 Riemann sum으로 계산하지 않고 antiderivative를 찾을수 있다면 이를 이


용하는 것이 좋다. 그러나 때론 antiderivataive를 찾는 것이 쉽지 않고 컴퓨터를
이용할 경우에는 Riemann sum (구분구적분)을 이용하는 것이 훨씬 쉽다.

Problem 5.8. Fundamental Theorem of Calculus (FTC)를 사용하여 다음의 적분값


을 구하시오.
Z a Z Z a Z a 2
(1) x2 dx (2) xα dx (3) x2 + x4 dx (4) x−1 dx
0 0 0 1

Solution 5.8 ⊔

Exercises

1. π가 구간 [a, b]의 partition 이고 ck ∈ [xk−1 , xk ]일 때 다음 극한이 수렴하는 적분


값을 찾으시오. 구간 [a, b]가 어떻게 주어져야 수렴하는지도 판별하시오.
p p p
(1) lim
∥π∥→0
∑ 2c2k △k (2) lim
∥π∥→0
∑ sin ck △k (3) lim
∥π∥→0
∑ (3ck + c2k )△k
k=1 k=1 k=1
p p p
(4) lim ∑ tan ck △k (5) lim ∑ c−1
k △k (6) lim ∑ ck0.5 △k
∥π∥→0 k=1 ∥π∥→0 k=1 ∥π∥→0 k=1

2. 다음 함수들의 antiderivative를 찾으시오. (변수는 무엇으로 사용하던 차이가


없음.)
(1) f (x) = x2 (2) f (y) = y−2 (3) f (t) = −|t|
(4) f (t) = 3t − 1 (5) f (y) = sin y (6) f (x) = x−1
3. 다음Z 적분을 계산 하시오.
2 Z 2 Z 3
(1) (x2 − x − 1)dx (2) x100 dx (3) |t|dt
Z0 3 2 Z 12π Z−2π
y − y4 sin 2x
(4) dy (5) dx (6) (cos x + | cos x|)dx
1 y2 0 sin x 0
4. 다음을 간단히 하시오.
Z 2 Z 1 Z √t
d x 2 d t d d
Z
−2
(1) t dt (2) f (x)dx (3) √ sintdt (4) x 3 dx
dx 0 dt 2 dx x dt 1

5. y = x2 과 y = 1를 경계로 가지는 구간의 면적을 구하시오.



6. y = x, x = 1, y = 0을 경계로 가지는 구간의 면적을 구하시오.
Lecture 6
Inverse functions and their derivatives

이번 강의에서는 매우 중요한 함수인 로그 함수를 배운다. 로그함수의 역함수인


exponential 함수도 배운다. 함수의 정의와 언제 역함수가 존재하는지 등에 대한
기본적인 수학적인 개념을 다루고 chain rule을 이용해 역함수의 미분을 계산한다.

6.1 Bijection (one-to-one and onto function)

함수 f 가 집함 A를 정의 구역으로 하고 집합 B를 공변역으로 할 때 f : A → B와 같
이 표기 한다. 영어로 집합 A를 domain, B를 co-domain이라고 부른다. 함수의 이
미지를 다 모은 집합 B의 부분집합 R( f ) := {y ∈ B| there exists x ∈ A such that y =
f (x)}을 range라고 부른다.
함수는 각각의 정의구역의 각 원소에 대해 하나의 값을 가져야한다. 두 개 이상
의 값을 가지거나 0개의 값을 가지면 함수가 아니다.

Definition 6.1. The mapping f : A → B is called a function if there exists y ∈ B


uniquely for each x ∈ A such that f (x) = y.

역함수를 어떻게 정의 할지는 자명하다. 역으로 정한다. 주의를 기울여야 할


것은 역함수도 함수이어야 하니까 그렇게 되기 위한 조건이 있다.

Definition 6.2. A function f : A → B is called one-to-one (or injection) if any value


y ∈ B is taken at most once. In other words, f (x1 ) ̸= f (x2 ) if x1 ̸= x2 . A function
f : A → B is called onto (or surjection) if any value y ∈ B is taken at least once, i.e.,
R( f ) = B. The function f is called bijection if it is one-to-one and onto.

우리는 one-to-one이고 onto인 함수에 대해서는 역함수를 정할 수 있다.

Definition 6.3. If f : A → B is one-to-one and onto, we may define a function g :


B → A such that g(y) is the preimage of f for y, i.e., f (g(y)) = y. This function g is
called the inverse function of f . We denote the inverse function if f as f −1 .

Problem 6.1. 함수 f : A → B가 bijection 이면 f 의 역함수가 정의됨을 보이시오.

Solution 6.1 이 상황에서 역함수가 정의 된다는 것을 보이라는 것은 무엇을 하라


는 것인가? 정의에서와 같이 역관계로 정의한 역함수가 함수라는 것을 보이라는

43
44 6 Inverse functions and their derivatives

뜻이다. 역함수 g가 함수라는 것을 보이라는 것은 모든 y ∈ B에 대해서 함수 값


g(y) 가 정확하게 하나 정의 된다는 것을 보이면 된다. 일단 onto 함수이니까 모든
y ∈ B에 대해 하나의 x ∈ A는 존재해서 f (x) = y가 된다. 즉 g(y)가 0개의 함수 값을
가지는 경우는 없다. 만약 g(y)가 서로 다른 두 개의 함수 값 x1 ̸= x2 를 가진다면
f (x1 ) = f (x2 ) = y를 뜻한다. 즉 f 는 one-to-one이 아니라는 뜻이므로 조건에 맞
지 않는다. 즉 g(y)는 모든 y ∈ B에 대해서 정확하게 하나의 값을 가지며 따라서
함수이다. ⊔ ⊓

Question 6.1. Bijection인 함수 f (x)와 그 역함수 f −1 (x)의 그래프를 그리면 이


둘은 서로 어떤 관계가 있을까? 그 둘은 직선 y = x를 중심으로 대칭이 된다. 그
이유를 쉽게 설명할 수 있을까?

함수 f 의 그래프는 좌표 평면에 y = f (x)를 만족하는 점들을 그린 것이다. 같


은 점들이 역함수 x = f −1 (y)를 만족한다. 따라서 같은 그래프이다. 그러나 보통

변수를 x로 나타내기 때문에 그래프를 직선 y = x를 중심으로 대칭 이동 시켜서


두번째 그림을 얻는다. 그후에 x과 y를 바꿔쓰면 세번째 그림을 얻는다.
어떤 함수 f : A → B가 bijection이 아니라면 어떻게 역함수를 정할까? A와 B
를 적당히 더 작게 잡아서 one-to-one and onto를 만들어서 정하게 된다. 이렇게 하
는 것을 하나의 branch를 잡는다고 하는데 다른 branch를 잡으면 다른 역함수가
된다. branch를 잡을 때는 최대한 많은 영역을 포함해야 한다.

Problem 6.2. Find sets A, B ⊂ R that make the following function f : A → B a bi-
jection. Find its inverse function.
(1) f (x) = 12 x + 1 (2) f (x) = x2

Solution 6.2 (1) 이 함수는 A = R로 잡고 B = R로 잡을 때 one-to-one and onto


이다. 역함수를 구하기 위해서는 단순히 f (x) = y로 놓고 이를 변형해서 x = g(y)
로 변형하면 된다.
1
x + 1 = y ⇒ x = 2(y − 1) ⇒ g(y) = x = 2(y − 1).
2
(2) f 는 R에서 one-to-one이 아니다. one-to-one인 구간을 잡는데 A = [0, ∞)로 잡
던지 A = (−∞, 0]으로 잡으면 된다. 이 경우 대부분의 사람은 A = [0, ∞)로 잡을
6.2 Derivative of inverse functions 45

것이고 우리도 그렇게 한다. 또한 B = [0, ∞)로 잡아서 f 를 f : A → B인 branch로


제한된 함수로 생각하면 역함수가 있다. 이 경우
√ √
y = x2 ⇒ x = y ⇒ g(y) = y, y ≥ 0.

즉, 역함수는 g(y) = y가 된다. ⊔

6.2 Derivative of inverse functions

함수 f : A → B의 역함수는 보통 f −1 로 표기한다. 그러면 f −1 : B → A이다. 만약


domain의 변수를 x ∈ A로 codomain의 변수를 y ∈ B로 구분해서 쓰면 f (x) 이고
f −1 (y)이다. 이렇게 구분해서 쓰며 혼동을 줄일 수 있다.
역함수의 미분을 구하는 것은 합성 함수의 미분법 즉 chain rule을 사용하는 것
이 가장 좋다. The chain rule says that if f is differentiable at c and g is differentiable
at f (c), then the composition g ◦ f is differentiable at c and its derivative is

(g ◦ f )′ (c) = g′ ( f (c)) f ′ (c).

변수 x와 y를 구분해서 Leibnitz 표기법을 사용해서 다시 써보자. If we set y = f (x)


and g = g(y) = g( f (x)), we may denote

dg dg dy
= = g′ (y) f ′ (x) = g′ ( f (x)) f ′ (x).
dx dy dx

만약 g가 f 의 역함수이면 g( f (x)) = x이고 따라서 미분을 하면

(g ◦ f )(x) = x ⇒ (g ◦ f )′ (x) = 1.

합성 함수의 미분법을 적용하면


1
g′ ( f (c)) f ′ (x) = 1 ⇒ g′ ( f (x)) = .
f ′ (x)

앞에서도 말했듯히 분모가 0이 되는 경우는 위의 법칙히 성립하지 않는다. 따라서


우리는 다음의 역함수의 미분 법칙을 얻는다.

Theorem 6.1 (역합수의 미분). If f : A → B is a bijection, differentiable at c ∈ A,


and f ′ (c) ̸= 0. Then, the inverse function f −1 is differentiable at f (c) and its deriva-
tive is given by
1
( f −1 )′ ( f (c)) = ′ .
f (c)

Proof. 앞에서 chain rule을 사용해서 역함수를 계산한 것은 아직 완전한 증명이 아


니다. 역함수가 미분 가능하다는 것을 가정해서 chain rule을 사용했기 때문이다.
따라서 역함수가 미분 가능하다는 것을 보여야 증명이 완결된다. 두 가지 방법을
46 6 Inverse functions and their derivatives

생각 할 수 있다. 일단 미분이 무엇이 되어야 하는 지를 알았으니 그것이 극한이라


는 것을 보이는 방법이다. 또하나는 그래프를 이용한다. 역함수의 그래프는 단지
원 함수의 그래프를 y = x를 중심으로 대칭 이동하는 것으로 기울기가 f ′ (c) ̸= 0
이면 접선도 대칭이동 한 후에 접선이 되고 기울기는 f ′1(c) 이 된다. ⊔

역함수의 미분을 구하기 위해서는 역함수를 구한후에 미분을 하거나 위의 역함


수의 미분 공식을 이용하면 된다. 다음의 문제에서는 그 두 개를 다해 보고 결과가
같은지 비교해 보자.

Problem 6.3. 역함수와 그 미분을 구하고 역함수의 미분 공식과 비교하시오.


(1) f (x) = x2 (2) f (x) = x3 − 2 일 때 ( f −1 )′ (6)를 구하시오.

Solution 6.3 (1) 역함수를 구하기 위해서 y = x2 라고 놓고 시작한다. 그러며, x, y ≥


√ √
0일 때 x = y 이므로 역함수는 f −1 (y) = y = y1/2 . 미분을 계산하면

1 1
( f −1 )′ (y) = y−1/2 = √ .
2 2 y

이제 역함수의 미분 공식을 사용하면


1 1
( f −1 )′ (y) = ( f −1 )′ ( f (x)) = = .
f ′ (x) 2x

이 둘은 일치 하는가? 그렇다. x = y이니까 대입하면 된다.
(2) 똑같이 반복하자. y = x3 − 2라고 놓고 다시 쓰면, x = (y + 2)1/3 를 얻는다.
1
따라서 f −1 (y) = (y + 2)1/3 이고 ( f −1 )′ (y) = (y + 2)−2/3 이다. 역함수의 미분 공
3
식을 사용하면
1 1
( f −1 )′ (y) = ( f −1 )′ ( f (x)) = ′ = 2.
f (x) 3x
이 둘은 일치한다. 이제 ( f −1 )′ (6)를 구해보자. 처음 것에 대입하면 ( f −1 )′ (6) =
1 −2/3 1
38 = 12 . 두 번째 식에 대입하려면 일단 y = 6이면 x = 2라는 것을 확인하고
그러면
1 1 1
( f −1 )′ (6) = ′ = 2
= .
f (2) 3 × 2 12
둘은 일치한다. ⊔

많은 경우 역함수를 explicit하게 계산하는 것은 많은 계산을 요구한다. 가능하지


않은 경우도 많다. 할 수 있다고 해도 역함수를 찾은후에 미분하는 것 보다는 역
함수의 미분을 잘 이해해서 사용하는 것이 바람직하다.
6.3 Natural logarithm 47

6.3 Natural logarithm

앞의 강의에서 멱함수 xα 의 antiderivative는 α = −1인 경우를 제외하고는 찾을


수 있었다. 그러면 x−1 의 antiderivative는 무엇일까? Natural logarithm으로 함수
f (x) = x−1 의 면적 함수로 정의한다. 그 면적함수를 natural logarithm이라고 부
르고 다음과 같이 표기하고 정의 한다.
Z x
1
ln x = dt. (6.1)
1 t

Question 6.2. 왜 ln x를 정의할 때 1 부터 x 까지 적분하는 것일까? 0 부터 x 까지


적분하는 것이 더 자연스럽지 않을까? 아니면 x에서 ∞ 까지 적분 하던지. 반듯이
1 부터 적분해야만 하는 이유가 있을까?

아마도 가장 자연스러운 선택은 0부터 적분하는 것일 것이다. 그러나 함수 t −1


를 0에서 부터는 적분할 수 없다. 그 적분 값이 무한으로 발산하기 때문이다. 즉,
Z x
1
dt = ∞.
0 t
그렇다면 다음으로 자연스러운 선택은 x 부터 ∞ 까지 적분하는 것이다. 그러나
그럴 수도 없다. 그 적분 값도 무한으로 발산하기 때문이다. 즉,
1
Z ∞
dt = ∞.
x t
따라서 우리가 선택할 수 있는 것은 0이 아닌 다른 양수에서 부터 적분하는 것이
다. 역사적으로 사람들은 1에서 부터 적분하는 것을 택했고 그래서 (6.1)을 사용
해서 ln x를 정의한 것이다.
이제 우리는 모든 멱함수 xα 의 antiderivative를 가지게 되었으면 α = −1의 경우
에는 자연로그 ln x가 antiderivative이다. 이를 이용해서 자연로그와 관련한 미분을
할 수 있다.
다음은 자연로그의 정의에서 오는 기본적인 성질이다.
48 6 Inverse functions and their derivatives

Theorem 6.2. 자연로그 ln x는 다음을 만족한다.


1. ln x is defined only for x > 0.
2. ln |x| is defined for all non-zero x ∈ R − {0}.
d 1
3. dx ln x = x for all x > 0 by the fundamental theorem of calculus.
d 1
4. dx ln |x| = x for all x ̸= 0.

Proof. 1,2,3번의 성질은 자연로그의 정의에서 온다. 4의 성질도 y = ln |x|의 그래


프를 생각하면 자명하다. 합성함수의 미분을 사용해도 좋다. 즉 ln |x| = ln(−x) for
x < 0이므로 x < 0일 때
d d 1 1
ln(|x|) = ln(−x) = × (−1) = .
dx dx −x x

따라서 모든 x ̸= 0에 대해서 d
dx ln |x| = 1x 이다. ⊔

다음은 자연로그를 사용한 계산에서 유용하게 사용하는 법칙이다.

Theorem 6.3 (자연로그의 성질). 자연로그 ln x는 다음의 성질을 가진다.


1. ln(xy) = ln x + ln y.
2. ln xk = k ln x for x > 0 and k ∈ R.
3. ln(x/y) = ln x − ln y.
d f ′ (x)
4. dx ln | f (x)| = f (x) for all x such that f (x) ̸= 0.

Proof. 이러한 규칙의 증명에는 미분의 기술이 매우 유용하다. (1)을 보이기 위해


양변을 미분하자. 이때 양변을 같은 방법으로 미분을 해야한다. y는 상수로 고려
하고 x에 대해 미분하자. 그러면 chain rule을 사용하여 다음을 얻는다.
d 1 1 d 1
ln(xy) = y = , (ln x + ln y) = .
dx xy x dx x

양변의 미분이 같다는 것은 양변이 상수 차이라는 것이다. 즉,

ln(xy) = ln x + ln y +C.

상수 C를 찾기위해 x에 1을 대입하면 C = 0을 얻는다.


(2)를 보이기 위해 양변을 미분하면 다음을 얻는다.
d 1 k d k
ln xk = k kxk−1 = , k ln x = .
dx x x dx x
양변의 미분이 같다는 것은 양변이 상수 차이라는 것이다. 즉,

ln xk = k ln x +C.
6.3 Natural logarithm 49

상수 C를 찾기위해 x에 1을 대입하면 C = 0을 얻는다.


(3)은 위에서 얻은 성질을 사용하여 증명한다.

ln(x/y) = ln(xy−1 ) = ln x + ln y−1 = ln x − ln y.

(4)는 단순히 chain rule을 Theorem 6.2(4)에 적용하면 된다. ⊔


Problem 6.4. a > 0 라고 하자. Theorem 6.3을 이용해서 다음을 보이시오:


d x
a = ax ln a.
dx

Solution 6.4 증명은 자연 로그를 붙힌 ln ax 의 미분을 통해 보인다. Theorem 6.3(2)


를 이용하면,
d d
ln(ax ) = (x ln a) = ln a.
dx dx
을 얻는다. 반면에 Theorem 6.3(4)를 이용하면

d (ax )′
ln(ax ) = x
dx a
을 얻는다. 둘은 일치해야 함으로 (ax )′ = ax ln a를 얻는다. ⊔

자연로그를 사용하면 다음 문제와 같이 복잡해 보이는 분수꼴 함수의 미분을


구하기 쉽다.

(x2 +1)(x+3)1/2
Problem 6.5. 분수 함수 x−1 의 미분을 구하시오.

Solution 6.5 분수와 곱의 미분 법칙을 이용하여 주어진 함수를 미분해 보자. 복


잡하다는 것을 알 수 있다. 반면에 이러한 함수에 로그를 취하면 곱과 나누기가
분리되어 미분이 쉬워진다. 우선 이 함수를 y로 두자:

(x2 + 1)(x + 3)1/2


y= .
x−1
그러면 자연로그의 성질을 이용하면
1
ln y = ln(x2 + 1) + ln(x + 3) − ln(x − 1)
2
을 얻는다. 양변을 미분하면

y′ 2x 1 1
= 2 + −
y x + 1 2(x + 3) x − 1

을 얻는다. 다시 정리해서 쓰면,


50 6 Inverse functions and their derivatives
 2x 1 1  (x2 + 1)(x + 3)1/2
y′ = + −
x2 + 1 2(x + 3) x − 1 x−1

을 얻는다. 간단한 분수꼴 함수는 직접 계산하지만 복잡해 지면 자연로그를 이용


하는 것이 좋다. ⊔

Problem 6.6. 다음 부정
Z 적분을 구하시오.
2 cos x
Z Z
(1) cot x dx (2) tan x dx (3) dx
Z Z 3 + 2 sin x
(4) sec x dx (5) csc x dx

Solution 6.6 일반적으로 antiderivative를 찾는 것은 쉽지 않다. 위의 문제들은 자


연로그의 성질 Theorem 6.3(4)를 이용해서 antiderivative를 찾는 경우이다. 만약
주어진 함수가
f ′ (x)
F(x) =
f (x)
로 쓰여진다는 것을 알면 바로 Theorem 6.3(4)를 이용해서
Z
F(x)dx = ln | f (x)| +C

라는 것을 기억해야 한다. 절대값을 붙이는 것도 잊지 말아야 한다. ⊔


6.4 Exponential function

Euler number 또는 자연 상수라고 불리는 특수 숫자 e는 다음을 만족하는 수이다:


Z e
1
dt = 1.
1 t
즉, ln e = 1 이 되는 수이다. 이 수는 π와 같이 무리수 이다. 이제 Euler number e를
base로 하는 지수 함수 f (x) = ex 의 미분을 생각해 보자. Problem 6.4에 따르면

d x
e = ex ln e = ex
dx
이다. 즉 미분과 원함수가 같은 매우 특별한 함수이다.
이제는 자연로그의 역함수를 생각해보자. 자연로그 ln x의 역함수를 exponential
function 이라고 하며 exp x 로 표시한다. 자연로그 함수를 ln : A → B로 적을 때
정의 구역은 A = (0, ∞)이고 range는 B = (−∞, ∞) = R이다. 따라서 exponential
function는 exp : R → (0, ∞)이다. 이제 exp x의 미분을 계산해 보자. y = exp(x)
라고 하면 x = ln(y)이고 역함수의 미분 법칙을 사용하면

1 1
exp′ (x) = ′ = = y = exp(x)
ln (y) 1/y
6.4 Exponential function 51

를 얻는다. 다시말해서, exponential function 도 지수 함수 ex 처럼 미분을 하면 자기


자신으로 돌아오는 성질을 가졌다. 혹시 둘은 같은 함수일까? 둘이 같은 함수라는
것을 보이려면 무엇을 보여야 할까? 일단 다음 문제를 생각해 보자.

Problem 6.7. 두 함수 f (x)와 g(x)는 0보다 크며 다음을 만족한다:

f ′ (x) = f (x), g′ (x) = g(x), f (c) = g(c) for some c.

두 함수는 같은 함수 임을 보이시오.

Solution 6.7 일단 양의 값을 가진다고 했으니까 g(x)가 0이 되지 않아서 분수 함


f (x)
수 g(x) 가 잘 정의 된다. 이 분수 함수의 미분이 0이 된다는 것을 쉽게 보일 수 있다.
그러면 이 분수 함수가 상수라는 뜻이다. f 와 g가 x = 1에서 같은 값을 가지므로
이 상수는 1이다. 즉. 모든 x에 대해서 f (x)/g(x) = 1이다. 따라서 f (x) = g(x)를
만족한다. ⊔ ⊓

두 함수 ex 와 exp x 모두 양수 값을 가지고 미분이 자기 자신이 된다. 또한 e0 = 1


이고, ln 1 = 0 이므로 exp 0 = 1이다. 따라서 이 두 함수는 동일한 함수이다. 즉,

exp x = ex , x ∈ R.

두 개의 표현이 다 쓰이지만 우리는 주로 ex 를 사용한다. 이제 지수 함수의 몇 가지


성질을 정리해 보자.

Theorem 6.4 (Exponential Function). 지수함수 ex 는 다음을 만족한다.


d x
(1) dx e = ex . d f (x)
(2) dx e = f ′ (x)e f (x) . (3) ex ey = ex+y .

Proof. (1)은 이미 보였다. (2)는 (1)에 chain rule을 사용한 것이다. (3)을 보이기
위해 좌변에 자연로그를 취하면,

ln(ex ey ) = ln ex + ln ey = x + y = (x + y) ln e = ln(ex+y )

을 얻는다. 자연로그는 one-to-one function 이므로 ex ey = ex+y 를 만족한다. ⊔


Exercises

1. 다음 함수의 역함수를 정의구역과 함께 구하시오.


(1) f (x) = x5 (2) f (x) = 2x + 1 (3) f (x) = (1 − x)3
2. 다음 함수의 역함수의 미분 ( f −1 )′ (2) 을 계산하시오. (즉 y = 2에서의 미분값)
(1) f (x) = x5 x
(2) f (x) = 2√ +1 (3) f (x) = x3 + 1
x+3 x
(4) f (x) = (5) f (x) = √ (6) f (x) = (x2 − 1)0.3
x−1 x−3
52 6 Inverse functions and their derivatives

3. 다음 함수의 미분을 계산하시오.


2 +3
(1) y = ln(x3 + x) (2) y = ln(ln
r x )
2
(3) y = ex
1+t 1+t  1 
(4) y = (5) y = (6) y = ln
1−t 1−t t(1 + t)
4. 다음Z 적분을 계산하시오.
−1 1 Z π
cos x
Z 2
(1) dx (2) dx (3) ex dx
−2 x 0 10 + sin x 0
Z 2
dx 7t
Z Z
(4) (5) 10 tan 2x dx (6) dt
1 x ln x t 2 − 10
5. 자연로그의
s 성질을 이용해서 다음을 미분 하시오.
(x + 1)(x − 1)2 2+t √
(1) 2 2
(2) (3) tan θ 2θ − 1
(x + 1)x t sint
dy
6. x와 y가 다음 관계식을 만족 할 때 를 구하시오.
dx
(1) y = yx (2) ex = x2y+2x (3) ln y = x3 y
(4) y = xx (5) y = (tan x)2x (6) ysin x = xcos y
7. 다음Z 적분을 구하시오. Z Z ln x
2 ln(10x) dx 1
(1) dx (2) (3) dt
x − 1 Z ln x
x Z1 0 t
Z √ √
(4) 3x 2
dx (5) x 2−1
dx (6) 5−x dx
−2
Part II
Kepler and Newton’s Laws of Motion
천문학자인 요하네스 케플러는 16세기 덴마크 천문학자 Tycho Brahe의 관찰을
분석하여 1609년에서 1619년 사이에 태양 주위를 도는 행성의 궤도를 3개의 법
칙으로 설명했다. 이 법칙은 니콜라우스 코페르니쿠스의 태양 중심의 원형 궤도
이론을 수정하여 타원형 궤도로 대체하고 행성 속도가 어떻게 변하는지 설명한
다. 세 가지 법칙은 다음과 같다.
1. 행성의 궤도는 두 초점 중 하나에 태양이 있는 타원이다.
2. 행성과 태양을 연결하는 선분은 동일한 시간 간격 동안 동일한 영역을 휩쓸고
지나간다.
3. 행성의 궤도 주기의 제곱은 궤도 장반경 길이의 세제곱에 비례한다.
아이작 뉴턴은 1687년에 케플러의 법칙은 자신의 운동 법칙과 만유인력 법칙
의 결과로 만들어 진다는 것을 보였다. 뉴턴의 운동법칙은 3개로 이루어 졌으며
다음과 같다.
1. 관성의 법칙: 외력이 없으면 물체는 등속 운동을 한다.
2. 힘의 법칙: 힘은 질량과 가속도의 곱이다 (F = ma).
3. 작용 반작용의 법칙: 힘이 가해지면 그에 대한 반작용의 힘이 같은 크기 반대
방향을 생긴다.
뉴턴의 만류인력의 법칙은 두 물체 사이에 작용하는 중력은 거리제곱에 반비
례 하고 질량의 곱에 비례한다. 두 물체의 질량을 m1 , m2 이라고 하고, 두 물체의
위치를 각각 x1 과 x2 라고 하면 물체 m1 이 받는 중력은 다음과 같다.
m1 m2 r
Fm1 = −G .
r2 r
위의 식에서 G는 중력계수로 6.674 × 10−11 m2 /kg s 이며 r 과 r은 다음과 같다

r = x1 − x2 , r = ∥r∥.

물체 m2 가 받는 힘은 r을 r̃ = x1 − x2 으로 교체하면 되는데 방향만 반대이므로


m1 m2 r
Fm2 = G = −Fm1 .
r2 r
즉, 작용 반작용의 법칙을 만족한다.

Part II에서는 뉴턴의 법칙으로 케플러의 법칙을 설명하는 것이 첫 번째 목표이


고 그 과정에서 매우 유용한 여러가지의 수학을 익히는 것이 두 번째 목표이다.
Lecture 7
Rectangular coordinate system and curves in R3

Space: the final frontier. These are the voyages of the Starship Enterprise. Its
five-year mission: to explore strange new worlds. To seek out new life and new
civilizations. To boldly go where no man has gone before! (From Star Trek)

이제 뉴턴의 입장이 되어서 천체의 움직임을 수학을 사용해서 설명해 보자. 우


주에 있는 천체들의 움직임을 수식으로 나타내기 위해서는 일단 우주에 좌표를
만들어 넣어야 한다. 이 작업은 생각 처럼 간단하지 않다. 지구 위에서 살아 왔던
우리에게 지구 즉 땅은 하나의 기준이 되었다. 그러나 우주에는 그러한 절대적인
기준은 없다. 기준은 우리가 정해야 한다.
영화 스타트랙에서 우주선 엔터프라이즈호는 종종 빠른 속도로 움직였다가 멈
춘다. 그러나 일정한 속도로 움직이는 우주선과 정지된 우주선은 구별할 수 없다.
이 때문에 빠르게 움직이고 있다거나 정지한다는 것은 의미가 없다. 만약 어떤
행성에 도착하고자 한다면 그 행성의 속도에 우주선의 속도를 맞춘다는 것이 더
정확한 의미이다. 속도는 상대적인 것일 뿐이다. 운동에너지도 상대적인 것이다.
오직 가속도만 의미가 있다.

7.1 Coordinate system

우주에 입자가 하나 있다. 그림에서 r로 표시되어 있다. 우리는 기준을 갖기 전


에는 이 입자가 움직이는지 아닌지 말할 수 없다. 기준으로 삼을 수 있는 것은
가속하지 않는 물체 또는 위치 이다. 우리는 그것을 원점 origin이라고 부르고 0으
로 표시한다. 입자 r이 원점 0과 같은 속도로 움직이면 입자가 움직이지 않는다고

55
56 7 Rectangular coordinate system and curves in R3

말한다. 즉, 원점의 속도를 제로 속도 v = 0라고 한다. 우리는 원점과 원점의 속도


에 대해 동일한 표기 0를 사용하며 문맥으로 그 둘을 구분한다. 공간의 움직이지
않는 점, 즉 원점의 속도 0으로 움직이는 점을 위치라고 부른다.
입자의 위치를 수치로 표현하기 위해서는 좌표계가 필요하다. 공간의 좌표계
는 원점과 특정 속성을 만족하는 세 개의 위치를 의미한다. 먼저 거리의 단위를
정한다. 다음으로는 원점 0으로 부터 단위거리 distance unit 만큼 떨어진 i라는
위치가 필요하다. 그런 다음 원점을 통과하고 0과 i를 연결하는 선에 수직인 선을
하나 고른다. 이 직선위에 원점 0에서 단위 거리에 있는 점을 선택하고 이름을 j
로 한다. 원점을 지나고 세 점 0, i, j를 지나는 평면에 수직인 직선은 0과 거리가 1
떨어진 점이 두 개 있다. 그 중 하나를 k로 정하면 좌표계가 완성된다.

Problem 7.1. 위의 설명에서 k의 선택에 따라 좌표계를 positively oriented 좌표


계 또는 negatively oriented 좌표계라고 부른다. 각각 어떤 경우인가?

Solution 7.1 (i) 오른손 법칙(right hand rule): 원점과 i, j를 포함하는 평편에
수직이고 원점을 지나는 직선 (즉, z 축)을 오른손 손가락으로 휘감는데 i에서 j 방
향으로 네 손가락으로 감싼다. 이 때 엄지손가락 방향에 k가 있으면 이 좌표계를
positively oriented라고 부른다. 그 반대의 경우는 negatively oriented라고 부른다.
(ii) Cross product 테스트. k = i × j이면 이 좌표계를 positively oriented라고 부
른다. (어차피 cross product도 오른손 법칙을 사용하여 설명하니까 이 두 설명은
동일한 설명이다.) ⊔ ⊓

우리는 positively oriented 좌표계를 택한다. 전통적으로 항상 그렇게 한다.

Remark 7.1. 우리는 이번 강의에서 3차원 공간을 고려하지만 2차원 이상의 모든


공간에는 positive와 negative 2가지 좌표계가 있다. 그 둘은 서로 구별이 가능 하
다. 하지만 두 개의 positively oriented 좌표계는 구별을 할 수 없다. 로테이션을
하면 일치하기 때문이다. 그러나 1차원 공간에는 한가지 뿐이다. 1차원 공간에서
입자가 오른쪽으로 이동할 때 x가 증가하면 positively oriented라고 하고 x가 감소
하면 negatively oriented라고 할 것 같지만 사실 돌려 앉기만 하면 왼쪽과 오른쪽이
바뀌어서 구분이 안간다. 그리고 실제 좌표를 어떤 순서로 택하는가가 orientation
을 결정한다. 1차원에는 축이 하나 밖에 없어서 orientation도 하나 밖에 없다.
7.2 Projection 57

Problem 7.2. 두 개의 서로 다른 속도로 가속력 없이 움직이는 두 개의 입자가 공


간에 있다. 이 두 입자의 움직임을 포함하는 하나의 평면이 존재 함을 보이시오.

Solution 7.2 논의한 바와 같이 하나의 입자를 원점으로 삼아는다. 두 번째 입자


가 지나가는 직선과 원점을 포함하는 평면은 존재한다. 그 직선이 원점을 지나면
그러한 평면은 많고 원점을 지나지 않으면 그러한 평면은 유일하다. ⊔ ⊓

위 문제의 답을 보고 약간 속은 느낌이라면 그렇지 않다는 것을 강조하고 싶


다. 물론 제 3자를 원점으로 하는 좌표계 안에는 그런 평면이 없다. problem 7.2는
좌표계는 목적에 맞게 잡아야 한다는 것을 보여준다.

7.2 Projection

r을 공간에서 입자의 위치라고 하자. 좌표계가 주어지면 그 좌표계를 사용하여 세


개의 수로 r의 위치를 나타낼 수 있다. 그 의미와 방법을 자세히 살펴 보자. 먼저
위치 r을 0과 i를 연결하는 직선인 x축에 투영 project 한다. 직선에 project 할 때는
일단 위치 r을 통과하고 x 축에 수직인 평면이 x축과 만나는 점이 x 축에 대한 r의
투영점 projection이다. 원점에서 투영점까지의 거리가 r의 x 좌표이다. 투영점이
i의 반대쪽에 있으면 음의 부호를 붙인다. j 및 k에 대해서도 유사하게 수행하고 y
및 z 좌표를 찾을 수 있다. 이것들이 점 r의 좌표이다. xy 평면으로의 projection을
고려해 보자. 일단 r을 지나가는 직선 중에서 xy 평면에 수직인 직선을 그리고 xy
평면과 만나는 점을 찾는다. 이 점이 projection이다. 이 점의 xy 평면상의 좌표가
(x, y)이다.

우리는 r을 column vector로 이해하고 표기한다, i.e.,


 
x
r = y .
z

i, j, k, 또는 0에 대한 해당 좌표는 다음과 같다:


58 7 Rectangular coordinate system and curves in R3
       
0 1 0 0
0 = 0 , i = 0 , j = 1 , k = 0 .
0 0 0 1

점 r은 i, j, 그리고 k를 사용하면 다음과 같이 표기할 수 있다:

r = xi + yj + zk.

우리는 vector는 굵은 글자체로 표기하고 scalar는 일반 글자체로 표기한다. 위치


vector r의 크기 또는 norm (또는 size)는 다음과 같이 정의하고 표기한다:
p
∥r∥ = x2 + y2 + z2 .

이 것은 위치 r과 원점 0 사이의 거리이다(피타고라스의 정리). 필요에 따라 사람


에 따라 다른 좌표계를 선택할 수 있다. 그경우 본질인 r 위치는 바뀌지 않지만
그에 대한 표현이 변경된다.

Question 7.1. 대부분의 미적분 교과서는 vector가 column vector인지 row vector
인지 구분하지 않는다. 그러나 우리는 r을 column 벡터로 고정해서 사용한다. 행
벡터 대신 열 벡터를 선택하면 좋은 점은 무엇일까?

사용하는 벡터가 열벡터인지 행벡터인지를 구분해서 쓰는 버릇을 들리면 혼돈


을 줄일 수 있다. 그리고 위치 vector r을 column vector로 사용하는 이유 중 하나는
행렬 곱셈이다. A가 3 × 3 행렬이고 x가 벡터라고 하자. 우리는 보통 행렬과 벡터
사이의 곱셈을 Ax로 쓴다. 이 경우 x는 column vector 이어야 한다.
그런데 column vector로 쓰면 나쁜 점이 있다. 칸을 너무 많이 잡아 먹는다. 따
라서 때론 r = (1, 3, 2)와 같이 적기도 하겠다. 칸을 아끼기 위해서 가로로 썼지만
문맥에 따라 column vector라는 것을 기억하자.

7.3 Moving particle and trajectory curves in space

우주에서 움직이는 행성을 생각해 보자. 시간 변수를 t ∈ R로 표기하고 r(t)는 시


간 t에서 행성 또는 물체의 위치라고 하자. 그러면 우리는 다음과 같이 쓸 수 있다:
 
f (t)
r(t) = f (t)i + g(t)j + h(t)k =  g(t)  .
h(t)

다음과 같이 쓸 수도 있다:

x = f (t), y = g(t), z = h(t).

어느 쪽이든 동일하며 의미는 명확하다. 그러나 다시 생각해 보면 새로운 표현인


f (t), g(t), h(t)를 도입해야 하는 이유는 무엇인가? 그들의 의미는 행성의 x, y 및
z 좌표를 나타내는 함수일 뿐이다. 그러나 나중에는 f (t)가 x 좌표였는지 y 좌표
7.3 Moving particle and trajectory curves in space 59

였는지 잊을 수 있다. 그래서 다음과 같이 쓰는 것이 좋다:


 
x(t)
r(t) = y(t) .
z(t)

행성이 움직이는 궤적 {r(t) : t ∈ R}은 3차원 공간의 곡선이다. 따라서 시간 변수


t ∈ R를 변수로 가지는 vector-valued 함수로 간주할 수 있다. 위의 두 가지 표현을
사용하여 위치 vector r(t)의 norm을 나타내면 다음과 같다:
q q
∥r(t)∥ = f 2 (t) + g2 (t) + h2 (t) or ∥r(t)∥ = x2 (t) + y2 (t) + z2 (t).

두 번째 표기는 x, y, z 좌표의 제곱의 합에 제곱근을 취한 것이 위치 vector r(t)와


원점과의 거리라는 의미가 명확하다. notation abuse가 의미를 명확하게 한다.

Remark 7.2. 이 표기법에서 x(t)는 시간이 t일 때 움직이는 입자 위치의 x 좌표


를 제공하는 t를 변수로 가지는 함수이다. 우리는 이렇게 표현하는 것을 notation
abuse (표기 남용)이라고 부른다. 동일한 문자 x를 좌표계의 x 좌표로도 쓰고 입
자의 시간 t에서의 위치를 나타내는 함수 x(t)로도 쓴다. 이것은 새로운 함수 f (t)
를 도입해서 x = f (t)로 사용하는 것보다 더 편리하다. 이처럼 엄밀하게 보면 서
로 다른 두 가지 대상을 하나의 표기법으로 사용하는 notation abuse는 많은 곳에
쓰이고 chain rule 등에서 이미 사용하였다.

Question 7.2. vector와 scalar의 차이점은 무엇인가?

우리는 흔히 스칼라는 크기만 있는 양이고 벡터는 크기와 방향이 함께 있는 양


이라고 말한다. 그러나 그 말은 그다지 정확하지 않다. 스칼라 값 x ∈ R도 오른쪽
또는 왼쪽 두 방향 중 하나를 가지고 있고 그 크기는 |x|이다. 조금더 정확 구분은
scalar는 실수나 복소수와 같은 수 체계에서 나오는 양이고, 벡터는 단일 성분의
경우를 포함하여 여러 개의 scalar로 구성된 양이라고 할 수 있다. 즉, 스칼라는
단일 성분 벡터라고 말할 수 있다.
60 7 Rectangular coordinate system and curves in R3

Problem 7.3. r(t) = costi + sintj에 의해 주어진 벡터 함수 r : (0, 2π) → R2 의 궤


적을 그리시오. 움직이는 방향은 어디인다?

Problem 7.4. r(t) = costi + sintj + tk에 의해 주어진 벡터 함수 r : (0, 2π) → R3


의 궤적을 그리시오.

Problem 7.5. xy 평면으로 project하면 반경 2의 원이 되는 z 축을 10회 회전하는


코일의 궤적을 가지는 함수 r : (0, 2π) → R3 를 생성하시오.

Vector sums and substractions

scalar를 벡터에 곱하는 것은 cr = (cx, cy, cz)으로 주어진다. 두 벡터의 합과 차는


각 벡터의 구성 요소별로 합하고 빼는 것으로 정의한다. 즉,

r1 + r2 = (x1 + x2 , y1 + y2 , z1 + z2 )., r1 − r2 = (x1 − x2 , y1 − y2 , z1 − z2 ).

벡터 합의 기하적 의미는 평행사변형을 써서 설명한다. 벡터 차 r2 − r1 은 r2 가


종점이고 r1 이 시점으로 이해 한다 (위의 그림 참조).

7.4 Cross product, inner product, and outer product

3가지 종류의 product를 소개한다.

Cross product

cross product는 두 개의 3차원 벡터 사이의 곱이다. 두 벡터,


   
x1 x2
r1 = y1  , r2 = y2  ,
z1 z2

의 cross product는 다음과 같이 표시하고 정의 한다.

r1 × r2 = (y1 z2 − z1 y2 )i − (x1 z2 − z1 x2 )j + (x1 y2 − y1 x2 )k.

벡터 곱 (vector product)라고 부르기도 한다. 위의 식을 쉽게 기억하기 위해 3 × 3


행열의 determinent를 사용한다:

i j k
y z x z x y
r1 × r2 = x1 y1 z1 = 1 1 i − 1 1 j + 1 1 k.
y2 z2 x2 z2 x2 y2
x2 y2 z2
7.4 Cross product, inner product, and outer product 61

cross product는 3차원 벡터에게만 정의 된다. 기하적으로 설명하면 cross product


r1 × r2 는 두 개의 벡터 r1 과 r2 를 포함하는 평면에 수직인 벡터이고 크기는

∥r1 × r2 ∥ = ∥r1 ∥ ∥r2 ∥ sin θ (7.1)

이다. 이러한 벡터는 두 개 있는데 오른손 법칙을 만족하는 벡터이다. 두 개의 벡


터가 평행이면, 즉 각도가 θ = 0이면, r1 × r2 = 0이 된다.

Problem 7.6. r1 (t)과 r2 (t)를 시간이 t일 때 두 물체의 위치를 나타내는 벡터라고


하자. cross product가 다음 product rule을 만족하는 것을 보이시오:

(r1 (t) × r2 (t))′ = r′1 (t) × r2 (t) + r1 (t) × r′2 (t).

Solution 7.6 다음과 같이 미분의 product rule을 쓰면 된다:

(r1 (t) × r2 (t))′ = (y1 z2 − z1 y2 )′ i − (x1 z2 − z1 x2 )′ j + (x1 y2 − y1 x2 )′ k


= (y′1 z2 − z′1 y2 )i + (y1 z′2 − z1 y′2 )i + (· · · )j + (· · · )k
= r′1 (t) × r2 (t) + r1 (t) × r′2 (t).

따라서 product rule을 만족한다. (모든 항을 적진 않았으니 확인해 보시오.) ⊔


Question 7.3. 두 개의 벡터 r1 과 r2 가 주어 졌을 때 서로 수직인지 알 수 있는 방


법이 있을까? 각도를 쉽게 알 수 있는 방법이 있을까?

Innder product

inner product는 두 개의 크기가 같은 벡터 사이의 곱이다. (7.1)을 사용하면 두 벡


터가 이루는 각도를 알 수 있다. 그러나 각도를 알 수 있는 더 쉬운 방법은 inner
product 내적이다. dot product라고도 부른다. inner product는 다음의 두 방법
으로 표기하고 정의 한다:

r1 · r2 = ⟨r1 , r2 ⟩ = x1 x2 + y1 y2 + z1 z2 .
62 7 Rectangular coordinate system and curves in R3

두 개의 벡터를 내적하면 하나의 실수를 얻는다.

Problem 7.7. 두 개의 벡터 r1 과 r2 가 이루는 각도를 θ 라고 하면


r1 · r2
cos θ = (7.2)
∥r1 ∥ ∥r2 ∥

임을 보이시오.

Solution 7.7 두 개의 벡터가 원점에서 만나면 하나의 평면위에 있을 테니까 그


평면이 xy 평면이라고 가정해도 된다. 따라서 z component는 모두 0이라고 하자.
그러면 위 관계는 삼각형과 cosine 함수와의 관계로 고등학교 때 이미 배웠다. 여
기선 생략하지만 (7.2)은 반듯히 기억해야 한다. ⊔ ⊓

위의 관계 (7.2) 매우 중요한 것을 말하고 있다. 만약 내적이 0이면 두 벡터가


이루는 각도는 직각이다. 그리고 각도가 0이면 즉 두 벡터가 평행하면 cos 0 = 1
이니까 두 벡터의 내적은 두 벡터의 길이의 곱과 같다.

Problem 7.8 (평면의 식). 점 r = (1, 2, −1)을 지나고 벡터 v = (0, 3, −2)에 수직인
평면의 식을 구하시오.

Solution 7.8 (위의 그림 참조) 평면 위의 점을 x = (x, y, z)라고 하자. 그러면 벡터


x − r = (x − 1, y − 2, z + 1)은 v = (0, 3, −2)와 수직이다. 따라서

(x − r) · v = 0(x − 1) + 3(y − 2) − 2(z + 1) = 3y − 2z − 8 = 0.

즉, 평면의 식은 3y − 2z − 8 = 0이다. 물론 3y − 2z = 8로 써도 좋다. ⊔


내적은 3차원 벡터 뿐만 아니라 모든 차원의 벡터에 대해서도 비슷하게 정의 할


수 있다. 그러나 n차원 벡터의 내적을 나타내기 위해서는 이전의 표기법은 좋지
않다. 조금 다르게 표기해서 2개의 n차원 벡터를 다음과 같이 표기해보자.
   
x1 y1
x =  ...  , y =  ...  .
   

xn yn

이 두 벡터의 내적은 x · y 또는 ⟨x, y⟩으로 표기하고 다음으로 정의한다:


 
y1 n
 . 
⟨x, y⟩ = x1 · · · xn  ..  = ∑ xi yi . (7.3)
i=1
yn

두 함수 f , g : R → R의 내적도 다음과 같이 적분으로 정의 할 수있다.


Z
⟨ f , g⟩ = f (x)g(x)dx. (7.4)
7.4 Cross product, inner product, and outer product 63

n차원 공간에서의 두 벡터의 각도는 무엇일까? 두 함수 f , g 사이의 각도는 무엇


일까? 의미는 다르더라도 (7.2)를 각도에 대한 정의로 사용한다.

Question 7.4. 내적 (7.3)와 (7.4)는 달라 보이는데 어떤 공통점이 있을까?

Problem 7.9. x(t)와 y(t)를 시간이 t일 때 두 물체의 위치를 나타내는 벡터라고하


자. 그 내적의 미분도 다음 product rule을 만족함을 보이시오:

(x(t) · y(t))′ = x′ (t) · y(t) + x(t) · y′ (t).

Solution 7.9 다음과 같이 미분의 product rule을 쓰면 된다:


 n ′ n
(x(t) · y(t))′ = x (t)y
∑ i i (t) = ∑ (xi (t)yi (t))′
i=1 i=1
n
= ∑ (xi′ (t)yi (t) + xi (t)y′i (t)) = x′ (t) · y(t) + x(t) · y′ (t).
i=1

따라서 product rule을 만족한다. ⊔


Outer product

outer product 또는 tensor product는 크기가 달라도 되는 두 벡터 사이의 곱이다.


x ∈ Rn 과 y ∈ Rm 두 개의 임이의 크기의 벡터가 있을 때 그 outer product는 n × m
행열    
x1 x1 y1 · · · x1 ym
x ⊗ y =  ...  y1 · · · ym =  ... .. 
   
. 
xn xn y1 · · · xn ym
이다.

Exercises

1. 벡터 r = i + 2j + k와 수직인 벡터를 모두 찾으시오.


(1) r = i + 2j + k (2) r = 2i − 3j + 4k (3) r = i − j + k (4) r = 2i + 1j − 3k
2. 다음 두 개의 벡터에 수직인 단위 벡터를 찾으시오.
(1) r1 = 3j + k, r2 = 2i + j − k (2) r1 = i + 2j + k, r2 = 2i − j
3. 원점을 지나고 벡터 v = 2i + 3j + kd와 수직인 평면의 식을 구하시오.
4. r = i + j + k을 지나고 v = 2i + 3j + kd와 수직인 평면의 식을 구하시오.
5. 평면의 식이 2x + 3y − z = 2이다. 이 평면에 수직인 벡터를 구하시오.
64 7 Rectangular coordinate system and curves in R3

6. 점 r = (2, 1, 4)를 지나고 xy 평면에 평행인 평면의 식을 구하시오.


7. 점 r = (2, 1, 4)를 지나고 xz 평면에 평행인 평면의 식을 구하시오.
8. 두 개의 평면 2x + 3y − z = 2와 3x + y − 2z = 0의 교집합을 구하시오.
9. 두 개의 점 r1 = (1, 2, 1)과 r2 = (3, 2, −1)와 같은 거리에 있는 점들이 만족하는
식을 구하시오.
Lecture 8
Polar coordinates in R2

태양계의 행성들은 태양을 중심으로 원에 가까운 타원형 궤도를 돈다. 지구 주


위를 도는 인공 위성들은 주로 원형궤도를 돌게 설계되지만 타원형 궤도를 돌게
하기도 한다. 각 궤도는 각각의 평면위에 있어서 2차원 공간의 좌표로 설명이 가능
하다. 특히 원형 또는 타원형 궤도를 표현하기에는 극좌표가 유용하다. 그 외에도
쓰임새가 매우 많은 극좌표를 이번 강의에서 다룬다.

8.1 Variable change with polar coordinates

2차원 공간의 극좌표계는 길이 r과 각도 θ 의 두 개의 숫자로 구성된다. 2차원의


직교 좌표계는 x좌표와 y 좌표 두 개의 숫자로 구성된다. 원점과 점 (x, y)를 연결
한 선분의 길이가 r이고 이 선분과 x축이 이루는 각도가 θ 이다. 극좌표 (r, θ )가
주어지면 sin θ 와 cos θ 를 사용해 직교 좌표를 계산할 수 있다. 즉,

x = r cos θ , y = r sin θ . (8.1)

물론 직교 좌표 (x, y)가 주어지면 해당하는 극 좌표 (r, θ )를 구할 수 있다. 단, r과

θ 의 범위를 확실히 해야 하는데 우리는

(r, θ ) ∈ [0, ∞) × [0, 2π)

로 한다. 그러면 길이 r은 p
r= x 2 + y2

65
66 8 Polar coordinates in R2

로 주어진다. 그러나 각도의 경우는 명시적으로 θ = f (x, y)의 꼴로 쓰기는 힘들고


implicit하게
x y p
cos θ = , sin θ = , r = x2 + y2 (8.2)
r r
로 주어진다. r ̸= 0이면 (8.2)를 만족하는 θ 는 구간 0 ≤ θ < 2π에서 하나 존재한다.
그리고 x를 y 보다 앞에 쓰듯이 r을 θ 보다 앞에 쓰는 것으로 고정하자.
목적과 편리에 따라 두 좌표계 중 하나를 선택해서 사용 할 수 있는데 그 둘의
상관관계를 잘 이해해서 자유롭게 변수 변환을 할 줄 알아야 한다. 극좌표 (r, θ )
와 직교좌표 (x, y)와의 관계인 (8.1)과 (8.2)는 다차원 변수 변환의 첫번째 예로
가장 중요하다. 변수 변환을 명확하게 이해 하는 것은 그 자체로 유용하며 뉴턴의
행성이론을 이해하는데는 필수이다.
직교 좌표계는 좌표계인 동시에 행성의 움직임이 일어나는 실제 세상이다. 반
면에 극 좌표계는 직교 좌표계의 타원형 궤도를 나타내기에 편리한 좌표계이다.
극좌표계를 직교 좌표계에 쉽게 사용하기 위해서 직교 좌표계의 기본 기저벡터
(basis 벡터)인 i, j 대신에 새로운 기저 벡터를 도입한다. 이들은 다음과 같다:
   
cos θ − sin θ
er (θ ) = , eθ (θ ) = . (8.3)
sin θ cos θ

이 두 벡터는 unit 벡터 이지만 i, j와는 달리 상수 벡터는 아니다. 두 벡터 모두 θ


만의 함수이다. 즉, r과는 상관이 없다. 이 두 벡터에 대응하는 극 좌표계의 기저
벡터는 er 은 (1, 0)가 되고 eθ 는 (0, 1)이 된다. 그 이유는 그림에서 보는 바와 같이

벡터 er 은 θ 를 고정한 방향의 벡터이므로 극 좌표계에서는 (1, 0)에 해당하고 벡터


eθ 는 r을 고정한 방향의 벡터이므로 극 좌표계에서는 (0, 1)에 해당한다. 이 극좌
표 평면에 주어진 점의 좌표가 (r, θ )이면 이 점이 직교좌표의 어떤 점으로 대응
되는지 살펴보자. 일단 각도 θ 가 주어 졌으니까 각도 θ 에 해당하는 방향 벡터 er
을 고려한다. 방향 벡터는 크기가 1인 벡터이다. 따라서 길이가 r이니까 대응 되는
벡터는
r = rer (θ )
이다. 이 식은 관계식 (8.1)을 벡터식으로 다시 적은 것에 불과하다. er 이 첫 번째
좌표축이고 eθ 가 두 번째 좌표축이면 새 좌표계도 positive orientation을 가진다.
8.2 Motion in polar coordinates 67

이제 반대로 xy 평면의 점 r = (x, y)가 주어지면 이에 해당하는 극좌표 (r, θ )를


찾아보자. 주의할 점이 있다. 대응관계 (8.1)이 one-to-one이 아니어서 하나로 정해
지지 않는다. 역대응을 만들려면 역함수를 정의 할 때 처럼 branch를 택해야 한다.
극 좌표에서는 r ≥ 0 와 0 ≤ θ < 2π를 branch로 택한다. 이 영역 안에서 (8.2)의 세
관계식을 만족하는 r과 θ 를 택한다.

Question 8.1. 식 (8.2) 대신 θ = tan−1 (y/x), θ = sin−1 (y/r), 또는 θ = cos−1 (x/r)


로 적으면 어떨까?

실제 여러 미적 책에서 그러한 관계를 사용한다. 그러나 만약에 θ = tan−1 (y/x)


또는 θ = sin−1 (y/r)로 정의하면 이들 두 역함수의 정의에 따라서 − π2 ≤ θ ≤ π2
인 영역의 각도만 준다. 만약 θ = cos−1 (x/r)를 사용하면 cos−1 의 정의에 따라
0 ≤ θ ≤ π의 각도만 준다. 따라서 이 표현들은 정확한 표현이 아니다. 그저 단순
히 (8.2)의 해를 새로운 함수 θ (x, y) 처럼 사용하자. 그러면 극 좌표에서 다루는
영역 0 ≤ θ < 2π를 다 포함 할 수 있다.

8.2 Motion in polar coordinates

이 부분은 행성의 궤도 공식을 유도하는데 핵심이 된다. 물리적인 이해를 위해


수학적 사고가 필요한 부분이다. 두 개의 천체는 (가령 태양과 지구는) 서로간의
중력을 제외한 다른 외부의 힘이 미치지 않는다고 가정하면 하나의 평면 위에 놓
이게 된다 (아래서 다시 확인한다). 이 평면 위에 극좌표계를 도입하면 물체 또는
행성의 위치를 극좌표를 사용하여 표시할 수 있다:

r = xi + yj = r cos θ i + r sin θ j = rer (θ ).

직교좌표 공간상의 위치를 굵은 글자체 r로 표시 했다. 극좌표 r과의 상관관계는

∥r∥ = r

이다. 직교 좌표계의 i와 j는 위치에 따른 변화가 없는 고정된 서로 수직인 기저


벡터이다. 그러나 er (θ )과 eθ (θ ) 각 위치에 해당하는 θ 값에 따라 변하는 서로
수직인 basis이고 r 값과는 독립이다.

Problem 8.1. 다음 미분을 보이시오.


der deθ der deθ
= eθ , = −er , = = 0.
dθ dθ dr dr

Solution 8.1 삼각함수의 미분 법칙에 의해 위의 관계를 쉽게 보일 수 있다. 기억


하는 것이 더 중요하다. ⊔ ⊓

새 좌표계를 쓰면 물체의 위치는 r = rer (θ )로 표시된다. 이 표기법에는 시간 변


수가 숨겨져 있다. 물체가 움직이면 물체의 위치에 대한 극좌표 r과 θ 는 시간 변수
68 8 Polar coordinates in R2

t의 함수이다. 다음 그림의 우측에는 직교좌표계 xy 평면상에 움직이는 입자의 궤


적이 있다. 그러면 해당하는 극좌표계의 위치는 r̃(t) = (r(t), θ (t))로 표현할 수

있다. 뉴턴의 법칙이 적용되는 공간은 극좌표계 공간이 아니라 직각좌표계 공간


이다. 다시말해 그림 우측의 점 r = rer (θ )이 움직이는 궤적에 뉴턴의 중력 법칙과
운동법칙을 적용해야 한다. 따라서 좌표계 er 및 eθ 는 각도 θ 를 통해서 시간 변수
t의 함수가 되고 입자의 위치는 다음과 같이 쓸수 있다:

r(t) = r(t)er (θ (t)).

Problem 8.2. 다음을 보이시오.

ėr = eθ θ̇ , ėθ = −er θ̇ . (8.4)

Solution 8.2 시간에 대한 미분인 ėr 와 ėθ 를 계산 하라는 것은 각도를 시간에 대한


함수 θ = θ (t)로 보라는 것이다. chain rule과 problem 8.1를 이용하면,
   ′   
d cos θ (t) cos θ (t)θ̇ − sin θ (t)θ̇
ėr = = = = eθ θ̇
dt sin θ (t) sin′ θ (t)θ̇ cos θ (t)θ̇

을 얻는다. chain rule을 요소별로 적용하지 않고 통으로 Problem 8.1을 사용하면


deθ
ėθ = θ̇ = −er θ̇

을 얻는다. ⊔

Problem 8.3 (극 좌표를 이용한 위치,속도,가속도). 물체의 위치, 속도, 가속도는


다음과 같이 주어진다는 것을 보이시오.

r = rer (8.5)
v = ṙer + rθ̇ eθ (8.6)
2
a = (r̈ − rθ̇ )er + (rθ̈ + 2ṙθ̇ )eθ (8.7)

Solution 8.3 위치 벡터 (8.5)는 이미 설명 되었다. 이에 대한 미분은 곱의 미분


법칙과 (8.4)을 이용하여 다음을 얻는다:
8.3 Ellipses in polar coordinates 69

v = ṙ = ṙer + rėr = ṙer + rθ̇ eθ ,

a = v̇ = r̈er + 2ṙθ̇ eθ + rθ̈ eθ − rθ̇ 2 er = (r̈ − rθ̇ 2 )er + (rθ̈ + 2ṙθ̇ )eθ .

위성이나 행성의 궤도가 극 좌표 (r(t), θ (t))로 주어 졌을 때 직각 좌표계에서의


위치, 속도, 가속도를 계산하는 위의 세 식은 구구단 처럼 자주 쓰인다. 위의 식을
쉽게 얻은 것 같지만 이미 chain rule, 좌표 변환 등 많은 수학을 사용한 이후에
얻는 매우 가치있는 식이라는 것을 인식하자. 극 좌표 r과 θ 를 직각 좌표계에서
사용할 경우에는 기저 벡터로 i와 j 대신에 er 및 eθ 를 사용하면 편리하다는 것도
기억하자.

8.3 Ellipses in polar coordinates

중심이 원점이고 장축과 단축이 x축과 y축인 타원의 식은 다음과 같다:

x 2 y2
+ = 1.
a2 b2
그래프의 개요는 그림 좌측에 주어졌다. ±a는 x 절편이고 ±b는 y 절편이다. 만약

a = b이면 위의 타원은 원이 된다. 편의상 a ≥ b인 경우를 고려한다. 이 경우는 x


축이 장축이√된다. 타원의 focus (촛점)는 2개로 장축에 놓여있다. center와 focus
거리는 c = a2 − b2 이다. 즉, 촛점은 (±c, 0)이다. 타원이 원에서 부터 얼마나
벗어나 있나를 나타내는 eccentricity 이심율은 다음과 같이 정의한다:
r
c a2 − b2
e= = . (8.8)
a a2
이심율이 e = 0이면 원이다. 이심율이 e = 1이면 b = 0이고 더 이상 타원이 아니다.
타원의 이심율은 0과 1사이에 있다.
타원을 극좌표를 사용해서 나타내보자. 우측의 그림에서와 같이 x 축에 수직인
직선 x = k를 잡고 이 직선을 앞으로 얻을 곡선의 기준선 directrix로 이용하자. 점
70 8 Polar coordinates in R2

P(x, y)의 극좌표를 (r, θ )라고 하고 이 점에서 directrix에 내린 수선이 발을 D라고


하자. 어떤 양수 e > 0에 대해서
r = ePD (8.9)
을 만족하는 모든 점 P(x, y)로 이루어진 곡선을 찾아보자. (앞으로 이심율이 되기
때문에 e라고 표기했다.) 선분 PD의 길이는 k − x이므로 다음을 만족한다:
p
r = ePD ⇒ x2 + y2 = e(k − x) ⇒ x2 + y2 = e2 (k2 − 2kx + x2 ).

정리해서 쓰면 다음과 같다:

(1 − e2 )x2 + 2ke2 x + y2 = e2 k2 .

만약 e ̸= 1 이면, 이 식을 다음과 같이 쓸 수 있다:


 ke2 2 y2 e2 k 2
x+ 2
+ 2
= . (8.10)
1−e 1−e (1 − e2 )2
Problem 8.4. 0 < e < 1 이면 (8.10)는 원점이 촛점 중의 하나인 타원으로 e는 이
타원의 이심율 eccentricity이라는 것을 보이시오.

Solution 8.4 0 < e < 1 이면 1 − e2 > 0 이므로, 다음과 같이 정할 수 있다:

e2 k2 e2 k 2 ke2
a2 = , b2 = a2 (1 − e2 ) = , c= > 0.
(1 − e2 )2 (1 − e2 ) 1 − e2

(8.10)을 a2 으로 나누면
(x + c)2 y2
+ 2 =1
a2 b
q
a2 −b2
을 얻는데 이는 타원이다. 타원의 중심은 (−c, 0)이다. 타원의 eccentricity는 a2
로 정의되었다. 계산해 보면

a2 − b2 a2 − a2 (1 − e2 ) 1 − (1 − e2 )
2
= = = e2 (8.11)
a a2 1
을 얻는다. 즉, 위의 관계 r = ePD의 계수 e가 포물선의 이심율이어서 √ 처음부터
계수를 e로 둔 것이 타당했다. 타원의 중심과 촛점 까지의 거리가 a2 − b2 이니까
(8.11)을 이용해서 계산을 하면
s
p √ k2 e4
a2 − b2 = e2 a2 = =c
(1 − e2 )2

을 얻는다. 따라서 타원을 c 만큼 좌측으로 이동 했으므로 원점이 촛점이다. ⊔


(8.9)을 만족하는 점들이 이심율이 e이고 원점이 촛점 중의 하나인 타원임을


알았다. PD의 길이는 k − r cos θ 이므로 이 타원 궤도를 극좌표를 써서 나타내면
r = e(k − r cos θ )를 얻는다. 이를 r에 대해 정리하면 다음과 같다:
8.4 Curves in polar coordinates 71

L
r= , L = ek.
1 + e cos θ
이 식은 0 < e < 1인 경우 타원의 이심율이 e인 타원이다. 그러나 e ≥ 1인 경우에는
포물선과 쌍곡선을 나타낸다 (Appendix B 참조).

8.4 Curves in polar coordinates

극좌표 (r, θ )를 직교좌표 (x, y)에 대응해서 사용할 때는 보통 그 구간을 r ≥ 0 그


리고 0 ≤ θ < 2π로 하지만 단순히 극좌표를 써서 curve를 나타낼 때는 꼭 그런
제한 없이 쓰기도 한다. 이 절에서는 극좌표로 표현되는 curve의 식과 대응되는
직교좌표의 curve와 그 의미를 생각해 본다.

Problem 8.5. 다음 극좌표로 주어진 식을 직교 좌표로 바꾸고 해당하는 그래프를


그리시오.
2
(1) r = 1 (2) r = cos θ (3) r = cos(2θ ) (4) r =
sin θ − cos θ

Solution 8.5 극좌표에서의 그래프와 직교좌표에서의 그래프를 구분해서 생각하


고 극좌표에서의 그래프가 극좌표 변환 (8.1)에 의해서 직교좌표에서의 그래프로
대응 된다는 것으로 이해해야 한다. 그래프 개요는 그림에 주어졌다. 하나씩 해보
자.

p
(1) r = 1은 직교좌표를 사용하면 x2 + y2 = 1로 쓰인다. 양변을 제곱하면 x2 +
y2 = 1이다. 우리는 이 식은 중심이 원점이고 반지름이 1인 원이라는 것을 안다.
그것을 모른다고 해도 각도 θ 를 0에서 2π로 돌려가면서 r = 1을 찍으면 반지름이
1인 원이 된다는 것으로도 원이라는 것을 알 수 있다.
72 8 Polar coordinates in R2

(2) cos θ 는 음수의 값을 가지기 때문에 r = cos θ 라고 쓸 때는 r이 음수 값을


가지는 것도 고려한다. 이제 r = cos θ 에 r을 곱하면 r2 = r cos θ 을 얻고 다시 직교
좌표로 나타내면 x2 + y2 = x를 얻는다. 이를 다시쓰면 x2 − x + 14 + y2 = 14 가 되고
정리하면 (x − 0.5)2 + y2 = 0.52 이 된다. 즉, 중심이 (0.5, 0)이고 반지름이 0.5인
원이다. 극좌표 공간에서의 그래프는 cosine 함수인데 2π 구간을 넘어가면 다시
반복되므로 2π 구간만 고려하면 된다. 이 구간이 원을 두 번 돈다. θ 가 0에서 π
가지 움직이면 벌써 하나의 원이 된다. 왜 그런지 잘 따져 보자.
(3) 2배각 공식을 사용하면 r = cos2 θ − sin2 θ 를 얻고 양변에 r2 을 곱하고 변
환 공식을 사용하면 (x2 + y2 )3/2 = x2 − y2 을 얻는다. 양변을 제곱하여 다시쓰면
x6 + 3x4 y2 + 3x2 y4 + y6 = x4 − 2x2 y2 + y4 이 된다. 문제는 이 식이 만족하는 curve
는 모르겠다. 반면에 극좌표 에서의 그래프는 그림과 같이 단순히 cosine 그래
프이다. 그런데 위의 그래프를 생각하면 홀쭉해진 원을 네번 만드는데 이번에는
겹쳐진 것이 없어서 4잎 클로바가 된다.
(4) 이 경우는 극좌표에서의 그래프는 오히려 복잡해서 손으로 그리기 힘들지
만 직교 좌표로 고쳐쓰면 직선 y = x + 2을 쉽게 얻는다. ⊔

Exercises

1. 다음 직교 좌표로 주어진 점을 √ 극좌표로 바꾸시오. √


(1) r = (1, 1) (2) r = (−1, 3) (3) r = (−2 3, −2) (4) r = (0, −2)
2. 다음 극좌표로 주어진 점을 직교좌표로 바꾸시오.
π √ π π
(1) r̃ = (2, ) (2) r̃ = (4, π) (3) r̃ = (2 3, ) (4) r̃ = (0, )
2 6 4
3. 다음 극좌표식으로 주어진 curve의 개요를 그리시오.
(1) r = 1 − cos θ (2) r = 1 − sin θ (3) r2 = sin θ (4) r2 = 4 cos θ
4. 다음은 타원의 식이다. 중점, 촛점, eccentricity를 계산하시오.
(1) 16x2 + 25y2 = 400 (2) 9x2 − 18x + 10y2 = 44 (3) 6x2 + 9y2 − 18y = 45
5. 위에 주어진 타원 궤도를 극좌표를 사용해서 나타내시오.
6. 다음 주어진 극좌표로 주어진 곡선의 식을 직교좌표로 나타내고 곡선의 개요
1 20 5
를 그리시오. (1) r = (2) r = (3) r = (4)
1 + cos θ 10 − 5 cos θ 1 + 2 sin θ
5
r=
1 − 0.5 cos θ
7. Directrix가 x = 5, eccentricity가 e = 0.5, 촛점은 원점인 타원의 식을 구하시오.
8. 식 (8.6)을 이용해서 공전 주기가 24시간인 인공위성의 지구 중심으로 부터의
거리를 구하시오. (중력 공식 등 필요한 자료는 인터넷 등에서 찾을 것.)
Lecture 9
Differential Equations

많은 물리량이 함수의 미분으로 주어지고 물리 법칙은 이들의 관계식으로 주어진


다. 이러한 이유로 중요한 현상을 설명하는 미분 방정식이 자주 등장한다. 간단한
미분방정식의 해를 찾는 작업이 이번 강의의 주제이다.

9.1 First order differential equations

독립 변수를 t로 할 수도 있고 x로 할 수도 있다. 우리는 시간을 독립 변수로 자주


사용하지만 그렇지 않은 경우도 많다는 것을 강조하기위해 우선 x를 독립변수로
하자. 종속 변수를 f 로 적고 미분방정식의 해를 f (x)로 표기 해도 좋지만 미분방
정식 이론에선 자주 y를 구해야할 종속변수로 적는다. 그러면 y는 implicitly x에
대한 함수가 된다, 즉 y = y(x). 이러한 표기에서 x, y 는 좌표가 아니라 일반적인
변수일 뿐이다. 가장 일반적인 1차 미분 방정식 (first order differential equation)은
다음과 같이 쓸 수 있다.

y′ = f (x, y), y(x0 ) = y0 . (9.1)

(문자 f 를 여기에 사용한다.) 이 표기에서 첫 번째 관계식 y′ = f (x, y)이 미분 방


정식이다. 1차 미분만 포함되므로 1차 미분 방정식이라고 한다. 두 번째 관계식
y(x0 ) = y0 는 초기 조건을 말한다. 이 경우 x0 는 초기 순간으로 간주되고 y0 는 초기
순간의 함수 y가 가지는 값이다. Leibnitz 표기법을 쓰면 다음과 같이 쓸 수 있다:
dy
= f (x, y), y(x0 ) = y0 . (9.2)
dx
이 표기법이 조금 더 친절하다. y는 x의 함수이고 y를 변수 x로 미분한다고 명시적
으로 말하고 있다. 만약 f 가 x 만의 함수라면, i.e., y′ = f (x), y는 f (x)의 antideriva-
tive이다. f = f (y)이어도 쉽게 풀 수 있다. 우변에 x와 y가 모두 있는 경우를 풀어
야 한다.
1차미분방정식을 풀면 하나의 일반 상수가 나타나며 초기 조건이 이를 결정한
다. 쉬운 예를 통해 이를 확인해 보자.

Problem 9.1 (Easy example). 다음의 1차 미분 방정식의 해를 구하시오;

y′ = 3x + 2, y(1) = 1.

73
74 9 Differential Equations

Solution 9.1 f 가 x만의 함수일 경우다. 부정 적분을 하면


3
Z Z
y= y′ dx = (3x + 2)dx = x2 + 2x +C
2

을 얻는다. 초기 조건으로 인해 y(1) = 32 + 2 +C = 72 +C = 1이므로, 상수는 C =


− 52 . 따라서 해는 y = 23 x2 + 2x − 25 이 된다. ⊔

위의 문제는 간단한 경우고 일반적으로 미분 방정식을 푸는 것은 까다롭다. 그


러나 주어진 함수가 해인지 아닌지를 확인하는 것은 그에 비해서 쉽다.
C
Problem 9.2 (해인지 아닌지 확인하기). (1) 모든 상수 C에 대해서 y = + 2이
x
dy 1 1 x
미분 방정식 = (2 − y)의 해가 됨을 보이시오. (2) y = (1 + x) − e 이 미분
dx x 3

방정식 y = y − x, y(0) = 23 의 해가 됨을 보이시오.

Solution 9.2 (1) 초기값이 주어지지 않았기 때문에 많은 해가 있다. 이들을 포함


하기 위해서 해에는 일반 상수 C가 포함되어 있다. 일단 y = Cx−1 + 2라고 쓰자.
미분을 하면 y′ = −Cx−2 이다. 방정식의 우변에 y = Cx−1 + 2를 대입하면,
1 1 C C
(2 − y) = (− ) = − 2 .
x x x x
좌측과 우측이 동일하며 해가 된다.
1 1
(2) y = (1+x)− ex 을 미분하면 y′ = 1− ex 이 되고 우측 항을 계산하면 y−x =
3 3
1 x
1 − e 이 된다. 따라서 미분 방정식을 만족한다. 뿐만 아니라 초기 조건도 만족
3
한다: y(0) = 1 − 13 e0 = 23 . 따라서 초기치 문제의 해가된다. ⊔⊓

1차 미분 방정식 (9.1) 또는 (9.2)는 매우 일반적인 형태로 쓰였으며 많은 경우


명시적으로 풀 수 없다. 그러나 우리는 xy 평면에 기울기 필드를 만들어서 무슨
일이 일어나고 있는지 살펴볼 수 있다. 원리는 간단하다. 점 (x, y) 기울기가 f (x, y)
인 작은 선분을 그리면 된다. 그러면 해는 y′ = f (x, y)을 만족 하니까 만약 해 y(x)
의 그래프가 점 (x, y)를 지나면 해의 그래프는 이 작은 선분에 접하게 된다. 이러한
선분들의 집합을 slope field라고 부른다.

Problem 9.3 (Slope field). 미분 방정식 y′ = f (x, y)가 다음 함수들로 주어 졌을 때


slope field를 영역 [−2, 2] × [−2, 2] 위에서 그리시오.
2xy
(1) f (x, y) = . (2) f (x, y) = y − x2 .
1 + x2
Solution 9.3 MATLAB을 사용하여 주어진 함수 f (x, y)의 slope field를 그려보자.
아래에 그림과 계산 code가 주어졌다. 이러한 작은 코드를 만드는 연습을 하면
좋다. ⊔ ⊓

- MATLAB CODE -
9.1 First order differential equations 75

%% parameters
L=2.1;
dx=0.2;dy=0.2;
%% variables
[x,y] = meshgrid(-L:dx:L,-L:dy:L);
[NX,NY]=size(x);
%% computation
Y=(2*x.*y./(1+x.*x));
X=ones(NX,NY);
NRM=(Y.ˆ2+X.ˆ2).ˆ0.5;
X=dx*X./NRM; % normalize to the size of dx
Y=dx*Y./NRM;
quiver(x,y,X,Y);
axis([-2 2 -2 2]);
title(’f(x,y)=2xy/(1+xˆ2)’);

Problem 9.4. 초기 조건이 y(0) = 1일 때 문제 (9.3)의 두 경우에 대한 솔루션 그래


프의 개요를 위의 slope field 그림에 직접 그려 보시오.

Solution 9.4 초기 조건이 y(x0 ) = y0 라는 말은 해의 그래프가 점 (x0 , y0 )를 지난다


는 말이다. 따라서 이 점에서 시작하여 각 line segement에 접하는 곡선을 그리면
된다. ⊔ ⊓

다음의 미분 방정식을 풀어보자.

y′ = ky, y(0) = y0 .

이 문제는 f = f (y)인 경우이다. 첫 번째 방법은 기억력을 이용한다. 미분해서


자기 자신이 되는 함수는 ex 이다. 그런데 자기 자신이 아니라 자기 자신에게 k을
곱하게 되는 것은 ekx 라는 것을 생각해 내면 좋다. 그런데 이 하나만 있는 것이 아
니라 general constant C를 곱한 y = Cekx 라는 것을 생각해 내기는 조금 더 어렵다.
76 9 Differential Equations

(더하지 않고 곱했다.) 일단 이러한 일반 해를 구했으면 y(0) = Cek0 = C 이므로


초기치를 사용하여 C = y0 를 얻는다. 따라서 해는 다음과 같다:

y = y0 ekx .

그러나 이렇게 경험적으로 문제를 풀기에는 너무 제한적이다. 우리는 체계적으


로 문제를 풀 방법이 필요하다. 모든 미분 방정식을 풀진 못하겠지만 특정 종류의
미분 방정식은 풀 수 있다. 그리고 풀 수 있는 미분방정식이 어떤 것인지 기억해야
한다.

9.2 Separation of variables

f (x, y) = 2kxy인 경우에 separation of variables라고 불리는 변수분리 기법을 사


용해서 해를 구해보자. 일단 Leibnitz notation을 사용하여 나타낸다.
dy
= 2kxy.
dx
이제 x와 y를 분리한다. dx와 dy도 각각 x 그룹과 y그룹에 들어가게 한다. 그러면
dy
= 2kxdx
y

를 얻는다. 양변을 적분하면 다음을 얻는다:


dy
Z Z
= 2kxdx ⇒ ln |y| +C1 = kx2 +C2 ⇒ ln |y| = kx2 +C.
y

위에서 C2 −C1 은 어차피 하나의 일반 상수로 볼 수 있으므로 C로 치환했다. 양변


에 자연로그 ln y의 역함수인 exponential function을 취하면

eln |y| = |y|, ekx+C = eC ekx .

따라서
|y| = eC ekx ⇒ y = Cekx . (9.3)
여기에 초기치를 사용하면 y = y0 된다. (9.3)에서 ekx 가
|y|는 y로 동시에 eC 가 C로
바뀐 것에 주목하자. 일반 상수 C가 음수일 때도 eC 는 양수이다. 따라서 |y| = eC ekx
는 맞는 표현이다. eC 대신에 새로운 일반 상수 C를 썼으면 |y|는 y로 바뀌어서 부
호를 맞추어야 한다.
dy
Question 9.1. 그런데 이런 식으로 해도
R
되나? dx 는 y를 x로 미분하라는 똣인데
양변에 dx를 곱하고 거기에 적분기호 를 붙여서 좌항은 y로 적분하고 우항은 x
로 적분하고. 그렇게 해도 되나?
9.3 Integrating factor 77

변수분리 기법의 배경에는 chain rule이 있다. 이를 설명해 보자. 만약 f (x, y)가
다음과 같이 둘로 나누어 지면,

y′ = f (x, y) = g(x)h(y),

다음과 같이 쓸 수 있다:
1 ′
y = g(x).
h(y)
이제 G′ (x) = g(x)와 H ′ (y) = 1
h(y) 가 되는 G와 H를 찾으면 된다. 그러면 chain rule
에 의해서 = d
H ′ (y)y′ 이
된다. Fundamental Theorem of Calculus를 적용해
dx H(y)
서 양변을 x에 대해 적분하면
1 ′
Z Z
y dx = g(x)dx ⇒ H(y) = G(x) +C
h(y)

을 얻는다. 해 y는 위의 식에 의해 implicit 하게 주어졌다. 만약 H의 역함수가 존


재하면 y = H −1 (G(x) +C)로 주어진다.

Problem 9.5. 다음 미분 방정식의 일반해를 구하시오.


(1) y′ = (1 + y)ex (2) y(x + 1)y′ = x(y2 + 1)

Solution 9.5 초기 조건이 없으니 일반상수 C를 포함하는 해를 찾는다. ⊔


9.3 Integrating factor

1차 선형 방정식은 a(x)y′ + b(x)y = c(x)과 같은 꼴이다. a(x) ̸= 0인 구간에서는


a(x)로 나누어서 다음과 같은 꼴로 만든다:

y′ + P(x)y = Q(x). (9.4)

P(x)가 0차 항의 계수이고 Q(x)는 inhomogeneous 항이라고 한다. 만약 Q(x) = 0


이면 (9.4)을 homogeneous problem이라고 부른다. Q(x)를 좌측에 쓴후 우측에는
0을 넣어도 좋지만 대부분 그렇게 하지 않고 오른쪽에 쓴다.
1차 선형 방정식은 integrating factor기법을 사용하면 풀 수 있다. 만약 P(x)가
적분 가능하면 1차 선형 방정식 (9.4)의 integrating factor는 다음과 같다:
R
P(x)dx
I(x) = e . (Integrating factor)

반듯히 기억해야 한다. integrating factor의 유용성은 그 미분을 보면 알 수 있다:


R
I ′ (x) = P(x)e P(x)dx
= P(x)I(x).

이제 위의 방정식에 integrating factor를 곱하면 좋은 일이 벌어진다:


78 9 Differential Equations
Z
Iy′ + IPy = IQ ⇒ = Iy′ + I ′ y = IQ ⇒ (Iy)′ = IQ ⇒ Iy = IQdx.

따라서 IQ도 적분 가능하면 해는 다음과 같다.


1
Z R Z R
y= I(x)Q(x)dx = e− P(x)dx
e P(x)dx
Q(x)dx.
I(x)

예를 들어 P와 Q가 연속 함수이면 적분이 가능하고 1차 선형 방정식 (9.4)의 해는


위의 적분식으로 주어진다.

Problem 9.6. 다음 미분 방정식의 해와 해의 존재 구간을 정하시오.


(1) xy′ = x3 + 3y. (2) y′ = x − 3y/2.

Solution 9.6 (1) 일단 (9.4)의 꼴로 다시 쓰면 y′ − 3x y = x2 이다. P(x) = − 3x 인 경


우이다. x = 0이 포함되면 적분이 가능하지 않다. 해를 구하는 공간은 x > 0 또는
x < 0로 나우어진다. x > 0인 구간에서만 해를 찾자. 그러면 integrating factor는

− 3x dx
R
I=e = e−3 ln x = x−3

이다. (Integrating factor를 구할 때는 일반상수 C는 따라오지 않는다. 적분에 도움


이 되는 integrating factor가 하나면 충분하기 때문이다.) 따라서
Z
y = x3 x−3 x2 dx = x3 (ln x +C).

(2)도 비슷하게 한다. ⊔


Problem 9.7. 밑변이 지름이 10미터인 원형 물 탱크에 초당 50리터로 그림과 같이


물이 유입되고 있다. 물의 높이가 y 미터일 때 탱크 아래에서 초당 10×y 리터의
물이 빠진다. 물의 높이에 대한 1차 미분방정식을 구하고 해를 구하시오. 물의
유입은 시간t = 0에서 시작 되었고 그 때 탱크에 물은 없었다.

Solution 9.7
1 1
ẏ + y= , y(0) = 0.
10000 2000

9.4 Second Order Differential Equations

이제는 2차 선형 방정식의 해를 구한다. 2차 선형방정식은 다음과 같이 쓸수 있다.

y′′ + a(x)y′ + b(x)y = Q(x).

2차식을 푼다는 것은 적분을 2번 하는 것에 해당하고 따라서 2개의 general con-


stant가 등장한다. 이를 정하기 위해서는 다음과 같은 2개의 조건이 필요하다:
9.5 Equation for two-body problem 79

y(x0 ) = y0 , y′ (x0 ) = y1 .

2차 방정식은 1차 방정식에 비해 해를 구하기가 힘들다. 특수한 경우에만 풀린


다. 이번 강의에서 우리는 a, b, Q가 모두 상수인 경우에 한해 해를 구한다. 천체의
궤도 방정식이 이러한 꼴로 주어진다.

9.5 Equation for two-body problem

두 천체, 가령 태양과 지구의 궤적을 구하기 위해 우리가 풀어야 하는 미분 방정


식은 다음과 같다:
u′′ + u = K. (9.5)
이 방정식을 얻는 것이 Lecture 11의 주요 목표이다. 우측의 K는 상수로 K =
(m1 + m2 )G
로 주어진다. m1 과 m2 는 두 천체의 질량이고, G는 중력상수, L은 an-
L2
gular momentum으로 이들은 다 상수이다. x1 (t)와 x2 (t)를 두 천체의 시간 t에서의
위치라고 하면 u는 두 천체 사이의 거리 r = ∥x1 − x2 ∥의 역수이다. 그러나 (9.5)의
미분은 시간변수 t에 대한 미분이 아니라 극좌표의 각도변수 θ 에 대한 미분이다.
계수가 상수인 2차 선형 미분방정식의 해를 구하는 방법은 Appendix A에 자세히
설명 되어있다.
2차 미분방정식 (9.5)는 2개의 초기치가 필요하면 그 해는

(m1 + m2 )G
u = (1 + e cos(θ − θ0 ))K, K=
L2
로 주어진다. 여기서 θ0 는 초기 각도이고 e는 이심율 eccentricity이다. (사람들은
이심률을 자연상수 e와 동일한 문자를 쓰는 것은 전통이며 문맥을 통해 구별한
다.) 이 둘은 두개의 초기치에 의해 결정 된다.

Remark 9.1. 행성의 궤도를 정하기 위한 자연스러운 초기 조건은 초기 시간에서


의 두 행성의 위치와 속도이다. 그러나 u는 각도 θ 에 대한 함수이고 따라서 초기
순간에 해당하는 각도 θ0 를 알아야 초기 조건을 찾을 수 있다. 그러나 초기 각도를
찾는 것은 오히려 해를 찾은 이후에나 가능하다. 해의 모양을 알았으니 초기 조건
에 의해 주어지지만 보존되는 에너지를 이용해서 해를 표현하는 방법을 찾아야
한다. Lecture 12에서 그 작업을 한다.

Exercises

1. 다음 미분방정식의 일반해를 구하시오.


(1) xy′ = y2 x2 (2) x−1 y′ = y sin x (3) xy′ − 2y = x3 sin x cos x
2. 다음 미분방정식의 일반해와 해의 구간을 구하시오.
(1) y′ = x−1 ex − xy (2) x2 y′ = xy − ex (3) x3 y′ + dx2 y = cos x
80 9 Differential Equations

3. 다음 미분방정식의 일반해를 구하시오.


(1) (2) (3)
Lecture 10
Newton’s law on Earth

10.1 Newton’s law of motion and gravitation

뉴턴의 세 개의 운동 법칙은 다음과 같다.


1. 관성의 법칙: 외력이 없으면 물체는 일정한 속도로 움직인다.
2. 힘의 법칙: 힘은 질량과 가속도의 곱이다(F = ma).
3. 작용-반작용의 법칙: 힘이 가해지면 반발력은 크기는 같고 방향은 반대이다.
첫 번째 법칙은 Galileo의 관성 법칙으로 입자가 등속으로 움직일 때를 말하며
a = 0에 해당하는 두 번째 법칙의 특수한 경우이다.
뉴턴의 만유인력 법칙에 따르면 두 물체 사이에 작용하는 중력은 거리의 제곱
에 반비례하고 두 질량의 곱에 비례한다. m1 과 m2 를 두 물체의 질량이라고 하고
x1 및 x2 를 두 물체의 위치벡터라고 하자. 그러면 물체 m1 에 가해지는 중력은
m1 m2 r m1 m2
Fm1 = −G 2
= −G 2 er (10.1)
r r r
이다. 위 식에서 G는 gravity constant (중력상수)로 불리고 그 값은 G ∼= 6.674 ×
10−11 m2 /kg s이다. r은 두 물체 사이의 거리, r은 두 물체의 위치 차이 벡터이다.
즉,
r
r = x1 − x2 , r = ∥r∥, er = . (10.2)
r
r은 물체 m2 에서 물체m1 을가리키는 위치 벡터이다. 따라서 m2 에있는 관찰자가
바라보는 m1 의 움직임이 r(t)이다. 우리는 앞으로 m2 를 태양과 같은 큰 물체로,
m1 을 지구와 같은 작은 물체로 간주한다. 관계식 (10.2)에서 시간 매개변수 t ∈ R
에 대한 r(t)의 궤적은 m2 를 원점에 두고 그 시점에서 본 것이다. 다음 장에서 그
궤적이 타원 궤도임을 볼 것이다. 그러나 실제는 m2 도 약간 움직이고 따라서 m1
의 움직임은 타원에서 m2 가 움직인 만큼 약간만 벗어난 궤도이다. 움직이지 않는
것은 (또는 등속 운동을 하는 것은) 태양이 아니라 태양과 지구 두 천체의 무게
중심이다.

81
82 10 Newton’s law on Earth

벡터 rr 은 단위 벡터이고 방향은 x2 에서 x1 을 향한다. 이 것은 x2 를 원점으로 삼


았을 경우에 Lecture 8의 극좌표계의 단위 벡터 er 과 일치한다는 것을 기억하자.

10.2 Work and energy

물체가 힘 F를 받아서 길이 ℓ만큼 이동 했을 때 일(work)의 크기 W는 다음과 같이


주어진다:
W = f ℓ (일=힘의 이동 방향 성분×이동거리). (10.3)
여기서 f 는 힘 F의 물체가 이동하는 방향의 성분을 말한다. 만약 힘 F가 이동
방향과 직각을 이룬다면 f = 0이고 힘 F가 한 일은 없다. 예를 들어서 행성이나
위성이 원형 궤도를 돌고 있다면 작용하는 힘인 중력과 이동 방향은 수직을 이루
어서 일은 W = 0 이다.

Question 10.1. 왜 일은 힘과 이동거리의 곱인가?

일은 에너지 인가? (10.3)은 일의 정의인가? 만약 일이 에너지라면 (10.3)은 일


의 정의가 아니고 에너지를 계산하는 공식이어야 한다. 어떤 책에서는 (10.3)을
일의 정의라고 말한다. 만약 그 것이 정의라면 일과 에너지가 서로 어떤 관계인
지 따로 보여야 한다. 실제 둘은 동일하며 설명해야 할 것은 (10.3)을 이용하여
계산하면 에너지를 옳게 계산한다는 것이다. 그러면 옳게 계산한다는 것은 무슨
말이지? 기존의 에너지 개념과 상충되지 않는다는 말이다. 다시말해 이렇게 구한
에너지가 기존의 위치 에너지와 운동에너지 등과 어울어져서 에너지 보존법칙을
만족한다는 것을 확인해야 한다. 사실 일의 공식 (10.3)은 위치 에너지를 계산하는
공식으로 이해할 수 있다.
증명은 하지 말고 단순히 예를 통해서 에너지와 일이 어떻게 연결 되는 지를
살펴 보자. 1차원 공간에서 질량이 m인 물체가 힘 f = ma를 시간 t 동안 받았다고
하자. 그러면 가속도는 a이고 만약 정지상태에서 시작 했다면 t 시간 후의 속도
는 v = at이다. 따라서 그 당시의 운동 에너지는 Ek = 12 ma2t 2 이다. 그러면 이동
거리는 얼마인가? 이동 거리는 속도를 적분하면 된다. 즉,
Z t t
1 1
ℓ= as ds = as2 = at 2 .
0 2 0 2

따라서 (10.3)를 이용해서 일을 계산하면 W = f ℓ = ma × 12 at 2 = 21 ma2t 2 으로 운


동에너지와 같다. 즉, 에너지를 (10.3)으로 계산해도 된다. 실제 (10.3)은 에너지
계산의 파라미터를 시간에서 거리(arc-length)로 바꾼 것이고 따라서 위치에너지
를 계산하는데 적합하다.
만약 힘이 상수가 아니라 함수라면 어떻게 될까? 만약 시간에 대한 함수라면
가속도가 시간에R따라 바뀌는 것이고 따라서 속도는 가속도의 적분이 될 것이다,
즉 v(t) = v(0) + 0t a(s)ds. 따라서 운동 에너지는 쉽게 계산 할 수 있다. 만약 힘이
위치에 대한 함수이면 일의 공식 (10.3)을 이용하여 적분을 하면 된다. 실제 중력
(10.1)은 위치 (또는 거리)에 대한 함수이고 이 경우에는 공식 (10.3)이 운동에너
지 공식보다 더 유용하다. 가령 물체가 x축 위를 움직이고 힘의 x 방향 성분이 x에
10.3 Gravity force and potential energy 83

대한 함수 이면, 즉 f = f (x) 이면, 물체가 x = a에서 x = a + ℓ로 움직일 때의 일은


다음과 같이 계산된다: Z a+ℓ
W= f (x)dx. (10.4)
a
힘 f 가 상수 함수이면 (10.3)과 (10.4)는 동일하다.

10.3 Gravity force and potential energy

행성의 운동 에너지는 위치 에너지와 서로 교환 되면서 가속과 감속을 반복하게


된다. 질량이 m1 인 물체가 v의 속도로 움직일 때 운동 에너지는 다음과 같다:
1
Ek = m1 ∥v∥2 .
2
아래 문제는 지구 표면에서 중력에 의한 위치 에너지도 중력과 거리의 곱으로
나타내 진다는 것을 보여준다.

Problem 10.1 (Gravity on the earth surface). 지구 표면에서 질량이 m1 인 물체가


받는 중력은 −m1 gk이다. 여기서 g = 9.8m/sec2 는 중력 가속도이고 k는 지구 표
면에 수직인 방향의 단위 벡터이다. 지표면에서 높이가 h > 0인 위치에 이 물체가
놓여 있다면 물체의 위치 에너지는

E p = m1 gh (10.5)

이다. 다음에 답하시오.


(1) gravity constant g의 크기를 관계식 (10.1)을 써서 확인하시오.
(2) 위치 에너지 (10.5)을 work 개념을 써서 설명하시오.
(3) 위치 에너지 (10.5)의 의미를 설명하시오.

Solution 10.1 (1) 질량 m은 m1 에 해당하고 벡터 k는 r/r에 해당한다. 따라서 나


머지 부분이 상수 g에 해당 하며

g = Gm2 /R2 ∼
= 9.8m/sec2

에 해당한다. 여기서 m2 는 지구의 질량이고 R은 지구의 반지름이다. 인터넷 등에


서 이 값을 찾아서 g를 확인할 수 있다.
(2) 일(work)은 위치 에너지를 계산하는 방법이다. 물체가 움직이는 방향의 힘
F의 성분 fz 가 일정하다면 일은 fz h로 주어진다. 여기서 h은 (수직)이동 거리이다.
따라서 위치 에너지는 E p = m1 gh이다.
(3) 지구 표면에서 물체를 현재 위치로 밀어내는 데 필요한 에너지가 위치 에
너지 이다. 또는 그 위치에서 지구 표면으로 떨어졌을 때 중력이 한 일의 양이다.


84 10 Newton’s law on Earth

Problem 10.2. 지상에서 수직 방향으로 중력의 2배의 힘으로 질량 2Kg의 물체를


t 초 동안 동안 쏘아 올렸다. 그 순간의 운동에너지와 위치 에너지를 계산하시오.

Solution 10.2 중력의 2배의 힘이면 2mg = 4Kg중 Rt


이다. 가속도는 지구의 중력
을 빼야 하니까 g이다. 따라서 t 초 후의 속력은 0 gds = gt이다. 따라서 운동에
너지는 12 mv2 = g2t 2 Kg이다. 움직인 거리는 0t gsds = 12 gt 2 이므로 위치에너지는
R

E p = mgh = (2Kg)g 12 gt 2 = g2t 2 Kg이다. 총 에너지는 g2t 2 Kg + g2t 2 Kg = 2g2t 2 Kg


이다. 물론 각각 계산하지 않고도 (10.3)을 이용해서 총 에너지를 계산할 수 있다.
그러면 4gKg × 12 gt 2 = 2g2t 2 Kg이다. 만약 100초후의 총 에너지를 단위를 사용하
여 나타내면 g = 9.8m/sed 2 이니까 총 에너지는 다음과 같다:

Etotal = 2(9.8)2 m2 /sec4 × (100)2 sec2 Kg = 1.9208 × 106 m2 Kg/sec2 .


지구의 표면이 아니라 행성 간의 중력이나 행성과 별 사이의 중력으로 인한


위치 에너지는 어떻게 계산해야 하나. 이 경우 중력을 상수로 간주할 수 없다. 중
력은 거리에 대한 함수가 되고 이를 적분하여 에너지를 계산해야 한다. 그러나
근본적인 문제가 하나 더 있다. 지구 표면에서의 위치 에너지는 지구 표면이 기
준이 되서 물체가 지구 표면에 있으면 0으로 정의했다. 행성간의 위치 에너지는
무엇이 기준이 되어야 하나?

Problem 10.3 (지구 표면을 기준으로 한 위치에너지). 중력은 뉴턴의 중력 법칙


(10.1)에 의해 주어진 두 물체 사이의 거리 r의 함수이다. 지구의 질량을 m2 라고
하자. 지구 중심(지구 표면이 아님)에서 거리 r > 0에 위치한 질량 m1 인 물체의
위치 에너지는
E p = Gm1 m2 (R−1 − r−1 ) (10.6)
로 표시됨을 보여라. 여기서 R은 지구의 반지름이고 r은 물체의 중심과 지구 사이
의 거리이다.

Solution 10.3 먼저 물체가 지구 중심을 따라 위 아래로 움직인다고 가정한다.


중력의 k 성분은 f = −Gm1 m2 s−2 로 주어진다. 여기서 s는 지구 중심까지의 거리
이다. 지표면에서 물체를 밀어내기 위해 반대 방향으로 힘을 가한다고 생각하자.
중력을 적분하면 r > R에 대해 다음을 얻는다:
Z r r
Gm1 m2 s−2 ds = −Gm1 m2 s−1 = Gm1 m2 (R−1 − r−1 ).
R R

이것은 (10.6)과 일치한다. h를 표면으로부터의 거리라고 하자. 그러면 r = R + h


가 된다. 따라서 위치 에너지는
1 1  R+h−R h R2
E p = Gm1 m2 − = Gm1 m2 = Gm1 m2 2 2
R R+h R(R + h) R R + Rh

R2 ∼
이 된다. 만약 h가 R에 비해 매우 작다면 R2 +Rh
= 1이고 위치에너지를 다시 쓰면
10.4 Projectile motion 85

h Gm2
Ep ∼
= Gm1 m2 2 = m1 2 h,
R R
즉, 위치 에너지 (10.6)는 옳은 근사이다. (지구의 반경은 R = 6371km이다. h =
2
10km이면 R2R+Rh ∼
= 0.9984이다. 약 0.16%의 차이가 있다.) ⊔

h
Remark 10.1 (잠간만). h는 R에 비해 매우 작으므로 R(R+h) ∼ h2 라고 할 수 있다.
= R
그러나 분자의 h는 남겨 놓았다. 작다고 다 지우면 안된다. 무엇을 보고자 하느냐
에 따라 다르고 주변에 있는 것들에 따라 지워도 되는 작은 것과 지우면 안되는
작은 것을 구분 할 수 있어야 한다.

Question 10.2. 위치 에너지 (10.6)는 지구 표면에서 0이 된다. 이 정의는 지구 표


면을 기준으로 한 위치에너지이다. 위치 에너지를 지구의 중심을 기준으로 계산
하면 어떻게 될까?

위치 에너지를 지구 중심에서 계산하면 R = 0의 경우에 해당한다. 그러면 (10.6)


의 위치 에너지는 발산한다, i.e.,

lim Gm1 m2 (R−1 − r−1 ) = ∞.


R→0

이것은 지구 중심에서 부터 측정하면 위치 에너지가 무한하다는 것을 의미한다.


그것은 만약 지구의 질량이 한 점에 응축되어 있으면 이 중심에서 벗어나기 위해
서는 무한한 양의 에너지가 필요하다는 뜻이다. 즉, 지구의 중심에 있는 물체는
밖으로 꺼낼수 없다. (질량이 작은 물체라도 아주 작게 뭉칠 수 있다면 거기서
아무것도 빠져 나올 수 없다.)
만약에 위치에너지를 질량 중심에서 부터 잴 수 없다면 다음으로 자연스러운
방법은 ∞ 에서 부터 재는 것이다. 즉 R = ∞일 경우로 이 경우 위치 에너지는 다음
과 같다.
Gm1 m2
Ep = − . (Potential Energy)
r
이 경우 단점은 위치 에너지가 음수라는 점이다. 위치 에너지가 가장 큰 값을 갖는
경우인 무한대의 거리에서는 위치 에너지가 0이고 지구와 가까와 지면서 점점 작
아지고 지구의 중심에 도달하면 음의 무한대가 된다. 그러나 다른 선택보다는 이
선택이 가장 좋다. 행성간의 움직임을 고려할 때는 위치 에너지의 기준점은 r = ∞
이고 위치에너지는 음수이고 r = ∞에서 0이다. 지구 표면에서의 중력에 의한 움
직임을 고려할 때는 기준점은 지표이고 위치에너지는 양수이며 h = 0일때 최소값
0을 가진다.

10.4 Projectile motion

한 발사체가 각도 φ ∈ (0, π2 )와 초기 속력 (speed) v0 > 0로 지면에서 발사되었을


때 그 발사체의 궤적을 찾아보자. 발사체가 다시 땅에 닿기 전의 최대 높이, 움직인
거리 및 체공시간을 찾는 것이 목적이다. 공기 저항은 없다고 가정한다.
86 10 Newton’s law on Earth

발사체는 xz-평면에서 움직인다고 가정하고 궤적 r(t)를 찾아보자. 시작점은 원


점, r(0) = 0이고 초기 속도는 v(0) = (v0 cos φ , v0 sin φ )이다. 가속도 a는 중력에
의해 주어지므로 a(t) = (0, −g) 이다. 시간이 t 일 때 속도 벡터 v(t)는 가속도의
적분으로 주어진다. 초기 조건을 이용해서 적분하면,
     
v0 cos φ
Z
c1 c1
v(t) = a(t)dt = , v(0) = = .
−gt + c2 c2 v0 sin φ

따라서, v(t) = (v0 cos φ , −gt + v0 sin φ ). 한번 더 적분하여 위치 벡터를 계산하면


     
v0 cos φt + c1 0
Z
c
r(t) = v(t)dt = ⇒ r(0) = 1 =
− 12 gt 2 + v0 sin φt + c2 c2 0

을 얻는다. 따라서 발사체의 궤적은 다음과 같다:


   
x(t) v0 cos φt
r(t) = = .
z(t) − 21 gt 2 + v0 sin φt

z(t) = 0는 발사체가 지표면에 있는 순간을 말한다. 따라서 − 12 gt 2 + v0 sin φt = 0


를 푼다. 솔루션 중 하나는 시작 시간인 t = 0이다. 다른 하나는
2v0 sin φ
T= 체공 시간
g

으로 공중에 있다가 땅에 떨어지는 순간의 시간이다. 체공시간 T 일때의 x 성분


x(T )는 이동 거리이다:

2v20 sin φ cos φ


R = x(T ) = . 이동거리
g

발사체의 최대 높이는 이동 시간이 T 의 절반일 때이며, 따라서

v20 sin2 φ
H = z(T /2) = . 최대 높이
2g

Problem 10.4. 만약에 맞 바람이 시속 v1 의 속도로 불 경우에는 발사체의 궤적이


어떻게 되는지 설명하시오.

Solution 10.4 만약에 공기 저항을 고려하지 않는다면 아무리 강한 맞바람이 불


어도 발사체의 궤적에는 영향을 주지 않는다. 공기 저항을 고려하는 경우에는
위에서 구한 방법으로는 충분하지 않다. ⊔ ⊓

Problem 10.5. 발사 속도가 정해졌을 때 발사체를 가장 멀리 날리는 방법은?

Solution 10.5 만약 발사 각도 φ 가 고정되었다면 최대 거리와 높이는 속도 v20 의


제곱에 비례한다. 비행 시간은 v0 에 비례한다. 속도가 고정되어 있으면 각도 φ 를
선택할 수 있다. 이동 거리는 sin φ cos φ 가 최대값을 가질 때이다. 최대값을 가지는
각도 φ 에서는 미분이 0이므로 미분을 계산하면
10.4 Projectile motion 87

(sin φ cos φ )′ = cos2 φ − sin2 φ = 2 cos2 φ − 1.

따라서 critical point는 cos φ = √1 이고 각도는 φ = π4 이다. ⊔



2

Question 10.3. 다음 글은 야구 잡지에서 가져온 것이다. “우리는 학교에서 ’가장


멀리 공을 보낼 수 있는 각도’가 45도라고 배웠다. 그런데 실제 야구에서는 최적의
발사각도가 30도에 가깝다.” 왜 다를까? (골프공의 최적 각도는 17도 정도다.)

공기 저항과 공의 스핀이 이유이다. 공의 스핀은 야구 배트가 공의 아랫부분을


때리기 때문에 생긴다. 발사각도가 45도이면서 공에 그런 종류의 spin이 있다면
실제 탄도는 최적 탄도보다 훨씬 더 높게 만들어진다. 골프공의 스핀도 공의 아랫
부분을 때리기 때문에 생기는 것이며 야구공에 비해 스핀도 많이 먹고 또한 표면
의 생김새로 인해 스핀의 영향도 더 크다. 물론 공기저항이 없다면 어떤 경우에도
45도가 최적의 발사각도이다.

Exercises

1. 지구 표면에 있는 10Kg의 물체를 위치 에너지를 계산하시오. (R = ∞를 기준으


로 했을 때)
2. 지구와 태양 사이에 작용하는 중력을 계산하시오. 화성과 태양 사이에 작용
하는 중력과 비교 하시오. (필요한 자료는 인터넷에서 구하시오. 가령 지구와
화성의 무게와 태양과의 거리 등.)
3. 목성의 질량은 1.899 × 1027 kg, 반지름은 140, 000km라고 하자. 목성 표면에서
의 중력의 크기를 계산하고 지구표면에서의 중력과 비교 하시오.
4. 10Kg의 철이 10미터깊이의 물에 빠졌다. 중력이 한 일은? (필요한 자료는 인
터넷에서 구하시오. 가령 철의 밀도.)
5. 음속이 340 m/sec라고 하자. 포탄의 발사 속도가 음속일 경우의 때 최대 이동
거리를 구하시오. 이때의 체공시간과 최대 높이를 구하시오.
6. K9 자주포의 최대 사거리는 53Km라고 한다. 발사 속도는?
Lecture 11
Newton’s law in space: Two-body problem

이번 강의의 목적은 뉴턴의 운동법칙과 미분을 사용하여 두 천체 사이의 중력에


의한 궤적을 two-body problem을 통해서 풀고 케플러의 법칙을 확인하는 것이다.
움직임을 다루는 문제로 시간 변수 t에 대한 미분을 고려한다. 이 경우 시간 변수
t에 대한 미분을 공간 변수의 미분과 구별하기 위해 다음 표기법을 사용한다:
d
Ḟ := F = F ′ (t).
dt

11.1 Kepler’s laws

천문학자 Johannes Kepler는 1609년에서 1619년 사이에 태양 주위를 도는 행성의


궤도를 세 가지 법칙으로 설명했다. 이 법칙은 Copernicus의 태양 중심 원형 궤도
이론을 수정하여 타원형 궤도로 대체하고 행성 속도가 어떻게 변하는지 설명한
다. Kepler’s three laws of planetary motion은 다음과 같다.
1. 행성의 궤도는 두 개의 초점 중 하나에 태양이 있는 타원이다.
2. 행성과 태양을 연결하는 선분이 쓸고지나가는 영역은 시간에 불변이다.
3. 행성의 공전 주기의 제곱은 장반경의 세 제곱에 비례한다.
아이작 뉴턴은 케플러의 세개의 법칙이 10.1절에 제시된 뉴턴의 운동 법칙과
중력 법칙의 결과로 생성 된다는 것을 1687년에 보였다. 우리는 이 강의에서 그
과정을 이해하고자 한다.
이 절에서는 앞 절의 표기를 따라간다. 예를 들면 두 천체의 질량이 m1 , m2 이고
위치가 x1 , x2 이다. 위치 차이가 r = x1 − x2 으로 m2 에서 m1 을 바라보는 경우이다.
(m2 가 원점에 있다고 하면, 즉 x2 = 0라고 하면, r = x1 이다.)

Problem 11.1 (Plane motion). (1) 중력 이외에 작용하는 다른 힘이 없다면 다음을


만족하는 constant vector c가 있음을 보이시오;

89
90 11 Newton’s law in space: Two-body problem

r × ṙ = c. (11.1)

(2) 이 관계식의 의미를 설명하시오.

이 문제를 해결하려면 cross product의 성질 4가지를 기억해야 한다.


1. cross product v1 × v2 는 2개의 3차원 벡터 간에 정의된다.
2. cross product v1 × v2 는 v1 와 v2 에 모두 수직인 벡터이다.
3. v1 와 v2 가 서로 평행하거나 둘 중 하나가 0이면 v1 × v2 = 0이다.
4. cross product의 미분은 다음과 같은 곱의 규칙을 만족한다:

d
(v1 × v2 ) = v̇1 × v2 + v1 × v̇2 .
dt

Solution 11.1 (1) 물체 m1 에 적용된 중력은 Fm1 = − Gmr12m2 er 로 주어진다. 따라서


그 방향은 m2 를 향하는 방향이다. 그러면 m1 ẍ1 = Fm1 및 m2 ẍ2 = −Fm1 이므로, ẍ1
및 ẍ2 모두 r 또는 −r의 방향이다. 그러므로,
d
(r × ṙ) = ṙ × ṙ + r × r̈ = 0 + 0 = 0.
dt
따라서 r × ṙ = c가 되는 상수 벡터 c가 존재한다.
(2) 원점을 포함하고 벡터 c에 수직인 평면을 고려하자. 그러면 식 (11.1)은 관
계는 벡터 r이 c와 수직임을 말해준다. 즉, 평면 위에 있음을 의미한다. 즉, 물체
m1 은 이 평면 위에서 움직인다. ⊔⊓

11.2 Two-body problem

우주에서 움직이는 두 개의 물체를 고려하자. m1 및 m2 를 질량으로 하고 x1 (t) 및


x2 (t)를 시간 t에서의 위치로 두자. 둘 사이에서 작용하는 중력 외에는 다른 외부
의 힘이 없다고 가정한다. 그러면 이들은 뉴턴의 힘의 법칙에 의해 주어진 두 개의
2차 미분 방정식을 만족한다, i.e.,

m1 ẍ1 = −G m1 m2 er ,

r2 (11.2)
m2 ẍ2 = G m1 m2 er .
r2
이 문제를 two-body problem이라고 한다. 이 문제를 풀어서 해가 과연 Kepler의
법칙을 만족하는지를 확인해 보자.
참고로 Newton의 3번째 운동법칙인 작용 반작용의 법칙은 이미 미분 방정식
(11.2) 안에 녹아 있다. m1 ẍ1 은 m2 가 m1 을 잡아 당기는 힘이고 그 반작용으로 m1
이 m2 를 잡아 당기는 힘은 m2 ẍ2 이다. 이 둘은 크기는 같고 방향은 반대 이므로
합하면
11.3 Center of mass 91

m1 ẍ1 + m2 ẍ2 = 0
을 얻는다. 작용과 반작용의 힘은 방향은 반대이고 크기는 같다.
(11.2)를 3차원 벡터들의 미분 방정식으로 보아도 되지만 평면위에 있다는 것을
알고 있으니까 2차원 벡터들의 미분 방정식으로 이해 한다. 그러면 사실 총 4개의
스칼라 방정식을 풀어야 한다는 뜻이다. 1차 미분 방정식을 풀려면 1개의 초기 조
건이 있어야 한다. 2차 미분 방정식은 2개가 필요하다. 2개의 2차 미분 방정식을
풀려면 4개의 초기 조건이 필요하다. 즉, 다음이 주어 졌다고 하자:

x1 (0), ẋ1 (0), x2 (0), and ẋ2 (0). (11.3)

즉, 초기 값 4개의 선택의 자유가 있다. 그 만큼 다양한 경우가 가능하다는 뜻도 된


다. 각각이 평면 상의 벡터 이므로 총 8개의 스칼라에 대한 자유도가 있다는 것을
기억하자.

11.3 Center of mass

두 개의 2차 벡터 미분방정식 (11.2)의 해 x1 (t) 및 x2 (t)를 찾기 위해서 단순화


작업을 진행 한다. 먼저 center of mass (질량 중심)를 찾는다. 질량 중심은 전체
질량이 균형을 이루는 위치로 질량에 대한 위치의 가중 평균이다. 다음과 같다:
m1 m2 m1 x1 + m2 x2
R= x1 + x2 = . (Center of Mass)
m1 + m2 m1 + m2 m1 + m2

질량 중심에 대한 2차 미분을 구하면,


m1 ẍ1 + m2 ẍ2
R̈ = = 0.
m1 + m2

다시 말해 질량 중심은 일정한 속도로 움직이다. 따라서 Lecture ??에서 논의한


것 처럼 질량 중심이 원점인 좌표계를 취할 수 있다. 이 좌표계를 center of mass
frame이라고 부른다. 이 질량 중심 frame에서는 다음을 만족한다:

R = Ṙ = R̈ = 0.

이 좌표계 아래서는 (11.3)에 있는 초기치가 다음의 두 조건을 만족해야 한다:

m1 x1 (0) + m2 x2 (0) = 0, m1 ẋ1 (0) + m2 ẋ2 (0) = 0.

여기서 총 4개의 스칼라 자유도가 사용 되었고 이제 4개가 남았다.


92 11 Newton’s law in space: Two-body problem

11.4 Displacement vector

우리가 계산하는 것은 위치 차 벡터 r = x1 − x2 이다. 즉, x2 를 원점에 두고 궤적


을 계산한다는 뜻이다. 마치 태양과 같은 무거운 천체가 원점에 있는 경우처럼
생각하면, x2 = 0, r은 지구의 위치 처럼 고려할 수 있다. 그렇게 놓고 계산하는 것
은 안된다. 정지되어 있는 것은 무게 중심이기 때문이다. 따라서 r이 타원궤도를
만족한다고 해도 실제 m1 의 궤적은 타원에서 약간 벗어나 있다. 얼마 만큼일까?
무게 중심과 x2 의 거리 만큼이다.
그러면 r의 움직임을 고려하자. 일단 Fm2 = −Fm1 이므로 가속도 차는 다음과
같다:
Fm Fm  1 1  m1 + m2
r̈ = ẍ1 − ẍ2 = 1 − 2 = + Fm1 = Fm1 .
m1 m2 m1 m2 m1 m2
뉴턴의 중력법칙을 사용하여 Fm1 를 다시 쓰면,

m1 + m2 m1 m2 1
r̈ = − G 2 er = −G(m1 + m2 ) 2 er .
m1 m2 r r

편이상 k = G(m1 + m2 )라고 두면, 이 방정식은 다음과 같이 쓰인다:

k
r̈ = − er , k = (m1 + m2 )G. (11.4)
r2
이런 종류의 문제를 Kepler problem이라고 부른다. 중력 뿐만 아니라 전기장의
경우에도 똑 같은 문제가 등장한다. 차이벡터 r(t)를 구한 후에는 무게 중심 R(t)
와 벡터 차 r(t)를 사용하여 두 궤적 x1 및 x2 를 구할 수 있다.

Problem 11.2. 다음을 보이시오;


m2 m1
x1 (t) = R(t) + r(t), x2 (t) = R(t) − r(t). (11.5)
m1 + m2 m1 + m2

Solution 11.2 단순 계산이다. R과 r은 다음으로 주어진다.


11.5 Kepler problem 93
m1 m2
R= x1 + x2 , r = x1 − x2 .
m1 + m2 m1 + m2

x1 를 계산하려면 x2 를 소거하면 되니까, x2 = x1 − r 을 대입하면


m1 m2 m2
R= x1 + (x1 − r) = x1 − r
m1 + m2 m1 + m2 m1 + m2

을 얻는다. 정리하면 된다. x2 도 비슷하게 얻는다. ⊔


Remark 11.1. m1 이 m2 에 비해 현격하게 작을 경우에는 (11.4)의 식에서 m1 을 무


시하고 k = m2 G를 사용한다. 지구와 위성과의 관계를 고려하면 위성의 질량은
지구의 질량에 대한 오차 범위에도 훨씬 못미치기 때문에 k = (m1 + m2 )G을 사
용하는 것이 의미가 없어서 m1 = 0로 두어도 좋다. 지구와 태양과의 관계에도
태양의 질량에 대한 오차가 지구의 질량보다 클 수 있어서 k = m2 G를 사용하는
것이 합리적일 수 있다. 실제에도 그렇게 사용한다. 그러나 (11.5)에서는 ∥r∥이 클
경우에는 k = (m1 + m2 )G을 사용하는 것이 차이를 만든다. 지구 궤도를 도는 위성
의 경우에는 거리가 작지만 멀리 떨어진 행성의 경우에는 무시할 수 없는 거리다.

11.5 Kepler problem

Kepler problem (11.4)를 풀자. 문제를 다시 적으면 다음과 같다:

k
r̈ = − er , k = (m1 + m2 )G.
r2
가속도를 사용해 다시 적으면 다음과 같다:
k
a=− er , k = (m1 + m2 )G. (11.6)
r2
Problem 11.3. 식 (8.5)–(8.7)의 관계를 사용하여 벡터 방정식 (11.6)이 다음 두 개
의 scalar 방정식으로 쓰이는 것을 보이시오,

(m1 + m2 )G
r̈ − rθ̇ 2 = − , (11.7)
r2
rθ̈ + 2ṙθ̇ = 0. (11.8)

Solution 11.3 (8.7)를 가져오면,


k
a = (r̈ − rθ̇ 2 )er + (rθ̈ + 2ṙθ̇ )eθ = − er
r2
을 얻는다. er 와 eθ 의 계수를 비교하면 위의 두 관계식을 얻는다. ⊔

위의 두 식은 핵심적인 역할을 한다. (11.8)은 각 운동량 일정의 법칙을 주고


이를 이용해서 (11.7)로 부터 궤도 방정식을 유도한다.
94 11 Newton’s law in space: Two-body problem

Problem 11.4 (Kepler의 제2법칙과 각 운동량 일정의 법칙). (1) 각 운동량 r2 θ̇


가 상수임을 보이시오. (2) 이것이 케플러 제2법칙을 의미 함을 설명하시오. (즉,
r = r(t)이고 θ = θ (t)일 때 태양과 지구를 잇는 선분이 쓸고간 면적의 변화율이
각 운동량임을 확인하시오.)

Solution 11.4 (1) 일단 각운동량 r2 θ̇ 를 미분해 보자. (11.8)을 사용하면 다음을


얻는다:
d 2
(r θ̇ ) = 2rṙθ̇ + r2 θ̈ = r(2ṙθ̇ + rθ̈ ) = 0.
dt
따라서 각운동량 r2 θ̇ 는 상수이다.
(2) 시간 t에서 부터 t + h까지 두 천체를 잇는 선분이 쓸고간 면적은 부체꼴과
비슷한 면적이다. 그런데 반지름의 길이 r(t)가 상수가 아니므로 최대 반지름과
최소 반지름 사이의 어떤 반지름이 있어서 그 면적은 다음과 같다:
1
(θ (t + h) − θ (t))r2 (t ∗ ), t < t ∗ < t + h.
2
여기서 중간치 정리를 사용했다. t ∗ 는 t와 t + h 사이에 있으므로 h → 0일 때 t로
수렴한다. 따라서 순간 변화율은 다음과 같다:

1 θ (t + h) − θ (t) 2 ∗ 1
lim r (t ) = θ̇ (t)r2 (t).
h→0 2 h 2
즉, 두 천체를 잇는 선분이 쓸고 지나가는 면적의 변화율은 각 운동량의 절반인
1 2
2 r θ̇ 이고 각 운동량은 상수이므로 이는 케플러 제2법칙을 의미한다. ⊔

이제 행성 궤도가 만족하는 미분 방정식을 유도하자. 식 (11.7)과 (11.8) 은 r 과


θ 가 종속 변수이고 시간 t가 독립 변수인 두 개의 식이다. 이제 시간 t을 제거하고
거리 r을 종속 변수로 각도 θ 를 독립 변수로 하는 하나의 식을 유도하려고 한다.
이를 위해 이용하는 것은 각속도가 일정하다는 사실을 이용하는데 각속도를 L
이라고 하자:
L := r2 θ̇ .
그러면 θ̇ = L/r2 > 0이다. 즉, 각도 θ 는 시간에 대해 단조 증가 함수이다. 따라
서 시간 변수 t 대신에 각도 θ 를 사용해서 변수 변환을 할 수 있다. Chain rule을
이용하면 시간에 대한 미분은 다음과 같이 각도에 대한 미분으로 바뀐다:
d dθ d d L d
= = θ̇ = 2 .
dt dt dθ dθ r dθ
r에 대한 식이 아니라 r의 역수 u = r−1 에 대한 식이 단순한 형태가 된다. 그래서
우리는 u로 변환한다. 그러면,

du d(r−1 ) dr
= = −r−2
dθ dθ dθ
을 만족한다. 이제 (11.7)의 각 항을 u(θ )에 대한 식으로 바꾸는 작업을 하자. 일단,
첫번째 항 r̈은
11.5 Kepler problem 95

d  dr  L d  L dr  d2u
r̈ = = 2 2
= −L2 u2 2
dt dt r dθ r dθ dθ
으로 치환된다. 그리고 L = r2 θ̇ 를 이용하면 (11.7)의 두 번째 항은

(r2 θ̇ )2 L2
rθ̇ 2 = = = u3 L2
r3 r3
으로 치환된다. 세 번째 항은

(m1 + m2 )G
= u2 (m1 + m2 )G
r2
이 된다. 이제 (11.7)에 대입하고 −L2 u2 으로 나누면, u에 대한 최종 식

d2u (m1 + m2 )G
+u = (11.9)
dθ 2 L2
을 얻는다. 이 식이 (9.5)에서 소개한 inhomogeneous 2차 미분방정식이다. 그 해는
다음과 같다.
(m1 + m2 )G
u= (1 + e cos(θ − θ0 )). (11.10)
L2
u = r−1 이므로 두 물체간의 거리 r을 써서 다시 나타내면

L2
r= (11.11)
G(m1 + m2 )(1 + e cos(θ − θ0 ))

을 얻는다. 우리는 e를 이심률, θ0 를 phase offset이라고 부르며 초기값에 의해 결


2
정된다. e = 0이면 궤도는 반지름이 r = G(mL+m ) 인 원이다. 0 < e < 1이면 궤도는
1 2
타원이다. e > 1이면 궤도는 쌍곡선이다. 경계 케이스 e = 1는 포물선이다. 이심
율과 궤도의 관계는 Appendix B에 자세히 설명되었다.

Question 11.1. 궤도가 쌍곡선 또는 포물선이라는 말의 의미는 무엇인가?

그 것은 태양을 중심으로 궤도를 도는 것이 아니고 스치고 지나간다는 말이다.


무게 중심을 고정하고 나면 자유도가 4개 남는다고 했다. 행성의 궤도가 놓여
있는 평면이 정해지고 태양이 원점에 위치한 것은 정해진 상태에서 행성의 궤도
가 특정 되기 위해서는 4개의 요소가 필요하며 4개의 자유도가 이들을 결정한다.
궤도를 특정 짓는 4개의 요소는 다음과 같다.
1. 각속도 L: 궤도의 크기를 정한다.
2. 이심율 e: 궤도의 모양을 정한다.
3. phase offset θ0 : 궤도 위에서의 행성의 위치를 정한다.
4. 장축의 각도: 궤도의 장축과 x축이 이루는 각도를 정한다.
우리가 주로 관심이 있는 것은 L과 e이다. 특히 이 둘은 행성의 총 에너지와
관련이 되어서 그 관계를 다음 강의에서 배운다.
96 11 Newton’s law in space: Two-body problem

Question 11.2. 케플러의 법칙은 뉴턴이 two-body problem을 풀어서 밝힌 행성의


궤도에 대해서 매우 정확하게 설명하고 있다. 측정 데이터를 가지고 알아 냈다는
것이 경이롭다. 케플러 법칙에 없는 것은 태양이 아니라 질량 중심이 움직이지 않
는 것이라는 사실 정도이다. 질량 중심이 태양의 중심에서 얼마나 떨어져 있을까?
목성의 경우 무게 중심은 태양의 중심에서 얼마나 떨어져 있을까?

Exercises

1.
2.
Lecture 12
Kepler’s law and the energy of planets

Curiosity: the final frontier for intelligence. These are voyages of college stu-
dents. Its four-year mission: to explore strange ideas. To seek out new ideas and
methodology. To boldly think what no man has thought about before!

태양계에는 8개의 행성이 태양을 중심으로 공전하고 있다. 각각의 행성은 타원


궤도를 돌고 있는데 이심율이 0.1이하의 원에 가까운 타원이다. 수성만 0.2정도이
다. 8개의 행성의 공전 평면은 약간씩 차이가 있지만 마치 하나의 평면위에 놓여진
것처럼 보인다. 이 8개의 행성은 모두 같은 방향으로 돌고 있다. 반면에 헬리혜성
이나 2006년에 발견된 HD20782b는 이심율이 0.97정도인 타원 궤도를 돌고 있고
이케야-세키 혜성(공식 이름: C/1965 S1)은 이심율이 0.9999 정도이다. 이들은 왜
이렇게 다른 궤도를 돌고 있을까? 8개의 행성과 태양은 같은 시기에 같이 생성 되
었다고 믿어지는데 그 근거는 무엇일까? 이심율이 1에 가까운 혜성들도 태양계와
같이 만들어 졌을까?

12.1 Energy of circular orbits

행성 궤도식 (11.10)을 얻기 위해서는 식 (11.9)를 유도해서 풀어야 했지만 대부분


의 행성의 움직임에 대한 성질은 식 (11.8)에서 얻어지는 각속도 불변 (즉 L = r2 θ̇
는 시간에 대한 상수라는 사실) 과 식 (11.7)을 통해 얻을 수 있다. 식 (11.7)을 다시
쓰면 다음과 같다.

97
98 12 Kepler’s law and the energy of planets

r̈ − rθ̇ 2 = −kr−2 , k = G(m1 + m2 ). (12.1)

질량이 m1 과 m2 인 두 물체 사이의 거리가 r일 때 중력에 의한 위치 에너지는


Gm1 m2
Ep = − (12.2)
r
이라는 것도 자주 사용한다.

Problem 12.1 (Escape speed and escape energy). 지구의 반지름을 R 이라고 하
자. 지구 표면의 질량이 m인 물체를 지구 중력 밖으로 쏘아 보내기 위한 최소
속력을 구하시오.

Solution 12.1 위치 에너지는 E p = − GmMR 이다. 여기서 M은 지구의 질량이다.


지구 중력 밖으로 나가면 총 에너지가 0보다 커져야 하므로 운동에너지는 GmM R
보다는 커야 한다. 이 것이 escape energy이다. 이를 이용하면 최소 속력 v는 다음
을 만족한다:
1 2 GmM
mv = .
2 R
q
이 것을 풀면 v = 2GM R 이 escape speed이다. ⊔⊓

Problem 12.2 (음의 총 에너지). 반지름이 r > 0인 원형 궤도를 도는 물체의 총


에너지는는 다음과 같음을 보이시오.

1 Gm1 (m1 − m2 )
Etotal = < 0. (12.3)
2 r

Solution 12.2 원형 궤도를 돌기 때문에 r̈ = 0이다. 따라서 (12.1)을 이용해서 운


동에너지를 계산하면 다음과 같다:

1 1 Gm1 (m1 + m2 )
Ek = m1 r2 θ̇ 2 = .
2 2 r
위치 에너지는 (12.2)와 같으므로 이므로 총 에너지는 이 둘의 합인 (12.3)과 같이
주어진다. ⊔

지구 주위를 원 궤도로 도는 인공위성의 경우와 같이 m1 이 m2 에 비해 현격히


작으면 운동 에너지, 위치 에너지, 총 에너지는 다음과 같다:
1 Gm1 m2 Gm1 m2 1 Gm1 m2
Ek = , Ep = − , Etotal = − .
2 r r 2 r
즉 무한 거리에서 부터 현재의 위치로 내려오면서 감소한 위치에너지의 절반이
운동 에너지 이다. 따라서 총 에너지와 운동 에너지는 부호만 다르다.
태양계 외부에서 유입된 물체는 매우 멀리에서 왔으므로 초기 위치에너지가
0에 가깝고 총 에너지는 양수이다. 반면 태양계의 8개의 행성은 원형에 가까운
궤도를 돌고 있고 problem 12.2에서 보인 것과 같이 이러한 궤도를 도는 행성의
12.2 Energy of elliptical orbits 99

총 에너지는 외부에서 들어온 물체에 비해 에너지가 매우 낮다. 따라서 8개의 내


행성이 외부에서 들어온 행성일 가능성은 매우 작고 천문학자들은 태양와 함께
만들어 졌을 것이라고 설명한다.
높은 궤도를 도는 위성일 수록 속도는 낮아져서 운동에너지는 작아진다. 반면
에 위치 에너지는 줄어든 운동에너지의 두 배로 더 커지게 된다. 따라서 총 에너지
는 궤도가 높을 수록 커지며 당연하겠지만 높은 궤도로 위성을 올리려면 더 많은
에너지가 필요하다.

Problem 12.3 (위성을 궤도에 올리기 위한 최소 필요 에너지). 질량이 m1 인 위성


이 지구상에 있을 때와 지상에서의 높이가 h 인 원형 궤도 상에 있을 때의 총에너
지 차이를 구하시오.

Solution 12.3 지구의 반경을 R이라 하자. 위성의 높이가 h이면 지구 중심으로
부너츼 거리는 r = R + h이다. 지구 상에 있을 때는 운동 에너지가 0이고 위치
에너지는 E p = −GmR1 m2 이다. 따라서 에너지 차이는

1 Gm1 (m1 − m2 ) −Gm1 m2 (R + 2h)m1 m2 + Rm21 ∼ (R + 2h)m1 m2


− =G =G .
2 R+h R 2R(R + h) 2R(R + h)

이 것이 질량이 m1 인 위성을 높이가 h인 궤도에 올리기 위한 최소 에너지이다.


(물론 실제는 훨씬 더 많은 에너지가 필요하다. 연료 무게 로켓 무게 다 고려하면
이 최소 에너지보다 수십 배는 많은 에너지가 필요할 것이다.) ⊔⊓

Problem 12.4 (지구 자전으로 인한 운동에너지). 지구의 자전으로 인한 운동 에너


지는 얼마나 영향이 있는지 비교하시오.

Solution 12.4 ⊔

12.2 Energy of elliptical orbits

Phase offset을 θ0 = 0로 설정하면 (11.11)에 주어진 거리 r은

L2
r= (12.4)
G(m1 + m2 )(1 + e cos θ )

로 적을 수 있다.

Problem 12.5 (총 에너지와 이심율). 이심율이 e이고 각속도가 L인 타원형 궤도를


도는 천체의 총 에너지는 다음과 같음을 보이시오.

G2 m1 (m1 + m2 )(1 + e)[(m1 + m2 )(1 + e) − 2m2 ]


Etotal = . (12.5)
2L2

Solution 12.5 에너지는 보존 되므로 특정 순간의 운동에너지와 위치 에너지를


계산하면 된다. 식 (8.6)에 주어진 속도 v의 공식을 사용하여 타원궤도를 도는 물
100 12 Kepler’s law and the energy of planets

체의 운동에너지를 계산하면
1 1 1
Ek = m1 v · v = m1 (ṙer + rθ̇ eθ ) · (ṙer + rθ̇ eθ ) = m1 (ṙ2 + r2 θ̇ 2 )
2 2 2
을 얻는다. 거리 r은 θ = 0 일 때 최소값을 가진다. 최소값을 r0 라고 하면 이 때
미분이 ṙ = 0 이므로 운동 에너지는

m1 2 2 m1 L 2 1 Gm1 (m1 + m2 )(1 + e) 1 G2 m1 (m1 + m2 )2 (1 + e)2


Ek = r0 θ̇ = = =
2 2 r02 2 r0 2 L2

이다. 이 순간의 위치 에너지는

Gm1 m2 G2 m1 m2 (m1 + m2 )(1 + e)


Ep = − =−
r0 L2

이다. 이 두 에너지를 더하면 (12.5)에 주어진 총에너지가 된다. ⊔


총에너지에 대한 식 (12.5)를 다시 쓰면 다음과 같다:

2L2 Etotal
(m1 + m2 )e2 + 2m1 e + m1 − m2 − = 0.
G2 m1 (m1 + m2 )

이심율 e에 대한 2차식을 풀면 하나의 양수 근과 하나의 음수 근을 얻으며 양수


근을 취하면 이심율을 얻는다. 즉,
s
m1 m21 m1 − m2 2L2 Etotal
e=− ± − + .
m1 + m2 (m1 + m2 )2 m1 + m2 G2 m1 (m1 + m2 )2

m1 이 m2 에 비해 현격히 작은 경우 이를 이용해서 위 식을 단순화 하면

2L2 Etotal
m2 e2 − m2 =
G2 m1 m2

을 얻는다. 따라서, s
2Etotal L2
e= 1+ . (12.6)
m1 G2 m22
이 공식을 비교하면 Etotal < 0는 타원에 해당하고(폐쇄 궤도인 모든 솔루션은 타원
임) Etotal = 0은 포물선에 해당하며 Etotal > 0은 쌍곡선에 해당한다. 특히, Etotal =
m1 k2 ∼ m1 G2 m22
− 2 = − 는 완전한 원형 궤도에 해당한다. 총에너지와 각속도 L을
2L 2L2
정하면 이심율이 정해진다. 물론 이심율과 총에너지가 정해지면 각속도가 정해
진다.
12.4 Elliptical orbits of satellites 101

12.3 Circular orbit of satellites

지구를 반지름이 r인 원형 궤도로 회전시키는 인공위성을 고려하자. 그에 해당하


는 궤도 방정식은
r3 θ̇ 2 = G(m1 + m2 ) (12.7)
이다. 여기서 m2 는 지구의 질량 이고 m1 은 satellite의 질량이다. 1번 회전 하는데
걸리는 시간, 즉 공전 주기를 T 라고 하자. 반지름과 각 속도가 일정 함으로 θ̇ 는
상수이고
T θ̇ = 2π
을 만족한다. 따라서 이를 위의 식에 대입하면 다음 Kepler’s 3rd law를 얻는다:

T2 4π 2
= . (12.8)
r3 G(m1 + m2 )

Problem 12.6 (Kepler’s third law).


(1) 위성의 반지름을 두 배로 하면 주기는 어떻게 변하는가?
(2) 위성이 지구를 하루에 한 바퀴 자전할 때 궤도의 반지름은 얼마인가?

Solution 12.6 (1) (12.7)나 (12.8)를 사용하여 계산한다. (12.8)를 사용하여 주기의
공식을 적으면 다음과 같다.
 4π 2 1/2
T= r3 .
G(m1 + m2 )

따라서 r을 2r로 치환하면 T 는 23/2 배가 된다.


(2) 이번엔 (12.7) r = θ̇ −2/3 (G(m1 + m2 ))1/3 를 이용해보자. 하루에 한번 지구
를 회전하면 θ̇ = 2π/86400s이다. 인공위성의 무게 m1 은 무시하고 지구의 질량
m2 = 5.972 × 1024 kg과 중력계수 G ∼ = 6.674 × 10−11 m2 /kg s를 대입하면 인공위
성의 정지궤도의 지구 중심에서의 거리는 r = 4.2240 × 107 m이다. 지구 반지름의
6.63배 정도이다. ⊔ ⊓

12.4 Elliptical orbits of satellites

타원 궤도를 도는 인공위성도 많이 쓰인다. 인공위성이 지구에 가장 접근 했을


때는 해가 (12.4)으로 쓰여질 때 각도 θ 가 0일 때 일어난다. 그 거리는 다음과
같다:
L2
r0 = .
G(m1 + m2 )(1 + e)
이 순간의 speed를 v0 라고 하면 다음과 같이 주어진다:

v0 = ∥v∥ = ∥ṙer + rθ̇ eθ ∥ = r0 θ̇ .


102 12 Kepler’s law and the energy of planets

따라서 r0 v0 = r02 θ̇ 는 각속도 L이다. 이 최소 거리를 사용하여 (12.4)을 다시 쓰면


다음과 같다:
(1 + e)r0
r= .
1 + e cos θ
반면에 가장 멀리 떨어 졌을 때는 cos θ = −1일 때로 그 거리는 다음과 같다
1+e
r1 = r0 .
1−e
타원 궤도의 장반경은 장축의 절반이다:

r0 + r1 r0 L2
a= = = .
2 1 − e G(m1 + m2 )(1 − e2 )

타원의 단반경 b = a 1 − e2 은 이심율 (8.8)을 이용하면 얻는다.

Problem 12.7 (Kepler’s 3rd law). T > 0을 행성이 궤도를 한 번 회전하는 주기라
고 하고 a > 0를 궤도의 장반경이라고 하자. 다음을 보이시오;

T2 4π 2
= . (12.9)
a3 G(m1 + m2 )

Solution 12.7 타원의 면적은 πab = πa2 1 − e2 이다. Kepler 제2 법칙을 사용하여
면적을 구하면 다음과 같다:
Z T Z T
1 1
dA = Ldt = LT.
0 2 0 2
따라서 √
2πa2 1 − e2
T=
L
을 만족한다. 양변을 제곱한 후에 a3 으로 나누면,

T2 4π 2 a(1 − e2 ) 4π 2
3
= 2
= ,
a L G(m1 + m2 )

Kepler의 제 3법칙을 얻는다. ⊔


Question 12.1. 반지름이 r인 원형 궤도를 도는 인공위성과 장반경이 같은 r이지


만 이심율이 e인 타원형 궤도를 도는 인공위성 중 공전주기는 어느 쪽이 더 클까?
인공위성을 궤도에 올릴 때 더 많은 에너지가 필요한 궤도는 어는 것인가? 인공
위성의 무게가 2배로 증가하면 주기는 어떻게 변하나?
s

Question 12.2. 길이가 ℓ이고 무게가 m1 인 진자의 주기는 T = 2π 으로 알려져
g
있다. 케플러의 제 3법칙 (12.9)과 관계가 있을까 아니면 없을까?
12.5 Interstellar and solar system object 103

Problem 12.8. 엔터프라이즈호가 미지의 행성으로 날아가고 있다. 행성과의 속


도차가 v0 이다. 엔터프라이즈호를 행성에 착륙시키는 대신 Spock과 McCoy만
Transporter를 이용해 내려 보내기로 했다. beaming up 최대 거리가 r > 0이어서
반지름이 r인 원형 궤도에서 행성을 회전하기로 했다. 얼마나 많은 에너지를 잃어
야하는가? 에너지를 아끼기 위해서는 어떻게 해야 하나?

Solution 12.8 우주선 Enterpr0ise의 질량이 m1 라고 가정한다. 그러면 무한거리


에서의 운동 에너지는 Ek = 12 m1 ∥v0 ∥2 이므로 이것이 행성의 입장에서 본 총 에
너지이다. 우주선이 반경 r > 0의 원형 궤도에 있는 경우 총 에너지는 Etotal =
Gm1 (m1 −m2 )
2r 로 변한다. 따라서 에너지 차이는

1 Gm1 (m1 − m2 )
m1 ∥v0 ∥2 −
2 2r
이고 이것은 원형 궤도에 머무르기 위해 손실되는 에너지이다. 에너지를 절약하
기 위해서는 최소 거리가 r인 타원 궤도를 돌게 하는 것이 좋겠다. ⊔

Problem 12.9. 위의 문제의 경우 엔터프라이즈호가 eccentricity가 e이고 최소 거


리가 r인 궤도를 도는 얼마만큼의 에너지를 아낄수 있는지 구하시오.

Solution 12.9 (12.4)를 이용하면 이심율이 e이고 각속도가 L인 궤도의 최소거리


는 cos θ = 1일 때다. 그 경우

L2 = rG(m1 + m2 )(1 + e)

를 만족한다. 그리고 이 경우 총 에너지는

Gm1 [(m1 + m2 )(1 + e) − 2m2 ] Gm1 (m1 − m2 ) Gm1 (m1 + m2 )e


Etotal = = +
2r 2r 2r
Gm1 (m1 + m2 )e
이다. 에너지 차이는 이고 이것이 아낄 수 있는 에너지 양이다.
2r

12.5 Interstellar and solar system object

우주 공간에 v의 속도로 이동하다가 우연히 태양에 접근하는 물체가 있다고 가정


하자. 어떠한 일이 벌어질 수 있을까? 물체가 정면 충돌하여 태양에 흡수 되거나,
태양을 지나쳐 다른 곳으로 이동하거나, 또는 일부분만 부딪혀 일부는 태양에 흡
수되고 나머지는 분리되는 경우도 있을 수 있을 것이다. 그러면 태양의 중력에
사로잡혀 태양 중심의 궤도를 돌 가능성이 있을까? 지금 태양을 중심으로 돌고
있는 천체들이 이렇게 생겨 난 것은 아닐까? 그 것을 확인하기 위한 우리의 아이
디어는 간단하다. 궤도 상의 행성이 가지는 에너지는 보존 될 것이다. 이 에너지를
계산한후 외계 행성이 가지고 있는 에너지와 비교 하는 것이다.
104 12 Kepler’s law and the energy of planets

물체가 태양 중력의 영향을 받는 영역에 진입하기 전에 v의 속도로 움직이고


있다고 가정하자. 물체의 질량이 m1 이면 운동 에너지는 Ek = 12 m1 ∥v∥2 이다. 무한
거리 ∞에서의 위치 에너지는 E p = 0 이므로 총에너지는 ∞ 거리에서의 운동에너
지이다. 즉, 만약 충돌 등으로 인한 에너지 손실이 없다면
1
Etotal = Ek + E p = m1 ∥v∥2
2
을 만족한다. 만약 이 물체가 태양의 중력에 이끌리어서 태양 주위를 돈다면 총
에너지가 이 양수 값을 가지는 궤도일 것이다. 물론 너무 가깝게 접근해서 충돌
하든지 아니면 일부가 찢겨저 나와서 총 에너지에 변화가 있을 수도 있다.

Problem 12.10 (외계 물체의 공전). 이심율이 1에 가까운 타원형 궤도를 도는 행


성 또는 물체는 총 에너지가 양수를 가질수 있는지 확인하시오.

Solution 12.10 Problem 12.5에서 각속도가 L이고 이심율이 e인 궤도를 도는 천


체의 총 에너지는

G2 m1 (m1 + m2 )(1 + e)[(m1 + m2 )(1 + e) − 2m2 ]


Etotal =
2L2
임을 계산했다. 양수 값을 가지기 위해서는 (m1 + m2 )(1 + e) − 2m2 > 0 이어야
한다. 이심율 e가 1에 가까울 경우 가능하다. 그러나 자료를 찾아 보면 이심율이 1
에 가까와 져도 행성과 태양의 질량차가 워낙 커서 양수 값을 가지기 매우 힘들다.
외계에서 온 물체였다면 아마도 총 에너지가 변화가 있었을 것이다. ⊔ ⊓

Exercises

1. 질량이 103 Kg인 위성을 정지 궤도에 올리기 위한 최소 에너지를 계산하시오.


2. 주기가 1일이고 이심율이 e인 타원 궤도를 도는 질량이 103 Kg인 위성의 총
에너지를 구하시오.
3. E.핼리가 발견한 태양의 주위를 도는 핼리혜성은 궤도 이심률이 0.9673이고
주기는 76.03년이라고 한다. 이 혜성의 최고 속도와 최저 속도를 구하시오. 총
에너지를 구하시오.
Part III
The Arts of Calculus
미분과 적분은 이제 세상의 문제를 이해하는 핵심 수단이 되었고 이를 이용하
여 많은 것을 할 수 있다. 미분과 적분을 잘 이해하고 적용하는 것은 유용하며 Part
III에서는 이에 대한 핵심 기술을 이해하고 배운다.
Lecture 13
Curves and particle trajectories in R3

변수 t가 시간을 나타내고 r(t)가 움직이는 입자의 시간 t일 때의 위치를 나타내


면 미분 r′ (t) = v(t)는 시간 t에서 입자의 속도이다. 꼭 입자의 궤적이 아니더라도
r(t)는 공간상의 곡선이고 철사나 휘어있는 철골과 같은 1차원 물체를 표현할 수
있다. 시간 t가 아니라 곡선의 길이 arclength s를 변수로 하면 물체의 궤적으로가
아닌 곡선 자체의 성질을 나타낼 수 있다. 이번 강의에서는 시간 변수 t와 arclength
변수 s를 번갈아 사용하면서 3차원 상의 curve의 성질을 공부한다. 특히 이번 강
의에서는 notation abuse를 많이 사용하는데 이를 통해서 익숙해 져야 한다.

13.1 arclength as a variable

집에서 직장까지 운전한다고 가정하자. 두 위치 사이의 거리는 두 위치를 연결하


는 직선의 길이다. 반면에 주행거리는 자동차가 운행한 궤적의 길이이며 출발시
간부터 도착시간까지 속력을 시간에 대해 적분하면 얻는다.

Question 13.1. 왜 속력을 적분하면 궤적의 길이가 나올까? 속력이 아니라 속도를
적분하면 무엇을 얻나?

r : [0, T0 ] → R3 가 공간에서 움직이는 입자의 위치라고 하자. 변수 t ∈ [0, T0 ]는


시간을 나타낸다. 속도는 위치를 시간으로 미분한 것이다. 위치와 속도를
   ′ 
x(t) x (t)
r(t) = y(t) 와 v(t) = r′ (t) = y′ (t)
z(t) z′ (t)

로 표기하면, 속력은 속도의 크기


q
∥v(t)∥ = (x′ (t))2 + (y′ (t))2 + (z′ (t))2

이다. 움직인 거리를 arclength 라고 하는데 시간 t 동안의 arclength는 다음과 같이


계산한다:

107
108 13 Curves and particle trajectories in R3
Z tq Z t
s(t) = (x′ (τ))2 + (y′ (τ))2 + (z′ (τ))2 dτ = ∥v(τ)∥dτ.
0 0

Problem 13.1. 3차원 상의 곡선 r(t) = costi + sintj + tk의 변수 구간이 t ∈ [0, 2π]
일 때 arclength를 구하시오.

Solution 13.1 속도는 v(t) = − sinti + costj + k이고 속력은


p √
∥v∥ = sin2 t + cos2 t + 1 = 2
Rt √ √
이다. 따라서 arclength는
√ s(t) = 0 2dt = 2t이다. 따라서 전체 변수 구간 [0, 2π]
에 대한 arclenth는 2 2π 이다. ⊔ ⊓

13.2 Parametrization with arclength

모든 t에 대해 ∥r′ (t)∥ ≠ 0를 만족하는 벡터 함수 r : [0, T0 ] → R3 가 주어 졌다.


s(t)를 시작 시간 0에서 t > 0까지 움직인 궤적의 길이라고 하자. 궤적의 길이는
다음과 같이 주어진다:
Z t Z tq
s(t) = ∥v(τ)∥dτ = (x′ (τ))2 + (y′ (τ))2 + (z′ (τ))2 dτ.
0 0

따라서 s(t)는 시간 구간 [0, T0 ]에서 arclength 구간 [0, L]으로 대응 되는 함수이며


여기서 L = s(T0 )는 전체 궤적의 길이다. 그러면 s(t)는 증가 함수이므로 역함수가
존재하며 역함수를 t(s)로 표시하자. 여기서 arclength s 와 시간 parameter t를 변
수로도 사용하고 함수로도 사용하는 notation abuse를 하고 있다. 역 함수의 관게
s(t(s)) = s 및 t(s(t)) = t가 만족한다. 역함수에 대한 미분 법칙을 사용하면

ds 1
=
dt t=t0 dt
ds s=s
0

을 얻는다. 다른 표기법으로는
1 1
s′ (t0 ) = , t ′ (s0 ) =
t ′ (s0 ) s′ (t0 )

을 얻는다. 여기서 s0 와 t0 는 서로 대응하는 arclength와 시간 parameter 이다.


13.2 Parametrization with arclength 109

r(t)와 t(s)의 합성 함수를 r̃(s) = r(t(s))로 나타내는데 이는 arclength 를 나타


내는 interval [0, L] 에서 정의 되고 R3 의 값을 가진다. 시간 t가 아니라 arclength s
를 변수로 할 경우 미분의 크기는 어떻게 될까? 변수 s의 관점에서 미분의 크기는
1이다. 이것이 직관적으로 명백한가? 계산해보자;

d v(t)
r̃′ (s) = r(t(s)) = r′ (t)t ′ (s) = . (13.1)
ds ∥v(t(s))∥

따라서 ∥r̃′ (s)∥ = 1이다.


표기를 남용하자. 만약 r̃(s)의 물결표 표기를 지우고 간단하게 r(s)라고 쓰면
r(t)와 헷갈릴까? 우리는 충분히 구분할 수 있다. r(s)라고 쓰면 r을 arclength 변수
s의 함수로 생각하는 것임을 알 수 있고 r(t)로 쓰면 시간 t의 함수로 생각하는 것
임을 알 수 있다. 그리고 r′ (s)라고 쓴 것은 위치 r을 s 변수로 생각해서 미분하라는
d
뜻이다. 즉, r′ (s) = r이다. 그러면 v(s) = r′ (s)일까? 전혀 아니다. v는 속도이고
ds
d
따라서 v = r으로 주어진다. 따라서 v(s) = dtd r(s)를 의미한다. 즉 arclength 변수
dt
s에 대응하는 지점에서의 속도이다. 앞으로 정의하는 T, N, S, κ, τ등을 s를 변수로
생각하기도 t를 변수로 생각하기도 하는데 이와 같은 notation abuse에 익숙해 져
야 한다.

Remark 13.1. 함수 f 의 변수가 무엇인지 분명 할 때는 미분을 f ′ 라고 써도 혼란이


없다. 그러나 notation을 abuse하여 사용할 때는 변수가 무엇인지 분명히 해야 한
다. 따라서 f ′ (s)라고 쓰던지 f ′ (t)로 써서 변수가 무엇인지 분명하게 말 해야 한다.
df df
그러한 면에서 Leibnitz notation인 또는 의 사용은 혼란을 예방한다.
ds dt

Question 13.2. 일단 r(s) = r(t(s))와 r(t) = r(s(t))로 적자. 이중에서 무엇이 (13.1)
에서 잠시 정의한 r̃에 해당 하는지 구분해 보시오. (첫 번째와 네 번째)

Problem 13.2. 3차원 상의 곡선 r(t) = costi + sintj + tk, t ∈ [0, T0 ]의 개요를 그리


시오. arclength s(t)와 그 역함수 t(s), 그리고 r′ (s)를 계산하시오.

Solution 13.2 Problem (13.1)에 주어진 대로 ∥v(t)∥ = 2 이다. 따라서,
Z t√ √
s(t) = 2dτ = 2t,
0

는 상수 배로 주어지고 그 역함수는 t(s) = √s 로 주어진다. 따라서, 합성하면


2

s s s 1  s s 
r(s) = cos √ i + sin √ j + √ k, r′ (s) = √ − sin √ i + cos √ j + k
2 2 2 2 2 2
을 얻는다. 이 경우에 ∥r′ (s)∥ = 1임을 쉽게 확인할 수 있다. ⊔

110 13 Curves and particle trajectories in R3

13.3 TNB coordinate system

Unit tangent vector

unit tangent vector T 는 arclength s를 변수로 한 위치 벡터 r의 미분이다:

T (s) = r′ (s).

식 (13.1)에서 T (s)는 unit vector 임을 이미 보았다. 만약 T (t)라고 쓸 때는 T (t) =


r′ (t)를 의미하는 것이 아니다. 이미 위에서 정의 된 T 에 notation abuse를 적용
하고 있는 것이다. 따라서 T (t) = T (s(t))를 의미한다.

Problem 13.3. 곡선 r(t) = (1 + 3 cost)i + (3 sint)j + t 2 k의 unit tangent vector를


계산하시오.

Solution 13.3 arclength s로 변수 변환을 한 후에 미분을 하는 것이 아니고 식


(13.1)에서 처럼 r′ (t)를 계산한 후에 ∥r′ (t)∥로 나누어 계산한다. ⊔

Problem 13.4. (1) 정의 구역 t ∈ (0, 2π)에서 정의된 곡선 r(t) = costi + sintj 의


속도 v(t) 와 가속도 a(t)를 구하고 세 벡터 (r, v, a)의 수직관계를 설명하시오.
(2) 정의 구역 t ∈ (0, 2π)에서 정의된 곡선 r(t) = cost 2 i + sint 2 j 의 속도 v(t) 와
가속도 a(t)를 구하고 세 벡터 (r, v, a) 의 관계를 설명하시오.
(3) 정의 구역 t ∈ (0, 2π)에서 정의된 곡선 r(t) = sint costi+sin2 tj+costk 의 속도
v(t) 와 가속도 a(t)를 구하고 세 벡터 (r, v, a) 의 관계를 설명하시오.

Solution 13.4 (1) v는 r와 a에게 모두 수직이다. (2) r과 v가 서로 수직이다. (3) r


과 v가 서로 수직이다. ⊔ ⊓

Problem 13.5. (1) 속력이 일정하면 가속도 a(t)와 속도 v(t)가 서로 수직임을 보


이시오. (2) 입자와 원점과의 거리가 일정하면 무엇이 서로 수직인가?

Solution 13.5 (1) 속력이 일정하면 속력의 제곱도 일정하다. 속력의 제곱은 v(t) ·
v(t)이다. 미분을 구하면

d
0= (v(t) · v(t)) = 2v(t) · v′ (t) = 2v(t) · a(t).
dt
따라서 v(t)와 a(t)는 서로 수직이다. (2) 비슷하게 원점과의 거리가 일정하면 그
제곱도 일정하다. 즉 r(t) · r(t)는 상수이다. 미분은 0이므로 위와 같은 원리로 r(t)
와 v(t)는 서로 수직이다. ⊔ ⊓

Curvature κ and principal unit normal vector N

unit tangent vector T (s)의 미분 T ′ (s)을 벡터 curvature라고 부르고 그 절대값을


스칼라 curvature라고 부른다. 그냥 curvature라고 부를 때는 스칼라 curvature를
13.3 TNB coordinate system 111

의미하며 보통 그리스 문자 κ (kappa)로 표시한다. 즉,

κ(s) = ∥T ′ (s)∥ = ∥r′′ (s)∥.

Problem 13.6 (Principal unit normal vector). curvature κ(s) ̸= 0라고 하자. (1)
1
N(s) = κ(s) T ′ (s)를 principal unit normal vector라고 부른다. unit tangent vector T
와 수직임을 보이시오. (2) 다음을 만족함을 보이시오;

T ′ (t)
N(t) = .
∥T ′ (t)∥

Solution 13.6 (1) T 는 길이가 항상 1인 unit vector 이므로 T · T = 1 상수이다.


상수의 미분은 0이므로, 내적의 미분을 이용하면

(T (s) · T (s))′ = 2T (s) · T ′ (s) = 2κ(s)T (s) · N(s) = 0.

따라서 수직이다. (2) 어차피 T ′ (s)와 T ′ (t)는 같은 방향이고 N은 unit vector이니까


위의 식을 만족한다. ⊔ ⊓

curvature κ(s)는 곡선 위의 점 r(s) 에서 곡선이 얼마나 급격하게 휘었는지를


말해 주는데 예를 통해 검토해 보자.

Problem 13.7. 직선 r(t) = c + tv의 curvature를 계산 하시오. 여기서 c와 v는 우어


진 상수 벡터이다.

Solution 13.7 그러면, r′ (t) = v, T (t) = v/∥v∥, 그리고 T ′ (t) = 0. 따라서, 직성의
curvature는 κ(t) = 0 이다. ⊔ ⊓
1
Problem 13.8. 반지름이 a > 0인 원 r(t) = a costi + a sintj의 curvature는 κ = a
임을 보이시오.

Solution 13.8 그러면, r′ (t) = −a sinti+a costj, ∥v(t)∥ = a, T (t) = − sinti+costj,


그리고 T ′ (t) = − costi − sintj이다. 따라서, κ(t) = ∥T ′ (t)∥/a = 1/a이다. ⊔ ⊓

Problem 13.9. Problem 13.8의 예는 적어도 2차원 평면 상의 곡선의 곡률을 결정


하는 방법을 보여준다. 방법을 설명하시오.

Solution 13.9 r(t)가 곡선 상의 한 점이라고 하자. 그런 다음 점에서 곡선에 접


하는 원을 찾는다. a > 0이 이러한 접선원의 최대 반지름이면 곡률은 1/a이다.
직선과 같이 접하는 반경의 제한이 없다면 a = ∞이라고 말할 수 있고 곡률은 0
이다. ⊔ ⊓

Torsion τ and binomial vector B

Binomial vector 는 B로 표기하고 다음과 같이 정의한다:


112 13 Curves and particle trajectories in R3

B = T × N.

그러면 T, N, B는 positively oriented 직교좌표계가 된다. 미분을 계산하면

d d d d
B = T × N + T × N = 0 + T × N.
ds ds ds ds
d d
N은 unit vector이니까 ds N는 N에 수직이고 따라서 T × ds N는 N에 수직인 두 벡
d
터의 cross product이므로 ds B는 N 방향 성분만 가지고 있다. 커브 r(s)의 torsion
d
은 τ로 표기하고 ds B의 N 방향 성분의 negative로 다음과 같이 정의 하며

d
τ =− B · N,
ds
진행방향 T 의 수직 방향으로 얼마나 꼬이는지를 나타낸다.

13.4 Computation formulas

앞 절에서 정의한 대상은 공간상의 curve의 기하학적인 성질들이고 모든 정의는


arclength 변수를 사용하여 만들어 졌다. 그러나 매번 변수 변환을 해서 계산하는
것은 힘들다. 일반적인 매개변수에 대해서 할 수 있다. 이 절에서는 기존의 시간
변수 t가 주어 졌을 때 계산하는 방법을 소개 한다. 속도 v와 가속도 a는 시간의
미분으로 주어 졌으므로 이들을 이용해서 계산한다.
unit tangent vector는 방향은 v(t)이므로 크기만 1로 맞춰준다:

v(t)
T (t) = .
∥v(t)∥

T ′ (s)와 T ′ (t)는 서로 다른 벡터 이지만 방향은 같다. 왜냐하면,

d dt 1
T ′ (s) = T (t(s)) = T ′ (t) = T ′ (t) .
ds ds ∥v(t)∥

따라서 principal normal vector N은 방향은 T ′ (t)이고 크기는 1이므로 다음과 같이


계산한다:
T ′ (t)
N(t) = .
∥T ′ (t)∥
Binormal vector는 cross product를 사용해서 계산한다:

B = T × N.

Problem 13.10. 가속도 a는 B와 수직이며 다음과 같이 주어짐을 보이시오.


d
a = CT T +CN N, CT = ∥v∥, CN = κ∥v∥2 .
dt
13.5 Exercises 113

Solution 13.10 일단 a를 T NB system을 써서 계산해보면,

d d  ds  d 2 s ds
a= v(t) = T = 2 T + T ′ (t)
dt dt dt dt dt
d2s ds  d ds  d 2 s  ds 2
= 2T + T (s) = 2T + κN.
dt dt ds dt dt dt
Binormial vector B의 component가 없다는 것은 B에 수직이라는 의미다. 계수를
다시 쓰면 위의 계수가 된다. ⊔ ⊓

위의 식은 가속도 a는 T 성분과 N 성분으로 나누어지고 오로지 T 성분만 속


력의 변화 dtd ∥v∥를 만들어 낸다는 것을 말하고 있다. N 성분은 curvature에 비래
하고 속력의 제곱에 비례하면 방향을 바꾸는 역할을 하고 속력의 변화는 만들지
않는다.

Problem 13.11. curvature κ와 torsion τ는 다음과 같이 주어짐을 보이시오.

ẋ ẏ ż
ẍ ÿ z̈
... ... ...
∥v × a∥ x y z
κ= , τ= .
∥v∥3 ∥v × a∥2

Solution 13.11 κ는 위의 가속도 식을 이용한다. v = ∥v∥T 이고 T × T = 0 이므로

∥v × a∥ = ∥∥v∥T × a∥ = ∥v∥3 κ∥T × N∥ = ∥v∥3 κ∥B∥ = ∥v∥3 κ.

따라서 κ는 위의 식을 만족한다. torsion τ에 대한 식은 그냥 외우자. ⊔


13.5 Exercises

1. 다음 커브를 arclength 변수 s를 써서 다시 나타내시오.


(1) r(t) = sinti + costj + tk, 0 ≤ t ≤ 1 (2) r(t) = ti + 3j − t 2 k, 0 < t < 1
2. (8.3)의 기저 벡터를 사용하여 다음 극좌표 상의 궤적에 대당하는 직교좌표 상
의 궤적의 속도와 가속도를 찾으시오.
(1) r = θ , θ = 3t (2) r = sin θ , θ = t 2 (3) rθ = 1, r = t
3. 다음 커브의 T, N, B, κ, τ 을 구하시오.
(1) r(t) = sinti + costj + 2tk (2) r(t) = sin2 ti + cos2 tj − 3k
Lecture 14
Linearization and differentials

함수의 그래프 y = f (x) 위의 점 (c, f (c))에서 그래프에 접하는 접선의 식은


y − f (c) = f ′ (c)(x − c)이다. 이 접선과 그래프를 접선 근방에서 확대하면 확대 할
수록 이 둘은 점점 비슷해 진다. 이러한 이유로 접선은 접점 근처에서는 그래프의
많은 성질을 가지고 있어서 그래프의 근사로 간주할 수 있다. 접점에서 멀어지면
둘은 점점 다르게 되지만 접점에 접근하면 접선은 함수의 훌륭한 근사이다. 1차
미분 뿐만 아니라 고차 미분을 사용하는 근사는 Part 4에서 배운다. 우리는 이번
강의에서 함수 f : R → R를 c ∈ R에서 미분 가능하다고 가정하고 논의한다.

14.1 Linearization

원점을 지나는 기울기가 a ∈ R 인 직선의 식은 y = ax 이다. 함수 기호를 써서


f (x) = ax로 표현할 수 있지만 그냥 y를 x에 대한 함수로 생각하는 것에 익숙해
dy
질 필요가 있다. 그러면 이 직선의 기울기는 y′ = dx = a이다. 만약 직선이 원점이
아니라 점 (x0 , y0 )를 지나면, 직선의 식은 다음과 같다:

y − y0 = a(x − x0 ). (14.1)

점 (c, f (c))는 그래프 y = f (x) 위의 점이다. 이 점에서 그래프에 접하는 직선의


식은 어떻게 구할까? 기울기는 미분을 이용하면 f ′ (c)라는 것을 알고 있고 점
(c, f (c))는 그 직선 위에 있어야 하니까 y − f (c) = f ′ (c)(x − c)이다. 다시 쓰면

y = f (c) + f ′ (c)(x − c) (14.2)

이다. 우변을 편의상


L(x) := f (c) + f ′ (c)(x − c)

115
116 14 Linearization and differentials

로 표기하면 접선을 그래프로 가지는 함수가 된다. 이 경우 우리는 L(x)를 함수


f (x)의 점 c에서의 linearization 또는 linear approximation이라고 부른다.

Problem 14.1. f (x) = 1 + x라고 하자. x = 0에서 f 의 linearization 함수 L(x)를
찾으시오.

Solution 14.1 미분을 하면 f ′ (x) = 12 (1 + x)−1/2 , f ′ (0) = 0.5, f (0) = 1를 얻는다.


따라서, L(x) = f (0) + f ′ (0)(x − 0) = 1 + 0.5x이다. ⊔ ⊓

Problem 14.2. 함수 f (x) = cos x의 점 x = π2 에서의 liniearization 함수 L(x)를 찾


으시오.

Solution 14.2 미분을 하면 f ′ (x) = − sin x, f ′ ( π2 ) = −1, f ( π2 ) = 0를 얻는다. 따라


서, L(x) = f ( π2 ) + f ′ ( π2 )(x − π2 ) = −(x − π2 ) = π2 − x이다. ⊔

Local property

어떤 성질은 local property (국소적 성질)이라고 불린다. 이 것은 작은 영역에서의


행동에 의해서 결정되는 성질을 말한다. 이 절에서 설명하는 linearization은 선형
함수 L(x)는 국소적으로는 본 함수 f (x)와 접점의 x 좌표 c 근처에서 같아진다는
것을 말한다. 이 말은 local property의 많은 것들이 미분을 통해서 주어진다는 것
을 말한다. 미분이 유용하게 사용되는 이유 중의 하나이다. 미적1과 2에서 local
maximum, local minimum, 길이와 부피의 팽창율 등에 사용된다.

14.2 Differentials

Linearization L(x) = f (c) + f ′ (c)(x − c)는 x가 c에 가까울 때 f (x)를 근사하는


(14.2)의 관계를 사용한다. f (x)를 근사하려 하지말고 그 차이만을 근사하려고 하
면 더 편하다. 다시말해 (14.1)에 해당하는 다음과 같은 관계를 쓸 수 있다:

dy = f ′ (x)dx. (14.3)

여기서 dx 및 dy는 differential이라고 하며 dx는 독립 변수이고 dy는 x와 dx에 따라


정해지는 종속변수이다. 이 관계는 dx가 충분히 작을 때에 의미를 가진다.
dy
Question 14.1 (Notation abuse). 미분 표기법 dx 의 dx 및 dy는 (14.3)의 differential
인 dx, dy와 동일한가?

Solution 14.1 그렇지 않다. 그것들은 다른 것을 의미하지만 같은 표기법이 사용


된다. 같은 표기법으로 다른 것을 표기하는 방식을 notation abuse (표기법 남용)
이라고 한다. 때때로 우리는 편의를 위해 표기법을 남용한다. 가장 놀라운 표기 남
용 중 하나는 dx 및 dy와 같은 미분이다. 독립 변수 x에 대한 종속 변수 y의 미분을
14.2 Differentials 117

dy
dx 로 표시한다. 따라서 그 둘이 함께 쓸 때 미분의 의미가 있다. 반면 differential
로 쓰이는 dy 및 dx는 작은 숫자로 취급된다. (14.2)에서 dy를 f (x) − f (c)에, dx를
x − c에 대응시킬 수 있다. 그러나 (14.3)은 또 다음과 같이 쓸 수 있다.
dy
= f ′ (x). ⊔

dx
이 경우 differential과 Leibniz notation을 사용한 미분이 같은 것을 의미한다. 따라
서 둘은 관점에 따라 다르면서도 실제에 있어서는 같은 것을 나타낸다. 이 둘의
차이와 서로 교체해서 사용하는 것에 익숙해질 필요가 있다.

Problem 14.3. 변수 x가 1이고 differential dx가 = 0.2 일때 변수 y = x4 + 7x의


differential dy를 찾으시오.

Solution 14.3 미분 f ′ (x) = 4x3 + 7이고 f ′ (1) = 11이다. 따라서 dy = 11dx = 2.2
이다. ⊔ ⊓

위의 differential dy는 함수 f (x)에 대한 것이다. y를 도입하지 않고 직접

d f = f ′ (x)dx

으로 표기 할수도 한다.

Problem 14.4. 함수 f (x) = 3x2 − 6의 differential d f 를 찾으시오.

Solution 14.4 d f = f ′ (x)dx = 6xdx이다. ⊔


합과 곱과 합성 함수의 differential의 계산은 미분 법칙이 성립한다.


1. d(u + v) = du + dv.
2. d(uv) = udv + vdu.
3. d( f (u)) = f ′ (u)du.

Question 14.2. 합성 함수의 미분을 이용하면 다음을 얻는다:

d(sin(sin(u))) = cos(sin(u))d(sin(u)) = cos(sin(u)) cos(u)du.

첫 번째 등식의 이유는 무엇인가?

Solution 14.2 일단 sin(u)를 v로 치환하면 다음을 얻는다:

d(sin(v)) = cos(v)dv = cos(sin(u))d(sin(u)).

이 계산을 한번 더 하면 둘 번째 등식을 얻는다. ⊔



118 14 Linearization and differentials

14.3 Differentials for linear approximation

미분을 이용한 근사는 선형함수를 이용한 근사를 말한다. 이제 선형근사와 오차


에 대해서 자세히 비교하자. 일단 독립변수 x와 비교점 c와의 차이를 ∆ x = x − c
라고 하자. 이와 같은 독립변수의 경우에는 differential dx와 변수의 차이 ∆ x를
동일하게 둔다. 즉,
dx = ∆ x = x − c.
만약 dx가 충분히 작으면 미분의 정의에 따르면 미분 가능한 함수 f (x)에 대해서

f (c + dx) − f (c)
f ′ (c) ∼
=
dx
를 만족한다. 따라서 x = c + dx에서의 함수 값을 다음과 같이 선형 함수로 근사한
다:
f (x) = f (c + dx) ∼
= f (c) + f ′ (c)dx.
이제 함수 값의 차이를

∆ y = f (x) − f (c) = f (c + dx) − f (c)

라고 하고 differential
dy = f ′ (c)dx
와의 차이를 비교하자. 이 표기에서 ∆ y는 함수 값의 차이이고 differential dy는 dx
와 미분 f ′ (c)와의 곱이다. 그러면 다음을 만족한다:

f (c + dx) − f (c)
∆ y = f (c + dx) − f (c) = dx ∼
= f ′ (c)dx = dy.
dx
이제 실제 차이 ∆ y와 differential의 차이는 다음과 같다:
 f (c + dx) − f (c) 
∆ y − dy = − f ′ (c) dx.
dx
따라서 실제 차이 ∆ y와 differential dy의 차이는 dx를 작게 할 수록 작아진다. 더
중요한 것은 dx가 작아지면 비율 f (c+dx)− dx
f (c)
는 미분 f ′ (c)로 수렴하기 때문에 dx
가 0으로 수렴하는 것보다 더 빠르게 0으로 간다. 즉,
∆ y − dy
→0 as dx → 0.
dx
16번째 강의에 little-oh 기호로 써서 나타내면 다음과 같다:

∆ y − dy = o(dx) as dx → 0.

Problem 14.5. 반지름이 10cm인 원형 디스크가 주어 졌다. 반지름이 1% 증가할


때, 즉 반지름이 10.1cm일 때 면적의 정확한 증가를 구하십시오. 이 때의 differen-
tial dy를 구하시오.
14.3 Differentials for linear approximation 119

Solution 14.5 반지름이 r인 디스크의 면적은 A(r) = πr2 이다. 그러면

∆ y = A(10.1) − A(10) = 2.01π

이다. A′ (r) = 2πr이고 A′ (10) = 20π 이므로

dy = A′ (10)dx = 20π0.1 = 2π.

따라서 그차이는 ∆ y − dy = 0.01π이다. ⊔


Problem 14.6. (7.97)1/3 의 값을 c = 8을 써서 근사하고 그 오차를 differential을


써서 예측하시오. 실제 오차와 비교 하시오.

Solution 14.6 함수 f (x) = x1/3 를 사용하자. 근사값으로 c = 8을 사용하면 f (8) =


81/3 = 2이 된다. 여기서 dx = 7.97 − 8 = −0.03이고 f ′ (8) = 13 8−2/3 = 12
1
이다.
따라서 differential dy는
1
dy = f ′ (c)dx = − × 0.03 = −0.0025
12
이다. 이제 differential을 써서 근사한 값은 다음과 같다:
1
(7.97)1/3 = f (7.97) ∼
= f (8) + f ′ (8)dx = 2 + (−0.03) = 2 − 0.0025 = 1.9975.
12
실제 오차의 차이는 0.000003이다. 그다지 나쁘지 않다. ⊔

Exercises

1.
Lecture 15
Inverse trigonometric and hyperbolic functions

이번 강의에서는 삼각함수의 역함수와 hyperbolic 함수를 배운다. 그런데 sin x와


cos x와 같은 삼각 함수들은 one-to-one function이 아니어서 역함수가 존재하지
않다. 우리가 구하는 것은 sin x와 cos x의 역함수가 아니라 이들의 branch에 대한
역함수라는 것을 명심하자.

15.1 Inverse trigonometric functions

일단 Lecture 6에서 학습한 역함수의 기본적인 사항을 복습하자. 만약 함수 f :


A → B가 one-to-one 이고 onto 함수이면 역함수 g : B → A가 존재하며 g( f (x)) = x
와 f (g(y)) = y를 만족하며 만약 f 가 미분 가능하고 f ′ (x) ̸= 0이면 g′ (y) = f ′1(x) 를
만족한다. 여기서 y = f (x)이다. 그리고 역함수 g 를 f −1 로 표시한다.

sine function

함수 sin θ 는 정의 구간이 전구간 R이고 공변역이 [−1, 1]이다. one-to-one 함수가


아니므로 역함수가 존재하지 않는다. sine 함수의 역함수는 없다고 하더라도 우
리는 정의 구간의 일부분만을 사용하는 sine 함수의 branch를 고르고 그 branch의
역함수를 고려한다.

Question 15.1. 함수 sin θ 의 정의 구간 중 일부를 취해서 one-to-one 함수를 만들


려고 한다면 어떤 구간을 고르는 것이 가장 좋을까?

가장 중요한 각도인 0도에서 90도 즉, 0에서 π/2 사이의 각도는 무조건 포함


시켜야 한다. sin θ 의 모양을 생각해 볼 때 sin 이 음의 값을 가지는 경우도 포함
하려면 −90 도에서 0도 까지도 포함하는 것이 가장 합리적으로 보인다. 따라서
우리가 고려해야 하는 branch는 다음과 같다:

sin |[−π/2,π/2] : [−π/2, π/2] → [−1, 1].

121
122 15 Inverse trigonometric and hyperbolic functions

역함수는 arcsin 또는 sin−1 로 나타낸다. sin−1 로 표기하더라도 sin 함수의 역함수

가 아니라 우리 뿐만 아니라 모든 사람들이 고른 branch sin |[−π/2,π/2] 의 역함수라


는 것을 잊지 말자. 따라서 역함수는

arcsin : [−1, 1] → [−π/2, π/2].

만약 누가 arcsin(−0.5)를 물어보면 반듯히 −π/2 와 π/2 사이의 각도중 sin θ =


−0.5를 만족하는 각도로 답을 해야지 다른 각도를 주면 틀린 답이다.
우리는 sine 함수를 표기할 때 때론 sin x또는 sin θ 로 한다. 특히 θ 를 사용하는 것
은 이것이 각도라는 것을 명확하게 나타내기 위함이다. 물론 sin x로 표기할 때도
x는 각도를 나타낸다. 그러나 arcsin θ 라고 표기하는 것은 매우 잘못이다. 그 것은
arcsin은 각도를 변수로 가지는 것이 아니라 sin값인 -1과 1사이의 값을 변수로
가지기 때문이다.

Problem 15.1. 다음 값을 구하시오.


(1) arcsin(0.5). (2) arcsin(−0.5). (3) arcsin(1). (4) arcsin(−1).

Solution 15.1 (1) arcsin(0.5)은 각도로 sin(θ ) = 0.5가 되는 각도 θ 중에 영역


[−π/2, π/2]에 있는 것이 답이다. 즉 30도 또는 π/6가 답이다. ⊔ ⊓

이제는 arcsin의 미분을 구하자. 역함수의 미분을 사용하면 된다. 일단 arcsin x =


θ 라고 하면
d 1 1
arcsin x = ′ = .
dx sin θ cos θ
물론 여기서 끝내면 안된다. x에 대한 함수를 미분 했으니까 x에 대한 함수로 끝
내야 유용하게 된다. 그러면
p q p
cos θ = 1 − sin2 θ = 1 − sin2 (arcsin x) = 1 − x2 .

결론적으로 arcsin의 미분은


d 1
arcsin x = √ , −1 ≤ x ≤ 1
dx 1 − x2
이 된다. 이 공식은 기억해야 한다.
15.1 Inverse trigonometric functions 123

cosine function

이제는 함수 cos θ 의 역함수를 생각해보자. 정의 구간이 전 구간 R이고 공변역이


[−1, 1]인 것은 같다. 마찬가지로 cos 함수의 branch를 고르고 그 branch의 역함수
를 고려한다. 함수 cos θ 의 정의 구간 중 일부를 취해서 one-to-one 함수를 만들
때, 마찬가지로 가장 중요한 각도인 0도에서 90도는 포함 시켜야 한다. cos θ 의
모양을 생각해 볼 때 cos 이 음의 값을 가지는 경우도 포함하려면 0 도에서 180
도 까지도 포함하는 것이 가장 합리적으로 보인다. 따라서 우리가 고려해야 하는
branch는
cos |[0,π] : [0, π] → [−1, 1].
역함수는 arccos 또는 cos−1 로 나타낸다. 따라서 역함수는

arccos : [−1, 1] → [0, π].

만약 arccos(−0.5)를 물어보면 반듯히 0 과 π 사이의 각도로 답 해야한다.

Problem 15.2. 다음의 값을 구하시오.


(1) arccos(0.5). (2) arccos(−0.5). (3) arccos(1). (4) arccos(−1).

Solution 15.2 (1) ⊔


자 이제는 arccos의 미분을 구하자. 일단 arccos x = θ 라고 하면


d 1 −1 −1 −1
arccos x = ′
= =p =√ .
dx cos θ sin θ 2
1 − cos (arccos x) 1 − x2

결론적으로 arccos의 미분은


d −1
arccos x = √ , −1 ≤ x ≤ 1.
dx 1 − x2
이전의 arcsin x의 미분에 음수기호를 붙인 것이다. 그래프를 보면 이유가 더 분명
하다.

tangent function

함수 tan θ 의 역함수를 생각해 보자. 일단 tangent 함수는 θ = ±π/2에서 발산한다.


골라야할 branch의 정의 구간은 (−π/2, π/2)이다:

tan |[−π/2,π/2] : (−π/2, π/2) → R.

그 역함수는 arctan로 표시한다,

arctan : R → (−π/2, π/2).

arctan의 미분을 구해보자. 일단 arctan x = θ 라고 하면


124 15 Inverse trigonometric and hyperbolic functions

d 1
arctan x = = cos2 θ .
dx tan′ θ
θ 를 x로 바꾸어 쓰기위해 arctan x = θ 를 이용해 계산하면

sin2 θ cos2 θ + sin2 θ 1


x = tan θ ⇒ 1 + x2 = 1 + 2
= = .
cos θ cos2 θ cos2 θ
따라서
d 1
arctan x = .
dx 1 + x2
이 건 기억하자. 자주 등장한다.

other functions

총 6개의 삼각함수 중 나머지 3개의 삼각함수에 대해서도 역함수를 고려할 수


있다. 물론 branch를 선택해야 한다. 나머지 3개의 삼각함수는 cotangent, secant,
그리고 cosecant이다. 그들의 정의는 다음과 같다.
1 1 1
cot θ = , sec θ = , csc θ = .
tan θ cos θ sin θ
sine과 cosine을 제외한 네가지 경우는 unbounded function이다. 역함수를 택하기
위해서 branch의 정의구간을 [0, π]또는 [−π/2, π/2]로 택하게 된다. 총 여섯개의
삼각함수의 역함수를 정리하면 다음과 같다.


arcsin : [−1, 1] → [−π/2, π/2]

arctan : → (−π/2, π/2)



 R

arcsec : R \ (−1, 1) → [0, π] \ {π/2}
(15.1)
arccos : [−1, 1]

 → [0, π]
→ (0, π)



arccot : R

arccsc : R \ (−1, 1) → [−π/2, π/2] \ {0}

Problem 15.3. (1) 삼각함수의 역함수를 만들기 위한 branch를 잡을 때 0과 90도


사이의 각도는 반드시 포함하고 정의 구역을 connected interval 로 만드는 경우는
sine,cosine,tantgent, cotangent함수의 경우에는 유일하게 정해진다는 것을 보이시
오. (2) secant와 cosecant함수의 경우에는 어차피 그래프와 정의 구역이 연결 되면
서 모든 함수 값을 포함하는 구간이 없다는 것을 확인하시오. (3) 위의 식 (15.1)은
arcsecant의 정의구간은 arccosine과 맞추고 arccosecant의 정의구간은 arccocosine
과 맞추었을 뿐이다.

Solution 15.3 이 문제는 그래프를 그려서 확인할 수 있다. ⊔



15.2 Hyperbolic functions 125

15.2 Hyperbolic functions

먼저 sine 과 cosine 함수의 미분을 생각해 보자;


(
sin′ x = cos x, cos′ x = − sin x
′′
sin x = − sin x, cos′′ x = − cos x

sine 함수를 미분하면 cosine 함수가 cosine 함수를 미분하면 sine 함수가 되는데
minus 부호가 붙을 때도 아닐 때도 있다. 2차 미분을 하면 자기 자신으로 돌아 오
는데 minus 부호가 붙는다. hyperbolic 함수들은 비슷한 성질을 가지는데 minus
부호는 등장하지 않는다. 이러한 함수들은 미분의 성질 때문에 sine 과 cosine 함
수와 이름이 비슷하지만 구조는 매우 다르다.
hyperbolic sine 함수와 hyperbolic cosine 함수는 다음과 같이 정의한다:

ex − e−x ex + e−x
sinh x = , cosh x = .
2 2
이들의 미분을 계산하면

ex + e−x ex − e−x
sinh′ x = = cosh x, cosh′ x = = sinh x.
2 2
즉, 상대방이 되고 따라서 2차 미분은 자기 자신이 된다:

sinh′′ x = sinh x, cosh′′ x = cosh x.

미분과 관련한 사항들을 기억하고 있으면 미분방정식을 푸는데 도움이 된다.

Problem 15.4. 함수 ex 와 e−x 의 그래프를 그리고 이를 이용해서 sinh x와 cosh′ x의


그래프를 그리시오.

Solution 15.4 ⊔

126 15 Inverse trigonometric and hyperbolic functions

Problem 15.5. 한번 미분을 해서 (1) 자기 자신이 되는 함수와 (2) 자기 자신에


마이너스를 붙인 함수가 되는 함수를 찾으시오.

이 문제는 1차 선형 미분 방정식 y′ = y 또는 y′ = −y의 해를 구하라는 것이다. 1


차니까 1개만 찾으면 된다.

Solution 15.5 (1) y = ex 이다. (2) y = e−x 이다. (상수를 곱해서 y = 3ex 또는 y =
4e−x 라고 답히도 되지만 좀 이상하고 y = Cex 와 y = Ce−x 로 답하면 좋아 보인다.)

hyperbolic sine 함수는 sine함수와는 별 상관이 없다. 주기 함수도 아니다. 위의


그래프에서 보았듯이

sinh : R → R one-to-one and onto function.

cosh : R → [1, ∞) not a one-to-one function.


다른 hyperbolic functions들은 다음과 같이 정의 한다.
sinh x cosh x 1 1
tanh x = , coth x = , sechx = , cschx = .
cosh x sinh x cosh x sinh x
sine 함수와 cosine 함수가 가지는 몇 가지 공식에 대응하는 hyperbolic함수들의
공식이 다음과 같다.

cosh2 x − sinh2 x = 1, sinh 2x = 2 sinh x cosh x.

tanh′ x = sech2 x, coth′ x = csch2 x, · · · .

Problem 15.6. 두번 미분 해서 (1) 자기 자신이 되는 함수와 (2) 자기 자신에 마이


너스를 붙인 함수가 되는 함수를 찾으시오.

이 문제는 2차 선형 미분 방정식 y′′ = y 또는 y′′ = −y의 해를 구하라는 것이다. 2


차니까 2개를 찾으면 된다.

Solution 15.6 (1) sinh x 와 cosh x. (또는 ex , e−x ) (2) y = sin x 와 y = cos x. (또는
eix , e−ix 로 답해도 좋다.) ⊔ ⊓
15.2 Hyperbolic functions 127

위의 답을 보면 sinh x 와 cosh x는 ex 와 e−x 같은 계열이고 y = sin x 와 y = cos x


는 eix , e−ix 와 같은 계열이다.

Problem 15.7. 세번 미분 해서 (1) 자기 자신이 되는 함수와 (2) 자기 자신에 마이


너스를 붙인 함수가 되는 함수를 찾으시오.

Solution 15.7 세 개씩 찾아야 하는데 하나씩은 아는데 나머지는 일반함수가 아


니다. ⊔ ⊓

Problem 15.8. 네번 미분 해서 (1) 자기 자신이 되는 함수와 (2) 자기 자신에 마이


너스를 붙인 함수가 되는 함수를 찾으시오.

이 문제는 4차 선형 미분 방정식 y′′′′ = y 또는 y′′′′ = −y의 해를 구하라는 것이다.


4차니까 4개를 찾으면 된다.

Solution 15.8 (1) sin x, cos x, sinh x, cosh x 이렇게 4개이다. exponential 함수로 표
현하면 ex , e−1 , eix , e−ix 이렇게 4개 이다. (2) 일반함수가 아니다. ⊔ ⊓

Exercises

1. Find the angles. √ √


(1) arctan(1) (2) arcsin(−0.5) (3) arccos( √3/2) (4) arcsin(1/ 2)
(5) arctan(−1) (6) arctan(0.5) (7) arcsin(− 3/2) (8) arccos(0.5)
2. Find the derivatives.
arctan(x2 )
(1) p (2) arccos(1 − x) (3) arcsin(cos θ ) (4) arctan(ln x)
(5) | arctan x| (6) ln(arccos x) (7) arcsec(cos θ ) (8) arccsc(sin θ )
3. FindZ the integrals.
1 1 1
Z Z
(1) 2
dx (2) √ dx (3) √ dx
1 + x 1 − x2 9 − x2
1 −1 1
Z Z Z
(4) dx (5) √ dx (6) p dx
9 + x2 1 − x2 1 − (x + 1)2
Lecture 16
L’Hopital’s rule, big-oh, and little-oh

16.1 L’Hopital’s rule

f (x)
극한 lim f (x)와 lim g(x) 가 존재하고 lim g(x) ̸= 0이면 극한 lim 이 존재하며
x→a x→a x→a x→a g(x)

f (x) limx→a f (x)


lim =
x→a g(x) limx→a g(x)

을 만족한다. 만약 이 조건이 성립하지 않으면 우항은 의미를 가지지 않는다. 하


지만 좌항의 극한은 아직 존재 할 수 있다. 좌항의 발산 여부를 쉽게 알 수 있는
경우도 있다. 가령 다음의 경우는 좌항은 발산한다:

lim g(x) = 0 이고 lim f (x) = c ̸= 0 또는 lim f (x) = ±∞


x→a x→a x→a

Problem 16.1. 수렴 여부를 쉽게 알 수 있는 경우에 대해 극한을 설명하시오.

Solution 16.1 일단 (limx→a f (x), limx→a g(x)) = (c, 0)인 경우를 고려해 보자. 만
약 극한 값 c가 0이아닌 실수 이거나 ±∞ 이면 그 극한은 c의 부호에 따라 ±∞
로 발산하게 된다. 그리고 (limx→a f (x), limx→a g(x)) = (c, ±∞)인 경우는 극한 c가
실수이면 위의 quotient는 0으로 수렴하게 된다. ⊔ ⊓

그러나 두 극한이 모두 0으로 수렴 하든지 또는 모두 발산하면, 즉

lim ( f (x), g(x)) = (0, 0) or (±∞, ±∞)


x→a

인 경우에는 직관으로 간단히 알 수 없다. 이 경우 극한을 찾는 편리한 방법이


L’Hopital’s rule이다.
여기서 우리는 극한을 다루기 때문에 a에서의 함수값 f (a)와 g(a)가 무엇인지
는 상관하지 않고 그 극한에 관심이 있다. 연속 함수일 때는 극한과 함수 값이
같다. 위의 극한이 one-sided limit 이어도 좋고 a가 실수가 아니라 ∞ 이거나 −∞

129
130 16 L’Hopital’s rule, big-oh, and little-oh

이어도 좋다. 물론 증명은 그에 맞추어 주어야 한다. 모든 경우에 대한 증명은 안


하지만 대표적인 두 경우에 대해 L’Hopital’s rule을 증명한다.
0
Theorem 16.1 (L’Hopital’s rule for 0 and a ∈ R). Suppose that lim ( f (x), g(x)) =
x→a
(0, 0). If f and g are differentiable in (a − δ , a + δ ) for some δ > 0, and g(x) ̸= 0
for x ̸= a in the interval, then

f (x) f ′ (x)
lim = lim ′ . (16.1)
x→a g(x) x→a g (x)

증명을 하기 전에 몇 가지 확일할 것이 있다. 위 식 (16.1)은 우항이 수렴 한다는


것을 가정하지 않는다. 발산할 때도 성립한다. Rule을 적용해도 수렴 여부가 확정
되지 않지만 L’Hopital’s rule을 사용할 조건이 되면 여러번 더 사용할 수 있다.

Proof. x ∈ (a−δ , a+δ )라고 하자. f 와 g가 (a−δ , a+δ ) 에서 미분 가능하고 모든


t ∈ (a − δ , a) ∪ (a, a + δ )에 대해 g′ (t) ̸= 0 이므로 Cauchy’s Mean Value Theorem
3.3에 의해서
f ′ (c) f (x) − f (a)

=
g (c) g(x) − g(a)
을 만족하는 c가 x과 a 사이에 존재한다. f 와 g가 미분가능한 함수이므로 점 a에서
연속이고 따라서 f (a) = g(a) = 0이다. 따라서 위의 식은

f ′ (c) f (x)

=
g (c) g(x)

이 된다. 여기서 c는 x에 대한 함수로 볼 수 있고 a와 x 사이에 있다. x기 a로 수렴


하면 sandwich 논법에 의해서 c도 a로 수렴한다. 따라서

f (x) f ′ (c(x)) f ′ (x)


lim = lim ′ = lim ′ .
x→a g(x) x→a g (c(x)) x→a g (x)

위 증명은 극한이 수렴한다는 가정을 하지 않았고 발산하는 경우도 포함한다. ⊔


Problem 16.2. 다음 극한을 구하시오. √


3x − cos x 3x − sin x 1+x−1
(1) lim (2) lim (3) lim
x→0 x x→0 x x→0 x
x − sin x sin x
(4) lim (5) lim 2
x→0 x3 x→0 x

Solution 16.2 (1)은 분모는 0으로 수렴하고 분자는 -1로 수렴하므로 양의 무한대
와 음의 무한대로 발산한다 (우극한은 −∞ 좌극한은 ∞). (2)의 경우는 분모 분자
모두 0으로 수렴하는 경우이므로 L’Hopital’s rule을 사용한다. 그러면
3x − sin x 3 − cos x
lim = lim = 2.
x→0 x x→0 1
(3)도 분모 분자 모두 0으로 수렴하므로 L’Hopital’s rule을 사용하면
16.1 L’Hopital’s rule 131

1+x−1 (1 + x)−0.5 × 0.5
lim = lim = 0.5.
x→0 x x→0 1
(4)도 분모 분자 모두 0으로 수렴하므로 L’Hopital’s rule을 사용 할 수 있고, 따라서
x − sin x 1 − cos x
lim = lim .
x→0 x3 x→0 3x2

그런데 얻은 식도 00 의 꼴로 결론을 내릴 수 없다. L’Hopital’s rule을 연속으로 사


용하면
x − sin x 1 − cos x sin x cos x 1
lim = lim = lim = lim = .
x→0 x3 x→0 3x2 x→0 6x x→0 6 6
(Theorem 16.1의 L’Hopital’s rule을 연속으로 3번 사용했다.) (5)의 경우에는
sin x cos x
lim 2
= lim
x→0 x x→0 2x

로 발산 한다. ⊔


Theorem 16.2 (L’Hopital’s rule for ∞ and a ∈ R). Suppose that lim ( f (x), g(x)) =
x→a+
(±∞, ±∞). If f and g are differentiable in (a, b) and g′ (x) ̸= 0 for x ∈ (a, b), then

f (x) f ′ (x)
lim = lim ′ .
x→a+ g(x) x→a+ g (x)

이 정리에서는 우극한에 대해서 말하고 있다. 좌극한에 대해서도 대응되는 조건


에서 대응되는 사실이 성립한다.

Proof. f (x)와 g(x)는 x → a+ 일 때 발산 하므로 0의 값을 갖지 않는다고 가정해도


1
된다. 아닐 경우 b를 a와 가깝게 다시 잡으면 되기 때문이다. 이제 F(x) = f (x) 라
1
고 하고 G(x) = g(x) 라고 하자. F(a) = G(a) = 0로 정의하면 F와 G는 a에서 right
continuous하다. F와 G에 대해서 앞 정리의 증명에서 처럼 Cauchy’s Mean Value
Theorem 3.3을 적용하면 모든 x ∈ (a, b)에 대해서

F(x) F ′ (c) g(x) f ′ (c) g2 (c)


= ⇒ = ′
G(x) G′ (c) f (x) g (c) f 2 (c)

을 만족하는 c가 a와 x 사이에 존재한다. 여기서 c는 x에 대한 함수로 볼 수 있고 a


와 x 사이에 있다. x가 a로 수렴하면 c도 a로 수렴한다. 따라서

g(x) f ′ (c) g2 (c) f ′ (x) g2 (x)


lim = lim ′ 2
= lim ′ lim 2
x→a+ f (x) x→a+ g (c) f (c) x→a+ g (x) x→a+ f (x)

을 얻는다. 다시 쓰면 정리의 관계를 얻는다. ⊔



132 16 L’Hopital’s rule, big-oh, and little-oh


Problem 16.3 (L’Hopital’s rule for ∞ and 00 when a = ±∞). Theorems 16.1과
0 ±∞
16.2의 증명은 와 꼴일 때의 L’Hopital’s rule을 극한점 a 실수일 때 보였다.
0 ±∞
극한점이 ∞ 인 경우에 해당하는 정리를 서술하고 증명하시오.

Solution 16.3 Theorems 16.2를 증명한 기본 방법은 상황을 Theorems 16.1에 해


당하도록 변경하는 것이었다. 이를 위해 f , g을 직접 다루지 않고 F = 1f 와 G = g1
바꾼후에 고려 했다는 것을 상기하자. 이제는 함수 값의 문제가 아니라 변수의
문제이다. 변수 변환으로 해결이 될까? ⊔ ⊓

Problem 16.4. 다음 극한을 계산 하시오.


sec x ln x
(1) lim . (2) lim √ .
x→π/2 1 + tan x x→∞ x

Solution 16.4 ⊔

극한 lim f (x)를 직접 구하기 힘들때 간접적으로 구하는 방법을 소개한다. φ


x→a
를 연속 역함수라고 하고 φ −1 를 그 역함수라고 하자. 이때 lim f (x)를 구하기는
x→a
힘들지만 lim φ ( f (x))는 구하기 쉬운 경우가 있다. 그 극한을 A라고 하면, φ 는 연
x→a
속함수 이므로
A = lim φ ( f (x)) = φ (lim f (x)).
x→a x→a

따라서 역함수를 적용하면

lim f (x) = φ −1 (A).


x→a

이러한 논리와 L’Hopital’s rule을 같이 사용하면 다음을 계산할 수 있다.

Problem 16.5. 다음 극한을 계산 하시오.


(1) lim (1 + x)1/x . (2) lim x1/x .
x→0 x→∞

Solution 16.5 (1) 일단 ln을 취하면 간단해 질 것 같다.

ln(1 + x) 1/(x + 1)
lim ln(1 + x)1/x = lim = lim = 1.
x→0 x→0 x x→0 1

Therefore, lim (1 + x)1/x = e1 = e.


x→0

(2)도 ln을 취하면 간단해 질 것 같다.

ln x 1/x
lim ln x1/x = lim = lim = 0.
x→∞ x→∞ x x→∞ 1

Therefore, lim x1/x = e0 = 1. ⊔



x→∞
16.2 Big-oh and Little-oh 133

16.2 Big-oh and Little-oh

이번 절은 극한적 크기를 비교하는 수학적 언어에 관한 것이지만 그 개념을 정확


히 가지고 있으면 도움이 된다. 크기의 비교이니까 양의 값을 가지는 두 함수를
비교한다.
두 개의 양의 함수 f (x)와 g(x)를 고려하자.

Definition 16.1. We say f (x) = o(g(x)) (little-oh) as x → a for a ∈ R or a = ±∞ if

f (x)
lim = 0.
x→a g(x)

We say f (x) = O(g(x)) (big-oh) as x → a for a ∈ R or a = ±∞ if there exists an


upper bound M > 0 such that

f (x)
≤M for x close enough to a.
g(x)

다시 말해서 함수 f 가 little-oh o(g) as x → a라는 말은 f 는 g보다 a 근처에서 훨


씬 작다는 말이다. 훨씬 작다의 의미는 그 비율이 0으로 수렴할 정도라는 말이다.
또 f 가 big-oh O(g) as x → a라는 말은 x가 a에 접근할 때 f 는 g의 상수배 보다는
작다는 말인데 여기에 상수배에는 0까지 포함 되어 있다. 따라서 f 가 g 보다 훨
씬 작을 수도 있고 두 함수가 상수배 차이나는 정도의 서로 비슷한 크기일 수도
있다는 뜻이다. 이 정의에서 little o(g)인 함수들의 집합은 big O(g)인 함수들의
부분집합으로 고려하고 있다는 것을 확인하자.

Problem 16.6. (1) f (x) = ex 와 g(x) = x2 에 대해 함수의 크기를 x → ∞인 경우 비


교하시오. (2) f (x) = x2 와 g(x) = |x|3 에 대해 크기를 x → 0인 경우 비교하시오.

Solution 16.6 (1)은 L’Hopital’s rule을 사용하면

f (x) ex
lim = lim 2 = ∞.
x→∞ g(x) x→∞ x

따라서 g = o( f ) (or x2 = o(ex )) as x → ∞라고 말할 수 있다.


(2)의 경우에는
f (x) x2
lim = lim 3 = ∞
x→0 g(x) x→0 x

을 만족하므로 x3 = o(x2 ) as x → 0이다. x가 음수일 때도 고려면 x3 은 음수가 될


수 있으니 |x|3 = o(x2 ) as x → 0라고 말하는 것이 더 낫다. ⊔

Problem 16.7. 다음의 asymptotic comparison이 맞는지 틀린지 확인하시오.


(1) ln x = o(x) as x → ∞ (2) x2 = o(x3 + 1) as x → ∞ (3) x = o(ex ) as x → ∞
(4) ex = o(x) as x → ∞ (5) x3 = o(x2 ) as x → 0+ (6) x = o(xx ) as x → 0+
134 16 L’Hopital’s rule, big-oh, and little-oh

Solution 16.7 ⊔

Exercises

1.
Lecture 17
Integration Techniques # 1

이번과 다음 강의에서는 몇가지 적분 기법을 배운다. 미분을 할 때는 chain rule,


product rule 등을 잘 사용하면 어려움 없이 많은 함수를 미분할 수 있지만 적분은
유형별로 기술이 필요하고 그 기술을 익혀야 사용할 수 있다. 그럼에도 불구하고
손으로 적분하지 못하는 함수들도 많다. 이런 경우는 구분 구적법을 컴퓨터를 이
용하여 수치적으로 계산할 수도 있고 컴퓨터 소프트 웨어를 사용하여 적분을 할
수 도 있다.

Derivatives of some functions

일단 몇 가지 특수 함수들의 미분을 기억해야 한다. 아래의 리스트를 참조하자.


d x

 dx e = ex
d x
= ax ln a

 dx a



d
dx ln(|x|) = 1x (17.1)
d
 dx arcsin x = √1 2




 1−x
d 1
dx arctan x = 1+x2

만약 식 (17.1)의 오른쪽 함수들에 대한 antiderivative를 모두 구하고 싶으면 단순


히 왼쪽 함수에 general constant C를 더하기만 하면 된다. 이것은 오른쪽 함수에서
시작해서 왼쪽의 함수를 찾아내는 과정이 아니고 단순히 기억하는가의 문제이다.
그래서 적분엔 기억이 중요하다. 이러한 몇가지 기억과 몇가지 적분 기법이 합해
지면 꽤 다양한 경우에 대한 적분을 할 수 있다.

135
136 17 Integration Techniques # 1

17.1 Substitution

substitution 기법은 chain rule을 역으로 사용하는 것이다. 만약 식 (17.1)의 왼쪽에


있는 함수 f (x)의 x자리에 어떤 함수 u(x)가 들어가서 합성함수 f (u(x))를 만들면
그 미분은 chain rule에 따라
d
f (u(x)) = f ′ (u(x))u′ (x)
dx
이다. 따라서 f ′ (u(x))u′ (x)의 부정 적분은 f (u(x)) + C가 된다. 이 원리를 기법적
으로는 단순히
u′ dx = du (17.2)
로 적는다. 그 후에 위에서 설명한 chain rule을 역으로 따라가면
Z Z
f ′ (u(x))u′ (x)dx = f ′ (u)du = f (u) +C = f (u(x)) +C

가 된다. 두 번째 적분은 x에 대해서 적분하는 것이 아니라 x는 잊어 버리고 u를


변수로 생각해 적분한다는 뜻이다. 위의 식 (17.2)는 단순히 substitution을 위한 기
법을 넘어서 Lecture 14에서 differential의 정의로 사용했다. 이 모든 것이 가능한
이유는 chain rule이다.
실제 사용하기 위해서는 무엇이 u가 되고 무엇이 u′ 이 되는 지를 찾아 내는 것이

핵심이다. 가령 √ 1 2 의 적분은 arcsin(x) +C이다. 이 대신에 √ u (x) 2 의 적분을
1−x 1−u(x)
1
구한다면 답은 arcsin(u(x)) +C이다. √ 의 적분을 구하는 것은 더 어렵지만
1−u(x)2
여기에 u′ (x)가 곱해진 것의 적분은 substitution 기법 덕분에 쉽다. 그런데 √ x
1−x4
의 적분은 어떻게 구할까? 이 문제는 u = x2 를 사용한다는 것을 보는 것이 중요
하다.
연습 문제를 몇 개 해보자. 그 과정에서 더 명확하게 이해하게 될 것이다.

Problem 17.1. 다음 다섯 경우의 부정 적분을 구하시오. Z


1 1 1 2x − 3
Z Z Z
(1) 2 +A
dx (2) 2 − x2
dx (3) 2
dx (4) √ dx
x a 8x − x x 2 − 3x + 1
1
Z
(5) dx
1 − sin x

Solution 17.1 (1)



1 1/A 1 1/ A
Z Z Z
dx = √ dx = √ √ dx
x2 + A (x/ A)2 + 1 A (x/ A)2 + 1
√ √
= arctan(x/ A)/ A +C.



17.2 Integration by parts 137

Problem 17.2. 다음 네 경우의 부정 적분을 구하시오.


3x2 − 7x 3x + 2 1
Z Z Z Z
(1) dx (2) √ dx (3) √ 3 dx (4) x3 cos xdx
3x + 2 1−x 2 (1 + x)
Solution 17.2 ⊔

Substitution의 다른 예를 살펴보자. sine을 미분하면 cosine이고 cosine을 미분


하면 Rsine이니까 이 관계를 잘 이용하면 sine과 cosine 의 곱들을 적분할 수 있다.
가령 cosk x sin xdx를 계산하려면 u = cos x로 치환한다. 그러면 du는 − sin xdx가
되므로
1 k+1 1
Z Z
cosk x sin xdx = − uk du = − u +C = − cosk+1 x +C
k+1 k+1
이 된다. 이와 같이 sin x가 하나만 있고 나머지는 모두 cos x이거나 그 반대이면
치환하기 좋다. 만약 그렇지 않더라도 sin x가 홀수 제곱으로 있는 경우에는 쉽게
적분 할 수 있다. 다음의 몇가지 문제를 통해서 Trigonometric substitution을 연습
해보자.

Problem 17.3. 다음 적분을 계산 하시오.


Z Z Z Z
sin3 x cos xdx, sin3 x cos2 xdx, cos5 xdx, sin2 x cos4 xdx.

Solution 17.3 가장 적분이 어려운 경우는 (iv)이다. 나머지는 오히려 쉽다. 이


경우는 sin x와 cos x가 모두 짝수 제곱만 있으니까 적분을 구하기 힘들다. 2배각
공식을 사용하자.
1 − cos 2x 1 + cos 2x
sin2 x = , cos2 x = .
2 2
문제를 다시 쓰면

1 − cos 2x 1 + 2 cos 2x + cos2 2x


Z Z
sin2 x cos4 xdx = × .
2 4
정리하면 cosine의 1,2,3 제곱 항이 나오고 각각을 적분하면 된다. ⊔

17.2 Integration by parts

아마도 가장 많이 사용하고 중요한 적분 기법은 integration by parts 부분적분이


다. 이 기법은 미분 법칙 중 product rule을 역으로 사용하는 방법이라고 생각하면
된다.
곱셈의 미분 법칙 product rule을 다시 적으면 다음과 같다:

(uv)′ = u′ v + uv′ ⇒ u′ v = (uv)′ − uv′ .


138 17 Integration Techniques # 1

양변을 적분하면 다음의 부정적분 공식을 얻는다.


Z Z
u′ vdx = uv − uv′ dx.

그런데 적분이 끝난 것이 아니다. 오른 쪽에 적분이 하나 더 있다. 좋아진 점이 있


나? 그 것은 하기 나름이다. 오른쪽의 적분이 왼쪽의 적분보다 더 쉬운것이 되도록
하는 것이 핵심이다. 어떻게 해야 할까?
R
우선 적분을 두 함수의 곱으로 봐야한다. 그러면 f (x)g(x)dx를 integration by
parts를 이용해서 적분하기 위해서는 f 와 g중에 무엇을 u′ 으로 무엇을 v로 둘 것
인지를 정해야 한다. 그 판단은 무엇이 적분하기 쉬운지 무엇이 미분하면 간단해
지는지를 보고 결정한다. 적분하기 쉬운것이 u′ 이고 미분하면 간단해 지는 것이 v
이다. 가령 f 의 적분을 구하기 쉽고 g′ 을 f 의 적분에 곱하면 간단해져서 적분하기
쉽다면 다음과 같이 한다.
Z Z Z
u′ = f , v = g ⇒ f gdx = u′ vdx = uv − uv′ dx.

이 관계를 보면 부분 적분법은 기본적으로 미분의 위치를 바꾸는 것이다. uv′ 을


적분 하는 것이 u′ v를 적분하는 것 보다 간단할 때 부분적분을 사용한다.
다음의 몇가지 문제를 통해서 부분적분을 연습해보자.

Problem
Z 17.4. 부분 적분을
Z 사용하여 다음을
Z 적분하시오.Z
(1) x cos xdx (2) ln xdx (3) x2 ex dx (4) ex sin xdx

Solution 17.4 (1) x와 cos x 모두 적분을 할 수도 있고 미분을 할 수 있지만 x는


미분을 하면 간단해 지니까 미분할 것은 v = x 그리고 적분할 것은 u′ = cos x이다.
부분 적분을 이용하면 u = sin x이고 v′ = 1 이므로
Z Z
x cos xdx = x sin x − sin xdx = x sin x + cos x +C.

(2) 두 번째 문제는 lnRx 하나만 있고 R


이 함수의 적분은 모르겠다. 미분은 1x 이다. 미
분은 할 수 있으니까 ln xdx = 1 ln xdx로 즉 1과 ln x의 곱으로 고려해서 u = ln x,
v′ = 1로 잡으면 u′ = 1x , v = x이므로

1
Z Z Z
ln xdx = 1 ln xdx = x ln x − x dx = x ln x − x +C.
x

(3) ex 는 미분을 하던 적분을 하던 바뀌지 않지만 x2 은 미분을 하면 간단해 진다.


특히 2번 미분하면 1이 된다. 따라서 u′ = ex 로 놓고 v = x2 으로 놓은 후 부분적분을
2번 정도 쓰면 될 것 같다. 해보면
Z Z Z
x2 ex dx = x2 ex − 2xex dx = x2 ex − 2xex + 2ex dx = x2 ex − 2xex + 2ex +C.
17.2 Integration by parts 139

(4) ex 와 sin x는 모두 미분과 적분이 쉽지만 그렇다고 간단해 지지는 않는다. 그


런데 ex 는 미분과 적분을 해도 바뀌지 않고 sin x는 두 번 미분하면 − sin x가 된다.
그러면 간단히 할 수 있다. 해보면
Z Z Z
ex sin xdx = ex sin x − ex cos xdx = ex sin x − ex cos x − ex sin xdx.
R x
e sin xdx에 대해서 다시 풀면

1 x
Z 
ex sin xdx = e sin x − ex cos x +C. ⊔

2

부분 적분은 매우 유용하다. 다음은 부분적분의 또다른 이용 방법을 보여 준다.

Problem 17.5 (Reduction). 적분 cosn xdx을 구하시오.


R

Solution 17.5 n = 1이면 부정적분은 sin x+C이다. n ≥ 2인 경우를 생각하자. 일단


Z Z
n
cos xdx = cosn−1 x cos xdx

로 나누어 쓰고 부분적분을 쓰자. 적분할 것은 u′ = cos x 미분할 것은 v = cosn−1 x.


그러면 u = sin x and v′ = −(n − 1) cosn−2 x sin x이다. 따라서
Z Z
cosn xdx = cosn−1 x sin x − (n − 1) cosn−2 x sin2 xdx
Z
= cosn−1 x sin x − (n − 1) cosn−2 x(1 − cos2 x)dx
Z Z
= cosn−1 x sin x − (n − 1) cosn−2 xdx + (n − 1) cosn xdx.

정리해서 다시 쓰면 다음을 얻는다


Z Z
n n−1
(2 − n) cos xdx = cos x sin x − (n − 1) cosn−2 xdx.

따라서 n ̸= 2 이면,
1 n−1
Z Z
cosn xdx = − cosn−1 x sin x + cosn−2 xdx
n−2 n−2
을 얻는다. 이 식은 일종의 reduction formula이다. 일단 n = 1, 2의 경우의 적분을
계산 하고 나면 그 이후의 것은 그 이전의 적분 값을 이용해서 얻는다. ⊔ ⊓
Lecture 18
Integration Techniques # 2

18.1 Trigonometric substitution

√ √ √
Trigonometric substitution 은 a2 + x2 , a2 − x2 , √x2 − a2 을 포함하는 함수를
적분하는 방법이다. 그림을 참조해서 하나씩 해보자. a2 + x2 을 다루기 위해서는
그림의 첫번째 삼각형이 주는 다음의 관계를 이용한다:


 x = a tan θ
dx = a sec2 θ dθ

θ = arctan(x/a), − π2 ≤ θ ≤ π2
√ 2



a + x2 = a sec θ

1
Z
Problem 18.1. 적분 √ dx을 구하시오.
4 + x2

Solution 18.1 a = 2, x = 2 tan θ , dx = 2 sec2 θ dθ , 4 + x2 = 2 sec θ 를 대입하면

1 2 sec2 θ
Z Z Z
√ dx = dθ = secθ dθ
4 + x2 2 sec θ

로 치환된다. 즉 x에 대한 적분이 각도 θ 에 대한 적분으로 변환 되었다. 이제 삼각


함수의 적분을 이용하면 다음을 얻는다:

141
142 18 Integration Techniques # 2

4 + x2 x
Z
secθ dθ = ln | sec θ + tan θ | +C = ln + +C. ⊔

2 2

a2 − x2 을 다루기 위해서는 그림의 두번째 삼각형이 주는 다음의 관계를 이용
한다: 

x = a sin θ

dx = a cos θ dθ
θ = arcsin(x/a), − π2 ≤ θ ≤ π2
√ 2



a − x2 = a cos θ .

1
Z
Problem 18.2. 적분 √ dx을 계산하시오.
4 − x2

Solution 18.2 a = 2, x = 2 sin θ , dx = 2 cos θ dθ , 4 − x2 = 2 cos θ 를 대입하면
1 2 cos θ
Z Z
√ dx = dθ = θ +C = arcsin(x/2) +C. ⊔

4 − x2 2 cos θ

x2 − a2 을 다루기 위해서는 그림의 세번째 삼각형이 주는 다음의 관계를 이용
한다: 

x = a sec θ

dx = a sec θ tan θ dθ
θ = arcsec(x/a), 0 ≤ θ ≤ π
√ 2


x − a2 = a| tan θ |.

Problem 18.3.
1
Z
√ dx =?.
2
x −4
Solution 18.3
1 2 sec θ tan θ
Z Z
√ dx = dθ =
2
x −4 2| tan θ |

18.2 Integration of rational functions

유리함수 Rational function은 분모와 분자가 다항식인 함수이다. 예를 들면

x4 + 2x3 + x2 + x + 1
f (x) =
x3 + 1
과 같다. 이 절에서는 이런 함수의 적분을 구한다. 일단 분자의 차수가 높으면 다시
정리해서 다음과 같이 나누어 쓸수 있다.
18.2 Integration of rational functions 143

x4 + 2x3 + x2 + x + 1 x2 − 1
3
= x+2+ 3 .
x +1 x +1
이와 같이 모든 rational function은 다항식과 분자의 차수가 분모의 차수보다 낮은
rational function의 합으로 쓸수 있다. 다항식의 적분은 잘 구하니까 우리는 분자의
차수가 분모의 차수보다 낮은 rational function의 적분만 구하면 된다. 즉

q(x)
f (x) = , deg(q) < deg(p)
p(x)

의 적분을 하는 것이 이번 절의 목적이다.
일단 매우 중요한 대수학의 정리를 이용해야 한다.

Theorem 18.1 (Fundamental Theorem of Algebra). 최고차 한의 계수가 1인 다


항식 p(x) 는 다음과 같이 인수 분해 된다:

p(x) = p1 (x) · · · pk (x).

여기서 pi (x)들은 더이상 인수 분해가 안되는 1차 또는 2차 다항식으로 각각의


최고차 항의 계수가 1이다.

더 이상 인수 분해가 되지 않는 다항식을 irreducible polynomial이라고 부른


다. 위 정리를 통해 3차 이상의 다항식은 인수 분해가 되고 2차식 중에는 인수
분해가 되는 것도 있고 안되는 것도 있다는 것을 알 수 있다.

Problem 18.4. a2 − 4b < 0이면 2차식 x2 + ax + b가 irreducible 임을 보이시오.

Solution 18.4 2차 방정식 x2 + ax + b = 0가 두 개의 실수 근 α, β 를 가지면 2차


식은 (x − α)(x − β )로 인수 분해 되어서 irreducible이 아니다. 따라서 판별식이 0
보다 작다는 것이 조건이다. ⊔ ⊓

2차식을 제곱 꼴로 다시쓰면
 a 2 a2 − 4b
x2 + ax + b = x + + A, A=−
2 4
을 얻는다. 따라서 2차식이 irreducible이면 위의 꼭지점에서의 값 A가 양수이고
그래프는 x축을 지나지 않으며 실근이 없다.
이제 분모가 irreducible인 경우의 적분을 구해보자.

Problem 18.5 (Irreducible denominators). 다음 적분식을 보이시오. 단, 2번째


식은 분모가 irreducible하다는 것을 가정하시오. 즉, a2 < 4b을 가정하시오.
b
Z
dx = b ln |x + a| +C
x+a
Z
cx + d c ac √ √
2
dx = ln |x2 + ax + b| + (d − ) tan−1 ((x + a/2)/ A)/ A +C,
x + ax + b 2 2
144 18 Integration Techniques # 2

4b−a2
where A = 4 > 0.

Solution 18.5 첫째 식은 자연 로그를 사용하여 얻는다. 즉,


b 1
Z Z
dx = b dx = b ln |x + a| +C.
x+a x+a

둘째 식을 유도해 보자. 분모의 미분은 (x2 + ax + b)′ = 2x + a라는 것을 고려하여


분자를 다시 쓰면,
Z c ac
cx + d 2 (2x + a) + d − 2
Z
dx = dx
x2 + ax + b x2 + ax + b
c 2x + a ac 1
Z Z
= 2
dx + (d − ) 2
dx.
2 x + ax + b 2 x + ax + b
첫번채 항은 substitution을 사용하면
c 2x + a c
Z
dx = ln |x2 + ax + b|.
2 x2 + ax + b 2
두 번째 항은 분모를 제곱 꼴로 고치면
Z
1
Z
1 √ √
2
dx = 2
dx = arctan((x + a/2)/ A)/ A,
x + ax + b (x + a/2) + A
2 −4b
where A = − a 4 > 0. 이 둘을 더하면 문제에 주어진 두번째 식을 얻는다. ⊔

Partial fraction

이제까지 분모의 차수가 1차인 경우와 분모의 차수가 2차이면서 irreducible인 경


우 이 두가지 경우에 대한 적분을 구했다. 이제는 partial fraction을 통해서 임
이의 rational function을 이 두가지 경우의 합으로 나타낸다. 그러면 모든 rational
function을 적분 할 수 있게 된다.
partial fraction은 rational function을 분모가 1차 또는 2차인 rational function
의 합으로 쓸수 있다는 것이다. Theorem 18.1에 따르면 모든 rational function은
다음과 같이 쓸 수있다:
q(x) q(x)
= .
p(x) p1 (x) · · · pk (x)
이 사실을 이용하면 partial fraction을 할 수 있다. 일단 차수를 구분하여 배열해서
i ≤ ℓ에 대해서 pi 가 1차식이고 그 이후의 항은 2차 식이면

q(x) a1 aℓ aℓ+1 x + bℓ+1 ak x + bk


= +···+ + +···+ (18.1)
p1 (x) · · · pk (x) p1 (x) pℓ (x) pℓ+1 (x) pk (x)

을 만족하는 ai 와 bi 를 찾을 수 있다. partial fraction의 핵심은 이와 같이 분모의 차


수가 1차 또는 2차인 rational function으로 나누어진다는 것이고 이미 우리는 그
18.2 Integration of rational functions 145

각각을 적분하는 방법을 알고 있다. 그러나 조금 다르게 해야 하는 경우가 있는데


pi = p j 인 i ̸= j가 있는 경우에는 (18.1)의 꼴로 나오지 않는다. 아래에 예를 통해
partial fraction을 하는 방법을 다룬다.

Problem 18.6. 다음의 유리함수를 부분 분수 분해하시오.


5x + 3
.
x2 + 2x − 3

Solution 18.6 분모가 2차식이지만 irreducible은 아니다. x2 + 2x − 3 = (x − 3)(x +


1)으로 인수 분해 된다. 그리고

5x + 1 A B Bx − 3B + Ax + A (A + B)x + (A − 3B)
= + = =
(x − 3)(x + 1) x − 3 x + 1 (x − 3)(x + 1) (x − 3)(x + 1)

로 쓸수 있다. 따라서 A + B = 5 and A − 3B = 1을 풀면 A = 4, B = 1이다. 따라서


5x + 3 4 1
= + . ⊔

x2 + 2x − 3 x−3 x+1
5x+3
Problem 18.7. 유리 함수 (x+1)2
을 적분 하시오.

Solution 18.7 우선 부분 분수 분리를 해보자. 일단 (18.1)의 꼴로는 되지 않는다는


것을 쉽게 알수 있다. 만약 시도해 본다면,
5x + 3 A B A+B
= + =
(x + 1)2 x+1 x+1 x+1

가 되어서 해당하는 A, B를 구할 수 없다. 이와 같이 분모에 같은 항이 있을 경우


에는 다음과 같이 한다.
5x + 3 A B Ax + A + B
= + = .
(x + 1)2 x + 1 (x + 1)2 (x + 1)2

위의 첫 번째 스텝에서 어떻게 시작했는지를 잘 기억하자. 따라서 A = 5, B = −2


가 되고
5x + 3 5 2
= −
(x + 1)2 x + 1 (x + 1)2
된다. 그리고 두 항을 적분하면
5 2 2
Z Z
dx = 5 ln |x + 1| +C, − 2
dx = +C.
x+1 (x + 1) x+1

둘을 합하면 된다. ⊔

Problem 18.8. 다음을 적분하시오.


146 18 Integration Techniques # 2

3x3 + 2x2 + 2x + 1
.
(x2 + 1)(x + 1)2

Solution 18.8 이 적분을 계산 하려면 일단 partial fraction을 해야 한다.

3x3 + 2x2 + 2x + 1 Ax + B C D
= 2 + + .
(x2 + 1)(x + 1)2 x + 1 x + 1 (x + 1)2

계수 비교를 통해 A, B,C, D를 계산해야 한다. 계수 비교를 하면


1 1 5
A = , B = − , C = , D = −1
2 2 2
을 얻는다. 세 항을 적분하면
C 5 D 1
Z Z
= ln |x + 1|, = ,
x+1 2 (x + 1)2 x+1

Ax + B 1 1
Z
= ln |x2 + 1| − tan−1 (x).
x2 + 1 4 2
이 셋을 합하면 된다. ⊔

Lecture 19
Integration Techniques # 3

19.1 Improper integrals

일반 적분은 함수 f 가 bounded이고 적분 구간이 유한 구간 [a, b]일 때 하는데 이


때 적분을 ab f (x)dx으로 적고 proper integral이라고 한다. 그렇지 않은 improper
R

integral은 두 가지 경우가 있는데 함수 f 가 bounded가 아니거나 적분 구간이 유한


구간이 아닐 때 즉 [a, ∞), (−∞, a], 또는 (−∞, ∞) 일 때이다.

Improper integral of type #1

적분 구간의 크기가 무한일 때의 improper integral을 고려해 보자. 함수 f 가 R에서


정의된 연속함수이면 ab f (x)dx가 잘 정의된다. 적분 구간이 무한크기인 경우에
R

적분은 바로 정의 되지 않는다. 수학에서는 무한 번 더한다거나 하지 않는다. 오직


극한을 생각할 뿐이다. Improper integral은 다음과 같이 극한으로 주어진다:
Z ∞ Z b


 f (x)dx = lim f (x)dx,
b→∞ aZ
Zab


b
f (x)dx = lim f (x)dx,
a→−∞ a
Z−∞

 Z 0 Z b
 ∞
f (x)dx = lim f (x)dx + lim f (x)dx.


−∞ a→−∞ a b→∞ 0

Question 19.1. 우주의 크기는 무한인가? 사람들은 유한이라고도 하고 점점 더 팽


창하고 있다고도 한다. 그 너머까지 우주라고 하면 무한이라고 해도 딱히 할 말은
없다. 그런데 적분할 때 적분 구간이 무한이라는 것은 어떤 의미가 있나? 이를
우려해야 하나?

Z ∞ 19.1. 다음의Zimproper
Problem integral을Z 구하시오.
ln x ∞ dx ∞
(1) 2
dx (2) 2
(3) x p dx
1 x −∞ x + 1 1

147
148 19 Integration Techniques # 3

Solution 19.1 (1) 이 문제를 보고 integration by part를 사용하는 것이 적절 하다


는 것을 알아 차려야 한다. ln x를 미분하면 1/x가 되니까 단순화 될 것이 보인다.
따라서 미분을 할 것을 v = ln x, 적분을 할 것을 u′ = x−2 를 정하고 나면 v′ = x−1 ,
u = −x−1 이므로
Z b b
Z b b ln b 1
u′ v = −x−1 ln x + x−2 = −x−1 ln x − x−1 =− − + 1.
1 1 1 1 b b
b → ∞ 극한을 택하면 1을 얻는다.
(2) 이 문제는 arctangent 함수의 미분을 기억하면 쉽다. 계산을 안해도 답이 π
라는 것이 보이는 것도 같다. 일단 해보자.
Z b b
dx π
= arctan x = arctan b − 0 → as b → ∞,
0 x2 + 1 0 2
Z 0 0
dx π
= arctan x = 0 − arctan b → as b → −∞.
b x2 + 1 b 2
둘을 더하면 답은 π이다.
(3) 이 문제는 쉬운 문제이지만 그 의미는 매우 중요해서 기억해야 한다. 함수
x p 의 무한대에서의 적분가능성에 대한 성질을 생각해 보게 한다. p ̸= −1이면
Z b b
1 p+1 1
x p dx = x = (b p+1 − 1).
1 p+1 1 p+1

b → ∞ 극한을 택하면 p > −1 인 경우에는 무한대로 발산하고 p < −1인 경우에는


1
− p+1 로 수렴한다. p = −1인 경우에는 ln b로 역시 무한대로 발산한다. ⊔

위 문제의 마지막 경우는 기억해 둘 필요가 있어서 아래에 다시 정리한다.


(
∞, p ≥ −1
Z ∞
p
x dx = −1 (19.1)
1 p+1 , p < −1.

자연 로그 ln x을 소개 할 때 보았듯이 경계는 p = −1이다.


R∞ 1 R∞ 1
Problem 19.2 (Comparison). 1 1+x2 와 1 x2 의 크기를 비교하시오.

Solution 19.2 다음의 comparison 관계를 고려하자.


Z b Z b
0 ≤ f (x) ≤ g(x) in [a, b] ⇒ 0 ≤ f (x)dx ≤ g(x)dx.
a a
R∞ 1 R∞ 1 R ∞ −2
따라서 1 1+x2 ≤ 1 x2 이다. 그리고 1 x = 1이고
Z b b
dx π π
= arctan x = arctan b − → as b → ∞.
1 x2 + 1 1 4 4
19.1 Improper integrals 149

따라서 π
4 < 1, 즉 π < 4를 얻는다. (Not bad.) ⊔

Improper integral of type #2

함수의 크기가 무한일 때의 improper integral을 고려해 보자. 이 경우는 조금 더 주


의를 요한다. 만약에 함수 f 가 유한 구간 [a, b]에서 정의 되어 있고 한 점 x0 ∈ (a, b)
로 x가 접근할 때 극한이 무한으로 발산하는 경우를 생각하자. 즉, f (x) 는 모든
c < x0 에 대해서 구간 [a, c]에서 유한이고, 또한 모든 c > x0 에 대해서선 구간 [c, b]
에서 유한일 때 improper integral of f on [a, b] 는 다음과 같이 정의한다:
Z b Z c Z b
f (x)dx = lim f (x)dx + lim f (x)dx.
a c→x0 − a c→x0 + c

만약에 극한이 존재하면 improper integral이 존재하는 것이고 극한이 존재하지


않으면 improper integral이 존재하지 않는 것이다.

Problem 19.3. 다음을 보이시오


(
Z 1 1
p p+1 , p > −1
x dx = (19.2)
0 ∞, p ≤ −1.

Solution 19.3 p ̸= −1이면


Z 1 1
1 p+1 1
x p dx = x = (1 − b p+1 ).
b p+1 b p+1

b → 0 극한을 택하면 p < −1 인 경우에는 무한대로 발산하고 p > −1인 경우에는


1
p+1 로 수렴한다. p = −1인 경우가 결론을 내리기 어려운 경우인데 이미 자연로그
배웠고 ln b는 b → 0+ 로 수렴할 때 무한대로 발산한다. ⊔

(19.2)의 경우에도 (19.1)의 경우와 마찬가지로 p = −1이 경계를 이룬다. 그러


나 무한대로 발산하는 경우는 그 반대이다. 오직 p = −1의 경우만 두 경우 모두
발산한다.

Problem
Z 2
19.4. 다음을 계산하시오.
Z 2
1 1
(1) dx (2) dx
0 |x − 1|1/2 0 x−1

Solution 19.4 두 경우 모두 함수는 x = 1 근방에서 발산하므로 improper integral


에 해당한다. (1)은 변수 변환을 써보자. z = x − 1이라고 하면 dx = dz이고
Z 2 Z 1 Z 1
1
dx = |z|−1/2 dz = 2 z−1/2 dz = 4.
0 |x − 1|1/2 −1 0

(2)의 경우는 비슷하게 다음과 같이 할 수 있다. 일단,


150 19 Integration Techniques # 3
Z 2 Z 1 Z 0
1 1 1
dx = dz + dz.
0 x−1 0 z −1 z

마지막 적분 항에 변수 변환 y = −z를 쓰면, dy = −dz이고


Z 0 Z 0 Z 1
1 1 1
dz = − dy = − dy.
−1 z 1 −y 0 y

이제 다시 대입하면
Z 2 Z 1 Z 1
1 1 1
dx = dz − dy = 0.
0 x−1 0 z 0 y

그런데 이렇게 답하면 안된다. 물론 01 1z dz와 01 1y dy는 같은 것이지만 둘 모두


R R

발산하고 무한에서 무한을 빼면 0이라는 말인데 그렇게 말하는 것은 틀리다. 발


산한다고 답하는 것이 옳아보인다. ⊔

19.2 Integration with software

우리가 학습한 적분 방법은 물론이고 더 다양한 적분 방법이 컴퓨터 소프트웨어


에 저장 되어서 이용할 수 있다. 이 절에서는 몇 가지 예를 통해서 사용법을 알아
보겠다.

Problem 19.5.

Solution 19.5 ⊔

Problem 19.6.

Solution 19.6 ⊔

Part IV
Approximation Techniques and Series
실제 문제를 다룰때 참값을 다룰 수가 없어 근사값으로 작업 해야 하는 경우가
대부분이다. 가령 원주율 π는 무리수이어서 컴퓨터로 참값을 다루지 못하지만
비행기를 날리고 인공위성을 궤도에 올리기 위해서는 매우 정밀한 근사값이 필
요하다. 그런데 근사 값을 사용 할때 두 가지 중요한 요소가 있다. 무엇일까?
하나는 정밀도가 높아야 좋은 근사이고 다른 하나는 근사값과 참 값의 최대 오
차범위를 알아야 한다. 수렴성이 매우 좋지만 오차 범위를 모르는 근사 방법과
수렴성은 낮지만 오차 범위를 아는 근사 방법이 있다고 하자. 보스는 무엇을 택
할까? 대부분의 보스는 오차범위를 아는 근사 방법을 택할 것이다. 그만큼 오차
범위를 아는 것이 중요하다.
수열과 급수는 대수처럼 보이는데 왜 미적분학에서 다루는 것일까? 그것은 근
사를 다루는 수학이 미적분과 해석학이기 때문이다. 특히 테일러 전개는 미분을
사용해서 함수를 근사하는 방법이다. 일반적으로 함수를 근사할 때는 특정한 함
수열 φi 가 먼저 주어지고 근사하고자 하는 목표 함수 f (x)를 함수열 φi 의 선형
조합으로 근사한다. 즉,

f (x) ∼
= ∑ ai φi (x)
i=0

의 꼴이다. 주어진 함수 f (x)에 따른 수열 ai 를 찾고 이렇게 만든 함수열의 수렴


여부와 수렴하는 x 구간을 찾으며 가능하다면 최대 오차 범위 까지 찾는 것이
목표이다. 테일러 전개에서는 φi (x) = xi 또는 φi (x) = (x − x0 )i 로 주어지고 계수 ai
를 미분을 이용해서 찾는다. 그리고 오차범위를 계산한다. 그 외에도 다양한 근사
방법이 있는데 함수열 φi 를 어떻게 구성하는가가 핵심이다.
만약 x에 특정 수를 대입하면 위 식의 우측은 급수이다. 그러한 이유로 우리는
일단 기본이 되는 수열과 급수의 성질을 먼저 이해한 후에 함수열을 고려 한다. 데
이타와 뉴론네트워크를 이용해서 근사값을 구하는 것이 AI라면 미분으 이용해서
근사를 하는 함수를 찾아 내는 것이 테일러 전개다. 테일러 전개에는 AI에 없는 것
이 있다. 바로 error estimation이다. AI를 이용한 근사도 최대 오차범위를 제공해
줄수 있다면 확신을 가지고 사용할 수 있을 것이지만 AI근사의 오차범위에 대한
이론은 불가능해 보인다.
Lecture 20
Numerical Integration

앞의 세 강의에서 여러가지 적분의 기법을 학습했다. 그럼에도 불구하고 무슨


작업을 하느냐에 따라 다르겠지만 이러한 방법을 사용하여 적분이 가능한 경우
보다 가능하지 않은 경우를 더 많이 만날 것이다. 그러나 그 원리와 의미 미분과의
관계를 이해하는 것은 중요하다. 실제에서 exact한 적분을 손으로 구하지 못한다
고 하더라도 컴퓨터를 이용해서 적분 값을 구할 수 있다. 그 과정에서 우리가 이미
학습한 적분과 미분에 대한 이해가 우리를 인도할 것이다.

20.1 Numerical integration and Riemann sum

구분 구적법은 인간이 직접 하기에는 너무 오래 걸리리고 지루한 작업 이지만


컴퓨터를 이용해 수치계산으로 수행하기에는 √ 매우 적절하다. 이 절에서는 그 기
법을 학습한다. 일단 test function을 f (x) = 1 − x2 으로 하고, 적분 구간을 [a, b] =
[0, 1]로 하자. 그러면 위의 그림에서와 같이 원점을 중점으로 하고 반지름이 1인
원의 1사분면에 있는 부분이고 그 적분 값은 원 면적의 14 이다. 즉,
Z 1p
π
1 − x2 dx = .
0 4
적분의 참 값을 아니까 수치 기법이 얼마나 적분을 잘 하는지 비교해 보자. 일단
적분을 하기 위해 partition을 정하자. 간단하게
0 1 2 n−1 n
x0 = , x1 = , x2 = , · · · , xn−1 = , xn =
n n n n n
로 잡자. 총 n개의 subinterval로 나누었다. 다음에는 구분 구적법에 따라 i 번째
subinterval [xi−1 , xi ]에서 한점 si ∈ [xi−1 , xi ]를 잡고 Riemann sum

153
154 20 Numerical Integration
n n
1
q
Rn = ∑ f (si )△xi = ∑ 1 − s2i
i=1 i=1 n

을 계산하면 수치 적분이 된다. n이 커짐에 따라서 위의 값은 점점 적분 값에 가까


와 진다. 다음은 이를 계산하기 위한 MALAB code 이다.
%% parameters
n=10;% number of subintervals
L=1;% integration domain is [0, L]
%%
dx=L/n;
x=0:dx:L; % partition for [0,L] with mesh size dx
% i-th interval is [x(i),x(i+1)].
%%
R=0; % Riemann sum
for i=1:n
s=x(i); % s is the left point
R=R+sqrt(1-sˆ2)*dx;
end
E=R-pi/4; % approximation error

MATLAB과 같은 많은 수치계산 code에서는 index를 0부터 시작하지 않고 1에


서 시작하기 때문에, 위에서 만들어진 partition은 x1 , · · · , xn+1 이다. 여기서 i번째
subinterval은 [xi , xi+1 ]이고 xi 는 그 왼쪽 끝점이다.

Problem 20.1. 수치적으로 Riemann sum을 계산할 때 si 를 구간 [xi , xi+1 ]의 점 중


에서 어떻게 잡는 것이 가장 좋을까?
x +x
Solution 20.1 세 가지 방법을 생각해 볼 수 있다. 좌측점 si = xi , 중점 si = i 2 i+1 ,
그리고 우측점 si = xi+1 이다. Trapezoid rule은 좌측점을 사용해 얻은 값과 우
측점을 사용해 얻는 값의 평균이다. 세가지 방법을 써서 여러 경우의 subinterval
갯수에 대해서 approximation error를 계산하여 Table 20.1을 만들었다. 이 테이블
에서 중점의 경우가 가장 에러가 작다는 것을 알 수 있다. 그러면 중점을 사용하는
방법이 가장 좋다고 말할 수 있을까? ⊔ ⊓

x +x
subinterval 갯수 좌측점 si = xi 사용 중점 si = i 2 i+1 사용 Trapezoid rule
n=5 0.07386 0.00760 -0.02614
n=10 0.04073 0.00270 -0.00927
n=15 0.02828 0.00147 -0.00505
n=20 0.02172 0.00096 -0.00328
n=25 0.01765 0.00069 -0.00235
n=30 0.01488 0.00052 -0.00179
n=35 0.01286 0.00042 -0.00142
n=40 0.01134 0.00034 -0.00116
R √
Table 20.1 Integration approximation error for 01 1 − x2 dx.
20.2 Convergence order 155

Table 20.1을 보면 중점을 이용한 경우가 가장 좋아 보이고 그 다음은 trapezoid


rule이다. 좌측점을 사용한 경우가 가장 나빠 보인다. 그러면 중점을 √ 사용하는 것
이 가장 좋은 방법이라고 말할 수 있을까? 만약 함수가 f (x) = 1 − x2 이 아니라
다른 함수 이어도 중점을 사용하는 방법이 가장 작은 오차를 줄까? 좋은 적분 방
법이라는 것은 어떤 의미일까?

20.2 Convergence order

무엇이 좋은 수치 방법인지를 이야기 할 때 많이 사용하는 것이 convergence order


이다. 함수가 연속이면 subinterval의 크기 △x를 점점 작게 할 수록 Riemann sum
이 적분 값으로 수렴한다는 것은 수학적으로 보여진 것인데 얼마나 빨리 수렴하는
가는 그 방법에 따라 다르다. 그 수렴속도를 나타내는 것 중의 하나가 convergence
order로 △x가 0으로 수렴함에 따라 approximation error가 얼마나 빨리 작아지는
지를 의미하는데 보통 앞에서 배운 big-oh 를 써서 나타낸다. mesh-size가 △x일
때 Error의 크기는 △x에 따라 변할 것이고 convergence order가 k라는 것은 다음을
뜻한다:
Approximation Error = O(△xk ) as △x → 0.
k가 크면 클 수록 더 빠르게 수렴한다는 뜻이다.
그러면 수치 결과를 보고 어떻게 convergence order를 계산 할 수 있을까? 수
렴 order k를 계산하는 가장 좋은 방법은 로그함수를 취하는 것이다. 만약 함수가
F = yk 과 같이 power로 주어 졌고 k를 알고 싶다면 양변에 자연로그를 취한다.
그러면 ln F = k ln y를 얻는다. y = y1 일때 F = F1 이고 y = y2 일때 F = F2 이면,
ln F1 − ln F2
ln F1 − ln F2 = k ln y1 − k ln y2 ⇒ k = .
ln y1 − ln y2

따라서 만약 mesh size가 △x = △x1 일 때와 △x = △x2 일 때 Error를 E1 , E2 라고


하면 convergence order k는
ln E1 − ln E2
k= (20.1)
ln △x1 − ln △x2

이다. 물론 error가 정학하게 power로 주어지지는 않고 단지 △x가 점점 작아질 때


그러한 convergence order를 보인다는 정도로 이해해야 한다.

Problem 20.2. Table 20.1를 사용해서 각 방법의 convergence order를 계산 하시오.

Solution 20.2 식 (20.1)을 사용해서 위의 데이터를 사용해 계산 해야 하는데 손


으로 일일이 계산하면 시간이 너무 걸리니까 작은 코드를 짜서 계산할 것을 추천
한다. 그러면 Table 20.2와 같은 결과를 얻는다. 이 계산에서 convergence order가
좌측점을 사용했을 경우에는 1로 수렴하는 것 처럼 보이고 중점을 사용했을 때와
Trapezoid rule을 사용 했을 때는 1.5로 수렴하는 것 처럼 보인다. ⊔

156 20 Numerical Integration
x +x
subinterval 갯수 좌측점 si = xi 사용 중점 si = i 2 i+1 사용 Trapezoid rule
n=5→ 10 0.8587 1.4903 1.4956
n=10→ 15 0.8996 1.4945 1.4975
n=15→ 20 0.9181 1.4961 1.4982
n=20→ 25 0.9293 1.4970 1.4986
n=25→ 30 0.9369 1.4975 1.4989
n=30→ 35 0.9426 1.4979 1.4991
n=35→ 40 0.9469 1.4982 1.4992
n=40→ 45 0.9505 1.4984 1.4993
R √
Table 20.2 Convergence order for 01 1 − x2 dx.

Question 20.1. 좌측점을 사용할 경우에 convergence order 가 1에 수렴한다. 실제


그렇게 알려 졌다. 그런데 중점이나 Trapezoid rule을 사용 했을 때 convergence
order가 2라는 것이 알려 졌는데 왜 그보다 낮은 1.5 정도가 나오는 것일까?

위에서 우리가 선택한 test function f (x) = 1 − x2 은 x = 1에서 미분이 발산한
다. 그림으로 보면 미분의 기울기가 x = 1에서 수직이다. 이와 같이 적분하고자
하는 함수의 미분이 유한이 아니면 좋은 적분 방법을 써도 convergence order는 이
론 처럼 높지 않다는 것을 기억하자. 그러면 이번에는 미분 값이 항상 1보다 작은
함수 f (x) = sin x를 구간 [a, b] = [0, π/2]에서 적분해 보자. 그러면 참값은 다음과
같다:
Z π/2 π/2
sin xdx = − cos x = − cos(π/2) + cos(0) = 1.
0 0

Table 20.3에 convergence order가 주어 졌다. 좌측점을 사용한 경우는 1에 가깝


고 중점과 Trapezoid rule을 사용한 경우는 2에 가깝다. 알려진 convergence order
에 가까운 결과를 얻었다. 이론적인 convergence order는 적분하는 함수가 충분히
미분이 가능할 때에 한정 한다는 것을 기억하자.

x +x
subinterval 갯수 좌측점 si = xi 사용 중점 si = i 2 i+1 사용 Trapezoid rule
n=5→ 10 1.0364 2.0031 2.0018
n=10→ 15 1.0211 2.0010 2.0006
n=15→ 20 1.0149 2.0005 2.0003
n=20→ 25 1.0116 2.0003 2.0002
n=25→ 30 1.0095 2.0002 2.0001
n=30→ 35 1.0080 2.0001 2.0001
n=35→ 40 1.0070 2.0001 2.0001
n=40→ 45 1.0061 2.0001 2.0000
R π/2
Table 20.3 Convergence order for 0 sin xdx.

Trapezoid rule

적분은 x 축과 함수의 그래프 사이의 면적 중 작게 자른 구간 [xi , xi+1 ]에 해당하는


면적을 계산해서 더하는 것이다. Riemann sum에서는 이를 f (si )(xi+1 − xi )로 근
20.3 Numerical integrals and Gaussian quadrature 157

사한다. 다른 근사법 중의 하나는 사다리꼴의 면적을 이용하는 것이다. 즉 사다리


f (x )+ f (x )
꼴로 보아서 i 2 i+1 (xi+1 − xi )로 근사한다. 따라서
n
1 n n
Z b
f (xi−1 ) + f (xi ) 
f (x)dx ∼
=∑ △x = ∑ f (xi−1 )△x + ∑ f (xi )△x .
a i=1 2 2 i=1 i=1

따라서 엄밀히 말하면 trapezoid rule은 Riemann sum의 한 종류는 아니다. 그런데
잘 보면 좌측점과 우측점을 사용한 두 가지 Riemann sum의 평균과 같다. Trape-
zoid rule은 convergence order가 1인 두 Riemann sum의 평균 이지만 convergence
order는 2 가 된다. 중점을 이용한 경우와 convergence order는 같다.
Trapezoid rule의 장점 중의 하나는 error estimate를 가지고 있다는 것으로 아
래에 증명없이 소개만 한다.

Theorem 20.1 (Error estimate for trapezoid rule). Let f : [a, b] → R be twice dif-
ferentiable and T (△x) be the estimate of the integral ab f (x)dx using the trapezoid
R

rule with uniform mesh size △x. Then, there exists ξ ∈ [a, b] such that

(b − a)3 ′′
Z b
f (x)dx − T (△x) = − f (ξ )|△x|2 .
a 12

따라서 함수 f 가 두번까지 미분 가능하고 2차 미분이 유한이면 convergence


order가 big-oh 표기법을 써서 △x → 0 일때 O(|△x|2 )이다.

20.3 Numerical integrals and Gaussian quadrature

앞절의 Riemann integration에서 중점을 택하는 것이 수치 에러를 줄이는 가장 좋


은 방법일까? 그렇다. 그런데 Riemann integral에서는 하나의 점 si 를 i번째 subin-
terval에서 정하지만, 수치 계산을 할 때는 꼭 하나가 아니라 두 개 이상의 점을
이용하여 구간 [xi , xi+1 ]에 해당하는 면적을 계산하는 것도 가능하다. Trapezoid
rule은 양 끝 점 2개의 점을 선택한 경우로 불 수 있다. 1개 이상의 점을 택한다면
어떤 점을 택하는 것이 좋을까?
Trapezoid rule에서는 양 끝점을 사용 하지만 그 것 말고 더 높은 수렴 속도
를 얻는 방법이 있는데 Gaussian-Legendre quadrature 또는 간단히 Gaussian
quadrature 기법에서 제시하는 방법이다. 1 개의 점을 택하는 경우는 중점을 택
하는 것이 이 방법이다. 여러 개의 점을 택하는 경우 전통적으로 구간 [−1, 1]을
기준으로 해서 택해야 하는 점과 거기에 곱해야 하는 계수 도는 weight이 주어진
다. 이 계수들의 합은 인터벌의 크기인 2이다. Table (20.4)에 그 기준점과 weight
이 주어졌다. 이러한 값들이 어떻게 주어졌는지는 Legendre polynomial을 공부
하면 알 수 있다.
이제 적분 구간이 [−1, 1]에서 [xi , xi+1 ]로 바뀌면 그 위치와 크기를 고려해서
위의 값들을 조정해 주어야 한다. 인터발의 크기가 2에서 △x로 바뀌었으므로
xi +xi+1
weight w j 는 단순히 △x △x
2 를 곱해 주면 된다. 위치 s j 는 2 를 곱해 주고 나서 2
158 20 Numerical Integration

점 갯수 사용점 wights
1 s1 = 0 w1 = 2
2 s1 = − √13 , s2 = √13 w1 = 1, w2 = 1
q q
3 3
3 s1 = − 4 , s2 = 0, s3 = 4 w1 = 59 , w2 = 98 , w3 = 59
r r
q q √ √
4 s2 , s3 = ± 37 − 27 65 , s1 , s4 = ± 37 + 27 65 w2 = w3 = 18+36 30 , w1 = w4 = 18−36 30

Table 20.4 Gauss–Legendre quadrature in interval [−1.1].

만큼 더 해서 오른쪽으로 옮겨준다. 그러면 Table 20.5를 얻는다. 사용하는 점의


갯수를 더 늘릴 수 있고 많은 점을 이용할수록 convergence order가 올라간다.

점 갯수 사용점 weights
xi + xi+1
1 s1 = w1 = △x
2
xi + xi+1 1 △x △x
2 s1,2 = ±√ w1,2 =
2r 3 2 2
xi + xi+1 3 △x xi + xi+1 5 △x 8 △x
3 s1,3 = ± , s2 = w1,3 = , w2 =
2 4s 2 2 9 2 9 2
r √
xi + xi+1 3 2 6 △x 18 + 30 △x
4 s2,3 = ± − w2,3 =
2 s7 7r5 2 36 2

xi + xi+1 3 2 6 △x 18 − 30 △x
s1,4 = ± + w1,4 =
2 7 7 5 2 36 2
Table 20.5 Gauss–Legendre quadrature in interval [xi , xi+1 ].

Problem 20.3. Table 20.5에 주어진 Gauss quadrature 근사법을 사용해서 사용점
의 갯수가 1,2,3개 일때 convergence order를 계산하시오.

Solution 20.3 convergence order를 계산한 결과가 Table 20.6에 주어 졌다. 근사점
1개를 사용한 경우는 앞의 중점을 사용한 경우이고 나머지 2개와 3개의 근사점
을 사용한 경우가 새로운 계산이다. 수렴도가 각각 4와 6으로 짝수로 올라간다는
것을 볼 수 있다. 그런데 근사점 3개를 사용한 경우는 6 근처에서 약간 흔들리는
것을 볼 수 있다. 왜 그렇지? 근사 오차의 크기를 Table 20.6에 비교했다. 벌 써
오차가 matlab 오차 한계에 도달하는 것을 볼 수 있다. 유효 숫자의 갯수를 늘리면
이러한 현상이 줄어든다. higher order approximation을 사용하는 것이 적분 구간
의 갯수를 늘리는 것 보다 더 효과적일 수 있다. ⊔ ⊓
20.3 Numerical integrals and Gaussian quadrature 159

subinterval의 갯수 근사점 1개 사용 근사점 2개 사용 근사점 3개 사용


n=5→ 10 2.0031 4.0034 6.0036
n=10→ 15 2.0010 4.0011 6.0013
n=15→ 20 2.0005 4.0005 6.0033
n=20→ 25 2.0003 4.0003 5.9793
n=25→ 30 2.0002 4.0002 6.0257
n=30→ 35 2.0001 4.0001 6.4575
n=35→ 40 2.0001 4.0001 5.6449
R π/2
Table 20.6 Convergence order for 0 sin xdx.

subinterval의 갯수 근사점 1개 사용 근사점 2개 사용 근사점 3개 사용


n=5 4.1242e-03 -2.2619e-06 4.7849e-10
n=10 1.0288e-03 -1.4104e-07 7.4576e-12
n=15 4.5705e-04 -2.7847e-08 6.5437e-13
n=20 2.5707e-04 -8.8097e-09 1.1635e-13
n=25 1.6451e-04 -3.6082e-09 3.0642e-14
n=30 1.1424e-04 -9.3919e-10 1.0214e-14
n=35 8.3930e-05 -5.5053e-10 3.7748e-15
R π/2
Table 20.7 Integration approximation error for 0 sin xdx.

Problem 20.4. 사용점을 늘리면 convergence order가 돌라가는 대신에 계산 복잡


도도 올라간다. 사용점을 늘리는 대신에 subinterval의 갯수를 늘리는 것이 더 효
과적이지는 않을까? 무엇이 더 효과적인지는 어떻게 비교할 수 있을까? 관심이
있는 학생들은 본 강의의 example 말고도 다른 경우에 스스로 convergence test를
해 보는 것도 좋은 연습이다.
R √
Problem 20.5. 01 1 − x2 dx를 계산할 때 convergence order가 1.5가 나오는 이유
가 있을까? 사용점을 2개 3개로 늘린 Gaussian quadrature 기법도 1.5 정도만 나올
까? 왜 1.5일까?
Lecture 21
Sequences and series

수열 (sequence)과 급수 (series)는 근본적으로 같다. sequence an 이 주어지면 그


부분 합인 sn = ∑ni=1 ai 을 만들 수 있고 sn 은 또 하나의 수열이다. 우리는 sn 을 수열
an 의 부분합으로 이루어진 수열 또는 그냥 간단히 an 의 급수라고 부른다. 그리고
수열 an 도 다른 어떤 수열의 급수가 될 수 있다. 만약

b1 = a1 , b2 = a2 − a1 , b3 = a3 − a2 , · · · , bn = an − an−1 , · · ·

라고 하면 an 은 수열 bn 의 급수가 된다. series가 주어지면 그 series를 만드는 se-


quence가 있고 이 정보를 이용해서 series의 극한 등을 구하는 것이 이번 강의의
목적이다. (때론 부분합 sn 의 극한을 급수라고 부르기도 한다.)

21.1 Sequence of real numbers

순서가 있는 수의 모임을 수열 sequence라고 한다. 우리는 실수(real number R)로


이루어진 수열을 고려한다. 순서는 첨자 index를 붙여서 나타낸다. 예를 들어

a1 , a2 , a3 , a4 , · · · .

보통 첨자를 0 이나 1에서 시작 하지만 꼭 그래야만 하는 것은 아니다. 상황에 따


라 편리하게 하면 된다. 별다른 언급이 없으면 첨차는 자연수 i ∈ N = {0, 1, 2, . . . }
로 간주한다.1 수열이 an = (−1)n−1 , n = 1, 2, · · · 와 같이 일반식으로 주어지면 이
수열을 순서대로 “{1, −1, 1, −1, · · · }”와 같이 나열 할 수 있다.

Problem 21.1. 수열 {an } = {1, − 21 , 31 , − 41 , · · · }이 주어졌다. an 의 일반식을 구하


시오.

(−1)n+1
Solution 21.1 이 수열의 일반식은 an = n 으로 쓸 수 있다. ⊔

1자연수에 0을 포함하기도 하고 안하기도 한다. 편리에 따르는 것인데 우리는 포함해서 진행한
다.

161
162 21 Sequences and series

수열의 수렴과 극한은 함수의 수렴과 극한 보다 더 간단하고 쉽게 다룰 수 있다.


극한을 이야기 할 때 수열의 앞부분의 값들은 사실 상관이 없고 뒤에 나오는 수에
관한 것이라는 것을 기억하자. 수열의 극한은 다음과 같이 정의한다.

Definition 21.1. (1) We say a sequence an convergesto a number L ∈ R as n → ∞ if


for any given ε > 0, there exists N, which may depend on ε, such that |an − L| < ε
whenever n ≥ N. We call L the limit of an as n → ∞ and denote lim an = L. (2) If
n→∞
there is no such a number L, we say an diverges as n → ∞. (3) If for any M ∈ R,
there exists N > 0 such that an > M whenever n ≥ N, we say an diverges to infinity.
(4) If for any M ∈ R, there exists N > 0 such that an < M whenever n ≥ N, we say
an diverges to negative infinity.

수열이 발산한다는 말은 값이 무한대로 커질때만 쓰는 것이 아니고 수렴하지


않는 모든 경우에 대해 쓴다. 함수의 연속성을 정의 할 때는 ε-δ 논법을 썼다. 여기
의 정의도 사실 같은 방식이다. δ 자리에 N이 들어갔을 뿐이다. 따라서 어느 정도
익숙하겠지만 다시 의미를 생각해보자.

Problem 21.2. 다음을 보이시오.


1
(1) lim = 0. (2) lim k = k. (3) an = (−1)n 는 발산한다.
n→∞ n n→∞

Solution 21.2 증명을 하기 위해서는 상황을 이해하는 직관이 필요하다. 그 후


에는 명확하게 써보는 연습이 있어야 한다. 쓰는 과정에서 생각이 더 정리되고
명확해 진다. 또한 명확하게 쓰려는 노력을 하다보면 새로운 표현 방법을 찾을 수
있다. 그래서 수학은 논리적 표현을 익히는 수단으로도 쓰였다. (1) 정의에서와
같이 ε > 0이 주어졌다 (또는 주어 졌다고 하자). N을 ε1 보다 큰 정수라고 하자.
그러면 모든 n > N에 대해서 다음을 만족한다:
1 1
− 0 = < ε.
n n
정의에서 요구한 성질을 만족하는 N을 찾았으니까 증명이 되었다.
(2) 이 문제의 의미는 수열이 an = k로 주어진 경우이다. 첨자 n에 상관없이 주
어 졌으니까 k는 그냥 상수라는 뜻이다. 따라서 임이의 주어진 ε > 0에 대해서 N
은 1 이상의 아무런 정수로 잡아도 된다. 그러면 |an − k| = |k − k| = 0 < ε for any
n > N이다. 정의에서 요구한 성질을 만족하는 N을 찾았으니까 증명이 되었다.
(3) 발산한다는 것은 수렴하는 L이 없다는 것이다. 보통 있다는 것을 보이는 것
보다 없다는 것을 보이는 것이 더 힘들다. 만약 어떤 L로 수렴한다고 하자. 그러면
ε = 0.5에 대해서 어떤 N이 존재해서 모든 n > N에 대해 |an −L| < 0.5를 만족해야
한다. 그러나 아무리 큰 N을 잡았더라도 an = 1 이 되는 n > N이 있고 또 am = −1
이 되는 m > N 이 있으므로 다음과 같이 모순을 만들 수 있다:

2 = |1 − (−1)| = |1 − L + L − (−1)| ≤ |an − L| + |L − am | < 0.5 + 0.5 = 1.

2 < 1라는 모순이 나왔다. 이 모순은 수렴하는 L이 있다는 가정에서 나온 것이다.


따라서 주어진 수열은 수렴하지 않는다. 즉, 발산한다. ⊔ ⊓
21.1 Sequence of real numbers 163

Problem 21.3. lim an = A이고 lim bn = B이다. 다음을 보이시오.


n→∞ n→∞
(1) lim (an + bn ) = A + B. (2) lim (an − bn ) = A − B. (3) lim (kan ) = kA.
n→∞ n→∞ n→∞
(4) lim (an bn ) = AB. (5) lim (an /bn ) = A/B if B ̸= 0.
n→∞ n→∞

Solution 21.3 수열의 극한이나 함수의 극한이나 증명은 본질적으로 같다.


(1) 영어로 답을 써보자. Let ε > 0 be given. Then, since limn→∞ an = A, there exists
N1 > 0 such that |an − A| < ε/2 whenever n > N1 . Similarly, since limn→∞ bn = B,
there exists N2 > 0 such that |bn − B| < ε/2 whenever n > N2 . Let N = max(N1 , N2 ).
Then,

|(an + bn ) − (A + B)| = |an − A + bn − B| ≤ |an − A| + |bn − B| < 0.5ε + 0.5ε = ε

whenever n > N. Therefore, limn→∞ (an + bn ) = A + B.


(5) 이 경우는 B ̸= 0의 조건이 추 가로 필요하다. 그런데 이러 증명을 너무 열심히
하다보면 미적분이 아니라 해석학이 된다. 그래도 수학에 관심이 있는 학생들은
해보는 것을 권장한다. ⊔ ⊓

Problem 21.4 (Sandwich Theorem). Let an ≤ bn ≤ cn and lim an = lim cn = L.


n→∞ n→∞
Show that lim bn = L.
n→∞

an 과 cn 이 같은 극한 값 L을 가지면 그 사이에 끼인 bn 도 L을 극한으로 가진다.

Problem 21.5 (Continuity). Let lim an = L and f (x) is continuous at L. Show that
n→∞

lim f (an ) = f ( lim an ) = f (L).


n→∞ n→∞

함수가 극한점에서 연속이면 limit이 함수 안으로 들어간다고 기억하면 좋다.

Problem 21.6 (Useful limits to remember). (1) lim x1/n = 1 if x > 0.


n→∞
1/n x n xn  n + 1 n
(2) lim n = 1. (3) lim 1 + x
= e . (4) lim = 0. (5) lim = e2 .
n→∞ n→∞ n n→∞ n! n→∞ n − 1

Solution 21.6 이 문제는 계산이니까 해보자. (1)은 (2)처럼 하면 되니까 생략.


1/n )
(2) 자연로그를 계산한 후에 지수함수를 취한다. (eln(n = n1/n 를 이용) 일단,
ln n
ln n1/n = →0 as n → ∞.
n
따라서 ex 이 연속 함수라는 것을 사용하면
1/n
1/n ln n1/n
( lim ln n )
lim n = lim e = e n→∞ = e0 = 1.
n→∞ n→∞

(눈에 보이지 않았던 것이 로그를 취한후에 지수함수를 취하면 보인다. 왜 일까?


무슨일이 벌어지고 있는 것일까? 뭔가 대단한 것을 얻은 것인가?)
164 21 Sequences and series

(3) 비슷하게 로그를 취한후에 limit을 구하고 지수함수를 취한다. 일단 h = 1/n


이라고 하면
x
1/h 1 ln(1 + hx)
= lim 1+hx = x.

lim ln 1 + hx = lim ln 1 + hx = lim
h→0 h→0 h h→0 h h→0 1

위의 마지막 부분에서 L’Hopital’s rule을 사용했다. 여기에 exponential 을 취한다.


(4) 직관적으로는 분명하다. 분모가 훨씬 빠르게 증가한다. 증명을 위해서 자연
로그를 택해보자. 그러면
xn
ln = n ln x − ln(n!)
n!
이 방법은 잘 안된다. 분모 분자를 xn 으로 나누어서 limit을 택하자. 그러면,
xn 1
lim = lim 12
=0
n→∞ n! n→∞
xx · · · n−1
x x
n

이다. 왜냐하면 분모의 절대값이 무한대로 발산하기 때문이다.


(5) (3)의 꼴로 다시 쓰면 다음과 같다.
 n + 1 n  2 n−1  2 
lim = lim 1 + 1+ = e2 · 1.
n→∞ n−1 n→∞ n−1 n−1

이제 upper bound, supremum, limit supremum의 개념을 익히자. 쉬워 보이지만


익숙해 지려면 연습이 필요하다. 논리를 연습하는데 좋고 많이 쓰인다.

Definition 21.2. (1) A sequence an is called bounded above if there exists M such
that an ≤ M for all n. Such M is called an upper bound of an . (2) The smallest
upper bound of an is called the supremum of an and denoted by M = sup an . (3)
Let M k be the supremum of {an : n ≥ k}. Then, the limit lim M k is called the limit
k→∞
supremum of an and is denoted by M = lim sup an .

우리는 극한에 관심이 많고 수열의 극한을 따질 때는 앞에 있는 유한 개의 값은


영향이 없다. supremum을 따질 때도 앞에 있는 유한개의 영향을 제거하고 싶을
때 limit supremum을 택한다.
다음 문제를 통해서

Problem 21.7. 수열 an 의 값 중에서 가장 큰 것을 최대 값 maximum이라고 부르


고 max an 으로 표기한다. 가장 작은 것을 최소 값 minimum이라고 부르고 min an
으로 표기한다. (1) 수열 an = 9.8n − n2 의 maximum을 구하시오. (2) 수열 an = − n1
의 maximum을 구하시오.

Solution 21.7 (1) 수열 an 을 함수 처럼 생각해서 f (x) = 9.8x − x2 라고 하자. 미


분을 하면 f ′ (x) = 9.8 − 2x. 따라서 최대값은 x = 4.9일 때이다. 그러나 n은 정수
이어야 하고 함수 f (x) 형태를 보면 n = 5일 때 수열 an 이 최대 값 24를 가진다.
21.2 Series of real numbers 165

(2) n이 증가하면 an 은 증가한다. 점점 0에 가까이 가지만 0의 값을 가지는 an


은 없다. 즉, an 의 값 중에서 가장 큰 것은 없다. 최대 값이라고 할 것은 없지만 0은
upper bound 중에서 가장 작은 것이다. 즉, supremum은 0이다. maximum은 있을
때도 있고 없을 때도 있다. 그러나 supremum은 한상 있다. 이러한 이유로 위에서
maximum 을 정의하지 않고 supremum을 정의하여 사용하는 것이다. ⊔ ⊓

이제 대칭이 되는 개념인 lower bound, infimum, limit infimum의 개념을 익히자.

Definition 21.3. (1) A sequence an is called bounded below if there exists M such
that an ≥ M for all n. Such M is called a lower bound of an . (2) The largest lower
bound of an is called the infimum an and denoted by M = inf an . (3) Let M k be the
infimum of {an : n ≥ k}. Then, the limit limk→∞ M k is called the limit infimum of
an and is denoted by M = lim inf an .

수열 중에서 가장 다루기 좋은 수열이 단조 수열이다. 계속 증가하거나 감소하


는 수열이다.

Definition 21.4. Let an be a sequence of real numbers. (1) It is called an increasing


sequence if an ≤ an+1 for all n. (2) It is called a decreasing sequence if an ≥ an+1
for all n. (3) It is called monotone if it is one of the two cases.

증가하는 수열에 상한이 있거나 감소하는 수열에 하한이 있다면 수렴한다는


것을 쉽게 알 수 있고 보일 수 있다.

Problem 21.8 (Bounded monotone sequence). If an is bounded above and increas-


ing, it converges.

Solution 21.8 첫 단계는 수렴하는 값을 추측하는 것이다. L = sup an 라고 하고 L


로 수렴하는 것을 보이자. ε > 0 주어 졌다고 하자. 이제 N을 잡아야 한다. 일단
모든 첨자 n에 대해서 an ≤ L이다. 그렇지 않은면 L은 supremum이 아니다. L − ε
은 upper bound가 아니다. 따라서 수열의 수 중에 L − ε과 L 사이에 들어가는 수가
있다. 그 수중의 하나의 첨자를 N이라고 하자. 만약 n > N이면 an 은 증가 수열
이니까 L − ε < aN ≤ an ≤ L이다. 따라서 모든 n > N에 대해서 |an − L| < ε이다.

위의 증명은 아주 쉽고 기본적이지만 이런 말의 전개에 익숙하지 않으면 처음


에는 힘들 수있다. 수학적으로 또는 논리적으로 말하는 법을 익히면 그 이후는
쉽다.

21.2 Series of real numbers

sequence an 이 주어 졌을 때 이 수열의 부분합을 가지고 새로운 수열을 만들 수


있다:
166 21 Sequences and series
n
sn = ∑ ai .
i=1

이렇게 부분합으로 만든 수열을 급수 series라고 부른다. 그리고 그 극한을 다음과


같이 표현한다:

lim sn = ∑ an .
n→∞
n=1

주의할 점은 ∑∞
i=1 an 이 무한개의 an 을 더한다는 의미가 아니다. 우리는 절대 무한
개를 더하지 않는다. 할 수도 없다. 단지 부분합 sn 으로 수열을 만들고 이 수열의
극한을 구하며 그 극한이 존재하면 그 극한을 ∑∞ n=1 an 로 표기 할 뿐이다. 그리고
그렇게 만든 수열 자체를 또는 그 극한을 급수라고 한다.

Problem 21.9. 만약 series ∑ ak 가 수렴하면 k→∞
lim ak = 0을 만족함을 보이시오.
k=1

k=1 ak = L라고 하자. 그러면, sk − sk−1 = ak 이므로


Solution 21.9 극한을 ∑∞

lim ak = lim (sk − sk−1 ) = lim sk − lim sk−1 = L − L = 0.


k→∞ k→∞ k→∞ k→∞

따라서 수열 an 는 0으로 수렴한다. ⊔


위의 결과를 뒤집어서 말하면 (논리적으로는 대우관계라고 한다) 만약 수열 an


이 0으로 수렴하지 않으면 급수 ∑∞ k=1 ak 는 발산한다는 것이다. 두 가지 경우를
생각할 수 있다. an 이 0이 아닌 다른 수로 수렴하든지 또는 발산하는 경우이다.
n+1
Problem 21.10. 급수 ∑∞
n=1 n 는 발산 한다는 것을 보이시오.

n+1
Solution 21.10 lim = 1이므로 급수는 발산한다. ⊔

n→∞ n
그러나 lim ak = 0라고 해서 급수 ∑∞
n=1 an 가 수렴하는 것은 아니다.
k→∞

1
Problem 21.11. 급수 ∑∞
n=1 n 은 발산함을 보이시오.

1
Solution 21.11 이 경우 lim an = lim = 0이지만, 급수는 발산한다. 즉,
n→∞ n→∞ n
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1+ + + + + + + + + + + + + + + +···
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
≥ 1+ + + + + + + + + + + + + + + +···
2 4 4 8 8 8 8 16 16 16 16 16 16 16 16
1 1 1 1
= 1+ + + + +···
2 2 2 2

이 계산에서 보이고자 하는 것은 12 을 얼마든지 만들어 넣을 수 있다는 것이다.


1 1 1
8을4개, 16 을 8개, 32 을 16개, 이런 식으로 무한히 할 수 있다. 따라서 무한대로
발산한다. ⊔ ⊓
21.3 Power series 167

1
급수 ∑∞
n=1 n 이 발산한다는 사실은 앞으로도 많이 쓰인다. 이 경우는 수렴과 발
산의 경계에 있는 매우 중요한 경우이다.

1
n=1 nα 은 발산한다. 왜 그럴까? 반면에 α > 1
Question 21.1. α < 1이면 급수 ∑∞
1
이면 ∑n=1 nα 은 수렴한다. 왜 그럴까? 전자는 당연하고 후자는 당연하지 않다.

21.3 Power series

앞으로 주로 다룰 급수는 power series로 다음의 꼴로 주어진 series를 말한다:



∑ cn (x − x0 )n .
n=0

여기서 x0 는 center 라고 하고 cn 은 n차 항의 계수라고 한다. 또한 x를 변수로 생


각하면 power series는 x를 변수로 하는 무한 차수의 다항식 같은 함수가 된다.
power series는 부분합을 계산할 때는 첨자가 1 부터 시작하지 않고 0부터 시작한
다. n = 0일 경우인 상수항을 나타내기 쉽기 때문이다. x축으로 평행 이동한 후에
x0 = 0 인 경우만 고려해도 된다. 위 power series의 수렴 여부는 계수 cn 과 변수
의 크기 |x − x0 |에 따라 달라지며 수렴하는 극한 값과 수렴하는 변수 영역을 찾는
것이 주요 관심이다.
계수들이 모두 같은 cn = c0 인 경우를 특별히 등비 급수라고 한다.

Problem 21.12 ( Geometric series). an = c0 xn , n = 0, 1, · · · 으로 주어진 수열을


등비수열 또는 geometric sequence라고 부른다. 다음을 보이시오.

c0
∑ c0 x n = 1 − x if |x| < 1,
i=0


만약 |x| ≥ 1이면 등비 급수 ∑ c0 xn 는 발산한다.
n=0

n
Solution 21.12 부분합 sn = ∑ c0 xi 라고 하자. 그러면
i=0

n n n n+1
sn − rsn = ∑ c0 xi − ∑ c0 xi+1 = ∑ c0 xi − ∑ c0 xi = c0 − c0 xn+1 .
i=0 i=0 i=0 i=1

마지막 등식은 중간에 중복되는 것은 다 상쇄되고 처음 항과 마지막 항만 남기


때문이다. 따라서, |x| < 1 인 경우는

c0 (1 − xn ) c0
lim sn = lim =
n→∞ n→∞ 1−r 1−r
168 21 Sequences and series

을 만족한다. 그리고 |x| ≥ 1인 경우는, an = c0 xn 은 0으로 수렴하지 않는다. 따라서



급수 ∑ c0 xn 는 발산한다. ⊔

n=1

Problem 21.13. 다음 급수의 극한을 구하시오.


(−1)n 4
(1) 91 + 27
1 1
+ 81 +· · · . (2) ∑∞
n=0 4n . (3) 5.232323232323 · · · . (4) ∑∞ 1
n=1 n(n+1) .

Solution 21.13 (1) 이 경우는 초기값이 a0 = 91 이고 등비가 r = 13 이다. 따라서 그


급수의 극한은 다음과 같다:

a0 1 1 1
∑ ak = 1 − r = 9(1 − 1 ) = 9 2 = .
6
k=0 3 3

(2) 초기 값은 a0 = 4이고 등비는 r = − 14 이다. 따라서 급수의 극한은 다음과 같다:



(−1)n 4 4 16
∑ n
= 1
= .
n=0 4 1 − (− 4 ) 5

(3) (순환하는 소수 5.2323232323 · · · 를 써 놓고 급수라고? 아, 순환 소수를 급수로


이해하라는 뜻이구나.) 이 순환 소수를 급수 처럼 다시 쓰면,

5 + 0.23 + 0.0023 + 0.000023 · · · = 5 + 0.23 + 0.23 × 0.01 + 0.23 × (0.01)2 + · · · .

맨 앞의 5는 따로 간주하면 초항이 a0 = 0.23이고 공비가 r = 0.01인 등비 급수에


5를 더한 것이다. 따라서 그 극한은 다음과 같다:
0.23 0.23 23
5+ = 5+ = 5+ .
1 − 0.01 0.99 99
1
(4)는 등비 급수는 아니다. x = 1이고 cn = n(n+1) 인 power series로 볼 수도 있지만
그건 마치 모든 급수를 power series로 보겠다는 말 같다. 그냥 n = 1 부터 시작하는
일반 급수로 보자. 부분합을 구하면
n n
1 1 1  1
sn = ∑ k(k + 1) = ∑ − = 1− .
k=1 k=1 k k+1 n+1

(여기서도 중간에 중복되는 것은 다 지워졌다.) 따라서,



1  1 
∑ = lim s n = lim 1 − = 1. ⊔

n=1 n(n + 1) n+1
n→∞ n→∞

geometric series의 수렴여부를 판별했지만 정작 power series의 수렴여부는 아


직 판별 하지 않았다. 다음 강의에서 배울 몇가지 판별 기법이 필요하다.
21.3 Power series 169

Exercises

1.
Lecture 22
Tests for absolute convergence

급수의 수렴 여부를 판별하는 기법을 배운다. absolute convergence test는 절대



값을 취한 ∑ |an |가 수렴하는지를 test한다. 그러면 절대값을 취하지 않은 급수
n=1

∑ an 는 자동으로 수렴한다.
n=1

22.1 Integral test

양의 값을 가지는 수열 an ≥ 0의 부분합 sn 은 증가 수열이 된다.



Problem 22.1. an ≥ 0 이면 급수 ∑ an 가 수렴한다는 것과 sn 이 상한이 있다는
n=1
것은 동치이다.

Solution 22.1 일단 sn+1 − sn = an+1 ≥ 0 이므로 sn+1 ≥ sn 이다. 따라서 sn 은 증가


수열이다. 증가 수열이 수렴한다는 것과 상한이 있다는 것 (bounded above라는
것)이 서로 동치라는 것이 이미 알고 있다. ⊔ ⊓

적분을 사용하여 급수의 수렴 여부를 판별하는 것을 integral test라고 한다.

Problem 22.2 (Integral test). 세 가지의 가정이 필요하다. (1) an ≥ 0, (2) an =



f (n) ≥ 0 for j = 1, 2, · · · , (3) f (x) 는 단조 감소 함수이다. 그러면, 급수 ∑ an 이
R∞ n=1
수렴한다는 것과 적분 1 f (x)dx 수렴한다는 것은 동치이다.

이 integral test를 증명하기 전에 그 의미를 생각해 보자. 세 개의 주요 조건이


있다. 이 세 조건이 모두 필요한데 아래 증명에서 어떻게 사용 되는지 잘 관찰해
보자. 그리고 이 조건 중 하나라도 만족하지 않을 때는 반례를 만들 수 있다.

171
172 22 Tests for absolute convergence

Solution 22.2 아래 증명에서 세 개의 조건이 어디에서 쓰이는지 표시하자. 일단


Z n+1 n Z k+1 n n
f (x)dx = ∑ f (x)dx ≤ ∑ f (k) = ∑ ak = sn ,
1 k=1 k k=1 k=1

n Z k+1 n n
∑ f (x)dx ≥ ∑ f (k + 1) = ∑ ak+1 = sn+1 − a1 .
k=1 k k=1 k=1

따라서 Z n+1
sn+1 − a1 ≤ f (x)dx ≤ sn
1
를 만족한다. 이 단계에서 f 가 감소 함수라는 것이 쓰였다. 만약 sn 이 수렴한다
면, 1n+1 f (x)dx 는 유한이다. f 는 단조 감소하고 모든 n에 대해서 f (n) ≥ 0이므로
R

f (x) ≥ 0 이다. 따라서 1n+1 f (x)dx 는 n이 증가하면 증가한다. 따라서, R 1n+1 f (x)dx
R R

는 n → ∞일 때 수렴한다. 반대로 만약 1 f (x)dx이 수렴하면, sn+1 은 1∞ f (x)dx +


R∞

a1 보다 작다. 따라서 sn 은 유한한 증가 수열이고 따라서 수렴한다. ⊔ ⊓


∞ ∞
1 1
급수 ∑n 는 diverge 한다는 것을 알고 있다. 그러면 급수 ∑ nα 는 어떠할까?
n=1 n=1
만약 α < 1이면 각각의 항이 α = 1일때 보다 더 커질테니까 급수는 발산할 것이
분명하다. 만약 α > 1이면 각각의 항이 더 작아지는데 그렇다면 급수가 수렴할 가
능성이 생긴다. 아래 문제에서 α > 1이면 수렴한다는 것을 보인다. 이말은 α = 1
이 수렴 여부를 가르는 경계라는 것이다. 우리는 비슷한 것을 적분에서 보았는데
사실 그 이유도 같다. 증명도 그 사실을 이용한다.

1
Problem 22.3. (1) 모든 α > 1에 대해서 급수 ∑ nα 가 수렴한다는 것을 보이시오.
n=1

1
(2) 모든 α ≤ 1에 대해서 급수 ∑ α 가 발산한다는 것을 보이시오.
n=1 n

Solution 22.3 (1) f (x) = x1α = x−α 라고 하자. 그러면 f 는 x ≥ 1에 대해서 양의


값을 가지는 감소 함수이다. 그리고 f (n) = n1α 이다. 따라서 integral test를 사용할
수 있다. 그러면, n → ∞ 일 때
Z n Z n n
1 1−α 1 1 1
f (x)dx = x−α dx = x = n1−α + → .
1 1 1−α 1 1−α α −1 α −1
이 증명을 통해 α = 1을 경계로 수렴과 발산이 나뉘는 이유를 알 수 있다.

(2) α = 1의 경우는 발산 한다는 것을 보았다. α < 1의 경우는 각 항들이 더 크


니까 더 빨리 발산한다. (이러한 비교에 의한 판별법을 comparison test라고 한다.)


22.2 Comparison test 173

Problem 22.4. 다음 급수의 수렴 여부를 판별하시오.


∞ ∞ ∞
1 2 1
(1) ∑ 2 . (2) ∑ ne−n . (3) ∑ ln n .
n=1 n + 1 n=1 n=1 2

Solution 22.4 Integral test를 사용한다. 3개의 조건들을 만족하는지 부터 확인을


하고 사용하자. ⊔ ⊓

22.2 Comparison test

한 급수의 수렴 여부를 알면 그 보다 작거나 큰 급수의 수렴여부를 판별할 수도


있다.

Problem 22.5 (Comparison test). 0 ≤ an ≤ bn 라고 하자. 만약 큰 수열 ∑ bn 가
n=1
∞ ∞
수렴하면, 작은 수열 ∑ an 도 수렴한다. 만약 작은 수열 ∑ an 가 발산 하면, 큰
n=1 n=1

수열 ∑ bn 도 발산한다.
n=1

수렴 여부는 처음 유한개의 숫자들은 아무리 크든 작든 상관이 없다. 관심은


첨자가 커짐에 따라 어떤 행동을 보이는가 이다. comparison test에서도 충분히
큰 첨자에서만 비교 가능하면 된다. 즉, 0 ≤ an ≤ bn 이 모든 n이 아니라 충분히 큰
n에 대해서만 성립하면 된다. 즉, 어떤 N이 있어서 이 보다 n에 대해서만 비교가
성립하면 된다.

Solution 22.5 증명은 단순하다. 양의 값을 가지면 부분합이 증가 수열이고 큰


부분합 수열이 수렴하면 bounded above이고 따라서 작은 부분합 수열도 bounded
above이다. 물론 작은 수열이 unbounded이면 큰 수열도 그렇다. 이 논리를 사용하
면 엄밀하게 답할 수 있다. ⊔ ⊓

Question 22.1. 위 조건중에 주의할 것은 부호가 바뀌는 수열은 적용하지 못한다


는 것이다. 다 양의 값을 가질때만 된다. 모두 음수 값을 가지는 경우인 an ≤ bn ≤ 0
의 가정 아래서 비슷한 주장을 할 수 있다. 문장으로 만들어 보자.
an
Problem 22.6 (Limit comparison). Let an , bn ≥ 0 for n ≥ N. (1) Let lim = 0.
n→∞ bn
∞ ∞ ∞ ∞
Then, if ∑ bn converges, ∑ an converges. If ∑ an diverges, ∑ bn diverges. (2)
n=1 n=1 n=1 n=1
∞ ∞
an
Let lim = C ̸= 0. Then, ∑ an converges if and only if ∑ bn converges.
n→∞ bn
n=1 n=1

an bn
만약 lim = ∞ 이면 lim
= 0 이므로 (1)을 이용하면 된다. 급수의 수렴은
n→∞ bn n→∞ an
an
n → ∞일 때의 행동에 따라 결정 되므로 극한 lim 에 의해 결정 되는 것은 자
n→∞ bn
174 22 Tests for absolute convergence

연스럽다. 그러나 부호가 바뀌는 경우는 이러한 비교가 작동하지 않는다는 것을


기억하자.

Solution 22.6 ⊔

Problem 22.7. 다음 급수의 수렴 여부를 판별하시오.


∞ ∞
5 1 1 1 1 1
(1) ∑ . (2) ∑ . (3) + √ + √ + √ +···.
n=1 5n − 1 3 2 + 2 2 + 3 2 + 4
2 3 4
n=1 n!

Solution 22.7 ⊔

22.3 Ratio test

앞에서는 양의 값을 가지는 수열을 고려 했다. 이젠 양수와 음수를 모두 가지는


수열과 그 급수를 고려한다. 그렇다고 해도 양수와 음수를 다 고려하는 세밀한 테
스트를 하는 것은 아니다. 음수 양수 퉁 쳐서 절대 값을 붙였을 때의 수렴을 이야기
한다. 일단 절대 수렴의 정의부터 시작한다.
∞ ∞
Definition 22.1. We say ∑ an converges absolutely if ∑ |an | converges.
n=1 n=1

급수 ∑∞n=1 an 이 absolute converge하면 보통 의미에서도 수렴한다는 것을 쉽게


보일 수 있다.
∞ ∞
Problem 22.8. Show that if ∑ |an | converges, ∑ an converges.
n=1 n=1

극한 값이 무엇인지 모르면서 수렴을 보이는 가장 좋은 방법은 Cauchy se-


quence 개념을 쓰는 것이다.

Solution 22.8 Let sn be the partial sum of an and vn of |an |. Since vn converges, for
any ε > 0, there exists N such that |vn − vn′ | < ε whenever n, n′ > N. Since
n n
|sn − sn′ | = ∑′ ak ≤ ∑′ |ak | < ε, n, n′ > N,
k=n +1 k=n +1

sn converges. ⊔

몇 가지 간단한 예를 들어보자.

Problem 22.9. 다음 급수가 수렴함을 보이시오.



(−1)n+1 ∞
sin n
(1) ∑ 2
. (2) ∑ 2
.
n=1 n n=1 n
22.3 Ratio test 175

1
Solution 22.9 이 두 가지 예 모두 절대값을 붙이면 급수 ∑∞
n=1 n2 또는 이보다 작은
급수가 되고 이는 수렴한다. 따라서 절대 수렴한다. ⊔ ⊓

앞으로 절대 수렴을 판별할 수 있는 두 방법을 소개하는데 ratio test가 그 첫번


째이다. 그리스 문자 ρ 는 로 rho라고 읽는다.
an+1
Problem 22.10 (Ratio test). lim = ρ 일 때 다음을 보이시오.
n→∞ an

(1) If ρ < 1, ∑n=1 an converges absolutely.
(2) If ρ > 1, ∑∞
n=1 an diverges. (3) If ρ = 1, no conclusion.

만약 an 이 등비수열이라면 ρ는 등비가 된다. 등비 수열이 아니라도 n이 무한대로


커지면서 |an |이 점점 등비 수열의 형태를 가진다는 뜻이다. 따라서 등비에 해당하
는 ρ가 1보다 크면 발산하고 작으면 수렴한다는 것이 매우 자연스럽다. 1일 때는
수렴하는 경우와 발산하는 경우 모두 포함하고 있어서 판별 불가이다.
1
n=1 n 은 발산한다는 것을 이미 알
Solution 22.10 일단 (3)을 확인해 보자. 급수 ∑∞
n+1 1
고 있다. ρ를 계산하면 ρ = limn→∞ n = 1이다. 급수 ∑∞ n=1 n2 은 수렴한다는 것을
2
알고 있다. ρ를 계산하면 ρ = limn→∞ n +2n+1
n2
= 1이다. 즉, ρ = 1인 경우는 수렴하
는 경우와 발산하는 경우 모두 포함하고 있어서 ρ = 1이라는 것 만으로는 판별이
불가하다.
(1)을 증명해 보자. 원리를 이해해 보자. 만약 ρ < 1이면 어떤 등비 r이 ρ와 1
|a |
사이에 존재하고 모든 n > N에 대해서 |an+1n|
< r을 만족한다. 그러면 r을 등비로
하고 |an | 보다는 큰 등비수열을 만들 수 있다. 따라서 comparison test에 의해서
급수는 수렴해야 한다. 수학에 진심인 학생들은 이러한 논리를 가지고 그러한 급
수를 추상적이지만 만들어 보고 증명을 완결해보라.
(2)를 위한 논리도 비슷하게 만들 수 있다. ⊔

Ratio test를 사용하는 몇가지 예를 연습해보자.

Problem 22.11. 다음 급수의 수렴성을 판별 하시오.



2n + 5 ∞
(2n)! ∞
4n n!n!
(1) ∑ n
. (2) ∑ . (3) ∑ .
n=1 3 n=1 n!n! n=1 (2n)!

Solution 22.11 (1)을 보면 n이 충분히 크면 마치 등비가 r = 23 인 등비수열 처럼


보이지 않나? Ratio test를 해 보고 싶은 생각이 당연히 든다. 그러면

|an+1 | 2n+1 + 5 3n
lim = lim .
n→∞ |an | n→∞ 3n+1 2n + 5

분모와 분자를 2n 3n 으로 나누면

|an+1 | 2 + 5/2n 1 2
lim = lim n
=
n→∞ |an | n→∞ 3 1 + 5/2 3

이다. 예상한 대로다. 따라서 ratio test에 의해서 수렴한다.


176 22 Tests for absolute convergence

(2)의 경우는 등비수열 처럼 보이지는 않지만 ratio를 계산하면 많은 것이 지워


지고 간단해 질 것 같다. 해보면

|an+1 | (2n + 2)! n!n! (2n + 2)(2n + 1)


lim = lim = lim = 4.
n→∞ |an | n→∞ (n + 1)!(n + 1)! 2n! n→∞ (n + 1)(n + 1)

따라서 ratio test에 의해서 발산한다.


(3) 앞의 경우는 ratio 가 4 였는데 이를 뒤집고나서 4n 을 곱했으니 ratio test를
하면 ρ = 1이 나오겠다. 따라서 판별 불가. ⊔ ⊓

22.4 Root test

이제는 root test를 소개 한다. 어떤 경우는 이 방법이 매우 유용하다.


p
Problem 22.12 (Root test). ρ = lim n
|an | = |an |1/n 라고 할 때 다음을 보이시오.
n→∞
∞ ∞
(1) If ρ < 1, ∑ an converges absolutely. (2) If ρ > 1, ∑ an diverges.
n=1 n=1
(3) If ρ = 1, no conclusion.

Solution 22.12 증명과 이를 위한 논리는 ratio test 경우와 거의 흡사하다. 일단 (3)


1 1
을 확인해 보자. 급수 ∑∞ n=1 n 와 ∑n=1 n2 의 경우 모두 ρ = 1이라는 것을 확인하자.

일단 Problem 21.6(2)에서 limn→∞ n1/n = 1을 보였다. 그리고

lim (n2 )1/n = lim (n1/n )2 = ( lim n1/n )2 = 12 = 1.


n→∞ n→∞ n→∞

(위에서 함수 f (x) = x2 이 연속이라는 것이 쓰였다. 어디인가?) 따라서, ρ = 1인


경우는 수렴하는 경우와 발산하는 경우 모두 포함하고 있어서 판별이 불가하다.
(1)을 증명해 보자. 원리를 이해해 보자. 만약 ρ < 1이면 어떤 등비 r이 ρ와 1
사이에 존재하고 모든 n > N에 대해서 |an |1/n < r을 만족한다. 양번을 n제곱하면

|an | < xn .

우측은 등비 수열이고 수렴한다. 따라서 comparison test에 의해서 ∑∞


n=1 an 는 ab-
solutely 수렴한다.
(2)를 위한 논리도 비슷하게 만들 수 있다. ⊔

몇 가지 간단한 예를 들어보자.
22.4 Root test 177

Problem 22.13. 다음 급수가 수렴하는지 판별하시오.



2n ∞
2n ∞ 
1 n
(1) ∑ 3 . (2) ∑ √ . (3) ∑ .
n=1 n n=1 n! n=1 n+1
(

n2−n , if n is odd
(4) ∑ an , an = .
n=1 2−n , if n is even

ratio test와 root test 중 어는 것을 사용하는 것이 좋은지는 연습을 통해 알아


나가자. 일단 예측을 해보고 실패와 성공을 반복해보자.

Solution 22.13 (1)은 ratio test가 좋아 보인다. 그러면

2n+1 n3
ρ = lim = 2.
n→∞ 2n (n + 1)3

따라서 ratio test에 의해 발산한다. (2)도 ratio test를 해보자. 그러면


√ r
2n+1 n! 1
ρ = lim p = 2 lim = 0.
n→∞ 2n (n + 1)! n→∞ n+1

따라서 ratio test에 의해 수렴한다. (3)은 root test를 하기에 적합해 보인다. 그러면
1
ρ = lim (an )1/n = lim = 0.
n→∞ n→∞ n + 1

따라서 root test에 의해 수렴한다. (4)는 사실 ratio test는 잘 안되고 root test는 잘
되는 예를 인위적으로 만든 것이다. 일단 ratio test를 해보자. 그러면

(n + 1)2−n−1
= lim (n + 1)2−1 = ∞ if n is even

 lim

ρ = n→∞ 2−n−1 2−n n→∞
2 −1
 lim = lim =0 if n is odd


n→∞ n2 −n n→∞ (n + 1)

따라서 ratio test는 그다지 도움이 되지 않는다. root test를 사용해 보자. 그러면,

lim (n2−n )1/n = lim n1/n 2−1 = 2−1 , lim (2−n )1/n = 2−1 .
n→∞ n→∞ n→∞

n이 짝수일 경우와 홀수인 경우 모두 0.5로 수렴한다. 따라서, ρ = 2−1 이고 급수는


root test에 의해 수렴한다. ⊔

Exercises

1.
2.
Lecture 23
Power series

전 강의에서 공부한 절대수렴 판별법 중 root test를 사용해서 power series의 수


렴과 수렴 반경을 공부한다. Taylor series의 수렴은 이 방법에 기반을 둔다. 강의
후반에는 conditional convergence test도 소개한다.

23.1 Convergence of a power series

다음 몇 가지 예를 통해서 power series 수렴 영역과 계수와의 관계에 대한 느낌을


갖자.

Problem 23.1. 다음의 power series의 수렴 영역을 찾으시오.


∞ ∞ ∞ 
1 n n ∞ ∞
xn
(1) ∑ xn . (2) ∑ (−1)n xn . (3) ∑ − x . (4) ∑ n2 xn . (5) ∑ (−1)n n .
n=0 n=0 n=0 2 n=0 n=0

power series의 수렴 판정은 root test와 ratio test 모두 가능한 경우가 많다. 물론
계수를 고려해야 한다. (1),(2),(3)의 경우는 등비 수열이니까 극한까지 쉽게 구할
수 있고 (4)과 (5)는 극한은 힘들어도 수렴여부는 판별할 수 있어 보인다.

Solution 23.1 (1)은 등비 수열로 공비가 x이다. 따라서 모든 |x| < 1에 대해서
수렴하며 모든 |x| ≥ 1에 대해서 발산한다.
(2)도 등비수열로 공비가 −x이다. 수렴 영역은 똑같이 |x| < 1이다. (2)는 alter-
nating series 처럼 보이지만 그렇지도 않다. x가 양수면 (2)가 alternating 이고 x가
음수이면 (1)이 alternating 수열이다.
(3)은 공비가 − 2x 인 등비 수열이다. 계수가 점점 작아지는 경우이고 수렴 영역
은 |x| < 2로 (1)에 비해 2배 커졌다.
(4)는 계수가 점점 커지는 경우다. ratio test를 하면

(n + 1)2 xn+1 (n + 1)2


lim = lim x = x.
n→∞ n2 xn n→∞ n2

179
180 23 Power series

따라서 |x| < 1이면 수렴한다. 경계 케이스인 x = 1, x = −1경우는 모두 발산한다.


수렴 구간이 변동이 없다. 결론 적으로 계수가 n2 정도로 커져서는 power series의
수렴구간에 영향이 없다.
(5)의 경우는 계수가 작아지는 경우지만 수렴 구간에는 변동이 없어 보인다.
ratio test를 하면
nxn+1 n
lim = lim x = x.
n→∞ (n + 1)xn n→∞ n + 1

따라서 |x| < 1이면 수렴한다. 경계 케이스 중 x = 1은 수렴한다. Alternating series


를 사용하면 된다. x = −1 경우는 발산한다. 수렴 구간 중 경계점 하나가 포함
되어 수렴구간은 −1 < x ≤ 1이다. ⊔⊓

계수가 n의 유한 제곱 꼴로 커지거나 또는 1n 의 유한 제곱 꼴로 작아지는 것은


power series의 수렴구간에 영향을 미치지 못한다. (경계점에서만 변동이 있을 수
있다.) 반면에 등비 수열 처럼 커지거나 작아지면 그에 맞추어서 수렴구간이 커지
거나 작아진다. 계수가 power series 처럼 행동하는 것이니까 이런 결과가 자연스
럽다. 다음은 계수가 등비 수열보다 빠르게 커지거나 작아지는 경우를 고려하자.

Problem 23.2. 다음의 power series의 수렴 영역을 찾으시오.


∞ n ∞
x
(1) ∑ . (2) ∑ n!xn .
n=0 n! n=0

Solution 23.2 (1)은 계수가 n!1 이고 매우 빠르게 작아진다. 계수가 등비 수열 보다


훨씬 빠르게 작아지니까 수렴구간이 클 것이라고 예상할 수 있다. 정말 그런지
ratio test를 해보자. 그러면,

xn+1 n! x
ρ = lim n
= lim = 0 < 1.
n→∞ (n + 1)!x n→∞ n + 1

다시 말해 x가 어떤 값을 가지던지 상관없이 ρ은999 1보다 작다. 즉 수렴구간은


전구간이다. 실제 이 급수는 매우 잘 알려진 급수이며 그 수렴값은 ex 이다. 이 급
수를 미분하면 자기 자신이 된다는 것을 확인할 수 있다. 마치 ex 의 미분이 자기
자신이 되는 것과 같다.
(2)의 경우에는 계수가 등비수열에 비해 매우 빠르게 커진다. 수렴구간이 매우
작을 것 같다. 정말 그런지 ratio test를 해보자. 그러면,
(
xn+1 (n + 1)! 0 if x = 0,
ρ = lim n
= lim (n + 1)x =
n→∞ n!x n→∞ ∞ otherwise.

따라서 수렴 구간은 x = 0 한점 뿐이다. ⊔


이번에는 일반적인 power series ∑∞ n


n=0 cn x 의 수렴을 판단하기 위해서 root test
를 해보자. 그러면

ρ = lim (|cn ||x|n )1/n = lim (|cn |)1/n |x|


n→∞ n→∞
23.2 Radius of convergence 181

root test에 따라서 ρ > 1이면 급수는 발산하고 ρ < 1이면 수렴하며, ρ = 1인 경
우는 발산할 수도 수렴할 수도 있다. 따라서 이를 이용하여 다음의 수렴반경을 알
수 있다.

23.2 Radius of convergence

Problem 23.3 (Radius of convergence). 주어진 급수 ∑∞ n


n=0 cn x 의 수렴반경 ra-
dius of convergence은 다음과 같이 정의 한다.
1 1
R= = .
ρ lim (|cn |)1/n
n→∞

그러면 다음을 만족한다.



1. 만약 |x| < R이면, 급수 ∑ cn xn 은 수렴한다.
n=0

2. 만약 |x| > R이면, 급수 ∑ cn xn 은 발산한다.
n=0

3. 만약 |x| = R이면, 급수 ∑ cn xn 은 발산할 수도 수렴할 수도 있다.
n=0

Solution 23.3 root test에 의해 자명하다. ⊔




Problem 23.4 (Differentiability of power series). 급수 ∑ cn xn 의 수렴 반경을 R
n=0

n
이라 하고 |x| < R에 대해 f (x) = ∑ cn x 라고 하자. 그러면, (1) f 모든 |x| < R
n=0

에 대해 미분 가능하고 f ′ (x) = ∑ ncn xn−1 이다. (2) f (x)는 모든 |x| < R에 대해
n=1
무한번 미분 가능하고 다음을 만족한다:

f (k) (x) = ∑ n(n − 1) · · · (n − k + 1)cn xn−k , |x| < R.
n=k

n n
Solution 23.4 부분합 sn (x) = ∑ ck xk 의 미분은 s′n (x) = ∑ kck xk−1 이다. 그리고
k=0 k=0
n
s′n (x) = ∑ kck x k−1
의 수렴 반경은 R로 동일하다. 그리고 미분 operation은 연속이
k=0
다. 따라서

f ′ (x) = ( lim sn (x))′ = lim (sn (x))′ = ∑ ncn xn−1 . (23.1)
n→∞ n→∞
n=0
182 23 Power series

급수 ∑ ncn xn−1 에 반복해서 다시 적용하면 위의 미분을 모두 얻을 수 있다. ⊔

n=0

Question 23.1. 위의 문제의 답에서 미분은 연속이라고 주장한 후에 (23.1)에서


limit을 미분 밖으로 꺼집어 냈다. 미분이 연속이라는 말과 이렇게 limit을 미분
밖으로 꺼내는 것이 연관이 있는지 설명할 수 있을까? 미분 operation은 정말 연
속인가? 어떻게 보이나?

미분을 했듯히 적분도 할 수 있다. 부분 합을 적분하고 그 수렴 반경을 확인한


후에 limit을 취하면 된다. 적분 operation도 연속이다.

Problem 23.5 (Integrability of power series). Let R be the radius of convergence


of ∑∞ n ∞ n
n=0 cn x and let f (x) = ∑n=0 cn x for |x| < R. Then,
Z x ∞
cn
F(x) =
0
f (s)ds = ∑ n + 1 xn+1 , |x| < R.
n=0

Solution 23.5 생략. ⊔



n
n=0 cn (x − x0 ) 가 주어지고 수렴 영역 |x| < R이 주어지면 최소한
power series ∑∞
이 영역 한에서는 얼마든지 미분하고 적분을 하여도 수렴한다는 것을 기억하자.
다시말해서 power series로 주어진 함수는 얼마든지 미분과 적분이 가능한 함수
라는 것이다.

23.3 Alternating series

수열 an 의 각 원소의 부호가 매번 바뀌는 경우 교대 수열 alternating sequence


이라고 부르고, 그 급수를 교대 급수 alternating series라고 한다. 예를 들어 모
든 짝수 인덱스에 해당하는 숫자는 양수이고 홀수 인덱스 숫자는 음수인 수열을
말한다. 따라서 an 이 교대 수열이면 다음과 같이 쓸 수 있다:

an = (−1)n−1 bn , bn ≥ 0.

이러한 수열로 이루어진 급수의 성질을 공부하자.

Problem 23.6 (Alternating series test). bn ≥ 0, bn → 0 as n → ∞, 그리고 bn 는 단조


감소한다고 가정하자. 그러면 급수 ∑∞ n−1 b 는 수렴하며 또한 모든 n > 0
n=1 (−1) n
에 대해서

s2n ≤ ∑ (−1)n−1 bn ≤ s2n+1 (23.2)
n=1

을 만족한다는 것을 보이시오.

수열 bn 이 감소 수열이라는 것과 더불어서 0으로 수렴한다는 것 모두 필요하


다. 이 두 조건 중 하나라도 만족하지 않으면 수렴하지 않는 반례를 만들 수 있다.
23.3 Alternating series 183

그리고 (23.2)은 수렴에 대한 error estimate로 매우 중요한 역할을 할 수 있다. 수


렴하는 것을 아는데 그치지 않고 그 극한이 어느 영역에 있다는 것을 아는 것은
매우 중요하다.

Solution 23.6 부분합은 다음과 같이 쓰여진다:

s2n+1 = b1 − b2 + b3 − b4 + b5 − · · · − b2n + b2n+1


= b1 − (b2 − b3 ) − (b4 − b5 ) − · · · − (b2n − b2n+1 ).

bn 은 감소 수열이므로 b2 − b3 ≥ 0, b4 − b5 ≥ 0, b6 − b7 ≥ 0, · · · 이다. 따라서 부분합


s2n+1 은 n이 증가함에 따라 감소하는 수열이다. 또한 s2n+1 을 다시 쓰면

s2n+1 = b1 − b2 + (b3 − b4 ) + · · · + (b2n−1 − b2n ) + b2n+1 ≥ b1 − b2

로 하한이 있다 (bounded below). 따라서 s2n+1 는 수렴한다. 이제 그 극한을 L1


이라고 하자. 비슷하게 s2n 에 대해 위의 계산을 하면

s2n = (b1 − b2 ) + (b3 − b4 ) + (b5 − b6 ) + · · · + (b2n−1 − b2n )

이고, 각 항이 0이거나 0보다 크므로 s2n 은 증가 수열이다. 또한 s2n 을 다시 쓰면

s2n = b1 − (b2 − b3 ) − (b4 − b5 ) − · · · − (b2n−2 − b2n−1 ) − b2n ≤ b1

로 상한이 있다. 따라서 s2n 은 수렴한다. 그 극한을 L2 라고 하자. 그러면 두 극한의


차이는

L1 − L2 = lim s2n+1 − lim s2n = lim (s2n+1 − s2n ) = lim b2n+1 = 0.


n→∞ n→∞ n→∞ n→∞


따라서 L1 = L2 이고 ∑ (−1)n−1 bn 는 수렴한다. s2n+1 은 감소 수열이고 s2n 은 증가
n=1
수열 이므로 (23.2)을 만족한다. ⊔

당연해 보이는데 이렇게 힘들게 증명해야 하나? 힘들게 증명 했다기 논리적으


로 서술 하는데 노력이 들었다. 이런 연습이 수학적 사고에 도움이 된다.

Problem 23.7. 다음 급수의 수렴 여부를 판정하시오.


∞ ∞
1 10n
(1) ∑ (−1)n−1 . (2) ∑ (−1)n−1 2 .
n=1 n n=1 n + 16

Solution 23.7 (1) n1 는 양수이고, 감소 수열이고, 0으로 수렴한다. 따라서 alternat-


ing series test에 의해서 급수 ∑∞ n−1 1 는 수렴한다. 그러나 절대값을 붙인
n=1 (−1) n
n−1 1 ∞ 1
∑n=1 |(−1) n | = ∑n=1 n 은 수렴하지 않는다. 이와같이 절대값을 붙이면 발산하

고 붙이지 않으면 수렴하는 경우를 conditional convergence 라고 한다.


(2) bn = n210n
+16
는 양의 값을 가지고 있고 n이 커짐에 따라 0으로 수렴한다. 그러
나 감소 수열은 아니다. n이 작은 경우에는 증가할 수 있지다. 하지만 충분히 큰
n에 대해서는 감소한다. 그리고 Alternating series test를 할 때 어차피 처음 몇 개
184 23 Power series

항은 수렴에 영향이 없다. 그러면 n이 클때는 감소 수열이라는 것을 어떻게 보일


까? 일단 f (x) = x210x
+16
로 놓고 그 미분의 부호를 알아보자. 계산해 보면 x > 4 이면
f ′ (x) ≤ 0 임을 알 수 있다. 따라서 n > 4에 대해서는 감소이고 감소수열의 성질에
따라서서 수렴한다. ⊔ ⊓

(23.2)의 위력은 극한 값의 위치를 추정할 수 있다는 것이다. 다음 문제를 통해


서 이를 확인해 보자.

Problem 23.8. L = ∑∞ n−1 2−n 의 값을 오차 0.01이하로 추정하시오.


n=1 (−1)

Solution 23.8 Alternating series 이고 n이 홀수 일때 an > 0 이니까 s2n < s2n+1 이


다. 극한은 s2n 과 s2n+1 사이에 있고 그 간격은 b2n+1 이다. 따라서 일단 b2n+1 < 0.01
인 n 부터 찾자. 그러면
ln 0.01
ln 2−2n−1 < ln 0.01 ⇒ −2n − 1 < ⇒ n > 2.8219.
ln 2
따라서 n = 3이다. 그러면 추정 구간은 (s6 , s7 )이다. 물론 우리는 L의 값을 안다.

0.5 1
L= = .
1 − (−0.5) 3
1
따라서 3 ∈ (s6 , s7 ) 라는 것을 확인 할 수 있을 것이다. ⊔

23.4 Rearrangement and conditional convergence

수열은 순서가 있는 수들의 집합이다. 때론 그 순서를 바꾸어서 새로운 수열을


만들고 그 성질을 통해서 기존 수열의 성질을 알 수 있을 때가 있다. 그 것을 re-
arrangement라고 한다. 여기서 순서는 바꾸지만 하나도 빼먹지 않아야 하고 두 번
등장하는 것도 없어야 한다. 어떻게 정의 할까?

Definition 23.1 (Rearranged series). Let N be the set of natural numbers and an be
a given sequence for all n ∈ N. A sequence bn is called a rearrangement of an if
there exists a one-to-one onto mapping φ : N → N such that

bn = aφ (n) , n ∈ N.

Question 23.2. 이 정의가 원래 의도한 것을 만족하는지 설명할 수 있나?

Problem 23.9. 급수 ∑∞
n=1 an 가 절대 수렴하면 모든 rearrangement가 절대 수렴하
며 그 극한도 변하지 않음을 보이시오.

이 문제는 절대 수렴하는 급수에 대해서는 rearrangement가 큰 차이를 만들어


내지 않는다는 것을 보여 준다. 증명은 간단한 편인데 상황을 잘 정리해야한다.
23.4 Rearrangement and conditional convergence 185

n=1 an = L이라 하자. 이제 ∑n=1 bn = L 을 보이자. sn 을 an 의 부


Solution 23.9 ∑∞ ∞

분합, vn 을 bn 의 부분합이라고 하자. 이제 ε > 0가 주어 졌다고 하자. 그러면 어떤


N이 존재해서 모든 n > N에 대해 |vn − L| < ε 임을 보이면 된다. ∑∞ n=1 an = L이
므로 어떤 N1 이 존재해서 모든 n > N1 에 대해서 |sn − L| < ε2 을 만족한다. 또한
n=1 |an |는 수렴함으로 N2 > N1 이 존재해서 ∑k=N2 |ak | < 2 . 이제 N을 택하는데
ε
∑∞ ∞

다음과 같이 택한다:
N = max{φ −1 (n) : n ≤ N2 }.
그러면, n > N에 대해서
n N2 ∞
ε ε
|vn − L| = | ∑ bk − L| < | ∑ ak − L| + ∑ |ak | ≤ + = ε.
k=1 k=1 k=N2 2 2

따라서 ∑∞
n=1 bn = L이다. (핵심은 첫번째 부등식이다.) ⊔

이제 또 다른 수렴성을 고려해 보자.

Definition 23.2. We say ∑∞ ∞


n=1 an converges conditionally if ∑n=1 an converges, but

∑n=1 |an | diverges.

급수 ∑∞n=1 an 이 수렴은 하지만 절대값을 붙인 ∑n=1 |an |은 수렴하지 않는 다는


말은 그 안에는 음수도 있고 양수도 있어서 서로 상쇄되어서 수렴이 일어나지만


절대값을 붙이면 발산한다는 것이다.

Problem 23.10. 다음 급수들이 conditionally 수렴한다는 것을 확인하시오.



(−1)n ∞
(−1)n n ∞
sin(n)
(1) ∑ with 0 < α ≤ 1. (2) ∑ 2
. (3) ∑ .
n=1 n n=1 n − 2n + 1 n
α
n=1

Solution 23.10 (1)과 (2) 모두 alternating convergence test를 쓰면 수렴한다는 것을


보일 수 있다. 절 대 값을 붙이면 발산한다는 것도 보일 수 있다. 따라서 condition-
ally converge한다. (3)의 경우는 정확하게 alternating 급수는 아니다. sine 함수는
π마다 2번 부호를 바꾼다. 2 마다 2번 바꾸는 것이 alternating이니까 가끔 부호
를 바꾸지 않는다는 말이다. 평균적으로 +와 -가 비슷하게 있으면서 conditionally
수렴할 것 같지만 증명할 마땅한 방법이 없다. ⊔ ⊓

Conditionally 수렴 한다는 말은 그 수열 안에 있는 양수만 더해도 발산하고 음


수만 더해도 발산한다는 말이다. 단지 서로가 적절히 상쇄 되어서 수렴한다는 말
이다. 그러면 그 수열의 순서를 바꾸어도 수렴할까? 뜻밖의 결과를 얻을 수 있다.

Problem 23.11. 급수 ∑∞
n=1 an 가 conditionally 수렴하면 어떤 숫자 L이 주어져도
이 값으로 수렴하는 rearranged 급수 ∑∞ n=1 bn 을 만들 수 있다는 것을 보이시오.

Solution 23.11 순서를 바꾸어도 어차피 모두 포함 된다면 어차피 소거 되어서


수렴할 것 같기도 한데 수렴하지 않을 수 있을 뿐만 아니라 어떤 수 L이 주어지든
n=1 bn = L이 되게 하도록 rearrangement bn 을 정할 수 있다니 이상할 수 있다.
∑∞
그러나 이 것은 우리의 경험이 유한의 세계에 기반을 둔 것이어서 무한의 세계에
익숙하지 않은 것 뿐이다.
186 23 Power series

그러한 rearrangement bn 을 만들어 보자. 그 말은 φ : N → N인 one-to-one onto


mapping을 만들어서 급수가 L로 수렴하게 하면 된다. 수열 an 에는 무수히 많은 양
수와 음수가 있고 각각을 따로 더하면 발산한다는 것을 기억하고 rearrangement
를 만들자. 일단 1은 1로 대응 시킨다. bn 이 n = 1, · · · , k까지 만들어 졌다고 하자.
만약 ∑kn=1 bn 이 L보다 크면 다음에는 다음번 음수를 가지는 index를 대응 시킨다.
L보다 작으면 다음번 양수 index를 대응시킨다. 계속 이런식으로 φ 를 만들면 급수
n=1 bn 는 L로 수렴한다. ⊔
∑∞ ⊓

Exercises

1. 다음 power series의 수렴구간을 판별하시오.


∞ ∞ ∞
(2n)! n ∞
3n x2n
(1) ∑ nxn (2) ∑ n2 (3x − 1)n (3) ∑ x (4) ∑ 2
n=1 n=1 n=1 n! n=1 n
∞ n
(−1) (2x − 1)n ∞ 2
(x − 1) n ∞
nn x n ∞
n2n xn
(5) ∑ (6) ∑ (7) ∑ (8) ∑
n=1 2n + 2 n=1 2 · 4 · 6 · · · 2n n=1 n! n=1 n!
2.
Lecture 24
Taylor Series

이전 강의에서 다양한 수열과 급수의 성질과 수렴에 대해 공부한 것은 이번 강의


에서 공부할 Taylor 급수로 가기 위한 사전 작업이었다. 드이어 이번 강의에서는
Taylor 급수를 소개하고 그 성질을 공부한다.

24.1 Taylor series

n번 미분이 가능한 함수 f (x)를 power series로 근사하고자 한다. 특히 x = x0 라는


점 주변에서 근사를 잘하고 싶다. 일단 근사를
n  
f (x) ∼
= ∑ cs (x − x0 )s ≡ pn (x) (24.1)
s=0

라고 두자. 우측의 부분합을 간단히 pn (x)라고 쓰자.

Question 24.1. 계수 cs 을 잘 정해서 우측의 다항식 pn (x)가 좌측의 함수 f (x)의


좋은 근사 함수가 되게 하고 싶다. 계수를 어떻게 정하면 될까?

계수 cs 을 정하는 다양한 방법이 있는데 Taylor series에서는 하나의 접 x0 에서


n차까지의 모든 미분이 같아지도록 정한다.

Problem 24.1. 함수 f 가 x = x0 에서 n차 까지 미분 가능하다고 하자. 이때 (24.1)의


근사함수 pn (x)와 목적 함수 f (x)가 x = x0 에서 미분 값이 0차에서 부터 n차까지
같아 지도록 계수 cs 을 정하시오.

Solution 24.1 계수가 총 n + 1개 있으니까 미분 차수를 0차에서 n차 까지 총 n + 1


개를 같게 할 수 있다. 즉,
(k)
f (k) (x0 ) = pn (x0 ), k = 0, 1, · · · , n

187
188 24 Taylor Series

를 만족하도록 계수 cs 을 정해보자. 위의 식은 n + 1 개의 계수를 미지수로 가지는


n + 1개의 연립방정식이 된다. 더군다나 우측은 이미 대각화가 되어 있다. pn (x)
를 k번 미분하여 x에 x0 를 대입하면
n
(k)
pn (x0 ) = ∑ s(s − 1) · · · (s − k + 1)cs (x − x0 )s−k x=x0 = ck k!
s=k

을 얻는다. 이 계산을 자세하게 설명하자. pn (x)를 k번 미분하니까 차수가 k보다


작은 항은 모두 0이된다. 그래서 위의 합산은 s = k부터 시작한다. 차수가 s ≥ k
인 경우의 항 cs (x − x0 )s 의 k차 미분은 위에 주어졌는데 (x − x0 )s−k 의 차수를 가
진다. 특히 차수가 k인 항 ck (x − x0 )k 의 k차 미분은 상수 k!ck 가 된다. 위 식에서 x
(k)
에 x0 를 대입하면 이 상수항을 빼고는 모두 0이 된다. 따라서 f (k) (x0 ) = pn (x0 )를
(k)
다시쓰면 f (x0 ) = k!ck 이 된다. 즉, 계수가

f (k) (x0 )
ck =
k!
로 주어진다. ⊔

이러한 계수로 만들어진 다항식 pn (x)를 Taylor polynomial이라고 부른다. 함


수 f (x)의 x0 를 center로 하는 n차 Taylor polynomial은 다음과 같다:
n
f (k) (x0 )
pn (x) = ∑ (x − x0 )k . Taylor polynomial
k=0 k!

Question 24.2. Taylor polynomial은 한점에서의 미분 정보만 가지고 만드는 근사


함수이다. 따라서 이 근사 함수는 함수 f (x)를 미분점 x0 근처에서 잘 근사 할 수
는 있어도 x0 에서 멀리 떨어져 있으면 pn (x)가 f (x)로 수렴할 것이라고 기대할 수
없다. 그런데 우리가 알고 있는 많은 함수들은 수렴한다. 가령 sin x 같은 함수는
모든 x ∈ R에 대해 수렴한다. 어떻게 이런일이 가능할까?

Problem 24.2 (Taylor series). 함수 f (x)가 무한번 미분 가능하면 부분합이 아니


라 급수를 만들 수 있다. 즉,

f (k) (x0 )
p(x) = ∑ (x − x0 )k . Taylor series
k=0 k!

이를 Taylor series 라고 부른다. 물론 수렴 구간 안에서만 의미가 있다.


(1) 이 급수는 언제 수렴하는가?
(2) 만약 f (x) = sin x이라면 수렴 반경은 얼마인가?
(3) 급수가 수렴하는 구간에서는 p(x)가 f (x)와 동일하다고 할 수 있는가?

Solution 24.2 (1) 계수의 분모에 k!이 있다는 것에서 수렴구간이 커질 수 있는 가


능성이 있다는 것을 알 수 있다. 그러나 분자에 있는 f (k) (x0 )가 매우 빠르게 커질
경우에는 이 효과가 없어질 수 있다. ratio test가 유용할 것 같다. (2) 만약 함수가
f (x) = sin x라면 f (k) (x0 )는 항상 절대값이 1보다 작다. 따라서 ratio test를 하면
24.1 Taylor series 189

수렴구간이 전 영역이라는 것을 보일 수 있다. (3) 수렴하기만 하면 p(x)는 f (x)


일까? 사실 그럴 이유는 없다. 근사 함수 p(x)는 원 함수 f (x)의 정보를 x0 한점에
서만 가져왔다. 따라서 x0 근처라면 몰라도 멀리 떨어진 x에 대해서 도 p(x)와 f (x)
가 동일할 이유는 없다. 동일 하다면 그 것은 매우 놀라운 경우일 것이다. 그런데
많은 함수들이 그렇다. 어떻게 그럴수 있을까? 증명은 어떻게 할까? ⊔ ⊓

Taylor 급수의 수렴성만 가지고는 그 극한이 무엇인지 알수 없다. Taylor series


의 진짜 가치는 error estimate이다.

Theorem 24.1 (Taylor’s theorem (Lagrange form)). Suppose that f (x) is differen-
tiable n + 1 times for all x ∈ (a, b) ⊂ R, and x0 ∈ (a, b). Then, there exists a point c
between x and x0 such that

f (x) = pn (x) + Rn (x),

where
n
f (k) (x0 ) f (n+1) (c)
pn (x) = ∑ (x − x0 )k , Rn (x) := (x − x0 )n+1 . (24.2)
k=0 k! (n + 1)!

Proof. (이 증명에도 Problem 24.1에서 사용한 논리가 사용된다.) 이 정리를 증명


할 때는 x와 x0 는 고정된 상수이다. 아래서 함수를 나타낼 때는 변수로 s를 사용한
다. 일단
f (x) = pn (x) + M(x − x0 )n+1
f (x) − pn (x)
을 만족하는 상수 M은 있다. 그냥 M = 로 정하면 된다. 이제 이 상수
(x − x0 )n+1
M이 정리에서 처럼 주어진다는 것을 보이면 된다. 좌항과 우항의 차이를

E(s) = f (s) − pn (s) − M(s − x0 )k+1

으로 두자. 그러면 E(s)는 n + 1 번 미분 가능하다. 그리고 모든 0 ≤ k ≤ n에 대


해서 E (k) (x0 ) = 0이다. 이제 Mean Value Theorem을 n + 1 번 사용 하려고 한다.
E(x0 ) = E(x) = 0 이므로 MVT에 의해서 x와 x0 사이에 E ′ (c1 ) = 0를 만족하는 c1
이 존재한다. 그리고 E ′ (x0 ) = E ′ (c1 ) = 0 이므로 c1 과 x0 사이에 E ′′ (c2 ) = 0를 만
족하는 c2 가 존재한다. 이것을 n + 1 번 하면 E (n+1) (c) = 0를 만족하는 cn+1 = c가
x0 와 cn 사이에 존재한다. pn (s)은 n차 다항식이니까 n + 1 번 미분하면 0이 된다.
따라서
E (n+1) (c) = f (n+1) (c) − M(n + 1)! = 0
f (n+1) (c)
을 만족한다. 즉, M = 으로 주어지는 c가 x와 x0 사이에 존재 한다. ⊔

(n + 1)!

함수 f (x)가 n + 1번 미분 가능하니까 n + 1차 Taylor polynomial pn+1 (x)를 가


지고 approximation을 할 수 있다. 그러나 그 경우는 오차가 얼마나 되는지 알지
못한다. error estimation이 Taylor theorem의 핵심이다. remainder term Rn (x)은
f (x)와 pn (x)의 차이를 즉 근사오차이며 f (n+1) (x0 ) 자리에 f (n+1) (s) 가 있는 것
190 24 Taylor Series

을 빼면 Taylor polynomial의 n + 1번째 항과 똑 같이 생겼다. 그리고 s는 x와 x0


사이에 있다.

Problem 24.3 (One point decides all). f (x) = sin x 이면 모든 x, x0 ∈ R에 대해



f (n) (x0 )
f (x) = ∑ (x − x0 )n (24.3)
n=0 n!

임을 보이시오. 다시말해 f (x) = p(x) 임을 보시오.

Solution 24.3 (1) Error estimate가 있기 때문에 쉽게 이 문제를 해결 할 수 있다.


sin x는 몇 번을 미분하던지 그 절대 값이 1이거나 1보다 작다. 따라서 (24.2)의
error term Rn (x)는 ratio test에 의해 모든 x, x0 ∈ R에 대해서 n → ∞일 때 0으로 수
렴한다. 따라서 급수의 극한값 p(x)는 f (x)와 같다. 말로 핵심만 설명한 것을 직접
손으로 계산해서 확인해 보자. ⊔ ⊓

위의 결과는 매우 특이하다. Taylor series는 오직 한점에서의 미분 값을 가지고


정의한다. 그런데 위의 결과는 한점에서의 모든 미분 정보가 모든 점에서의 함수
값을 결정한다는 것을 말하고 있다.
remainder term Rn 을 다시 써보자;

f (n+1) (s)
Rn (x) := (x − x0 )n+1 .
(n + 1)!

만약 어떤 수 M > 0에 대해서 차수 n과 점 s에 상관 없이 계수의 분자가 bound


된다면, 즉 | f (n+1) (s)| < M을 만족한다면, x가 아무리 멀리 떨어져 있어도 n이
무한대로 커지면 Rn (x)는 0으로 수렴한다. 물론 x가 x0 에서 멀리 떨어져 있으면
|x − x0 |이 크기 때문에 Rn (x) 충분히 작아지려면 n이 더 많이 커져야 하겠지만
궁극적으로는 충분히 작아진다.

Problem 24.4. Exponential 함수 f (x) = ex 에 대해서 (1) Taylor polynomial pn (x)


를 구하시오. (2) 수렴구간을 구하시오. (3) 극한 p(x)와 f (x) = ex 가 일치 하는
지를 판별하시오.

Solution 24.4 ⊔

Problem 24.5 (Maclaurin series). 만약 x0 = 0로 잡으면 (24.3)은 다음과 같이 쓰


인다는 것을 보이시오;

(−1)n ∞
(−1)n 2n
sin x = ∑ (2n + 1)! x2n+1 , cos x = ∑ x .
n=0 n=0 (2n)!

Solution 24.5 sin x의 짝수번째 미분은 sin x 이거나 − sin x이다 이들은 x = 0에서
0의 값을 가진다. 따라서 c2n = 0이다. 홀수 번째 미분은 cos x 이거나 − cos x이며
x = 0에서 +1이나 -1의 값을 가진다. 그래서 위와 같은 식을 얻는다. f (x) = cos x
의 경우도 비슷하게 할 수 있다. ⊔ ⊓
24.2 Applications 191

위와 같이 center 점 x0 를 0으로 잡은 Taylor series의 특별한 경우를 Maclaurin


series 라고 부른다.

24.2 Applications

Theorem 24.2 (binomial expansion). 모든 |x| < 1와 모든 α ∈ R에 대해서 다음이


성립함을 보이시오:
∞  
α k α α(α − 1) · · · (α − k + 1)
(1 + x) = ∑ ck x , ck = := . (24.4)
k=0
k k!

Proof. 증명은 Taylor 정리를 쓰면 된다. x > −1인 구간에서는 1 + x > 0 이므로 모
든 α ∈ R에 대해서 (1 + x)α 이 잘 정의 된다. 그 미분도 잘 정의 된다. f (x) = (1 +
x)α 라고 하면 f (k) (x) = α(α − 1) · · · (α − k + 1)(1 + x)α−k 가 된다. 따라서 Taylor
정리를 쓰면
n
α(α − 1) · · · (α − n)(1 + s)α−n−1
(1 + x)α = ∑ ck x k + (n + 1)!
k=0

을 만족한다. 여기서 s는 0과 x 사이의 수이다. |x| < 1 이면 1 + x > 0이 때문에


remainder term은 n → ∞일 때 0으로 수렴한다. 따라서 급수는 수렴하고 (24.4)을
만족한다. ⊔ ⊓

양의 정수 n > 0에 대해 이항식 (1 + x)n 을 전개하는 것을 곱해서 펼치는 것으로


볼 수 있지만 그 결과물은 어차피 Taylor 급수의 꼴이다. 따라서 전개한 결과물
을 Taylor polynomial로 보는 것은 Taylor series의 좋은 응용이다. 그리고 이 경우
n!
k > n에 대해서는 분자가 0이므로 ck = 0이고 ck = k!(n−k)! 이다. 따라서

n  
n n!
(1 + x)n = ∑ ck x k , ck = =
k=0
k k!(n − k)!

를 만족한다. 그러나 α가 양의 정수가 아니면 ck 는 한상 0이 아니고 따라서 급수로


이해해야 한다.

Problem 24.6. ratio 테스트를 써서 (24.4)의 급수가 수렴함을 보이시오.

Solution 24.6 ⊔

Problem 24.7. 다음 함수들의 Taylor 전개를 구하고 수렴 구간을 판별 하시오.


1 1 1
(1) . (2) . (3) . (4) arctan x.
1+x 1−x 1 + x2
Solution 24.7 ⊔

Problem 24.8. 다항식 (2 + 3x + x2 )10 의 0차,1차,2차 항을 구하시오.


192 24 Taylor Series

Solution 24.8 ⊔

Problem 24.9. ln x의 Taylor 전개를 구하시오.

Solution 24.9 중요한 point는 0을 center로 하는 Taylor 전개는 구하지 못한다는


것이다. ln 0가 정의 되지 않기 때문이다. 따라서 그러면 다음으로 생각할 수 있는
것은 1을 center로 하자는 것인다. 그러면 ln(1) = 0 이고 ln(k) (x) = (−1)k−1 (k −
1)!x−k 이므로

(−1)k−1 (k − 1)! (−1)k−1
ln = ∑ ck (x − 1)k , ck =
k!
=
k
.
k=1

필요에 따라 center를 1이 아닌 다른 값으로 할 수 있다. ⊔


Taylor’s Theorem은 다른 버전들이 존재하는데 다음은 그 중 하나이다.

Theorem 24.3 (Taylor’s theorem (Peano form)). Suppose that f (x) is differen-
tiable n times for all x ∈ (a, b) ⊂ R, and x0 ∈ (a, b). Then, there exists a function
hn : (a, b) → R such that

f (x) = pn (x) + hn (x)(x − x0 )n , a < x < b,

where hn (x) → 0 as x → x0 .

Proof. 함수 hn 을 ( f (x)−p
n (x)
(x−x0 )n if x ̸= x0 ,
hn (x) =
0 if x = x0
와 같이 정의하면 정리의 관계를 만족한다. 여기에 L’Hopital’s Ruled을 연속적으
로 적용하면 그 극한이 0임을 보일 수 있다. ⊔

Problem 24.10. (1) Theorem 24.3 의 의미를 설명하고 (2) Theorem 24.1과 비교
하시오.

Solution 24.10 (1) Theorem 24.3은 x → x0 일 때의 극한을 설명하고 있다. 정리가


말해주는 것을 little-oh 표현을 써서 적으면 다음과 같다:

| f (x) − pn (x)| = o(|x − xn |n ) as x → x0 .

따라서 x → x0 의 수렴 속도를 올리기 위해서는 차수를 올리는 것이 도움이 된다.


그러나 그 오차가 구체적으로 주어지지 않기 때문에 얼마나 도움이 되는지는 말
하기 힘들다. 그 계수에 해당하는 |hn (x)|의 크기를 비교하지 못하기 때문이다.
(2) Theorem 24.3은 Taylor series의 수렴에 대해서는 말하고 있지 않다. 함수 f
가 무한번 미분 가능해서 Taylor series를 만들 수 있어도 고정된 x ̸= x0 에 대해서
n → ∞의 극한을 말하지는 못한다. ⊔ ⊓
24.2 Applications 193

Exercises

1.
Appendix A
Second Order Differential Equations

이번 강의에서는 2차 선형 방정식의 해를 구한다. 2차 선형방정식은 다음과 같이


쓸수 있다.
y′′ + a(x)y′ + b(x)y = Q(x). (A.1)
2차 미분 방정식을 풀면 2개의 general constant가 등장하고 이를 정하기 위해서는
2개의 조건이 필요하다. 가령 2개의 초기 조건을 다음과 같이 줄수 있다.

y(x0 ) = y0 , y′ (x0 ) = y1 .

2차 미분방정식은 1차미분방정식에 비해 해를 구하기가 훨씬 힘들다. 특수한 경


우에만 손으로 풀린다. 이번 강의에서 우리는 a, b, Q가 모두 상수인 경우에 한해
해를 구한다. 이 경우가 뉴턴에게 특히 중요한 것은 천체의 궤도 방정식이 이 중의
특별한 경우로 주어지기 때문이다.

A.1 Second order homogeneous linear equation

Q = 0이면 (A.1)을 homogeneous 미분방정식 이라고 부른다. 우리는 그 중에서도


상수 계수를 가지는 경우의 해를 구한다:

y′′ + ay′ + by = 0. (A.2)

첫 번째 목표는 서로 linearly independent한 0이 아닌 2개의 해를 구하는 것이다.


이 둘을 y1 과 y2 로 표시하자. 물론 y = 0은 위 식을 만족한다. 하지만 이 것은 도
움이 안된다. 그리고 서로 linearly independent 하다는 말은 하나를 다른 하나의
상수 배로 나타낼 수 없다는 말이다. 다시 말해 y1 , y2 두 개의 해를 찾았는데 어떤
상수 C ∈ R에 대해서 y2 = Cy1 를 만족하면 아직 하나 밖에 찾지 못한 것이다.

Problem A.1. y1 및 y2 가 (A.2)의 해라면 모든 C1 ,C2 ∈ R에 대해 이들의 선형 조합,

y = C1 y1 +C2 y2 ,

195
196 A Second Order Differential Equations

도 해가 된다는 것을 보이시오.

Solution A.1 위의 선형 조합을 (A.1)에 대입하면 다음을 얻는다;

(C1 y1 +C2 y2 )′′ + a(x)(C1 y1 +C2 y2 )′ + b(x)(C1 y1 +C2 y2


= C1 (y′′1 + a(x)y′1 + b(x)y1 ) +C2 (y′′2 + a(x)y′2 + b(x)y2 ) = 0.

따라서 선형 조합도 (A.1)의 해이다. ⊔


여기서 핵심은 두 개의 서로 linearly independent한 해를 구하기만 하면 두 개의


general constant를 포함하는 일반해, 즉 모든 해를 구할 수 있다는 것이다. 그러면
어떻게 두개의 해를 구할 것인가? 계수 a, b가 상수일 경우에는

y = eλ x

꼴의 해를 구할 수가 있다. 해당하는 λ 를 찾으려면 eλ x 를 (A.2)에 대입한다. Expo-


nential 함수의 성질인
(eλ x )′ = λ eλ x (A.3)
를 사용하면 다음을 얻는다;

λ 2 eλ x + aλ eλ x + beλ x = 0.

여기서 eλ x 는 0이 아니므로 소거하면 λ 의 2차식을 얻는다.

λ 2 + aλ + b = 0. (A.4)

이 매우 중요한 식은 characteristic equation이라고 불리고 그 해는 다음과 같다.


√ √
−a + a2 − 4b −a − a2 − 4b
λ1 = , λ2 = .
2 2
판별식 a2 − 4b의 부호에 따라 해의 성격이 나뉜다.

Remark A.1 (Exponential Function). Characteristic equation (A.4)을 얻는 과정에


서 사용한 것은 exponential function eλ x 의 성질 (A.3)를 사용하였다. 이 성질이
exponential function의 본질이고 우리에게 필요한 것이다.

Case 1. a2 − 4b > 0

판별식이 양의 값을 가지므로 characteristic equation은 두개의 실근 λ1 , λ2 ∈ R를


가진다. 따라서 일반해는 다음과 같다.

y = C1 eλ1 x +C2 eλ2 x . (A.5)

Problem A.2. characteristic equation의 두개의 실근 λ1 , λ2 의 부호에 따른 (A.5)에


주어진 해의 asymptotic behavior, 즉 x → ∞ 일 때의 해의 행동을 설명 하시오.
A.1 Second order homogeneous linear equation 197

Solution A.2 λ1 , λ2 중 하나만 양수이어도 변수 x가 무한대로 커짐에 따라 해도


무한대로 발산한다. 둘 다 음수 일 경우는 해는 0으로 수렴한다. 둘 중 하나는 0
이면 정지 상태로 수렴하거나 정지 상태이다. (만약 변수 x가 시간을 의미하고 y
가 행성과 태양사이의 거리를 의미 한다면 위의 해는 행성의 궤도를 설명하지는
못한다.) ⊔ ⊓

Case 2. a2 − 4b = 0

판별식이 0이면 characteristic equation은 하나의 실근만을 가지며 그 근은


a
λ =−
2

이다. 이 해를 중근이라고 부른다. 일단 y1 = eλ x 은 해가 된다. 이제 해를 하나 더


찾아야 한다. 두 번째 해는 다음과 같다;

y2 = xy1 .

λ 가 중근이 아닌 경우에는 xy1 이 해가 되지 않지만 중근인 경우에는 해가 된다.


다음과 같이 확인할 수 있다. xy1 을 식 (A.2)에 대입하면

(xy1 )′′ + a(xy1 )′ + bxy1 = xy′′1 + axy′1 + bxy1 + x′′ y1 + 2x′ y′1 + ax′ y1
= 2λ y1 + ay1 = 0.

즉, xy1 는 해이다. 따라서 일반해는 다음과 같다.

y = C1 eλ x +C2 xeλ x . (A.6)

Problem A.3. characteristic equation의 중근 λ 의 부호에 따른 (A.6)에 주어진 해


의 asymptotic behavior, 즉 x → ∞에 따른 해의 행동을 설명 하시오.

Solution A.3 중근 λ 가 양수이면 변수 x가 무한대로 커질때 해도 무한대로 발산


한다. 중근이 음수 일 경우는 해는 0으로 수렴한다. 중근이 0이면 해는 직선이다.
(만약 변수 x가 시간을 의미하고 y가 행성과 태양사이의 거리를 의미 한다면 위의
해는 행성의 궤도를 설명하지 못한다.) ⊔ ⊓

Case 3. a2 − 4b < 0

판별식이 음수이면 characteristic equation은 다음과 같은 두 개의 복소수 해를 가


진다.
λ1 = α + β i, λ2 = α − β i.
√ 2
a |a −4b|
여기서 α = − 이고 β = 2 이다. 두 개의 해는 다음과 같다
2

y1 = e(α+β i)x , y2 = e(α−β i)x .


198 A Second Order Differential Equations

따라서 우리가 원하는 일반해는 다음과 같다

y = C1 e(α+β i)x +C2 e(α−β i)x .

복소수를 power로 가지는 exponential 함수의 정의를 살펴 보자. 일단 허수 부분


만을 power로 가지는 경우는 다음과 같다.
(
eβ ix = cos β x + i sin β x,
(A.7)
e−β ix = cos(−β x) + i sin(−β x) = cos β x − i sin β x.

실수 부분도 가지고 있는 경우에는 다음과 같이 정의 한다.

eα+β ix = eα eβ ix = eα (cos β x + i sin β x).

Question A.1. (A.7)의 우변과 같은 함수를 eβ ix 라고 부른다고 exponential 함수가


되나? exponential 함수라는 것은 도대체 무엇인가?

(A.7)의 우변으로 정의한 함수를 exponential 함수라고 부르기 위해서는 expo-


nential 함수 고유의 성질을 만족해야 한다. 무엇인가? characteristic equation을
얻을 때 필요했던 성질인 (A.3)을 만족하는 것이 중요하다.

Problem A.4. 실수 β ∈ R에 대해 (A.7)으로 정의한 함수 eβ ix 가 exponential 함수


고유 성질인 (A.3)를 만족함을 보이시오.

Solution A.4 (A.7)의 정의가 의미를 가지는지를 확인하려면 exponential 함수


특유의 성질을 만족해야 한다. 실제 계산하면 확인할 수 있다, i.e.,

(eβ ix )′ = (cos β x + i sin β x)′ = −β sin β x + iβ cos β x


= β i cos β x + i2 β sin β x = β i(cos β x + i sin β x) = β ieβ ix .

두 번째 경우인 (e−β ix )′ = −β ie−β ix 도 비슷하게 할 수 있지만 할 필요는 없다.


새로운 정의가 아니라 sin 함수가 odd function이라는 것 때문에 자연스럽게 만들
어지는 관계이다. ⊔ ⊓

따라서 위의 두 해는 다음과 같이 쓰여진다.

y1 = e(α+β i)x = eαx eβ ix = eαx (cos β x + i sin β x),

y2 = e(α−β i)x = eαx e−β ix = eαx (cos β x − i sin β x),


위의 두 해를 쓰는 것이 불편한 점이 있는데 복소수 함수라는 것이다. 실수 함수로
제한 해서 사용할 수도 있다. 두 해의 선형 조합도 해가 되기 때문에

eαx cos β x = (y1 + y2 )/2 와 eαx sin β x = (y1 − y2 )/2i

도 서로 linearly independent한 해가 된다. 이 두 개의 해를 사용해도 된다, 즉

y1 = eαx cos β x, y2 = eαx sin β x.


A.2 Second order inhomogeneous linear equation 199

이 두 해를 이용해서 실수 값을 가지는 일반해를 다음과 같이 만들 수 있다;

y = C1 eαx cos β x +C2 eαx sin β x. (A.8)

Problem A.5. characteristic equation의 복소근 λ1,2 = α ± β i의 실수부 α의 부호


에 따른 (A.8)에 주어진 해의 asymptotic behavior, 즉 x → ∞일 때의 해의 행동을
설명 하시오.

Solution A.5 만약 실수 α가 양수이면 변수 x가 무한대로 커짐에 따라 해도 무한


대로 발산한다. α가 음수 일 경우는 해는 0으로 수렴한다. 실수부가 0이면 해는
주기 함수이다. (만약 변수 x가 시간을 의미하고 y가 행성과 태양사이의 거리를
의미 한다면 복수근의 실수부가 α = 0일때 위의 해는 타원 위에 있다. 따라서
행성의 궤도를 설명할 수 있는 경우는 α = 0인 경우 즉, a = 0인 경우이다.) ⊔

A.2 Second order inhomogeneous linear equation

Inhomogeneous problem (A.1)의 모든 가능한 해를 찾기 위해서는 일단 Q = 0 경


우인 homogeneous problem의 두 개의 해 y1 과 y2 을 먼저 찾아야 한다. 앞 절에서
한 작업이 이것이다. 이제는 Q(x)를 포함한 inhomogeneous problem (A.1)의 해를
하나 찾아야 한다. 이 해를 특수해라고 하고 y p 라고 표기한다. 그러면 (A.1) 모든
해는 다음으로 주어진다.
y = C1 y1 +C2 y2 + y p . (A.9)

Problem A.6. y p 가 (A.1)을 만족하고 y1 , y2 가 homogeneous problem의 linearly in-


dependent한 해이면 모든 상수 C1 ,C2 에 대해서 (A.9)에 주어진 y는 (A.1)의 해가
됨을 보이시오.

Solution A.6 선형 문제의 경우 선형 연산자를 도입해서 설명하면 편하다. L (y) =


y′′ + ay′ + by로 정의하면 (A.1)을 단순하게 L (y) = Q로 적을 수 있어서 편리하다.
이 문제의 답도 간단하게 적을 수 있다.

L (y) = L (C1 y1 +C2 y2 + y p ) = C1 L (y1 ) +C2 L (y2 ) + L (y p ) = L (y p ) = Q.

따라서 y = C1 y1 +C2 y2 + y p 는 (A.1)의 해이다. ⊔


특수해를 찾는 기법은 Q와 y1 , y2 에 따라 달라진다. 그런데 계수 a, b가 상수이고


Q도 상수인 경우에는 상수함수 y p = Q/b가 특수해가 된다는 것을 쉽게 확인 할
수 있다. 즉,

y′′p + ay′p + by p = (Q/b)′′ + a(Q/b)′ + b(Q/b) = Q.

따라서
y = C1 y1 +C2 y2 + Q/b
는 (A.1)의 일반해이다.
200 A Second Order Differential Equations

A.3 Equation for two-body problem

두 천체, 가령 태양과 지구의 궤적을 구하기 위해 우리가 풀어야 하는 미분 방정


식은 다음과 같다;
u′′ + u = K. (A.10)
이 방정식을 유도하는 것이 Lecture 11의 주요 목표이다. 우측의 K는 상수로
(m1 + m2 )G
K= 로 주어진다. m1 과 m2 는 두 천체의 질량이고, G는 중력상수, L은
L2
angular momentum으로 이들은 다 상수이다. x1 와 x2 를 두 천체의 위치라고 하면
u는 두 천체 사이의 거리 r = ∥x1 − x2 ∥의 역수이다. 그러나 위의 미분방정식은
시간변수 t에 대한 미분이 아니라 극좌표의 각도 변수 θ 에 대한 미분이다.
위 문제 (A.10)의 일반 해는

u = C1 cos θ +C2 sin θ + K

이다. 삼각함수 부분의 계수 C1 ,C2 는 초기 조건에 의해 주어진다. 이 둘의 제곱의


합이 1이 되도록 다시 쓰면 다음과 같다.
 C1 C2 K q
u= q cos θ + q sin θ + q C12 +C22 .
2 2
C1 +C2 2 2
C1 +C2 2 2
C1 +C2

그러면 phase offset 이라고 불리는 다음을 만족하는 각도 θ0 가 존재한다. 즉,


C1 C2
cos(θ0 ) = q , sin(θ0 ) = q .
C12 +C22 C12 +C22

따라서 위 식은 다음과 같이 쓰인다;


 K q
u = cos(θ0 ) cos θ + sin(θ0 ) sin θ + q C12 +C22 .
2 2
C1 +C2

이제 cosine의 차의 법칙을 이용해서 해 u를 다시 쓰면


 K q
u = cos(θ − θ0 ) + q C12 +C22
2 2
C1 +C2

이 된다. 다시 간단히 하면
q
C12 +C22 (m1 + m2 )G
u = (1 + e cos(θ − θ0 ))K, e= ,K=
K L2
을 얻는다. 여기서 e는 타원의 이심율 eccentricity이다. (사람들은 이심률을 지수
e와 동일한 문자를 쓴다. 그것은 단지 전통일 뿐이며 문맥을 통해 구별해야 한다.)
따라서 두 천체 간의 거리 r = 1u 는 다음과 같이 주어진다:
A.3 Equation for two-body problem 201

L2
r= .
(1 + e cos(θ − θ0 ))(m1 + m2 )G
Appendix B
Elliptical orbits

B.1 Eccentricity and focus of an ellipse

중심 center가 원점이고 장축과 단축이 x축과 y축인 타원의 식은 다음과 같다:

x 2 y2
+ = 1.
a2 b2
그래프의 개요는 그림에 주어졌다. 만약 a = b이면 위의 타원은 원이 된다. 편의상

a > b인 경우를 고려한다. 그러면 x축이 장축이 된다. 타원의 focus (촛점)는 2개로
장축에 놓여있다. center와 focus 거리는
p
c = a2 − b2

이다. 따라서 촛점은 (±c, 0)이다. 타원이 원에서 부터 얼마나 벗어나 있나를 나타
내는 eccentricity 이심율은 다음과 같이 주어진다:
r
c a2 − b2
e= = .
a a2

203
204 B Elliptical orbits

이심율이 e = 0이면 a = b이 이 경우는 원이다. 이심율이 e = 1이면 b = 0이고 더


이상 타원이 아니다. 따라서 타원의 이심율은 0과 1사이에 있다.

Problem B.1. 점 P(x, y)가 타원 위에 있으면 이 점과 두 촛점 사이의 거리의 합은


항상 일정함을 보이시오.

Solution B.1 ⊔

중심이 원점이고 촛점이 x축에 있는 hyperbola 쌍곡선의 식은 다음과 같다:

x 2 y2
− = 1.
a2 b2
이와 같이 y2 항의 계수가 음수인 경우에는 두 개의 촛점이 x축 위에 있다. 그래프
의 개요는 그림을 참조하라. 쌍곡선의 focus (촛점)과 center와의 거리는
p
c = a2 + b2

이다. 따라서 촛점은 (±c, 0)이다. 쌍곡선의 eccentricity 이심율도 비슷하게 정의


한다: r
c a2 + b2
e= = .
a a2
이심율은 e > 1이다.

Problem B.2. 점 P(x, y)가 쌍곡선 위에 있으면 이 점과 두 촛점 사이의 거리의


차는 항상 일정함을 보이시오.

Solution B.2 ⊔

B.2 Directices and ellipses

Consider the following figure. The line x = k is called the directrix of the trajectory

of the point P(x, y) we are going to obtain in this section. The length of the line OP
B.2 Directices and ellipses 205
p
is denoted by r and given by r = x2 + y2 . The length of PD is k − x. For a number
e, we find a curve made by the point P(x, y) that satisfies

r = ePD. (B.1)

Then, it satisfies
p
x2 + y2 = e(k − x) ⇒ x2 + y2 = e2 (k2 − 2kx + x2 ).

It is written as
(1 − e2 )x2 + 2ke2 x + y2 = e2 k2 . (B.2)
Depending on the value e, we obtain three kinds of curves. We will soon see that e
is the eccentricity of these curves, which is why we denote it e. We split the problem
into three cases.

Problem B.3 (Case 1. e = 1). Show that if e = 1, the particle trajectory satisfied by
(B.2) is a parabola.

Solution B.3 If e = 1, (B.2) is written as


k 1
x= − y2 .
2 2k
This is a parabola. We know that the eccentricity of a parabola is 1. ⊔

Next, we assume e ̸= 1. Then, (B.2) is written as


 ke2  y2 e2 k2 k 2 e4
x+ + = + .
1 − e2 1 − e2 1 − e2 (1 − e2 )2

Simplify the right side and obtain


 ke2  y2 e2 k 2
x+ + = . (B.3)
1 − e2 1 − e2 (1 − e2 )2
206 B Elliptical orbits

Problem B.4 (Case 2. 0 < e < 1). Show that if 0 < e < 1, the particle trajectory
satisfied by (B.2) is an ellipse, the origin is one of the two focuses, and e is the
eccentricity of the ellipse.

Solution B.4 Suppose that 0 < e < 1. Then, since 1 − e2 > 0, we may set

e2 k2 e2 k 2 ke2
a2 = , b2 = a2 (1 − e2 ) = , c= > 0. (B.4)
(1 − e2 )2 (1 − e2 ) 1 − e2

Divide (B.3) by a2 and obtain

(x + c)2 y2
+ 2 = 1,
a2 b
which is an ellipse. The center of the ellipse is (−c, 0).
q
2 2
The eccentricity of the ellipse is defined as a a−b 2 . We see that

a2 − b2 a2 − a2 (1 − e2 ) 1 − (1 − e2 )
= = = e2 . (B.5)
a2 a2 1
Hence, the eccentricity
√ of the ellipse is e. The distance from the center of an ellipse
to a focus is a2 − b2 . Hence, using (B.5), we obtain

k 2 e4
a2 − b2 = a2 − a2 (1 − e2 ) = e2 a2 = .
(1 − e2 )2

Therefore, c in (B.4) is the distance. Hence, the origin is one of the two focuses of
the ellipse. ⊔

Problem B.5 (Case 3. e > 1). Show that if e > 1, the particle trajectory satisfied by
(B.2) is a branch of a hyperbola, the origin is one of the two focuses, and e is the
eccentricity of the ellipse.

Solution B.5 Suppose that e > 1. Then, since 1 − e2 < 0, we cannot take (B.4). We
take
e2 k2 e2 k 2 ke2
a2 = , b2 = a2 (e2 − 1) = , c= < 0.
(1 − e2 )2 (1 − e2 ) 1 − e2

Divide (B.3) by a2 and obtain

(x + c)2 y2 ke2
− 2 = 1, c= .
a2 b 1 − e2
This is a hyperbola. e is still the eccentricity of the hyperbola, and −c is the distance
between the origin and a focus. ⊔ ⊓
B.3 Polar equations of an ellipse 207

B.3 Polar equations of an ellipse

타원 궤도를 극좌표를 써서 나타내는 방법중 간단한 방법이 (B.1)이다. 이 경우


PD는 k − r cos θ 이므로 이식을 사용하면

r = e(k − r cos θ )

를 얻는다. 이를 r에 대해 정리하면 다음과 같다:


ek
r= .
1 + e cos θ
이 식은 0 < e < 1인 경우 타원의 이심율이 e인 타원이다. 그러나 e ≥ 1인 경우에
는 포물선과 쌍곡선을 나타낸다. directrix k는 이심률 e에 의존한다. 각속도 L과
이심율이 주어진 경우에는 다음과 같다:

L2
k= .
eG(m1 + m2 )

총 에너지 Etotal 와 각속도 L이 주어진 경우에는 이심율은 (12.6)에 의해 주어진다


는 것도 기억하자. 즉, s
2Etotal L2
e = 1+ .
m1 G2 m22
Appendix C
Numerical experiments for Taylor series

이 마지막 강의에서는 Taylor series가 실제 함수들을 어떻게 근사하는지 간단한


수치 코딩을 통해 관찰한다. 그 외에도 몇 가지 근사가법을 통한 비교도 한다.

209
Index

absolute convergence, 174 eccentricity of hyperbola, 204


acceleration in polar coordinates, 68 escape energy, 98
alternating sequence, 182 escape speed, 98
alternating series, 182
antiderivative, 35 focus of ellipse, 69, 203
area function, 37 focus of hyperbola, 204
function, 43
big-oh, 133 Fundamental Theorem of Algebra, 143
bijection, 43 fundamental theorem of calculus, 40
binomial expansion, 191
gauge, 39
Cauchy’s Fundamental Theorem of Calculus, Gaussian quadrature, 157
40 Gaussian-Legendre quadrature, 157
Cauchy’s Mean Value Theorem, 24 geometric sequence, 167
center of ellipse, 203 geometric series, 167
center of mass, 91 gravity constant, 81
center of mass frame, 91
hyperbola, 204
chain rule, 27
closed interval, 3 implicit differentiation, 32
co-domain, 43 increasing sequence, 165
comparison test, 173 infimum, 165
conditional convergence, 183, 185 injection, 43
continuity, 4, 11 inner product, 61
converge, 4 instantaneous growth rate, 20
convergence of sequence, 162 integrability, 39
convergence order, 155 integral, 39
cross product, 60 integral test, 171
integrating factor, 77
decreasing sequenc, 165 integration by parts, 137
derivative, 20 Intermediate Value Theorem, 24
differential equation, 73 inverse function, 43
directrix, 69, 204 irreducible polynomial, 143
distance unit, 56
domain, 43 Kepler problem, 92
dot product, 61 Kepler’s laws, 89

eccentricity of ellipse, 69, 203 L’Hopital’s rule, 129, 130

211
212 Index

law of action-reaction, 81 range, 43


law of force, 81 ratio test, 175
law of inertia, 81 rational function, 142
left continuity, 14 rearrangement, 184
left limit, 4, 13 remainder term, 189
Legendre polynomial, 157 Riemann sum, 39
Leibnitz notation, 21 right continuity, 14
limit, 4, 11 right hand rule, 56
limit comparison, 173 right limit, 4, 14
limit infimum, 165 root test, 176
limit of sequence, 162 rules of continuity, 7
limit supremum, 164
linearization, 116 sandwich theorem, 163
little-oh, 133 separation of variables, 76
local property, 116 sequence, 161
lower bound, 165 series, 166
slope field, 74
Maclaurin series, 191 supremum, 164
maximum, 164 surjection, 43
mean growth rate, 20
Mean Growth Rate Theorem, 25 Taylor polynomial, 188
Mean Value Theorem, 24 Taylor series, 188
minimum, 164 tensor product, 63
monotonicity, 165 trapezoid rule, 154, 157
two-body problem, 90
natural logarithm, 47
negatively oriented system, 56
upper bound, 164
one-to-one function, 43
onto function, 43 극 좌표를 이용한 위치,속도,가속도, 68
open interval, 4
outer product, 63 뉴턴의 제2운동법칙, 26
등비급수, 167
partial fraction, 144 미분, 20
partition, 38
positively orientated system, 56 순간 증가율, 20
power function, 6 연쇄법칙, 27
power series, 167 중력상수, 81
projection, 57
평균 증가율, 20
radius of convergence, 181 평균 증가율 정리, 25

You might also like