You are on page 1of 7

‘천재들의 주사위’를 읽고

나는 비교적 이해하기 쉬운 통계 입문서인 ‘천재들의 주사위’를 읽고 나니

전체 통계사에 대한 기본적인 이해가 생긴 것 같다. 이 책이 따뜻한 오후부터

여러 주인과 아내가 한 숙녀의 우유에 차를 넣는 게와 차에 우유를 넣는 게가

맛이 다르다는 견해를 통해 우리를 통계의 세계로 인도했다.

이 예는 책 전체 겉보기에 단순해 보이고 어떤 각도에서는 매우 중요하지

않은 오락 실험을 도입부로 취하지 않고 책 전체에서 단서로 사용한다는 것은

매우 흥미롭다. 1 장에서 이 여성의 결론이 맞는지 순전히 검증하는 것부터

시작해 이 여성이 분별력이 없을 때 추측만으로는 올바른 판단을 할 수 없도록

실험을 어떻게 설계하는 지 그리고 이 여성이 분별력을 가질 때 구분하기

실수하는 확률을 어느 정도로 허용할 수 있는지 등 문제를 점점 도입한다. 예를

들어, 10 번의 반복된 실험 후에 이 여성이 9 번 맞는지 구별할 수 있는 능력이

있다고 믿는 것은 가치가 있는 지를 단톡 했다. 저자가 새로운 개념을 소개할

때마다 배경 소개와 관련 일화가 어느 정도로 있을 것이다. 많은 경우 이러한


공식이 어떻게 파생되는지, 이러한 변수를 찾고 계산하는 방법을 이해하지

못한지만 기본적으로 이러한 공식과 변수들이 설정하는 이유와 어디에

사용하는지 잘 알 수 있다.

비록 이 책을 읽는 것이 통계적 능력을 향상시키고자 하는 데에는 전혀

영향을 미치지 않는다. 그러나 각 공식이 어떻게 나오는지, 무엇에 사용되는지,

왜 필요한지, 수학적인 계산이 아닌 더 최적으로 사용할 수 있는지 여부를

이해하는 방법에 대해 얼마나 많은 사람들이 생각할 것인지 모르겠다. 하지만

통계적 사고를 위해서는 이해하고 생각해야 한다고 생각한다. '실험 계획'의

저자 Fisher 가 이 여성의 결론을 검증하기 위해 보다 최적화된 실험 계획을

설계하는 방법에 대해 고민한 것처럼 이 실험의 결과는 성공 여부가 부차적인

관심사가 됐다. 만약 학자들이 이 여인의 결론을 확인하기만 하면 이 모든 것이

정말 단순한 오락에 불과하다고 생각한다.

그러나 저자가 비수학적 언어를 사용하여 통계 혁명이 가져온 기본 철학

개념의 주요 변화를 설명하고 일반 개념 도입 수준을 넘어 독자들에게 훌륭한


통계 연구 작업이 수행되는 방법을 구체적으로 보여 주려는 경우 이러한

목적을 위해 이 책은 요구 사항을 충족하지 않는다. 이은 많은 특정 작업의

기본 사상을 명확히 하지 않으며, 또한 통계 개념의 전체의 역량에 대한 독자의

이해 깊이에도 영향을 미친다.

이 책의 가장 큰 장점은 생생함이라고 생각하며, 우리가 평소 접하는 통계적

방법론에 대한 흥미로운 이야기를 재미 있게 기록하고 있다. 장점은 뻔한데

앞으로 student' T-test 을 사용할 때 두 거물 Pearson 과 Fisher 사이에 끼어

있는 Gosset 이 어색한 위치에 있다는 기억이 저절로 들 것이다. 유의성

검정에 대해서도 Fisher 의 관점, 즉 무작위 실험 설계가 없으면 실험 결과에서

아무것도 증명할 수 없다는 관점도 기억하겠다.

이 책의 내용은 매우 흥미롭고 저자는 일반인에게 더 쉽게 설명할 수 있는

개념과 사상을 훌륭하게 수행했다. 예를 들어, 책 전반부의 내용은 K. Pearson

에서 시작된 통계 혁명부터 비할 데 없는 천재 R.A. Fisher 의 눈부신 작품과

놀라운 천재적 통찰력, 그의 상대 부드러운 천재 J. Neyman, Bayes 에 대한


통찰력 있는 토론까지 이 부분의 역사와 현재 상황에 대한 저자의 심층적인

이해를 보여주는 완전한 진술을 했다. 이 부분에서는 현대 통계의 많은 기본

개념과 개발 프레임 워크를 결정했다. 예를 들어, Fisher 의 실험 설계 원칙,

유의성 검정 및 가설 검정의 사상, Kolmogorov 의 확률 이론 공리 시스템,

분산 분석, 시계열 분석 및 랜덤 프로세스 이론의 부상, 중심 극한 정리에 대한

관련 작업이다. 저자는 이러한 방법의 기본 사상과 세부적인 작업을 소개하기

위해 많은 시간을 할애하여 나에게 자신의 무지와 통계 방법의 힘을 몇 번이고

다시 느끼게 만든다.

책의 후반부는 전반부에서 확립된 이론들을 심층적으로 더 응용하고

연구하는 것으로, 새로운 사상의 발전으로 극복해야 할 많은 문제점들이

발견되었다. 예를 들어 Fisher 의 무작위 실험 설계가 불가능한 영역에서 실험

설계 및 통계 분석을 수행하는 방법은 무엇입니까? Deming 의 가설검증 개념

전체에 대한 공격은 확률 모델에 기반한 의사결정이 현실과 맞지 않는다는

심각한 문제를 내포하고 있다. 그리고 결함 데이터가 직접 제거됩니까? 그렇지


않다면 어떻게 분석을 수행해야 합니까? 이러한 문제는 일상 생활에서 우리도

접하고 생각하기 때문에 몇 번이고 충격을 주지만, 이를 분석하기 위한 통계

모델을 구축하는 방법은 저에게 정말 영감을 준다. 말로 설명하기 어려운 고등

이론의 경우 저자는 이론 창시자 자신의 이야기를 하고 이론만 설명하는

경향이 있는데, 이는 혼란스러울 뿐이고 공식에 대한 설명도 너무 적다. 그러나

20 세기 후반의 이러한 이론적 발전은 실제로 이론의 내부 문의에 많은 영향을

미쳤을 수 있으며 지금은 그것들을 명확하고 균일하게 요약하기가 어렵다.

이 책은 통계적 개념을 실제 문제에 적용한 많은 예를 포함하거나 실제

문제를 다루기 위해 통계 모델을 사용하는 데 문의를 야기하는 개념적 문제를

포함한다. 예를 들어, 통계적 관련성에 대한 이해에서 가장 유명한 예는 흡연과

폐암의 관계에 대한 통계적 분석에 대한 Fisher 의 관점이다. 그는 흡연과

폐암에 대한 통계적 분석이 불가능하다고 생각하는데, 분석적 관점에서 나는

그의 놀라운 재능에 동의한다. 통계적 상관성은 늘 비판을 받아 왔다.

한편으로는 저자가 언급한 통계적 방법을 사용하는 대부분의 사람들이 통계적


방법의 개념을 제대로 이해하지 못하고 있으며, 오용이나 원용된 경우가

일반적이다. 다른 한편으로 통계적 상관관계의 결론과 인과관계의 결론

사이에는 문제가 있다. 충분하지도 않고 필요하지도 않은 통계적 상관관계는

무엇을 의미합니까? 왜 사람들은 여전히 인과관계를 추구해야 합니까?

통계모형의 본질에 대한 생각과 관련하여 가장 중요한 두 가지 문제가

있다고 생각한다. 하나는 그것이 거대한 학문을 형성할 수 있을 정도로 중요한

이유이며, 이 학문의 위상은 어떠한가? 이 질문에 대한 나의 이해는 다물 체

모델이 20 세기부터 널리 연구되어 왔고 통계적 방법이 자연스럽게 필요하기

때문이다. 과목으로서는 필요하지 않고, 일종의 수학적 모델일 뿐이며, 그 적용

범위가 넓기 때문에 인기가 많다. 이 질문은 아주 간단하고 사회학적인

질문인데 어떤 내부자들은 자신의 일의 의미를 높이고 싶어하는데 많은

외부자들은 그것을 이해하지 못하고 있다. 다른 하나는 통계적 상관관계와

인과관계의 관계이다. 이 책에 나오는 많은 통계학자들을 포함한 전통적인

이해도 이 견해를 유지하고 있다. 즉, 통계적 상관관계를 얻은 후에는


인과관계에 대한 추가 분석이 필요하며 어떤 요인이 통계적 상관관계를

유발하는지에 대한 분석이 필요하다. 이 견해를 고수한다면 통계혁명을 제대로

이해했다고 보기 어렵다.

책의 마지막 장에서 저자는 통계와 확률에 대한 어려운 철학적 질문을

제기했는데 통계는 확률 이론과 분리될 수 있는가? 실생활에서 확률의 의미는

무엇입니까? 통계이론의 내적 일관성 등 문제를 말했다. 저자는 현대 세계관의

기본 가정 중 500 년 후에는 어떤 것이 우스꽝스러워 보일 수 있냐고 물어봤다.

비록 우리의 생각은 곧 쓸모없게 될 것이지만, 우리는 후세들에 의해 이해되지

않고 웃게 될 것이지만 인생은 생각에 있다.

You might also like