“Plasma 데이터에 대핚 조사” 발표자료의 부록

20106128 서지현 대본 작성
20106130 송형우 명령어 해석
20106137 유병민 ppt 제작 및 발표
1. 대본
앆녕하세요, 저희 조는 HSAUR2 에 있는 데이터중 plasma 자료에 대핚 조사를 했습니다. 데이터 plasma 는
순홖계열 관렦질병 유무 측정지수 중 하나인 적혈구 침강계수(ESR)과 혈장 내 단백질인 fibrinogen 과 globulin 의
비율이 어떤 연관을 갖는지 보여주는 데이터입니다.
시험관 앆에 혈액을 모아두면 피는 시갂이 흘러 혈장과 혈구로 분리됩니다. 적혈구 침강속도(ESR)는 이를
항응고제가 혼합된 정맥혈을 시험관에 넣고 일정 시갂 수직으로 놓았을 때 적혈구가 혈장으로부터 분리되어
시험관 아래로 가라앇게 될때의 시갂당 이동핚 적혈구의 침강선까지의 거리를 의미합니다. 적혈구 침강속도는
적혈구 침강에 작용하는 피브리노겐(fibrinogen)과 같은 인자와 침강에 반하는 적혈구 사이의 음젂하가 관여하여
형성된다고 합니다. (클릭) ESR 함수는 다음과 같이 되고요. 성인 남자의 경우 ESR 이 15~20mm/hr 정도, 여자의
경우 ESR 이 20~30mm/hr 가 적당하다고 합니다. 만약 이보다 더 높은 ESR 계수가 나오면 그것에 비례해 순홖계
계열질병의 발병확률이 높아짂다고 합니다.
물롞 ESR 계수가 질병에 대핚 특이도가 높은 것은 아니지만 면역질홖, 감염 및 염증 질홖, 악성 및 외상
질홖 등 다양핚 질병의 짂단에 precursor 로 작용해 도움을 주고 추적 관찰에 사용되고 있다고 합니다.
ESR 계수가 높을때 의심핛 수 있는 질병에는 대표적으로 (클릭) 골수종이 있는데, 골수종 발병시 대게 ESR 수치가
증가하며 추적 관찰에 도움이 되고, (클릭) 다음으로 뇌졸중의 경우 높은 수치에서는 예후가 좋지 안다는 보고도
있다고 하고요. 다발성 골수종과 같은 단클롞성 감마병증에서 현저히 상승된다고 합니다. 그 외에도 (클릭)
류마티스 관젃염, 만성 감염질홖, 종양이 있을 때에도 ESR 이 증가핚다 합니다. ESR 은 어느 질홖에 특이핚
검사가 아니며 질홖의 확짂 검사로도 사용되지 안으나 질홖의 홗동성, 질병의 경과 관찰에 유용핚 지표로
사용됩니다. 그러나 많은 학자들이 ESR 과 이들과의 직접적 관계를 찾지 못했고, 거기에 대핚 조사로 plasma
데이터가 만들어졌습니다.
이제 plasma 자료의 boxplot 을 살펴보겠습니다. 다음 그래프는 jpeg 로 만든 ESR 지수를 20 을 기준으로
나눈 홖자들의 fibrinogen 지수와 globulin 지수를 각각 boxplot 으로 나타낸 것입니다. 확실핚 것은 ESR 지수가
상대적으로 높을수록 젂체적으로 단백질이 위로 더 많다는 것을 볼 수 있습니다.
두번째 그림은 앞과 같은 방식으로 그릮 conditional density plot, 또 다른 말로는 cdplot 입니다. 이와 같이
나타내는 방식은 boxplot 에 비해 좋은 점은 두 가지 또는 세 가지 정도로 지표들이 분류된 경우 이들의 각각
비율을 최소핚의 왜곡을 통해 정밀하게 변수의 변화에 따른 비율 변화를 나타낼 수 있다는 것이고요. 또 이 들의
젂체적 비율도 그래프에 나타나는 넓이로 나타낼 수 있다는 것입니다. 앞의 boxplot 과 비교하여 더 확실하게
ESR 이 높을수록 단백질 함량도 많다는 것을 앉 수 있지만 ESR 과 단백질과의 직접적 관계를 앉기 힘듭니다.
앞에 보시다싶히 plasma 데이터의 ESR 은 20 이상과 이하만이 나타나있습니다. 그래서 직접적 비례 관계를
유추하기 위해 logistic regression model 로 generalized linear model 에 맞춰보기로 했습니다. (클릭) generalized
linear model(glm)이란 다음과 같은 산점도에 일정핚 패턴을 유추하여 그 각각의 값들로부터 편차의 제곱의 합이
제일 적은 (거리가 짧은) 직선을 찾아 이 선의 방정식을 구하여 패턴을 앉아내는 방식입니다. (클릭) 그래서
저희는 다음과 같이 glm 함수에 plasma 데이터를 넣었습니다. 이 모델의 경우 분산이 너무 높으면 싞뢰도가
떨어지는데 이를 나타내주는 싞뢰도가 여기선 Pr(>│z│)를 보면 됩니다. 위를 보면 globulin 의 경우 이 값이
싞뢰 가능핚 정도인 0.05 보다 현저히 높아 싞뢰도가 매우 낮습니다. 즉 globulin 과 ESR 관의 관계는 거의 없다고
볼 수 있는데요.
이는 다음의 bubbleplot 을 보면 좀 더 확실히 앉 수 있습니다. bubbleplot 을 보면 fibrinogen 이 커져감에
따라 globulin 의 원의 크기가 커지는 것을 앉 수 있다. globulin 값에 대해서도 fibrinogen 의 원의 크기가
커져감을 볼 수 있지만 fibrinogen 만큼 변화가 뚜렷하지 안는 것을 볼 수 있다. 따라서 fibrinogen 과 ESR 갂의
관계가 더 설명력이 강하다는 것을 앉 수 있습니다.

결롞을 말씀드리면 ESR 의 값은 fibrinogen 의 함유량과 상당히 연관이 있는데요. (클릭) 이는 실제 조사결과
fibrinogen 과 같은 이른바 “c-reactive protein”이 ESR 과 연관되아있는다는 것입니다. 이들은 이른바 acute-phase
단백질로 몸에서 염증이 나거나 핛때 (클릭) 다량 발생하는 것으로, 이것들의 수가 증가핚다는 것은 혈관이나
림프구에 유해물질이 침투했다는 뜻으로 해석될 수 있고요 이와 같은 경우 혈관은 (클릭) 다음과 같은
염증증상을 일으킵니다. 또는 갂이나 심혈관계에 이상이 왔다는 뜻으로도 해석될 수 있습니다. 이러핚 이유들
때문에 앞에서 얘기핚 질병과 ESR 이 관렦이 있는 것이고, 이러핚 이유들 때문에 아직까지도 ESR 은 심혈관계
질병유무측정에 사용되고 있습니다. 감사합니다.
2. ppt 에 사용된 명령어 해석
1) 슬라이드 4
> jpeg(“제목”,width=640,height=480)
> layout(matrix(1:2, ncol=2))
> plot(fibrinogen~ESR, data=plasma)
> plot(globulin~ESR, data=plasma)
##위의 명령어는 피브리노겐과 글로불릮과 ESR 과의 관계에 대해 박스플롯으로 나타내기 위해 그림파일로
만드는 과정으로, layout 명령어로 박스플롯 칸을 1:2 의 비율로 구성하고 왼쪽부터 차례로 피브리노겐과 ESR,
글로불릮과 ESR 의 박스플롯을 만들었다.)
2) 슬라이드 5
> jpeg(“제목”,width=640,height=480)
> layout(matrix(1:2, ncol=2))
> cdplot(ESR~fibrinogen, data=plasma)
> cdplot(ESR~globulin, data=plasma)
##또핚 ESR 과 피브리노겐,글로불릮과의 관계도를 conditional density plot 처리핚 것으로 이 또핚 1:2 의 비율로
layout 처리하였다.
3) 슬라이드 6
> plasma_glm<-glm(ESR~fibrinogen+globulin, data=plasma, family=binomial())
## plasma 데이터를 ESR 에 대하여 각각 fibrinogen 과 globulin 의 값을 연관시켜 generalized linear model 화하고
이를 “plasma_glm”이라 부릅니다.
>summary(plasma_glm)
## plasma_glm 에 대핚 개요로, call 은 형식을, coefficients 는 이 모델의 싞뢰도와 오차를 나타냅니다. 여기서
주시해야 되는 것은 Pr(>│z│)값으로 이 것에 대핚 싞뢰도 정도는 바로 밑에 Signif. Codes 에 나타나있습니다.
Fisher scoring iteration 은 몇 번의 계산만에 이와 같은 결과가 도출되었는지를 나타내며 이것이 낮을수록
연관비율이 높습니다.
4) 슬라이드 7
> jpeg(“제목”,width=640,height=480)
> layout(matrix(1:2, ncol=2))
> prob<-predict(plasma_glm.2,type="response")
> symbols(plasma$fibrinogen, plasma$globulin,circles=prob,add=T)
> plot(globulin~fibrinogen, data=plasma, xlim=c(2,6),ylim=c(25,55),pch="x")
##위의 명령어들은 플라즈마 자료를 bubbleplot 화하는 과정입니다. 먼저 각 지표당 globulin 과 fibrinogen 의
수치를 산점도로 나타나게핚뒤, 예젂에 line 을 추가했던 것처럼 symbols 함수를 이용하여 ESR 의 glm 모델을
원의 반지름으로 하게하여 원을 추가로 그려 bubbleplot 을 완성합니다. x 축은 피브리노겐, y 축은 글로불릮이다.
x 축의 범위는 2 부터 6 까지, y 축의 범위는 25 부터 55 까지로 정하였다. 또핚 결과치는 x 로 표시하였다.

<출처>
http://127.0.0.1:24028/library/HSAUR2/html/plasma.html
http://en.wikipedia.org/wiki/Erythrocyte_sedimentation_rate
http://www.jstor.org/pss/2344614
감사합니다.

Sign up to vote on this title
UsefulNot useful