Professional Documents
Culture Documents
An Analysis On Perception About Performance Indicators of The Korean Professional Baseball League
An Analysis On Perception About Performance Indicators of The Korean Professional Baseball League
Abstract
The purpose of this study was to find out what kind of perception people have about the performance indicators of
professional baseball by using the social text analysis method. In order to achieve this research purpose, the
programming language “python” was used to collect texts on the performance indicators of domestic professional
baseball that appeared on portal sites (Naver, daum, google) and SNS channels (Twitter, Facebook, Instagram). The
period was calculated as about one year from March 1, 2022 to February 28, 2023. Text mining, semantic network
analysis and concor analysis were adopted to find the main keywords with high frequency, network relationships
between co-occurring keywords and clusters between similar keywords etc. Based on these results, we found the
public opinion and perceptions on the Korean professional baseball performance index, and had a chance to suggest
insights and practical implications.
Key words: Korean professional baseball, Game stats, Saber matrix, Big data, Perception
연구방법 2. 분석절차 및 방법
구조(structure)를 살펴본다는 것이 중요한 관점이다. 계에서 첫 번째 분류로 인물, 단체, 장소, 상품을 제
콘커 분석기법은 도출된 수많은 키워드 중에서 관계 시하였는데, 본 연구에서도 한진욱 등(2015)의 연구에
성이 높은 유사한 키워드 간의 군집을 분석할 수 있 서 제시한 분류에 속하는 유사한 키워드들이 주로 나
는 보편적인 분석기법이다. 즉 추출된 키워드들에 대 타났다. 경기력 지표와 관련한 키워드들을 살펴보면,
한 매트릭스를 파악하고 피어슨 상관분석 방법론을 홈런, 안타, 타율, WAR, OPS 등이 높게 나타나고 있
활용하여 키워드간의 연결성 및 블록 관계를 분석할 다. 이는 전통적인 홈런, 안타 등의 기록뿐만 아니라
수 있다(김해원, 전채남, 2014). MLB에서 시작된 세이버매트릭스의 보편화로 인해 이
따라서 본 연구에서는 국내 프로야구 경기력 지표 와 관련한 다수의 경기력 지표가 반영된 결과를 나타
와 관련된 인터넷상의 텍스트에 대해서 키워드 간의 내고 있다. 특히, 세이버메트릭스 통계량 중에서 대체
연계성을 파악하고 추출한 텍스트의 빈도수를 분석함 선수대비승수인 WAR(wins above replacement)은 실
으로써 프로야구 경기력 지표에 대한 중요 키워드 및 제로 야구 경기 방송에서 자주 노출되어 팬에게 가장
핵심 개념을 파악하고자 주요키워드 분석을 실행하였
다. 또한, 소셜 네트워크상에 내재하여 있는 국내 프 표 2. 프로야구 경기력 지표 포털사이트 키워드(상위 50개)
로야구 경기력 지표에 대한 키워드 간의 관계성을 살
키워드 빈도수 키워드 빈도수
펴보고, 관련된 키워드들이 어떠한 군집을 형성하고
프로야구 10544 역대 897
있는지를 파악하였다. 이를 위해 Ucinet6 프로그램을
KBO 3485 타율 866
이용하여 실시하였으며, 시각화를 위해 Ucinet6 프로
홈런 3053 감독 852
그램의 넷드로(NetDraw) 기능을 활용하여 키워드 간
MLB 2442 KT 839
의 네트워크를 시각화 하였다. SSG 2006 우승 765
키움 1997 오늘 722
안타 1714 김하성 716
결과 및 논의 선수 1662 미국 712
LG 1541 MVP 688
1. 국내 프로야구 경기력 지표 분석 결과 롯데 1430 투수 675
한국프로야구 1400 NC 666
표 3. 프로야구 경기력 지표 SNS 키워드(상위 50개) 익숙한 경기력 지표 중의 하나가 되었다(Chang &
키워드 빈도수 키워드 빈도수 Zenilman, 2013). WAR은 선수의 승리기여도를 나타내
프로야구 813 한국프로야구 72 어 선수 간 직접적인 비교가 가능한 지표이기 때문에
홈런 479 JTBC방송 72 그 효용성이 높다고 할 수 있다. SNS에서 나타나는
안타 415 통산 69 키워드는 포털사이트에서 나타나는 키워드에 비해 선
KBO 339 삼성 69 수의 경기력 지표와 기록을 나타내는 순위, 역대, 랭
야구 317 MLB 66 크 등의 키워드가 높은 빈도수를 나타내고 있다. 이
선수 235 한국 65 는 SNS 채널에서 선수에 대한 현재 기록뿐만 아니라,
기록 224 영상 59 통산 기록 및 역대 기록 순위 등과 같은 이슈를 많이
타격 195 감독 58 다루고 있기 때문으로 판단된다. 홍종선, 김재영, 신
시즌 171 대표팀 57 동식(2016)은 한국프로야구 타자력 지수 제안 연구에
순위 160 부문 54
서 연봉은 현재의 타자 실력보다 지금까지 기록한 누
역대 151 이대호 53
적된 선수기록 및 경력이 더 많이 반영된다고 제시하
타율 142 키움 52
였다. 팬은 선수들의 연봉에 관심이 높기 때문에 그
투수 131 두산 52
와 연계된 선수의 누적된 역대 기록, 랭킹, 순위 등의
WAR 206 연속 51
키워드가 SNS상에서 주로 언급된 것으로 파악된다.
타자 122 팀 50
롯데 113 kbo 47
이와 같이 주요키워드 분석에서는 프로야구 경기력
롯데자이언츠 103 라인업 47 지표에 대해서 어느 구단의 선수가 얼마만큼의 기록
경기 92 응원가 47 을 나타내고 있는지에 대한 내용이 다수 나타나고 있
이정후 92 레전드 46 음을 알 수 있다.
TOP 88 NC 45
한국야구 85 사회인야구 44 2) 의미연결망 분석(semantic network analysis)
WBC 84 하이라이트 44 프로야구 경기력 지표에 대한 키워드가 어떠한 구
OPS 79 구단 42 조적 형태로 나타나고 있는지를 확인하기 위해 시맨
LG 77 FA 42 틱 네트워크 분석(sementic network analysis)을 진행
랭킹 74 최고의 42 하였다. 국내 프로야구 경기력 지표 관련 키워드에
수 수상에서는 연봉, MVP, 후보, 경쟁, 선정 등의 키 으며 더 나아가 경기력 지표가 연봉과 수상에 어떠한
워드들의 연결성이 높게 나타나고 있어 한 시즌을 치 영향을 미치는 정도까지 관심이 있음을 알 수 있다.
른 선수의 경기력 지표를 바탕으로 MVP와 같은 상을 따라서 국내 프로야구 구단에서는 선수와 구단의 기
누가 차지할 것인지, 후보자는 누구인지 에 대한 관 록을 단순히 집계하고 이를 홈페이지에 공시하는 정
심이 높게 나타났다. 셋째, 선수 계약에서는 구단명, 도에서 벗어나 데이터에 관심이 높아진 팬의 기준에
선수명, 기록, FA, 계약, 재계약 등의 키워드들이 높 부합하는 프로야구 경기력 지표의 정보성을 세분화시
은 연결성을 나타내고 있어 구단과 선수 간의 계약이 키고 팬은 누구나 그 정보에 접근할 수 있도록 노력
어떻게 되고 있는지에 대한 관심이 높음을 알 수 있 을 기울여야 할 것으로 판단된다.
다. 넷째, 프로 구단에서는 한국프로야구, 타이거즈, SNS에서 추출된 텍스트 데이터에 대한 결과는 <그
라이온즈, 두산, 한화 이글스, KT 등의 키워드가 높게 림 3>에서 보는 바와 같이 (1) 선수 기록 순위 (2) 프
나타나고 있어 프로스포츠에서 구단은 팬들과 밀접하 로야구 경기력 지표 (3) 기록 분석 등의 세 개의 그룹
게 관계를 맺고 있음을 알 수 있다. 프로야구 구단의 으로 분류된다. 이와 같은 결과는 팬은 포털사이트에
브랜드에 대한 자아 이미지 일치성은 팬의 욕구 및 비해서 SNS에서 프로야구 경기력 지표에 대해 더 많
감정을 긍정적으로 발생시키기 때문에 구단은 팬에게 은 이야기 거리를 만들고 있음을 방증한다. 첫째, 선
즐거움과 같은 긍정적인 감정을 갖도록 서비스를 제 수기록 순위에서는 투수, TOP 타자, 부문, 그래프, 시
공하고 충성도를 높이기 위한 전략을 실행하고 있다 즌, 예상 등에 대한 키워드들에 대한 연결성이 높게
(Malhotra, 1988). 이러한 이유로 구단에 충성도가 높 나타나 팬은 프로야구선수의 경기력 지표를 실시간으
은 팬은 선수와 마찬가지로 구단에 대해서도 높은 관 로 확인하고 해당 경기력 순위에 관심이 높은 것을
심을 표현하고 있는 것으로 판단된다. 알 수 있다. 둘째, 프로야구 경기력 지표에서는 홈런,
콘커 분석의 결과로 나타난 선수기록, 선수 수상, 안타, WAR, 기록, 역대, 최초 등에 대한 키워드들에
선수 계약, 프로 구단 등의 네 개의 군집들은 유사한 대한 연결성이 높게 나타나 팬은 경기력 지표에 대한
맥락에서 접근해 볼 수 있다. 국내 프로야구 팬은 선 선수의 기록 달성 여부에 관심이 많으며 그에 대해
수 및 구단의 기록과 성적에 관심이 매우 높다는 것 지속적으로 확인하고 있음을 알 수 있다. 이는 포털
을 알 수 있다. 과거의 팬은 프로야구 경기력 지표에 사이트의 첫 번째 그룹과 유사한 측면으로 풀이된다.
대해서 단순하게 명시되는 측면을 바라봤다면 지금은 셋째, 기록 분석에서는 야구 분석, 분석, 개막, 영상
프로야구 경기력 지표를 더 세분화해서 바라보고 있 등에 대한 키워드들이 높은 연결성을 보이며, 이러한