평소에 정치관련 이야기를 쓰지 않다가 처음으로 써보네요. 지금 하고 있는 일이 해석하고 분석하고 마이닝 하는 작업에 방법론을 만들고 있다보니 괜찮은 기회가 되어, 2012년 대선 주자 3인방을 토대로 간략하게만 정리해보고자 합니다. 그렇다고 추후 18대 대통령 당선자가 누가 될 것이냐는 식의 정답지를 얻어낼 수 없음을 미리 언급하고 싶네요.

소셜 미디어 대화 분석, 솔직히 말하면 분석이라는 표현 보다는(컨설팅 업체에서 하는 일련의 분석은 방법론을 적용하여 다양한 관점의 해석론, 공식, 학술적 지식을 결합하는 작업이고 소셜 분석 서비스의 '소셜 분석'은 포장된 용어로 볼 수 있습니다.) 소셜 미디어 대화 "해석"이라 표현하고 싶네요. 그런 의미에서 국내 소셜 분석 서비스로 꼽히는 다양한 서비스들은 모니터링 서비스 + 소셜 미디어 대화의 RAW 데이터를 열람할 수 있는 대화 창고로 표현하고 싶습니다. 현업에서의 소셜 분석은 거품이 많이 있고, 특히 분석 시장은 서비스 단독으로는 처리할 수 없음을 알려드리는 바 입니다.

그렇다면, 지난 10월 8일 부터 10월 11일 까지 약 3일간에 걸친 내용 정리 및 데이터 수집 기간을 거쳐 정리한 <2012년 대선 후보 3인, 소셜 분석을 떠나 소셜 미디어 대화 중심으로 특징을 재해석>한 내용을 공유하고자 합니다.

본 내용에는 트위터 버즈, 국내 주요 포털인 네이버와 다음의 뉴스 서비스 기사를 일정 기간 내 수집한 결과를 통해 도출된 내용으로 아래의 4개 가설을 중심으로 얻어 낼 수 있는 것이 무엇이 있는지 정리한 내용입니다. (본 내용에 대해 의의를 주시거나, 더욱 구체적인 데이터 해석이 필요하시다고 여겨지신다면 댓글로 달아주시거나 트위터로 멘션 부탁드립니다. 트위터 @pakseri79)

A. 가설에 대해

본 가설은 개인의 입장에서 지난 9월 19일 이후, 안철수 박사가 공식적으로 대선 후보 참가 발언을 한 시점에 기초하여 어떠한 변화가 일어나는지, 특히 트위터의 저널리즘 성을 기존 온라인 뉴스 미디어 매체와 비교하여 보고자 정리한 가설임을 알려드립니다.

하나. 트위터 상의 온라인 멘션을 놓고 보았을 때, 안철수(무소속) 지지층이 기존 대선후보였던 박근혜(새누리당) / 문재인(민주통합당) 후보 보다 많아 지고 있다.(9월 19일 이후)

둘. 올드 미디어(기존 신문/보도 매체)를 지켜보는 뉴스 소비계층을 배제하고, 뉴 미디어 소비 계층인 트위터 사용자가 생산하는 멘션수 vs 포털 뉴스 건수는 함께 움직이고 있다.

셋. 각 대선후보 들이 생산하는 트위터 / 뉴스의 키워드들은 후보들을 대표하는 언어로 표현되어 진다.

넷. 온라인 대화 속에서 후보들의 관계를 알아보고, 후보간 경쟁 구도가 있는지 살펴봄으로써 '대선 후보간 경쟁 대상', '단일화 지지 여부'를 알 수 있다.

위의 4개 가설을 중심으로 소셜 분석 서비스를 통해 얻은 결과로 아래의 그래프로 해석해보도록 하겠습니다.

이에 사용된 소셜 분석 서비스는 <코난테크놀로지 - 펄스 K + SNS 민심닷컴>, <다음소프트 - 소셜 위즈덤>, <와이즈넛 - 2012President>를 각각 활용하여 다각도로 보았습니다.


B. 가설에 대한 데이터를 해석

하나. 안철수 지지층의 대화는 기존 대선 후보 대화 대비 일정 시점 이후 많아지고 있다.

안철수 후보가 지난 7월 19일 이후 부터 9월 19일 까지 불규칙적인 이슈를 제기했었던 시점에 비추어 볼때, 기존 박근혜 후보와 문재인 후보간에 오르락내리락을 반복하는 트위터 버즈가, 그리고 트위터 상의 지지층 중심 대화가 지속되어 왔습니다.

하지만, 안철수 후보가 SBS 힐링캠프에 도서 '안철수의 생각'을 출간 이후 녹화 방송이 송출된 이후 시청률과 함께 안철수 후보의 버즈가 롤러코스터를 타게 됩니다. 하지만, 그 이후 공식적인 활동이나 트위터 상의 큰 버즈량 변화 없이 주춤하다가, 박근혜 후보의 새누리당 대선 후보 확정, 고 노무현 대통령의 봉하마을 방문으로 박근혜 중심의 버즈가 요동치기 시작하지요. 이때 민주통합당 문재인 후보에게는 큰 이슈 없이 민주통합당 경선과 관련한 이슈, 시장조사에 맞춘 여론조사 결과 속에서 크게 움직이지 않지요.

하지만, 9월초 박근헤 캠프에 큰 변화가 시작된 시점이 있습니다. 바로 안철수 후보 측에 대한 공격이었는데요. 이는 안철수 후보 측에 대선 불출하 협박 이슈가 언론을 통해 알려지면서 박근혜 후보와 안철수 후보간의 치열한 버즈 롤러코스터가 시작되면서 점유율이 역전이 됩니다.

결국 문재인 후보의 대선 후보 확정 소식은 9월 19일, 안철수 후보의 공식 출마 선언과 함께 잠겨버리고, 안철수 중심의 버즈와 버즈를 언급하는 사용자들의 움직임이 발빠르게 옮겨가기 시작했습니다. 어떻게 보면 단기적으로 보았을때 두드러지는 특성은 9월 19일 이후, 박근혜의 과거사 사과 이슈를 제외하곤 지속적으로 안철수에 대한 긍정/부정을 합한 버즈가 발생하고 있었습니다.

여기서 지지자층이 많아졌다고는 할 수 없으나, 박근혜 VS 문재인 후보의 양강 체제에 있다가 안철수 후보의 부각으로 문재인 후보에 대한 온라인 버즈가 안철수 후보 측으로 옮겨가면서 박근혜 VS 안철수 라는 새로운 대립 구조가 형성되었던 것으로만 해석 가능합니다.

지지자층에 대한 부분은 별도의 영향력자나 온라인 버즈를 생성하는 이들의 움직임을 별도로 추적해볼 필요가 있습니다.

둘. 멘션수와 포털 뉴스 건수는 상호 관계가 있다.

가장 재미있게 비교하고 싶었던 내용인데요. 온라인 뉴스와 각 후보를 중심으로 한 트위터 버즈량과의 관계 였습니다. 트위터 멘션수와 포털 뉴스 건수는 상호 관계가 있다? 위의 그래프만 본다면 전체적으로 보았을때, 안철수 후보와 박근혜 후보 버즈량에 따라 뉴스 기사 건수도 유사하게 매칭되는 것을 볼 수 있습니다. 하지만 여기서 볼 수 있는 것은 그래프에서 볼 수 있는 선형 회귀(분석)추세선인데요.

안철수 0.1017
박근혜 0.0196
문재인 0.0064


2012년 7월 15일 ~ 10월 9일
뉴스 매체 총량과 각 후보간의 버즈 총량(전체 모수 대비)을 각각 비교하며
선형 회귀분석(선형추세법) : R-제곱값을 해보니

안철수 후보는 지속적으로 상승세
박근혜 후보는 상승세가 둔화
문재인 후보는 오히려 9월 19일 이후로 하락세


그렇다고, 대선 후보들의 일부 트위터 버즈로만 예측 가능한 결과는 얻어낼 수 없지요. 참고만 할뿐입니다. 결국엔 안철수 후보와 문재인 후보 간의 단일화가 박근혜 후보와 붙어볼 만한 빅 매치가 되는 가설에 근거하네요. 좀 더 살펴봐야지요.

이렇게 봤을때, 이슈 메이커 역할을 하는 대선 후보는 안철수 후보와 박근혜 후보로 요약되며 문재인 후보의 경우 별도의 큰 이슈 없이 안철수 후보, 박근혜 후보의 이슈 메이킹에 함께 언급되면서 문재인 후보가 따라가는 격이 되고 있습니다. 후보 캠프에서의 온라인 활동이 온라인 여론몰이에 미치는 영향이 크다는 것을 인지 해야 할 것입니다. 안철수 후보가 대선 레이스에 참가한 것이 박근혜 후보와 문재인 후보에게 던지는 화두가 크지 않을까 보이네요. 온라인 영향력만 본다면 안철수와 박근혜 후보간의 양자 대결, 안철수 후보와 문재인 후보간의 단일화가 필요할 가능성이 높아보입니다.


셋. 후보들의 대표 언어를 트위터와 뉴스 속에서 발견 할 수 있다. 

후보간의 캠페인 공약이나 키워드 등은 사실 일반 대중들에게 매력적이지는 않지요. 실제로 공약을 실천할 만한 소재가 있느냐가 화두인데요. 후보들과 관련된 버즈와 뉴스에 있는 형용사 - 동사 - 명사를 토대로 감성어를 표출해보니 위와 같은 각 후보별 주요 감성어가 나왔습니다. (왼쪽부터 안철수 - 박근혜 - 문재인 후보)

위의 테이블에서 보여지는 '밝히다'는 각각의 후보에게 공격적으로 매칭되는 '이슈를 밝히다'라는 소재의 대화에서 뽑은 형용사로 크게 생각하지 않아도 됩니다. 하지만 아래의 내용들을 또 다르게 접근해보면 이야기는 틀려집니다. 즉 각 후보와 관련된 이슈어를 보면 버즈량에 따라 상관관계, 키워드별 그룹핑이 되어 집니다.(실제 표출된 이슈 키워드는 30여개 이상이나, 상위 10개만을 추출하여 거품형태로 표현하였습니다. 왼쪽은 트위터 / 오른쪽은 뉴스)

안철수 후보 : 서울대 > 민주통합당 > 새누리당 > 융합기술대 > 박근혜 순으로 '안철수' 후보가 안고 있는 이슈어는 매우 안철수 중심의 키워드로 시작하여 경쟁 정당인 민주통합당과 새누리당, 그리고 융합과학기술대가 따라오게 됩니다. 단 박근혜 후보와의 키워드 거리는 조금 있다고 볼 수 있습니다. 이 부분은 하기 박근혜 후보와 문재인 후보에서도 보이게 됩니다. 하지만 뉴스에서는 문재인이 박근혜 보다 앞서게 나와서 키워드 연관성을 고려한다면 트위터와 뉴스 간에는 일련의 차이가 보입니다.(단 키워드 랭킹에 변화만 있을뿐, 키워드는 유사합니다.)

박근혜 후보 : 새누리당 > 민주통합당 > 안철수 > 문재인 > 서울대 순으로 소속 정당인 새누리당과 경쟁 정당인 민주통합당, 안철수 후보와는 달리 상대 제일 강력한 후보인 안 후보가 언급이 됩니다. 그 이후 문재인 언급으로 모양이 그려지며 뉴스에서는 안철수 후보의 순위가 조금 달라짐으로써 박근혜 후보와 안철수 후보간의 버즈 발생은 매우 민감한 사항이며 앞으로 이 부분을 지켜봐야 할 것으로 보입니다. 버즈 총량은 기입한 숫자를 참고하세요.


문재인 후보 : 민주통합당 > 안철수 > 민주당 > 손학규 > 박근혜 순으로 문재인과 엮이게 되는 기존 경선 기간에 라이벌이었던 손학규와 정세균, 김두관 후보가 언급되는 격이 매우 재미있습니다. 가장 주력되는 점은 박근혜 후보와 문재인 후보가 조금 먼 거리에 있다는 것이며, 특히 안철수 후보와의 관계는 뉴스와 트위터 상에서 매우 긴밀함을 볼 수 있습니다. 문재인 후보에게도 안철수는 큰 존재이네요.

그렇게 봤을때, 박근혜 후보 관점에서만 외로운 대선 레이스가 되는 느낌이 들긴 합니다. 즉 안철수는 박근혜와 문재인 후보에게는 매우 뜨거운 경쟁 상대로 버즈를 차지하고 있지만, 박근혜 측에서는 안철수 후보만을 바라봐야 하는, 어떻게 보면 박근혜 후보에게는 안철수 후보가 적절한 대선 레이스 경쟁 주자임은 확실합니다. 문재인의 경우 안철수 후보 보다는 조금 미약하고 해당되는 버즈를 안철수와 박근혜 후보에게 의지하는 모양새나 나타납니다.

위의 사항까지만 이며, 좀 더 들여다봐야 하지만 추후 발전된 내용으로 하여 키워드에 대한 심층 해석을 담아보도록 하겠습니다.


넷. (온라인 상에서 생각하는) 후보들의 경쟁 관계, 단일화 지지 여부를 알 수 있다. (여론조사 + 키워드 포함 트윗/멘션)


마지막 가설 부분입니다. 사실 후보들의 경쟁 관계를 추론한다거나 단일화가 가능할 것인가?를 보고 싶었습니다. 하지만, 현재의 3자 후보간의 버즈만을 보고, 그렇다고 선형 추세선을 가지고는 단일화의 방향을 예측할 수는 없었습니다. 하지만 선형 추세를 보았을때 (위의 두번째 가설) 안철수와 문재인 후보간의 단일화는 언젠가 이뤄져야 크게 변화가 없는 문재인 후보의 버즈, 특히 여론조사에서 갈라지는 항목을 통합하는 수순이 될 것이라 보입니다.

---

이상, 매우 간략하게 4가지 가설에 입각하여 개인적으로 바라본 대선 후보 주자들의 버즈량을 뉴스와 함께 데이터 정량, 키워드 정량만을 놓고 보았는데요. 좀더 시간을 가지고 들여다보면 뭔가 보이지 않을까 내심 생각은 듭니다. 아직 후보 등록까지 1개월여 남겨두지 않고 있습니다. 공을 들여서 2차 해석 내용을 만들어보도록 하겠습니다.

참고 내용으로 3인 후보에 대한 긍정/부정/중립 분포를 볼 수 있는 데이터 차트를 첨부합니다.

별도로 RAW 파일이 필요하시다면 댓글로 남겨주시면, 본 내용에 활용된 내용을 공유드리겠습니다.

Methodology

- 해석에 입각한 기준 Date : 2012년 7월 15일 부터 10월 9일 까지
- 해석에 사용된 소셜 분석 서비스 : 코난 펄스K, 다음소프트 소셜 위즈덤, 와이즈넛

- 뉴스 : 네이버 뉴스 / 다음 미디어


[참고] 데이터를 기반으로 한 각 후보별 긍정/부정/중립 분포

1. 안철수

2. 박근혜

3. 문재인



고맙습니다. // 새우깡소년 드림


 


Currently 댓글이 없습니다. comments want to say something now?

댓글을 달아 주세요