livin' seberia

'이것이 팩트'라는 청와대 홈페이지를 뜯어보았다

analysis

'어이가 없네' 싶은 것들은 그냥 못 지나가는 글쓴이입니다. 오늘은 청와대의 '오보 괴담 바로잡기! 이것이 팩트입니다' 페이지를 뜯어보겠습니다. 논문 써야 하는데 지금 이런 걸 살펴봐야 한다니 이것은 인생낭비인지 스트레스 해소인지 뭔지... (암튼, 발암주의) 굳이 링크를 걸어야 할까 싶지만, 그래도 그 와중에 궁금하실 분 있을까 싶어 청와대 홈피도 알려드립니다. ☞ (http://www1.president.go.kr/news/briefingList2.php)


일단 배너부터 뜯어볼까요?

 


제가 개인적으로 좋아하는 보라색 계열 컬러를 띠고 있네요♥︎ k-means로 뽑아볼까 하다가 귀찮아서 어도비의 힘을 빌려보니 다음과 같이 구성돼 있군요. 



 

하지만, 이 색상들만으론 배너를 구성할 수 없지요. 

본격적으로, 이 배너 뒤에 숨어있는, 즉 기꺼이 배경화면이 되어준 기사들은 무엇이 있는지 한 번 스크랩해 봤습니다. (혹은 무단도용일 수도 있을까요? ㅎ)

 이런거 말이지요. 이 부분들을 제가 찾아볼 수 있는 한도 내에서 전부 스크랩해 봤습니다. 

(이정도면 정말 청와대의 모든 공작에 대해 애정 및 덕심이 있지 않고서야...)





2016-11-16 미디어펜

'최순실 광기'빠진 언론... 촛불 격문∙국정농단 숨은 주범

http://www.mediapen.com/news/view/207051




2016-10-28 더팩트 

'세월호 7시간' 박근혜 대통령 행적 의문, 최순실 지시 기다렸다?

http://news.tf.co.kr/read/ptoday/1662006.htm




2016-11-17 미디어펜

박 대통령 하야 선동 저주의 굿판…악마의 탈 쓴 언론

http://www.mediapen.com/news/view/207203




2016-11-18 뉴데일리

박대통령 비방 몰두 북, '계엄령' 유언비어에 신날 듯

https://newdaily.co.kr/news/article.html?no=327606




2016-11-14 머니투데이

통일부 "'통일대박' 최순실 개입 보도, 명백한 오보"

http://news.mt.co.kr/mtview.php?no=2016111417367693083




2016-11-04 미래한국

'최순실 의혹' 카더라 보도, 언론이 미쳤다

http://www.futurekorea.co.kr/news/articleView.html?idxno=33231



2016-11-07 한겨레21

다시, 7시간의 미스터리

http://h21.hani.co.kr/arti/cover/cover_general/42610.html



2016-11-15 팩트올

조선일보는 왜 '세월호'와 관해 유독 많은 오보를 냈나전직 조선일보 기자로 살아가기

http://www.factoll.com/page/news_view.php?Num=3693




뭐 제 눈으로 보이는 기사는 요정도입니다. 주로 보면 '저런 언론사도 있었나?' 싶은 것도 있지만 딱히 뭐 지목하진 않겠습니다.

(특히 미디어펜 이라는 언론사가 딱 '청와대가 하고 싶은 말'을 잘 해준 것 같기도 하고...)

어찌됐든, 이 그래픽을 만든 시점이 11월 18일 저녁인데 (참고로 메타데이터 이름 1로 되어있는 건, 제가 저장을 1.jpg로 했기 때문임을 알립니다18일 이전까지 나온 그 수많은 기사 가운데, 이것들만 골라다 넣은 이유는 무엇일지 

(아니, 찾기도 힘들었을 것 같은데 ㅋㅋ 청와대에서 어디 스크랩이라도 해 두시나..) 뭐 이런 저런 생각이 듭니다. 

그러고보니, 이 페이지가 오픈된 게 11월 19일이니까... 디자이너들 엄청 급하게 만들었겠네요. 


이번에야 밝혀진 사실입니다만(평소 청와대 홈피에 관심가질 일들이 없었으므로...) 해당 사이트 자체가 'euc-kr' 쓴다는 점에서 이래저래 개발자들 사이에서 화제를 모으고 있기도 하더군요... (utf-8을 달란말이다!!!)




저는 정말 순수한 마음에서, 맨 위에 올라와있는 글부터 '언제 쓰인 것일까?'를 탐구하기 시작합니다. 이렇게 말이지요... 


 

이를테면, 제일 위에 있는 '가장 핫한 글', 세월호 당일 대통령은 어디서 뭘 했는가- 에 대한 글은 청와대 홈피 이미지 에디터(...) 주소를 통해 확인할 수 있었습니다. 일단 해당 글의 맨 위에 있는 청와대 사진의 주소는 http://www.president.go.kr/img_editor/images/000177/20161119175910251_4YB1QKMI.jpg 입니다. 우리가 예를 들어 블로그를 작성한다고 할 때, 바로 사진을 붙여넣거나, 혹은 포토에디터를 쓰는 일도 있을텐데요. 이 글의 작성자는 포토에디터(img_editor라고 돼 있지요?)를 사용했던 모양입니다. 맨 뒤 201611191759 는 그 포토가 에디팅 후 저장된 시점으로 짐작됩니다.

다른 사진들도 마찬가지로 나타나거든요. 


청와대 사진 바로 뒤에 붙은 그림은 18시 4분에 붙었으니... 뭐 그 사이에 글을 쓰는 데에 5분쯤 걸렸나 봅니다. 가장 핫한 '타임라인' 사진의 경우 사진의 메타데이터를 확인해보면 19일 19시 9분에 제작됐는데요, html 코드를 보면 글에 붙은 시점이 20시 49분입니다. 아마, 글을 모두 다 쓴 뒤에 뒤늦게 수정해 저장한 것 같습니다. 왜냐하면, 바로 다음에 붙은 사진이 박통 전화 받는 사진인데, 이건 18시 27분에 첨부됐거든요. 이 글을 쓴 사람이, 한참 타이핑을 하다가 "아, 타임라인 그래픽도 한 번 만들어볼까?"라는 생각이 문득 들어 추후에 만든 그래픽이 아닐까.. 이런 생각이 듭니다.

 



다만, 여기서 의문스러운 건, 이 페이지에서 가장 마지막에 실린 사진이 18시 18분에 올라갔다는 것(즉, 박통의 전화받는 '이미지' 사진이 이 글에 있어선 꽤 늦게 실렸다는 것...)  

그리고, 이 글이 작성된 지 이틀 뒤인 11월 21일에야 아래 두 개의 사진이 글에 더 붙게 됐다는 정도랄까요... 



암튼, 글 자체를 촤라락 다 쓰는 데까진 대략 20분 정도 걸린 것 같습니다. 


자 그럼, 청와대 홈피에 올라온 글 11개 가운데 과연!! 어떤 글을 가장 먼저 해명하고 싶어했을지, 같은 방식으로 한 번 보겠습니다.  


 게시판No.

대략적인 제목 (다들 아니까)

적혀있는 작성 날짜 

첫 사진 수록시간 

 html 코드에 나타난 board detail 숫자

 11

 세월호 7시간

 11-19

 11-19 17시 59분

 18338

 10

 통일은 대박

 11-18

 11-18 21시 38분

 18329

 9

 세월호 간호장교

 11-18

 사진 없음

 18330

 8

 최순실 전용기 동행

 11-18

 사진 없음

 18331

 7

 청와대 최순실 경호

 11-18

 사진 없음

 18332

 6

 트럼프의 박 비하

 11-18

 사진 없음

 18333

 5

 간절히 원하면 온 우주가...

 11-18

 사진 없음

 18337

 4

 잠이 보약

 11-18

 사진 없음

 18334

 3

 대포폰

 11-18

 사진 없음

 18335

 2

 길라임

 11-18

 11-19 14시 37분

 18336

 1

 최순실용 침대

 11-18 

 사진 없음

 18347


생각보다 사진이 많지 않아 url, html 상 숫자 등을 함께 확인했습니다. (길라임 글에 실린 사진은 나중에 삽입한 것인지...) 

보드에는 대개 쓴 순서대로 글이 올라갈텐데, 청와대 홈피 게시판에 작성 후 사이트 바깥으로 게시하는 것은 일일이 편집되는 방식인지도 모르겠습니다. 만일, 저 보드 디테일 숫자가 글이 쓰인 순서대로-라고 한다면, 최순실베드는 가장 나중에 쓰인 글일테고, 가장 먼저 쓰인 건 '통일은 대박'이었겠네요(ㅋ) 18329부터 18347까지 만일 글이 쭉 다 써있던 거라면, 총 19개의 글이 올라왔어야 할 것이고, '작성은 했지만 올리지 않은 글'은 8개겠죠? 언제 올라올지 살펴보고 있겠습니다. 


참고로 청와대 게시판의 작성창이 하나로 이어져있고, 목록을 나눠 다는 순서라면 당연히 글의 숫자 인덱스도 엉키겠거니- 싶어서 다른 브리핑 게시판 창을 좀 봤습니다. 일단, 최근 '검찰 나빠요' 브리핑을 한 정연국 대변인의 블핑 자료에는 18339 라는 숫자가 달려있습니다. 그리고 newsList2.php에 나온 대변인 브리핑은 18340의 값을 가지고 있고요. 흠, 최순실용 침대는 그럼 미래에 쓰인 글인건가...ㅎㅎ 도통 모르겠네요, 이건. 




그리고, 콘텐츠가 실린 타입에도 차이가 좀 있는데요. 메인이미지를 본문에 첨부하는 형태의 기존 글들과 달리, '괴담 바로잡기' 페이지는 메인이미지 첨부가 전혀 돼 있지 않습니다. (보시면 알겠지만, 글의 정렬방식같은 것도 마치 네이버 블로그를 보는 것 같은 기분이...) 아마도... 이전까지 주로 이 게시판을 담당하던 사람과 다른 이가 해당 게시판을 관리하고 있는 것 같아 보입니다. 

 



오늘은 이렇게 청와대 홈페이지를 뜯어봤습니다. 제발 이제 그만 뜯어봐도 되도록, 그분이 빨리 내려왔으면 좋겠네요. 


(아 힘들다. 아이고 내눈...) 












정말 '기자가 예뻐서' 바라봤을까?

analysis

며칠 전 우병우 전 민정수석이 '기자 노려보는(속된 말로 야리는) 사진'이 화제가 됐죠. 오늘 일각에선 '그..그것은 사실 그 여기자가 예뻐서였다!'라는 의견이 제기됐습니다. 웃자고 시작한 말에 죽자고 달려드는 건 아닙니다만; 그렇다면 그 우병우의 얼굴에서 정말 "우왕ㅋ예쁨ㅋ"이라는 메시지가 느껴지는 지, 요즘 핫한 인공지능 감정분석 프로그램(MS Project Oxford: AI기반 Emotional Analysis)을 활용해 그 수치를 살펴보도록 하겠습니다. 


데이터는... 사실 사진이 찍히는 각도 및 타이밍이 정말 중요한지라, 일단 구글에서 검색되는 사진을 중심으로 랜덤으로 골랐습니다. (각 미디어 출처를 밝히지 못해 미안해요!)


진짜 분석에 앞서, 몇 가지 말씀드리자면 -이 프로젝트 옥스포드는 수우우많은 사진 데이터를 기반으로 머신러닝을 통해 사람의 감정을 검출해내는 방식이랍니다. 아래 링크에 들어가서 데모를 해 볼 수도 있으니 한 번 해 보셔요. 다만, 한국인 같은 동양인 얼굴의 경우, 데이터 비율이 낮은 편이라 상대적으로 감정 값에 크게 동의하지 못하는 경향도 있어요. 특히! 부정적인 얼굴에 대해서 말이죠. 웃는 표정 같은 건 전세계적으로 비슷하지만, 역겨워 한다거나, 슬퍼한다거나 하는 것은 동양인과 서양인이 짓는 표정 방식이 좀 다르거든요. (실제 저도 한 스무 명쯤 대상으로 실험을 해 보니 그런 피드백이 많이 나오더라고요. ㅎㅎ) 

데이터값은 <분노, 경멸, 역겨움, 공포, 행복감, 중립, 슬픔, 놀람> 등 여덟가지 감정(중립이 감정이라고 하기는 좀 그렇지만요)에 대해 수치를 보여주고, 그 합은 1로 모두 노멀라이즈(normalize)했답니다. 비율값을 출력한다고 보시면 돼요. 제가 지금까지 이 프로그램 API를 가지고 실험을 해 봤을때, 대부분 중립 또는 행복감이 가장 지배적으로 나왔고, 그 외의 감정은 아주 적은 비율을 차지하는 경우가 많았답니다. (관련해 논문부터 어서 끝내야 할텐데 ㅋㅋㅋㅋㅋㅋㅋ) 

링크는 요기 ▶︎▶︎▶︎ https://www.microsoft.com/cognitive-services/en-us/emotion-api



"scores": {
      "anger": 0.00106139132,
      "contempt": 0.00670030946,
      "disgust": 0.00154416647,
      "fear": 0.0000987502863,
      "happiness": 0.01872015,
      "neutral": 0.9382772,
      "sadness": 0.0329297632,
      "surprise": 0.000668298
    }

이 사진이 바로 그 므흣한 노려봄...을 보여주는 대표작인데, 그 값을 살펴보면 다음과 같습니다. 

일단 중립적이라는 판단이 가장 높게 나왔고요. 슬픔(0.0329)-행복감(0.01872)-경멸(0.0067) 순으로 나왔습니다. 앞서 말했듯, 통상 부정적인 값은 잘 나오지 않는 편인데요. 그럼에도 불구하고 슬픔의 값이 행복감보다도 높게 나왔다는 것이, 그래도 좀 의미있는 수치같아 보입니다. 




혹시 몰라 살짝 다른 각도에서 찍힌 사진을 가져와봤습니다. 


 "scores": {
      "anger": 0.00466062641,
      "contempt": 0.008483217,
      "disgust": 0.00337815471,
      "fear": 0.000283517,
      "happiness": 0.0116640572,
      "neutral": 0.9297119,
      "sadness": 0.04014902,
      "surprise": 0.00166950654
    }


이또한 중립 - 슬픔(0.04014)-행복(0.01166)-경멸(0.0085) 순으로 나왔는데요. 부정적인 감정의
 비율이 행복감에 비해 월등히 높습니다. (normalize한 값이니 수치들을 더해도 될 것 같은데요. anger+contempt+disgust = 0.0166 > happiness=0.0117 로 나옵니다.) 음, 이쯤되면 '반했다'기보단 '빡이 쳤다'(순화시켜 풀어쓰면 '하아 내가 지금 니네 질문에 답해주게 생겼나?') 정도로 봐야하지 않을까 싶습니다. 



그렇다면! 혹시 이분 평소 표정이 이런 것은 아닐까? 라는 생각이 들어서 (실제 분석하다 보면 유독 '웃고 있어도 안 좋은 감정 수치가 높은' 인물들이 좀 있거든요... ex. 김종인...이랄지...) 그래서 청와대 시절 사진 몇 장 더 가져와봤습니다. 비슷한 각도 사진으로 먼저 살펴봤는데요. 


"scores": {
      "anger": 0.000007467897,
      "contempt": 0.0007204781,
      "disgust": 0.000009470894,
      "fear": 0.00000664905656,
      "happiness": 0.00384653336,
      "neutral": 0.9683843,
      "sadness": 0.0269808266,
      "surprise": 0.0000442662749
    }

일단 '중립'을 제외하면 대체로 슬픔 값이 좀 높아요. (집에 우환이 있으신가) 그래도 위 사진에 비해 기타 부정적인 값들은 상대적으로 낮은 모습입니다. 경멸, 역겨움, 이런 것은 좀 적은 편이죠.   


조금 더 시니컬해보이는, 그러면서 기자를 야리던(?) 것과 각도가 비슷한 사진을 확인해 봤는데요. 


"scores": {
      "anger": 0.0009137483,
      "contempt": 0.002483103,
      "disgust": 0.000823965936,
      "fear": 0.0000622860462,
      "happiness": 0.008210836,
      "neutral": 0.952325642,
      "sadness": 0.033555124,
      "surprise": 0.00162528746
    }

제가 지금까지 이런 식으로 고개 숙이고 눈빛을 내려 까는 분들 사진 많이 분석했지만, 이 정도로 슬픔값이 높은 분은 참 흔치 않았습니다. (ㅎㅎ) 암튼, 그럼에도 불구하고 슬픔 다음 값이 행복감이라고 할 수 있을 정도로, 이 사진에선 은근히 긍정 비율이 있는 편이에요. 



그렇다면, 여기서!!!! 청와대 민정수석이었으니까, 이번엔 박근혜 대통령을 바라보는 모습!을 확인해보도록 하겠습니다. 


"scores": {
      "anger": 0.000128584186,
      "contempt": 0.00139316765,
      "disgust": 0.0000204426069,
      "fear": 4.1267208e-7,
      "happiness": 0.0000277560866,
      "neutral": 0.99662447,
      "sadness": 0.001768005,
      "surprise": 0.0000371851274
    }

그저 평온한 느낌이네요... 약간 슬프고 경멸스러워하긴 하지만 이 정도 값이면 뭐... 무시해도 되지 않을까 싶습니다...



"scores": {
      "anger": 0.00001031605,
      "contempt": 0.0000633868549,
      "disgust": 0.00000606544154,
      "fear": 1.265436e-7,
      "happiness": 0.000007915672,
      "neutral": 0.9943095,
      "sadness": 0.00554948673,
      "surprise": 0.0000532410377
    }

이쯤되면 이분이 전반적으로 좀 슬픈 분이라고 봐야할 것 같지만(ㅋㅋ) 대통령에 대해선 대부분 중립적인 표정을 짓고 있습니다. 뭐 임명장 같은 걸 받을 땐 웃고 있지만, 그런 건 일단 눈빛이 제대로 나오지 않으니 제하기로 하지요. 

참고로 청와대 시절 우병우 전 수석 사진들은 대부분 처가 땅투기 의혹 얘기가 나오던 시기에 실린 기사 사진들이랍니다. 아무래도 좀 암울한 사진들이 많겠죠. 하지만 그 전엔, 이분이 그리 뭐 자주 실릴 양반도 아니고(검사시절은 제외하더라도...) 그러다보니 더 부정적인 얼굴들이 많이 나오는 것일 수도 있겠지요. 

그렇다면, 여기서 문제!! 조선일보 사진기자가 찍은 '친정방문샷'의 결과는 어떨까요? 정답은,


"scores": {
      "anger": 0.00491771568,
      "contempt": 0.00495274225,
      "disgust": 0.002333943,
      "fear": 0.000603230554,
      "happiness": 0.0426047444,
      "neutral": 0.9296485,
      "sadness": 0.00951580051,
      "surprise": 0.005423305
    }

그래도 행복감이 좀 있는 편이네요ㅋ neutral 너무 많이 나와서 좀 실망스럽긴 합니다만.


그리하여 감히 마무리를 짓자면, "여기자가 예뻐서라기보단 빡쳐서 째려본 거 맞다!" 라는 결론을 내려봅니다. 







그리고 진짜 마지막으로... MB시절 검찰개혁안 및 감찰 의혹 등등과 관련해 검찰간부들로부터 사퇴요구를 받던 한상대 당시 검찰총장이 옷을 벗기 전 인터뷰 사진인데요. 당시에 이 자도 이런 사진이 찍혔더랬습니다! (후후 저 여기자가 바로 저예요. A형이라 뒤끝이 좀 있져ㅎㅎ) 여기는 여기자가 안 예쁜데도(!!) 이런 눈빛이 나왔단 말입니다. 이분의 얼굴에서 스믈스믈 우러나는 그 감정을 진짜 진심 걍 한 번 넘나 궁금해서 확인해 봤는데요.


"scores": {
      "anger": 0.0009859364,
      "contempt": 0.0008371636,
      "disgust": 0.000334082171,
      "fear": 0.01186428,
      "happiness": 0.0006033637,
      "neutral": 0.8842088,
      "sadness": 0.0209913366,
      "surprise": 0.08017502
    }

이유는 알 수 없지만 많이 놀라셨네요. 풀어 쓰면... '헐 뭐지 이 @#$^#$%^%는?' 이런 느낌이었나. 



대통령의 사과문, 누구 것과 가장 비슷할까?

analysis

'형태소 기반' 코사인 유사도만 구해보면... 양승태 대법원장 사과문-박근혜 당시 후보의 2012년 사과문-조현아 땅콩회항 사과문 순으로 비슷

가장 먼 것은 고 노무현 전 대통령의 2009년 사과문


▲이미지 하나쯤은 넣어야 겠으니 청와대 출처 사진 한 장 첨부...



할 일이 엄청 많지만 그래도 궁금한 것은 빨랑 풀어봐야만 하므로, 이번 박근혜 대통령의 사과문(2016.11.05)은 과연 누구의 사과문과 가장 비슷할 지 한 번 돌려봤다. 전에 짜 뒀던 코사인 유사도 코드를 살포시 다시금 꺼내보았고, 통상 명사기반을 많이 쓰고는 있지만 사안이 특수한(?) 관계로 형태소(morpheme)를 중심으로 살펴봤다. (주로 쓰인 문장 성분 같은 것을 비교한 것이다. 어투 등을 살필 때 유용하다.) Konlpy의 Twitter 분석기를 사용했다. (속도를 좀 높여야해서...) 

함께 분석 대상으로 삼은 문서는 다음과 같다. 


박근혜 대통령의 최순실 사태 2차 사과문 (대국민담화) vs. 


1. 박근혜 당시 대선 후보의 2012년 과거사 관련 사과문

2. 박근혜 대통령의 최순실 사태 1차 사과문

3. 이명박 전 대통령의 2012년 가족 연루 비리 사과문 

4. 노무현 전 대통령의 2009년 가족 연루 비리 사과문

5. 노무현 전 대통령의 2005년 시위 농민 사망 대국민 담화

6. 양승태 대법원장의 2016년 현직 부장판사 비리 사과문

7. 조희연 서울시교육감의 2016년 비서실장 비리 사과문

8. 신동빈 롯데그룹 회장의 2015년 롯데 사태 사과문

9. 이재용 삼성그룹 부회장의 2015년 삼성서울병원 메르스 사태 사과문

10. 조현아 전 대한항공 부사장의 2015년 땅콩회항 사과문(A4 3장 짜리)


이 가운데 가장 유사도가 높은 것은 양승태 사과문이었다. 0.3590이라는 높은 수치를 보였고, 그 다음을 본인의 2012년 사과문(0.3570), 조현아 사과문(0.3484)가 이었다. 조직 관리에 대한 사과, 개인 잘못에 대한 사과 등 사과의 원인 종류에 따르기보다는... 아무래도 형태소를 중심으로 분석했다보니, 형용사와 명사의 배치가 많이 겹치는 경우가 많이 걸린 것 같다. (재밌다면 재밌을 수 있지만, 박근혜의 2012년 과거사 사과문과 신동빈 회장의 롯데사태 사과문의 코사인 유사도가 가장 높게 나왔다.(0.5393!!) 흠, 명사 기준이라면 '아버지' 뭐 이런 말이 겹치니 그럴 수도 있겠다만...) 


그래서 또 궁금한 걸 참지 못하고 명사를 기반으로 하는 코사인유사도도 살펴봤다. <박근혜 2012 사과&조현아 땅콩사과(0.2968)>, <박근혜 2차 사과&양승태 사과(0.2940)>, <박근혜 2차 사과&MB 사과(0.2890)> 순으로 높았다. 


다시 돌아가서, 형태소를 기반으로 하는 기타 다른 '박근혜 문서'와의 차이도 좀 봤다. 대상은 2013년 취임사, 2015년 9개월 어치의 공식 대통령 연설문, 그리고 2012년 후보시절 사과, 2016년 최순실사태 1차 사과, 2차 사과 이렇게 총 다섯 개 문서다. 


가장 유사도가 높은 것은 <2013년 취임사-2015년 9개월 말뭉치(0.7160)>였고, 그 다음을 <2012년 사과와 2015년 9개월 뭉치(0.6676)>, <2012년 사과와 2015년 신년사(0.6129)>가 이었다. (설마 CSS 영향인가...) 그리고 그 외의 문서들과의 연관성은 아주 '현저히' 떨어지는 경향을 보이는데, 이를테면 이번 2차 사과문의 경우 ^취임사 (0.3875) ^2015년 연설문 (0.4235) 등의 수치를 보였다. 사과문이니 다를 법도 하지, 싶으면서도 그러면 2012년 사과문은 왜 유사도가 높은가- 뭐 그런 생각도 든다. 참고로 1차 사과문과 2차 사과문의 유사도가 가장 낮다. (0.2787)... 원체 1차 사과문의 유사도가 타 문서들(앞서 분석한 타 사과문들)과 비교해 많이 낮은 편이긴 하지만, 워낙 짧기도 하고 하니 뭐 그럴 수도 있겠지 싶으면서도- 2차 사과문과 너무나 많이 달라진 것을 보면 또 '같은 사람이 쓴 건 아니구나' 싶은 생각을 들게 하기도 한다. (내가 이렇게 만연체로 쓴다는 건 뭔가 미심쩍다는 소리다. ㅎㅎ) 


아무튼, 이제 KOSAC을 활용한 감정 분석을 좀 해볼까 하는데, 이건 말뭉치를 아마 언어학연구실을 통해 받아야하는 모양이다. (고백컨대 아직 한 번도 안 돌려봤...ㅠ) 언젠가는 To be continued... 


그리고 혹시나 본인 코드로 돌려보고 싶으신 분들을 위해, txt 형태 사과문들 뭉쳐 압축파일로 아래 첨부합니당. (내 코드는 안알랴줌...이 아니라 아직 넘나 부끄러운 관계로 나만 바라봐...)  


사과문.zip