livin' seberia

정말 '기자가 예뻐서' 바라봤을까?

analysis

며칠 전 우병우 전 민정수석이 '기자 노려보는(속된 말로 야리는) 사진'이 화제가 됐죠. 오늘 일각에선 '그..그것은 사실 그 여기자가 예뻐서였다!'라는 의견이 제기됐습니다. 웃자고 시작한 말에 죽자고 달려드는 건 아닙니다만; 그렇다면 그 우병우의 얼굴에서 정말 "우왕ㅋ예쁨ㅋ"이라는 메시지가 느껴지는 지, 요즘 핫한 인공지능 감정분석 프로그램(MS Project Oxford: AI기반 Emotional Analysis)을 활용해 그 수치를 살펴보도록 하겠습니다. 


데이터는... 사실 사진이 찍히는 각도 및 타이밍이 정말 중요한지라, 일단 구글에서 검색되는 사진을 중심으로 랜덤으로 골랐습니다. (각 미디어 출처를 밝히지 못해 미안해요!)


진짜 분석에 앞서, 몇 가지 말씀드리자면 -이 프로젝트 옥스포드는 수우우많은 사진 데이터를 기반으로 머신러닝을 통해 사람의 감정을 검출해내는 방식이랍니다. 아래 링크에 들어가서 데모를 해 볼 수도 있으니 한 번 해 보셔요. 다만, 한국인 같은 동양인 얼굴의 경우, 데이터 비율이 낮은 편이라 상대적으로 감정 값에 크게 동의하지 못하는 경향도 있어요. 특히! 부정적인 얼굴에 대해서 말이죠. 웃는 표정 같은 건 전세계적으로 비슷하지만, 역겨워 한다거나, 슬퍼한다거나 하는 것은 동양인과 서양인이 짓는 표정 방식이 좀 다르거든요. (실제 저도 한 스무 명쯤 대상으로 실험을 해 보니 그런 피드백이 많이 나오더라고요. ㅎㅎ) 

데이터값은 <분노, 경멸, 역겨움, 공포, 행복감, 중립, 슬픔, 놀람> 등 여덟가지 감정(중립이 감정이라고 하기는 좀 그렇지만요)에 대해 수치를 보여주고, 그 합은 1로 모두 노멀라이즈(normalize)했답니다. 비율값을 출력한다고 보시면 돼요. 제가 지금까지 이 프로그램 API를 가지고 실험을 해 봤을때, 대부분 중립 또는 행복감이 가장 지배적으로 나왔고, 그 외의 감정은 아주 적은 비율을 차지하는 경우가 많았답니다. (관련해 논문부터 어서 끝내야 할텐데 ㅋㅋㅋㅋㅋㅋㅋ) 

링크는 요기 ▶︎▶︎▶︎ https://www.microsoft.com/cognitive-services/en-us/emotion-api



"scores": {
      "anger": 0.00106139132,
      "contempt": 0.00670030946,
      "disgust": 0.00154416647,
      "fear": 0.0000987502863,
      "happiness": 0.01872015,
      "neutral": 0.9382772,
      "sadness": 0.0329297632,
      "surprise": 0.000668298
    }

이 사진이 바로 그 므흣한 노려봄...을 보여주는 대표작인데, 그 값을 살펴보면 다음과 같습니다. 

일단 중립적이라는 판단이 가장 높게 나왔고요. 슬픔(0.0329)-행복감(0.01872)-경멸(0.0067) 순으로 나왔습니다. 앞서 말했듯, 통상 부정적인 값은 잘 나오지 않는 편인데요. 그럼에도 불구하고 슬픔의 값이 행복감보다도 높게 나왔다는 것이, 그래도 좀 의미있는 수치같아 보입니다. 




혹시 몰라 살짝 다른 각도에서 찍힌 사진을 가져와봤습니다. 


 "scores": {
      "anger": 0.00466062641,
      "contempt": 0.008483217,
      "disgust": 0.00337815471,
      "fear": 0.000283517,
      "happiness": 0.0116640572,
      "neutral": 0.9297119,
      "sadness": 0.04014902,
      "surprise": 0.00166950654
    }


이또한 중립 - 슬픔(0.04014)-행복(0.01166)-경멸(0.0085) 순으로 나왔는데요. 부정적인 감정의
 비율이 행복감에 비해 월등히 높습니다. (normalize한 값이니 수치들을 더해도 될 것 같은데요. anger+contempt+disgust = 0.0166 > happiness=0.0117 로 나옵니다.) 음, 이쯤되면 '반했다'기보단 '빡이 쳤다'(순화시켜 풀어쓰면 '하아 내가 지금 니네 질문에 답해주게 생겼나?') 정도로 봐야하지 않을까 싶습니다. 



그렇다면! 혹시 이분 평소 표정이 이런 것은 아닐까? 라는 생각이 들어서 (실제 분석하다 보면 유독 '웃고 있어도 안 좋은 감정 수치가 높은' 인물들이 좀 있거든요... ex. 김종인...이랄지...) 그래서 청와대 시절 사진 몇 장 더 가져와봤습니다. 비슷한 각도 사진으로 먼저 살펴봤는데요. 


"scores": {
      "anger": 0.000007467897,
      "contempt": 0.0007204781,
      "disgust": 0.000009470894,
      "fear": 0.00000664905656,
      "happiness": 0.00384653336,
      "neutral": 0.9683843,
      "sadness": 0.0269808266,
      "surprise": 0.0000442662749
    }

일단 '중립'을 제외하면 대체로 슬픔 값이 좀 높아요. (집에 우환이 있으신가) 그래도 위 사진에 비해 기타 부정적인 값들은 상대적으로 낮은 모습입니다. 경멸, 역겨움, 이런 것은 좀 적은 편이죠.   


조금 더 시니컬해보이는, 그러면서 기자를 야리던(?) 것과 각도가 비슷한 사진을 확인해 봤는데요. 


"scores": {
      "anger": 0.0009137483,
      "contempt": 0.002483103,
      "disgust": 0.000823965936,
      "fear": 0.0000622860462,
      "happiness": 0.008210836,
      "neutral": 0.952325642,
      "sadness": 0.033555124,
      "surprise": 0.00162528746
    }

제가 지금까지 이런 식으로 고개 숙이고 눈빛을 내려 까는 분들 사진 많이 분석했지만, 이 정도로 슬픔값이 높은 분은 참 흔치 않았습니다. (ㅎㅎ) 암튼, 그럼에도 불구하고 슬픔 다음 값이 행복감이라고 할 수 있을 정도로, 이 사진에선 은근히 긍정 비율이 있는 편이에요. 



그렇다면, 여기서!!!! 청와대 민정수석이었으니까, 이번엔 박근혜 대통령을 바라보는 모습!을 확인해보도록 하겠습니다. 


"scores": {
      "anger": 0.000128584186,
      "contempt": 0.00139316765,
      "disgust": 0.0000204426069,
      "fear": 4.1267208e-7,
      "happiness": 0.0000277560866,
      "neutral": 0.99662447,
      "sadness": 0.001768005,
      "surprise": 0.0000371851274
    }

그저 평온한 느낌이네요... 약간 슬프고 경멸스러워하긴 하지만 이 정도 값이면 뭐... 무시해도 되지 않을까 싶습니다...



"scores": {
      "anger": 0.00001031605,
      "contempt": 0.0000633868549,
      "disgust": 0.00000606544154,
      "fear": 1.265436e-7,
      "happiness": 0.000007915672,
      "neutral": 0.9943095,
      "sadness": 0.00554948673,
      "surprise": 0.0000532410377
    }

이쯤되면 이분이 전반적으로 좀 슬픈 분이라고 봐야할 것 같지만(ㅋㅋ) 대통령에 대해선 대부분 중립적인 표정을 짓고 있습니다. 뭐 임명장 같은 걸 받을 땐 웃고 있지만, 그런 건 일단 눈빛이 제대로 나오지 않으니 제하기로 하지요. 

참고로 청와대 시절 우병우 전 수석 사진들은 대부분 처가 땅투기 의혹 얘기가 나오던 시기에 실린 기사 사진들이랍니다. 아무래도 좀 암울한 사진들이 많겠죠. 하지만 그 전엔, 이분이 그리 뭐 자주 실릴 양반도 아니고(검사시절은 제외하더라도...) 그러다보니 더 부정적인 얼굴들이 많이 나오는 것일 수도 있겠지요. 

그렇다면, 여기서 문제!! 조선일보 사진기자가 찍은 '친정방문샷'의 결과는 어떨까요? 정답은,


"scores": {
      "anger": 0.00491771568,
      "contempt": 0.00495274225,
      "disgust": 0.002333943,
      "fear": 0.000603230554,
      "happiness": 0.0426047444,
      "neutral": 0.9296485,
      "sadness": 0.00951580051,
      "surprise": 0.005423305
    }

그래도 행복감이 좀 있는 편이네요ㅋ neutral 너무 많이 나와서 좀 실망스럽긴 합니다만.


그리하여 감히 마무리를 짓자면, "여기자가 예뻐서라기보단 빡쳐서 째려본 거 맞다!" 라는 결론을 내려봅니다. 







그리고 진짜 마지막으로... MB시절 검찰개혁안 및 감찰 의혹 등등과 관련해 검찰간부들로부터 사퇴요구를 받던 한상대 당시 검찰총장이 옷을 벗기 전 인터뷰 사진인데요. 당시에 이 자도 이런 사진이 찍혔더랬습니다! (후후 저 여기자가 바로 저예요. A형이라 뒤끝이 좀 있져ㅎㅎ) 여기는 여기자가 안 예쁜데도(!!) 이런 눈빛이 나왔단 말입니다. 이분의 얼굴에서 스믈스믈 우러나는 그 감정을 진짜 진심 걍 한 번 넘나 궁금해서 확인해 봤는데요.


"scores": {
      "anger": 0.0009859364,
      "contempt": 0.0008371636,
      "disgust": 0.000334082171,
      "fear": 0.01186428,
      "happiness": 0.0006033637,
      "neutral": 0.8842088,
      "sadness": 0.0209913366,
      "surprise": 0.08017502
    }

이유는 알 수 없지만 많이 놀라셨네요. 풀어 쓰면... '헐 뭐지 이 @#$^#$%^%는?' 이런 느낌이었나. 



대통령의 사과문, 누구 것과 가장 비슷할까?

analysis

'형태소 기반' 코사인 유사도만 구해보면... 양승태 대법원장 사과문-박근혜 당시 후보의 2012년 사과문-조현아 땅콩회항 사과문 순으로 비슷

가장 먼 것은 고 노무현 전 대통령의 2009년 사과문


▲이미지 하나쯤은 넣어야 겠으니 청와대 출처 사진 한 장 첨부...



할 일이 엄청 많지만 그래도 궁금한 것은 빨랑 풀어봐야만 하므로, 이번 박근혜 대통령의 사과문(2016.11.05)은 과연 누구의 사과문과 가장 비슷할 지 한 번 돌려봤다. 전에 짜 뒀던 코사인 유사도 코드를 살포시 다시금 꺼내보았고, 통상 명사기반을 많이 쓰고는 있지만 사안이 특수한(?) 관계로 형태소(morpheme)를 중심으로 살펴봤다. (주로 쓰인 문장 성분 같은 것을 비교한 것이다. 어투 등을 살필 때 유용하다.) Konlpy의 Twitter 분석기를 사용했다. (속도를 좀 높여야해서...) 

함께 분석 대상으로 삼은 문서는 다음과 같다. 


박근혜 대통령의 최순실 사태 2차 사과문 (대국민담화) vs. 


1. 박근혜 당시 대선 후보의 2012년 과거사 관련 사과문

2. 박근혜 대통령의 최순실 사태 1차 사과문

3. 이명박 전 대통령의 2012년 가족 연루 비리 사과문 

4. 노무현 전 대통령의 2009년 가족 연루 비리 사과문

5. 노무현 전 대통령의 2005년 시위 농민 사망 대국민 담화

6. 양승태 대법원장의 2016년 현직 부장판사 비리 사과문

7. 조희연 서울시교육감의 2016년 비서실장 비리 사과문

8. 신동빈 롯데그룹 회장의 2015년 롯데 사태 사과문

9. 이재용 삼성그룹 부회장의 2015년 삼성서울병원 메르스 사태 사과문

10. 조현아 전 대한항공 부사장의 2015년 땅콩회항 사과문(A4 3장 짜리)


이 가운데 가장 유사도가 높은 것은 양승태 사과문이었다. 0.3590이라는 높은 수치를 보였고, 그 다음을 본인의 2012년 사과문(0.3570), 조현아 사과문(0.3484)가 이었다. 조직 관리에 대한 사과, 개인 잘못에 대한 사과 등 사과의 원인 종류에 따르기보다는... 아무래도 형태소를 중심으로 분석했다보니, 형용사와 명사의 배치가 많이 겹치는 경우가 많이 걸린 것 같다. (재밌다면 재밌을 수 있지만, 박근혜의 2012년 과거사 사과문과 신동빈 회장의 롯데사태 사과문의 코사인 유사도가 가장 높게 나왔다.(0.5393!!) 흠, 명사 기준이라면 '아버지' 뭐 이런 말이 겹치니 그럴 수도 있겠다만...) 


그래서 또 궁금한 걸 참지 못하고 명사를 기반으로 하는 코사인유사도도 살펴봤다. <박근혜 2012 사과&조현아 땅콩사과(0.2968)>, <박근혜 2차 사과&양승태 사과(0.2940)>, <박근혜 2차 사과&MB 사과(0.2890)> 순으로 높았다. 


다시 돌아가서, 형태소를 기반으로 하는 기타 다른 '박근혜 문서'와의 차이도 좀 봤다. 대상은 2013년 취임사, 2015년 9개월 어치의 공식 대통령 연설문, 그리고 2012년 후보시절 사과, 2016년 최순실사태 1차 사과, 2차 사과 이렇게 총 다섯 개 문서다. 


가장 유사도가 높은 것은 <2013년 취임사-2015년 9개월 말뭉치(0.7160)>였고, 그 다음을 <2012년 사과와 2015년 9개월 뭉치(0.6676)>, <2012년 사과와 2015년 신년사(0.6129)>가 이었다. (설마 CSS 영향인가...) 그리고 그 외의 문서들과의 연관성은 아주 '현저히' 떨어지는 경향을 보이는데, 이를테면 이번 2차 사과문의 경우 ^취임사 (0.3875) ^2015년 연설문 (0.4235) 등의 수치를 보였다. 사과문이니 다를 법도 하지, 싶으면서도 그러면 2012년 사과문은 왜 유사도가 높은가- 뭐 그런 생각도 든다. 참고로 1차 사과문과 2차 사과문의 유사도가 가장 낮다. (0.2787)... 원체 1차 사과문의 유사도가 타 문서들(앞서 분석한 타 사과문들)과 비교해 많이 낮은 편이긴 하지만, 워낙 짧기도 하고 하니 뭐 그럴 수도 있겠지 싶으면서도- 2차 사과문과 너무나 많이 달라진 것을 보면 또 '같은 사람이 쓴 건 아니구나' 싶은 생각을 들게 하기도 한다. (내가 이렇게 만연체로 쓴다는 건 뭔가 미심쩍다는 소리다. ㅎㅎ) 


아무튼, 이제 KOSAC을 활용한 감정 분석을 좀 해볼까 하는데, 이건 말뭉치를 아마 언어학연구실을 통해 받아야하는 모양이다. (고백컨대 아직 한 번도 안 돌려봤...ㅠ) 언젠가는 To be continued... 


그리고 혹시나 본인 코드로 돌려보고 싶으신 분들을 위해, txt 형태 사과문들 뭉쳐 압축파일로 아래 첨부합니당. (내 코드는 안알랴줌...이 아니라 아직 넘나 부끄러운 관계로 나만 바라봐...)  


사과문.zip


'돈도 실력'이라기에 분석해 본 실력자의 말타기 성적

analysis
***(11/8 첨언: "저 아래, 비어있는 바로 그 기간이 출산 및 육아 기간이었다니 ㅎㄷㄷ 그것은 상상도 못하였거늘...)***


유라 양이 돈도 실력이라기에 닫았던 블로그를 다시 열었습니다. (개인 블로그에 괜히 이 분의 흔적을 남겨봐야 기분만 나쁠 것 같아서, 이건 이런 공공 블로그에...)

1996년 생으로 이제 겨우 스무살이 넘은 정유라 양이 아주 말버릇이 없더군요. 이런 건 초장에 고쳐야 하는데, 부모님이 신경을 많이 못 쓰시나...

참고기사: 딸을 향한 정윤회의 애착... 말 목장까지 계획 http://www.ohmynews.com/NWS_Web/View/at_pg.aspx?CNTN_CD=A0002036160 )
유라 양의 주종목은 마장마술입니다. 자세한 건 이 링크를 참조. (http://www.krj.co.kr/hbns/new_hbns/index.phtml?mode=view&vcode=601004&view_id=20110000630)

다른 건 아니고, 제가 말을 잘 아는 사람은 아니니 숫자만 볼 수 밖에요. 팩트만 나열할테니, 잘 아시는 분은 댓글로 설명좀...
최근 국제경기(국제승마협회 FEI 기재 http://www.fei.org/athlete/10110814/CHUNG-Yoora) 성적을 좀 봤습니다.

참고로 올해에만 5개 대회에 참가했는데(세부 종목까지 치면 19개...), 세계 랭킹은 561위네요. 분발하셔야할 듯 합니다.
하지만 높은 레벨의 대회에서 우승하면 순위가 팍팍 뛰기도 하더라고요. 그 얘기는 높은 레벨 대회에 참가할 자격이 있어야 한다는 말인데...

아무튼, 제가 말은 잘 모르지만 말마다 차이가 있는 건 아니까 말별로 성적을 뽑아봤답니다. 그래프는 타블로를 활용했습니다.



보시면 알겠지만, 점수가 높았던 것 로얄레드2를 타고 달릴 때인데, 온전히 유라양의 소유인 말이죠... 고득점한 경기2014 인천아시안게임때네요. 홈에서 강한 모습을 보입니다!
*랭킹으로 치면, 아시안게임 1년 뒤인 2015년 11월 zakrzow 대회 3위 성적이 있긴 합니다.
로얄레드2를 마지막으로 탄 게 올 2월인데, 이후엔 다른 말로 갈아타고 성적 GG치고 있지요.

...로얄레드2, 살아있니?...

이후엔 삼성이 비타나V를 사줬다는 이야기가 나왔습니다. (http://gustips.tistory.com/102) 정말로 타기 시작한 지 얼마 안 됐네요!


말은 잘 모르지만, 유라 양이 높은 성적을 보인 종목은 대부분 세인트조지 레벨(Prix St.George)인데요. 그 외엔 대부분 인터미디어트네요. (올해 나간 그랑프리에선 59.03점으로 개인통산 역대 두 번째로 낮은 점수를 받습니다 ㅠㅠ 등수는 16등인데, 참가 선수 수를 모르겠네요. 15등 안에 들어야 프리스타일을 한다는데...)

관련해선 승마협회에서 친절하게 설명서도 내 주었는데요.

20130717162313511_마장마술규정(2013).hwp

2. 세인트조지(Prix St. Georges) - 중급 수준의 경기종목 이 경기종목은 중급 수준의 훈련에 해당한다. 고전승마를 시행할 때의 모든 요구사항 그리고, 조화롭고, 민첩하고, 쉽게 이행할 수 있는 육체적, 정신적 균형과 발전의 수준에 대한 말의 복종을 보여주는 운동도 포함한다. 3. 인터미디어트 I(Intermediate I) - 중 상급 수준의 경기종목 이 경기종목의 목적은 말의 정신과 마체에 해를 끼치지 않으면서, 세인트조지 종목의 정확한 이행부터 인터미디어트 II처럼 더 힘든 단계의 연습을 점진적으로 이행하는 것이다.


이런 말도 있네요. 


세인트조지. 다음의 경우를 제외한 모든 말이 참가할 수 있다:

지명참가일 전, 그랑프리, CDIO, 국제승마연맹 선수권대회, 올림픽대회에서 상위 15위까지 입상한 말

지명참가일 전, 인터미디어트 II, CDI3*, CDI4*, CDI5*, CDIO 그리고 이 등급 이상의 경기에서 3회 이상 우승한 말

만약 (위의 수상에 참가한 선수가 아닌) 다른 선수가 (위의 수상 후) 해당 말을 타는 경우는 제외한다.


암튼, 선수로서 얼마만큼 뛰어난 지는 숫자상으론 그리 '실력자'라고 하기만은 어려울 수도 있을 것 같습니다. CDI는 성인 선수를 대상으로 하는 국제경기인데, 외국인이 15명 이상이면 된다... 이런 이야기도 있고요. 물론 국제대회 나가는 건 정말 대단하긴 합니다. (...)


그런데 말입니다. 요건, 유라 양이 국제대회에서 거둔 등수 그래프인데요. 등수는 그렇다 치고, 이상한 게 있지요!



14년 이후 1년 가까이 비어있어요. 실제로 2014년 9월 21일 이후 첫 경기가 프랑스 남부 비아리츠에서 열린 2015년 10월 9일 경기랍니다. 이후엔 진짜 열심히 꾸준히 나가더군요. (그래서 독일에...) 다만, 이 친구가 이화여대 입학한 게 2015학번이니까... 학교를 열심히 다니느라 그랬나? 싶긴 하지만, 현재 이화여대 반응을 보면 그렇지가 않네요. 


마지막으로 2014년 당시, '정윤회 딸이라 봐주냐!'는 말에 대해 승마협회가 낸 공식 자료가 마침 있길래 올려 봅니다.  

[0414]승마협회 참고자료.hwp


내용인즉, 정유라 양은 훈련 받을 데도 없는 불쌍한 '실력자'니 훈련장소 내 드리는 것은 당연하다, 다른 선수들에게도 으레 그래왔다... 이런 이야기입니다. 그리고 실력있다. 이런 이야기. 

아버지 정윤회씨가 따님 전용 말목장을 만들려고 2004년에 사둔 평창 일대 땅에 2009년부터 공사 시작해놓고, 중도에 그만 뒀는데요. 뭐 시점이 대략 맞물리는 건 아닌지... (때마침 2011년 7월에 평창이 올림픽 개최지로도 선정되기도 했고...)


▲위쪽에 첨부한 오마이뉴스 기사 일부 발췌



암튼, 유라 양. 실력 운운하기에 앞서, 본인의 스탯과 인성에도 신경 써 주시길. 


진짜 마지막으로, FEI에 올라온 개인 소개... 



음, 아빠 이름은 물론 박근혜 대통령 이름까지 같이 거론됐는데 이걸 누가 알고 찾아서 올려준 건지.. (그나저나 도쿄에 대한 포부는... 네, 아니 뭐 이런것까지 바이오그래피에......) *참고로 김동선 선수의 경우에도, 한화 김승연 회장의 아들임이 나와있답니다. 하지만 그건 그거고, 정윤회가 이렇게까지 글로벌리 유명한 사람인가...