텍스트 마이닝(text mining)은 대규모 텍스트 자료에서 육안으로 읽고 분석하기 힘든 정보를 추출하고 이를 분석하는 기법을 의미한다.
한은은 "텍스트 마이닝은 또 중앙은행이 자체적으로 통화정책 커뮤니케이션을 진단하는 도구로 활용 가능함을 시사한다"고 밝혔다.
한은은 "텍스트 마이닝으로 중앙은행 커뮤니케이션을 지수화하면 해당 커뮤니케이션의 어조 혹은 강도가 중앙은행이 의도한 바와 일치하는지 여부를 점검할 수 있다"고 밝혔다.
또한 금융통화위원회 전후 기사들의 어조 변화를 통해 통화정책의 충격을 측정하고, 이것이 금융시장 및 실물경기에 미치는 영향을 분석하는 것도 가능하다고 설명했다.
한은 분석에 따르면 금통위 의사록에서 추출한 지수는 여타 변수에 비해 기준금리에 대한 설명력과 예측력이 높은 것으로 나타났다.
한은은 "기존 테일러준칙의 GDP갭률과 인플레이션율 등과 함께 이번 보고서에서 작성한 금통위 의사록 어조지수를 설명변수로 추가할 경우 과거 및 향후 금리에 대해 상당부분 설명이 가능하다"고 밝혔다.
한은은 "또한 기존에 활용되고 있는 한국의 불확실성지수(EPU 및 UI)등에 비해서도 기준금리에 대한 설명력과 예측력이 높게 나타났다"고 발표했다.
한은은 연구 배경에 대해 "중앙은행 커뮤니케이션이 통화정책의 방향, 경제상황에 대한 판단 등이 포함돼 시장의 기대에 즉각적인 영향을 미칠 수 있는데도, 중앙은행 커뮤니케이션은 절제된 표현이 많아 내재된 정보를 추출하고 그 영향력 등을 분석하는데 한계가 있다"며 "이에 텍스트 마이닝을 활용해 금통위 의사록에 담긴 어조를 추출해 지수로 편제하고 기준금리 변동에 대한 설명력과 예측력을 검정하고자 했다"고 밝혔다.
이번 분석을 위해 지난 2005년 5월부터 2017년 12월 중 약 23만 건의 신문기사와 채권 애널리스트 보고서, 금통위 의사록에서 추출한 형태소 조합(n-gram)을 분석해 감성사전이 구축됐다.
감성사전은 특정 형태소 조합(예: 금통위 금리 인상)이 지닌 극성을 규정한 사전을 의미한다. 예를 들어 금통위 금리 인상은 매파적이라는 것에서 문장의 극성을 사전에 정의된 형태소 등장 여부나 횟수 등으로 판단한다.
김경목 기자 kkm3416@fntimes.com