딥서치 - 뉴스 분석 API

뉴스 분석 API 는 뉴스를 기반으로 한 서비스를 개발하고자 할 때에 기반 데이터를 제공하여 줍니다. 다양한 주제로 뉴스를 검색할 수 있도록 제공하고, 그 뉴스에 대한 분석 결과를 제공합니다.     □ 개요

뉴스 분석 API는 뉴스를 기반으로 한 서비스를 개발하고자 할 때에 기반 데이터를 제공하여 줍니다. 다양한 주제로 뉴스를 검색할수 있도록 제공 하고, 그 뉴스에 대한 분석결과를 제공합니다.

□ 특징

수집된 뉴스 데이터를 바탕으로 머신러닝 기술을 바탕으로 다음과 같은 분석을 수행하여 API 형태로 제공합니다.

ㄱ. 어떤 기업과 연관되어 있는 뉴스 인가?

뉴스 본문에 언급되어 있는 기업을, 당사가 보유하고 있는 기업 리스트와 대조하여, 어떤 기업에 대한 뉴스인지를 판단하는 과정을 거칩니다. 연관 기업에 대한 정보는 기업명, 사업자 번호, 법인 번호, 상장 기업의 경우 상장 기업 코드 등의 기업 개요 정보를 포함합니다.

ㄴ. 어떤 산업과 연관되어 있는 뉴스 인가?

머신러닝 기술을 이용하여, 각각의 뉴스가 어떤 산업에 대한 뉴스인지 분류합니다. 10차통계산업분류의 산업 코드 중, 금융업, 제조업, 의약업, 출판업, 부동산업, 식료품 제조업, 자동차 업 등 약 50여개의 산업으로 분류합니다. 이를 위하여 금융 전문가가 기준에 따라서 약 100만개의 뉴스에 대하여 각각의 뉴스가 어떤 산업에 대한 뉴스인지를 태깅하였으며, 태깅데이터를 딥러닝으로 학습하여 산업을 자동으로 분류하는 모델을 개발하였습니다

ㄷ. 센티멘트의 분석

개별 뉴스가 긍정적인 뉴스인지, 부정적인 뉴스인지를 판단합니다. 긍부정의 판단은 단순히 기사의 뉘앙스나, 포함된 단어의 긍부정 여부에 따라 결정하지 않고, 전체 기사 본문의 내용에 따라 결정됩니다. 예를 들어, 회사 실적의 상승, 신제품의 출시 등의 내용에 대해서는 긍정을, 실적의 감소, 횡령 등 불미스러운 사건의 발생 등에 대해서는 부정으로 태그됩니다. 이를 위하여, 기업의 긍부정 여부를 구분할 수 있는 가이드 문서를 작성하고,이 가이드 문서에 따라서 약 100만개의 뉴스를 수작업으로 태깅하였습니다. 이후, 태깅된 결과를 머신러닝 기술을 기반으로 학습하여 모델을 만들고, 이 모델을 바탕으로 전체 뉴스에 대한 센티멘트 분석을 수행합니다.

ㄹ. 중요도의 분석

하루 약 5만개의 뉴스가 수집되고 있으며, 이 뉴스 중 어떤 뉴스가 중요한 뉴스인지를 판단합니다. 이를 위하여, 매 10분 단위로 최근 12시간의 뉴스들을 이슈별로 묶고, 각 이슈가 얼만큼 중요한 이슈인지를 판단하는 과정을 거칩니다. 이슈의 중요도는 얼만큼 많은 뉴스가 연결되어 있으며, 얼만큼 빨리 뉴스가 업데이트 되고 있는지 여부등을 가지고 판단합니다.

ㅁ. 트렌드의 분석

과거 20년치의 뉴스 데이터 분석 결과를 바탕으로 특정 이벤트가 언제 발생했는지를 분석하여 제공합니다. 예를 들어, 북한 핵실험이 언제 발생했는지에 대한 분석을 뉴스 데이터를 기반으로 수행합니다. 과거 20년치의 뉴스에서 북한 핵실험에 대한 뉴스가 매일의 뉴스에서 차지하는 비중이 크게 증가한 시점을 북한 핵실험이 발생한 날짜로 가정할 수 있습니다.

□ 상품 제공 범위

국내 500만개의 상장/비상장/외감/비외감 기업, 30년간의 재무정보 및 기업정보, 뉴스, 공시, IR, 증권사 리포트, 시장 전문가의 분석 글, 국가통계자료, 특허 정보, 신용 정보, 환율, 유가, 각종 경제지표 등 다양한 금융빅데이터를 통합하여 정확한 데이터를 검색할 수 있으며 연산엔진을 통해 복잡한 연산 과정을 생략하여 손쉽게 재무정보 분석을 할 수 있습니다.

□ 상품 컬럼(속성) 정보

1.기업검색

사업 영역, 관련 키워드, 산업, 주소, 설립일, 대표이사, 재무 정보, 시장 정보 등 다양한 조건으로 원하는 기업을 쉽게 찾을 수 있습니다.

2.문서검색

사용자가 분석하기 원하는 이벤트를 손쉽게 정의하고, 특정 기업, 산업 혹은 나의 포트폴리오에 어떻게 영향을 미치는지 분석할 수 있습니다.

3.산업분석

해당 산업에 어떤 기업으로 구성되어 있고, 산업에서 차지하는 비중이 어떠한지, 내가 분석하고자 하는 기업이 해당 산업에 어떠한 위치에 있고, 어떻게 평가할 수 있는지 등 산업에 대한 깊이 있는 분석을 손쉽게 진행할 수 있습니다.

4.감성분석

내가 분석하고자 하는 제품이나 기업, 인물 등에 대해서 최근 20년간 해당 키워드에 대한 Sentiment 변화를 분석해 볼 수 있습니다. 특히 특정 주제에 대한 부정적인 이슈만을 모아서 살펴봄으로써 빠르게 위기에 대응할 수 있습니다.

5.이벤트분석

문서 검색은 20년 이상의 뉴스, 공시, 증권사리포트, IR, 알파 문서 등 총 1억건 이상의 다양한 문서를 다양한 조건으로 검색하고, 이와 관련된 기업을 손쉽게 추출할 수 있도록 제공합니다.

6.마인드맵

마인드맵은 특정 키워드와 관련된 주제, 최근의 이슈, 관련된 기업 및 산업 등으로 확장하고, 각각의 주제가 어떻게 관련되어 있는지를 분석하여 제공합니다. .

데이터와 리소스

추가 정보

필드
소스 http://www.datastore.or.kr/product/api/3f37cdab-ff51-48bf-9d8c-8a9556a5efe0
저자 딥서치
버전 2019-07-16
가격 18,000,000원