자연어처리
[project] Dart crawling
[project] Dart crawling
2020.01.29전자공시시스템 dart 에는 주식시장에 상장된 기업들의 공시정보를 제공합니다. 유가증권시장, 코스닥 시장 외에도 많은 한국의 기업들의 전자정보를 제공하며 따로 dart api 를 제공하기 때문에 비교적 쉽게 데이터를 가져올 수 있습니다. 이중에서도 기업이 매년 공시하는 정기보고서 중 사업보고서를 크롤링하여 가져와보았습니다. 그 중 이사의 경영진단 및 분석의견 항목에는 회사의 전반적인 당년 성과가 텍스트로 나와있습니다. (해당 기업이 전반적으로 적자를 보았다는 내용) 재무제표를 제외한 기업의 당년 평가정보에 대한 텍스트를 저장하여 라벨링해 해당 기업의 성과를 분석할 수 있다면, 또 이를 historical data와 비교하여 어느정도 패턴을 찾거나 상관성을 발견할 수 있다면 유의미한 프로젝트가 되지 않을까..