이 질문은 R 프로그래밍 질문이 아니지만이 질문이 (거의) 닫히기 전에 어쨌든 몇 가지 의견을 남기겠다.
다음과 같이 요약 할 수 있습니다. 지출 할 돈이 있더라도 섹터와 시장에서 신뢰할 수있는 기본 데이터를 확보하는 것은 충분히 어렵습니다. 당신이 미국을 바라보고 있다면 많은 옵션이 있지만, 모든 주요 (상대적으로 신뢰성있는) 공급자는 매월 수천 달러를 필요로합니다 - FactSet, Bloomberg, Datastream 등. 가치있는 일이라면, 나는 기본적인 데이터를 가지고 작업하고 FactSet을 사용합니다.
일반적으로 말해서 각 공급자가 제공하는 Excel 도구가 더 성숙하기 때문에 스프레드 시트에 데이터를 채우고 데이터를 R로 읽어들이는 것이 더 쉬웠다. 다시 한 번 나는 몇 가지 기본 사항을 다루고있다. "알려진"회사의 도메인을 벗어나면 비정상 상태를 확인하는 데 걸리는 시간이 기하 급수적으로 늘어나기 때문에 대부분의 경우 수십 개의 회사가 있습니다.
수많은 잠재적 인 "잡았다"가 있습니다. 가장 확실한 정의는 부문마다 다릅니다. 산업 회사의 "판매"는 예를 들어 은행의 "판매"와 매우 다릅니다. 또 다른 문제는 정의의 변화입니다. 거의 매년 회계 규정 또는 기타 변경 사항을 적용하고 데이터 계열을 손상시킵니다. 지난 해 소수 민족은 으로 여기에으로보고되었지만, 올해는이 항목이 P & L의 다른 위치로 이동되었습니다.
또 다른 문제는 기업 자체가 변하는 것입니다. 예를 들어 합병, 인수 및 분사를 어떻게 처리 할 수 있습니까? 이런 종류의 일은 불가능한 다음으로 유기적 인 매출 성장을 측정 할 수 있습니다. 또 다른 염두에 두어야 할 점은 운영 또는 순이익을 다루는 경우 예외 사항과이를 조정할지 여부를 고려해야한다는 것입니다.
미국 이외의 회사와의 거래는 더 많은 문제를 추가합니다. 물론 주요 데이터 제공 업체는 전 세계적으로 표준화를 시도합니다 (예 : FactSet Fundamentals). 이것은 추상화의 또 다른 계층을 추가하고 일반적으로 데이터가 어떻게 조작되었는지 확인하기 어렵습니다.
요약하면 데이터를 가져 오는 것은 번거롭고 신뢰할 수있는 무료 소스를 알고 있습니다. 매우 동 질적 인 회사 그룹에 대해 가장 단순한 항목을 다루지 않는 한, 데이터가 있더라도 웜의 깡통입니다.
예, 블룸버그 서브 스크립 션을 사서 RBloomberg를 사용하십시오. 진실하게, 당신은 자유로운 자료로 제한된 경우에 많은 선택권이 없다. –
감사합니다. Joshua, RBloomberg도 있습니다. 그러나 몇 년 동안 무료로 액세스 할 수있는 데이터가 있습니까? 우리가 무료로 데이터를 얻을 수 있다면 훨씬 더 좋을 것입니다 :) – moldovean
나는이 유형의 다른 무료 데이터 소스를 모른다. 그럼에도 불구하고 "자유로운 데이터를 어디에서 얻을 수 있습니까?" 프로그래밍 질문이 아닙니다. –