40,000 개의 HTML 파일이 있습니다. 각 파일에는 특정 회사의 이익 진술 & 손실 진술이 포함 된 표가 있습니다.Stata로 데이터 스크랩
이 모든 데이터를 Stata로 스크랩하고 싶습니다. (또는 Excel/CSV 파일로). 최종 제품은 모든 회사의 목록과 대차 대조표 (수익, 이익 등)의 목록이 포함 된 Stata/Excel 파일이어야합니다.
어떻게 수행 할 수 있는지 알고 있습니다. 나는 Outwit을 시도했지만 충분하지 않은 것 같습니다.
없습니다. 어떤 의미의 프로그램을 추출하지 않고도 어떤 프로그램도 의미를 추출 할 수 없습니다. 특정 파일 구조의 예제를 제공하고 다른 소프트웨어에서 어떤 코드가 작동하는지 확인해야만이 문제를 해결할 수 있습니다. –