2011-04-19 4 views
0

웹 페이지에서 데이터를 가져 오는 C++ 프로그램을 작성해야합니다 (URL이 있습니다). 기본적으로 웹 페이지에는 여러 페이지에 걸쳐 거대한 테이블이 있습니다 (다음 버튼).웹 페이지에서 테이블을 읽는 C++ 프로그램

이 전체 테이블을 가져온 다음 각 행을 가져 와서 구문 분석해야합니다 (테이블에는 약 10 개의 열이 있음). 이 각각은 약간의 사소한 처리 후에 유사한 데이터 형식으로 CSV 파일에 저장되어야합니다.

누구나 최선의 방법을 제안 할 수 있습니까? C++에서이 작업을 수행하려면 libs shd가 사용하는 기능이 무엇인지 궁금합니다. 창문에서해야하지만, 플랫폼 독립적/의존적 인 것들을 사용하지 마라.

미리 감사드립니다.

답변

0

나는 이것이 당신이 찾고있는 정확한 답변을하지 않을 수 있음을 알고 있지만이 옵션이기 때문에 ...

당신은 기본 HTTP 원시 소켓 GET 생성 할 수 있으며, 다음 테이블을받을 것 HTML 형식. 그런 다음 구문 분석 만하면됩니다 (XML 파서를 사용하거나 테이블이나 특정 ID를 찾는 수동). 결과를 얻으십시오.

나는 이것이 최고의 "사용 준비가 된"해결책은 아니지만 여전히 효과가있을 수 있음을 알고 있습니다.

2

libcurl을 다운로드하십시오. 그것은 빠르며 HTTP를 직접 다룰 필요가 없습니다.

C++에서 XML을 구문 분석하기위한 많은 라이브러리가 있습니다. this을 참조하십시오.

모두에게 호의적이며 HTML을 정규 표현식으로 구문 분석하지 마십시오. Cthulhu을 소환합니다.

+0

페이지 탐색 방법을 알고 싶습니다. 테이블은 여러 페이지에 걸쳐 있으며 테이블의 맨 아래에 다음 페이지 번호가 있습니다. 이제는 __doPostBack (일부 args) 함수를 호출하는 javascript coee에 매핑됩니다.이 함수는 차례로 submit 양식을 호출합니다. 나는 이것을 달성하는 방법을 알고 싶다. – AMM

관련 문제