2010-04-26 4 views
0

이전에 이런 종류의 글을 올렸지 만, 내 원래 질문에만 댓글을 쓰거나 내 자신의 질문에만 답변 할 수있는 방법을 모르겠습니다.HTML을 구문 분석하여 특정 링크를 찾으십시오. (키워드없이)

어쨌든 웹 사이트에서 4 링크를 가져와야합니다. Windows 및 Linux의 최신 안정 빌드 링크와 최신 개발 빌드는 Windows 및 Linux (4 링크 총)에 대한 링크를 C++ 응용 프로그램에서 빌드해야합니다.

프로젝트에 이미 구현 된 LibCURL 페이지 (http://www.sourcemod.net/snapshots.php)를 다운로드 할 수 있지만 그 후에는 확실치 않습니다. 나는 파서를보고 있었지만 링크로부터 링크를 어떻게 구별 할 것인지 생각할 수는 없다. 필자는 파서를 사용하여 각 테이블에서 첫 번째 링크를 얻을 수 있지만 효율적이지 않으며 Windows 빌드에 대한 링크 만 제공합니다.

필자가 필요로하는 링크가 두 테이블에서 모두 4 번째가 될 것으로 보이지만, 나는이 문제를 해결할 수있는 좋은 방법을 잘 알고 있으므로 도움이 될 것입니다.

답변

0

아마도 실제 다운로드 위치 인 http://www.sourcemod.net/smdrop/을 쉽게 파싱 할 수 있습니다.

+0

와우, 어떻게 든 내가 거기 보이지 않았다. 거의 모든 것이 HTML 전체를 정렬하는 것과 비교하면 공원에서 산책을하게됩니다. 버전이 바뀌면 여전히 문제가 될 것입니다 (1.4는 안정되고 1.5는 개발자가됩니다). 그러나 당분간은 이것이 아주 좋습니다! 감사합니다! –

+0

죄송합니다. 5 분 더 답변을받지 못하게됩니다. 잠시 후에 답변을 드리겠습니다. –

+0

글쎄, 아마도 가장 높은 숫자가 개발 버전이고 두 번째로 높은 것이 안정하다고 가정 할 수 있습니다. 비상식 데이터를 파싱하는 것은 언제나 그러한 가정에 항상 의지 할 것입니다 ... – Thomas

0

저는 C++에 너무 익숙하지 않지만 더 좋은 해결책을 찾지 못하면 BeautifulSoup이 Python 용으로 Html을 파싱하고 조작 된 문서를 처리하는 데 정말 좋습니다. 그리고이 글은 embedding Python in C/C++의 CodeProject에 대해 "이 글은 Python보다 C/C++에서 더 많은 경험을 가진 프로그래머를 위해 작성된 것으로,이 튜토리얼은 실질적인 접근법을 취하고 모든 이론적 토론을 생략했다"고 주장했다.

(내가 언급 한 바와 같이 나는 C와 정말 익숙하지 않은, 개인적으로 읽어하지 않은 ++)

관련 문제