2014-02-16 1 views
0

C++에서 간단한 웹 크롤러를 만들고 있습니다. 지금은 시드 URL에서 HTML 코드를 가져 와서 문자열이나 텍스트 파일로 저장했습니다.HTML 코드 C++에서 URL 구문 분석

HTML에서 URL을 찾아서 저장하는 방법 웹 크롤링을 계속하고 싶습니까?

+0

읽은 파일에서 HTML을 구문 분석합니다. 참고 사항 : * 사소하지 않습니다. –

답변

0

이 작업을 제대로 수행하려면 적절한 HTML 구문 분석기가 필요합니다. Gumbo은 Google에서 오픈 소스로 작성한 오픈 소스 HTML5 파서로서 이와 같은 기능을 구현하는 데 사용할 수 있습니다.