페이지에서 모든 링크를 추출하고 싶습니다. HTML:LinkExtor
을 사용하고 있습니다. HTML 콘텐츠 페이지 만 가리키는 모든 링크를 어떻게 추출합니까?Perl의 HTML 페이지를 가리키는 JavaScript의 링크를 어떻게 추출합니까?
또한 링크의 이러한 종류를 추출 할 수 없습니다 :
javascript:openpopup('http://www.admissions.college.harvard.edu/financial_aid/index.html'),
편집 : HTML 페이지 - 텍스트/HTML을. 나는 그림 등을 인덱싱하지 않을 것입니다.
정확히 "HTML 콘텐츠 페이지 만"은 무엇입니까? 즉, 어떤 종류의 링크를 추출하지 않으시겠습니까? – innaM