HTML 문서의 텍스트 파일에 대한 모든 링크를 검색해야하는데, 가장 좋은 방법은 무엇인지 모르겠지만, 나는 루비에서 다음을 시도했다. 이있는 경우.* .txt 파일에 대한 모든 링크를 모으는 것
line.scan(/<a href="([\w+:\/.-]*.txt)/)
하지만이 표현이 가능한 모든 링크 파일을 텍스트 가리키는 커버 확실하지 않다, 나는 궁금 일부 내장이에 대한 정규 표현식? 또는 거대한 웹 페이지의 텍스트 파일에 대한 모든 링크를 검색하는 더 좋은 방법을 아는 사람이라면.
사용에게 DOM 파서를 모든 링크를 수집 한 후 정규 표현식을 사용하여 모든 링크의 배열을 검색하여'.txt'로 끝나는 링크를 찾으십시오. 두 정규 표현식을 사용하여 두 작업을 수행하지 마십시오. – CanSpice