HTML 양식을 구문 분석하고 포함 된 이미지의 파일 이름을 가져오고 싶습니다.자바에서 정규 표현식을 사용하여 문자열의 내용을 캡처하는 방법
{
이
가 ... 위부터 임의의 HTML 내용
image1.png
more random HTML content
image3.png
... }
가 나는를 작성하려합니다 : 같은
그래서 문자열을 볼 수 있었다 함수는 Java에서 나를 {image1.png, image3.png}으로 반환합니다.마지막 이미지 이름 (image3.png) 만 반환하는 정규 표현식이 있지만 이전 이미지 이름은 무시합니다. 정규 표현식을 사용하여 모든 것을 어떻게 캡처 할 수 있습니까?
전체/모든 도움을 주시면 감사하겠습니다.
이것은 [JSoup] (http : //)와 같은 구문 분석 API에 가장 적합한 작업입니다. jsoup.org/) 또는 [JTidy] (http://jtidy.sourceforge.net/). RegEx는 강력한 도구이지만 실제 WWW HTML에서 정보를 추출하는 데는 시간이 걸리고 또 다시 부족한 것으로 나타났습니다. –