수신중인 HTML 소스에서 모든 단일 태그를 분리하려고합니다.RegEx를 사용하여 HTML 소스를 분석하십시오.
나는 거대한 코드 조각이며, 인간 분석을 위해 더 읽기 쉽도록 노력하고 있습니다.
RegEx(<\w*>.*<\/\w*>)
을하지만이 </html>
까지 !DOCTYPE
태그와 실행 '의 beggining을 얻을 : 이 지금까지 난 단지이 정규식 코드까지했다.
그리고 내가하려는 것은 형식과 관계없이 개별적으로 각 태그를 선택하는 것입니다.
또한이 RegEx를 JavaScript로 실행하고 있습니다.
어떤 제안은 매우있는 즉시 문제는 사소한 해결
이번에는 여러 가지 방법으로 문제를 해결하기 위해 사고 방식을 바꾸 었으며, 좋은 라이브러리를 발견했습니다. Jsoup, 그리고 좋은 것 같습니다. 팁을 사용하여 '*?'. 대단히 감사합니다. D –