좀 HTML을 구문 분석하고있어, 나는 body 태그의 모든 HTML을 얻을 필요가있다. 내 목표 문자열은 항상 다음과 같이 보일 것입니다 :Regex를 사용해도 안전합니까? (HTML)
<body><div><img src="" />text etc</div></body>
하지만, 난 그냥 필요
<div><img src="" />text etc</div>
내 목표 문자열이 항상 시작하고 그 body 태그로 끝납니다. 그러나 Regex를 사용하여 HTML을 구문 분석하지 말라는 반복적 인 경고가 있지만 현재 Regex 외에도 사용 가능한 솔루션이 없습니다.
질문 :는 안전 정규식 (들)이이 경우에이 사용할 수 있습니까? 아니면 그냥 잊어야합니까?
이 실제로 무엇을 "나는이 순간에 정규식 이외의 것을 사용할 수에 대한 모든 가능한 솔루션을 필요가 없습니다"는 HTML에서 추출하고 의미? 왜 당신은 실행 가능한 솔루션을 가지고 있지 않습니까? * 실현 불가능한 솔루션을 사용하는 것이 최선이 아닌가? –
내 논리와 수사학 선생님처럼 들리 네. 하지만 네, 맞습니다. 내가 지금 사용하고있는 해결책은 문제이지만, 지금 내가 가진 최선의 해결책이다. 내가 사용하고있는 DOM Parser는 요소 자체의 태그가 그대로있는 요소의 innerHTML을 반환합니다. 즉 내부의 HTML뿐만 아니라 전체 요소를 반환합니다. Regex에서 내부를 추출해야합니다. – mattsven