현재 웹 사이트의 보이는 텍스트를 읽고이를 Java를 사용하여 일반 텍스트 문자열에 저장할 수있는 방법을 찾고 있습니다.HTML 2 텍스트 - "숨겨진"텍스트 제거
즉, 나는 이런 식으로 뭔가를 변환하고 싶습니다 :
Hello <span style="display: none">stupid</span> World
을 "안녕하세요"
나 같은 "비우"(그리고 무엇인가 "에
<span>Un</span>friendly
같은으로 유엔 친화적 ")
또는
Hello
World
,
을 "Hello World"로 변경하십시오 (HTML에서는 새로운 행이 무시 됨).
이 작업을 지원할 수있는 라이브러리가 있습니까?
건배,
마티아스
정규식을 사용해 보셨습니까? ;) –
필요한 것은 HTML 렌더러의 일종입니다. – adarshr