2011-03-09 4 views
2

현재 웹 사이트의 보이는 텍스트를 읽고이를 Java를 사용하여 일반 텍스트 문자열에 저장할 수있는 방법을 찾고 있습니다.HTML 2 텍스트 - "숨겨진"텍스트 제거

, 나는 이런 식으로 뭔가를 변환하고 싶습니다 :

Hello <span style="display: none">stupid</span> World을 "안녕하세요"

나 같은 "비우"(그리고 무엇인가 "에

<span>Un</span>friendly 같은으로 유엔 친화적 ")

또는

Hello 

World 
,

을 "Hello World"로 변경하십시오 (HTML에서는 새로운 행이 무시 됨).

이 작업을 지원할 수있는 라이브러리가 있습니까?

건배,

마티아스

+0

정규식을 사용해 보셨습니까? ;) –

+0

필요한 것은 HTML 렌더러의 일종입니다. – adarshr

답변

0

Cobra을보고 API가 HTML을 렌더링하고 일반 텍스트로 변환하는 방법을 제공하는지 확인하십시오.