2017-05-23 2 views
-2

다음과 같이 텍스트 서식을 지정하는 HTML 페이지가 있습니다. 같은 서식으로 텍스트 파일을 생성하고 싶습니다.html 페이지를 텍스트 파일로 변환하는 방법은 무엇입니까?

Text1                 Text2 

    This is the paragraph1 

    Text 

    01.03.2017 
    This is the paragraph 2 

현재, 나는 html2text 클래스를 사용하고 있지만 내가 가진 출력이 다른,이 출력 아래이 표시

include("html2text/html2text.php"); 
    $text = convert_html_to_text($my_var); 

은 한 줄에

Text1 Text2 This is paragraph 1 Text 01.03.2017 This is the paragraph2 

그래서 모든 것을 생성합니다. 그러나 HTML 문서를 렌더링 할 때와 같은 형식으로 원합니다. 이것을 어떻게 성취합니까?

답변

0

HTML 파일에 HTML 태그가 없으므로 텍스트로 변환 하시겠습니까? 이미 텍스트 파일입니다.

$ my_var 변수에 "pre"태그를 추가 할 수 있습니다. 사용하는 라이브러리는 태그 내부의 공백을 보존합니다.

그래도 작동하지 않으면 모든 이중 공간을 다른 문자열로 바꾸고 변환을 수행 한 다음 문자열을 다시 이중 공간으로 바꿀 수 있습니다.

+0

아니요 텍스트 파일이 아닙니다. html 파일이므로 브라우저 출력을 보여줍니다. –

+0

그는 이것을 반대로하고 싶습니다. https://stackoverflow.com/questions/43996613/how-to-get-text-from-word-file-using-php-accurately. HTML – RST

+0

에서 Word 파일을 만듭니다. @ RST.this는 완전히 다른 문제입니다.이 문제에 대한 해결책이 있습니까? –

0

이것은 기본적으로 스타일 문제입니다.

일부 배경의 경우 Cascading Style Sheets (CSS)을 살펴 보시기 바랍니다. 브라우저는 CSS 코드를 사용하여 HTML을 사용자에게 렌더링하는 방법을 결정합니다.

즉,이 문제는 스타일을 지원하는 문서 형식에 대해서만 자동으로 해결할 수 있음을 의미합니다. HTML + CSS를 입력으로 사용하는 변환기를 찾아 원하는 형식으로 출력 할 수 있습니다. 예를 들어, pandoc을 살펴보십시오.

일반 텍스트의 경우이 문제는 자동으로 해결할 수 없습니다. 부정적인 공백이나 공백을 입력 된 공백으로 변환해야하지만 정확히 필요한 공백의 정도를 결정하는 것은 상당히 어렵습니다.

관련 문제