2014-06-13 1 views
1

이 내용 만 포함 된 .doc 확장자를 가진 단어 파일은 Test1001입니다. 나는이 단어는 나에게 다음과 같은 문자 .doc 확장 파일을 PHP를 사용하여 텍스트 형식으로 변환 할 때

Y, dXiJ(x(I_TS1EZBmU/xYy5g/GMGeD3Vqq8K)fw9 xrxwrTZaGy8IjbRcXI u3KGnD1NIBs 
RuKV.ELM2fiVvlu8zH (W)6-rCSj id DAIqbJx6kASht(QpmcaSlXP1Mh9MVdDAaVBfJP8AVf 6Q 

대신 Test1001

당신이 왜이 문자를 보여주는 것 알고 계십니까

을 보여주는 것 파일을 변환 할 때?

나는 다음과 같은 클래스를 사용하고 있습니다 :

private function read_doc() { 
     $fileHandle = fopen($this->filename, "r"); 
     $line = @fread($fileHandle, filesize($this->filename)); 
     $lines = explode(chr(0x0D),$line); 
     $outtext = ""; 
     foreach($lines as $thisline) 
      { 
      $pos = strpos($thisline, chr(0x00)); 
      if (($pos !== FALSE)||(strlen($thisline)==0)) 
       { 
       } else { 
       $outtext .= $thisline." "; 
       } 
      } 
     $outtext = preg_replace("/[^a-zA-Z0-9\s\,\.\-\n\r\[email protected]\/\_\(\)]/","",$outtext); 
     return $outtext; 
    } 

답변

0

말씀 .doc 형식 바이너리 텍스트가 아닌, 당신은 단순히 당신이 당신의 PHP에서했던 것처럼 그들이 텍스트 있다고 가정 할 수 없다.

Word 파일에서 데이터를 가져 오려면 Word 또는 Word 바이너리 형식을 이해하고 텍스트로 변환하는 라이브러리를 실제로 사용해야합니다.

대부분의 사람들은 .docx 형식을 사용하려고합니다.이 형식은 최신 버전의 Word에서 만들어 지므로 zip 보관 파일에서 XML을 사용합니다. 해당 형식을 처리 할 라이브러리가 많이 있습니다. 예 : PHPOffice.

이진 .doc 형식의 경우 Docvert.doc에서 즉시 HTML로 변환됩니다.

+0

이 doc 파일 텍스트 파일을 변환하는 라이브러리를 알고 계십니까? – Babu

+0

중간 편집에서 나를 붙 잡았습니다. –

관련 문제