2011-10-05 3 views
0

나는 아랍어 글자가있는 Html로 작업 중입니다. Excel에서 기본적으로 열리는 CSV 파일로 글자를 구문 분석하려고합니다. 나는 문자를 구문 분석하는 Perl 스크립트를 사용하고Perl을 사용하여 csv로 아랍어 글자 읽기

그러나 나는 이것이 CSV 그것을하지 않습니다하지만 아랍어 문자를 저장할 수 있습니다 것

use feature 'unicode_strings';

펄의를 사용하여 생각했다.

방법이 있습니까?

+0

죄송합니다, 이것은 아무도 할 수없는 등의 [좋은 문제 설명] (http://catb.org/~esr/faqs/smart-questions.html) 아니다 ([무엇이 잘못되었는지 재현] http://www.chiark.greenend.org.uk/~sgtatham/bugs.html#showmehow) 우리는 추측을해야합니다. 코드를 보여주십시오. 샘플 입출력을 제공하십시오. – daxim

답변

1
use autodie qw(:all); 
use Web::Query qw(wq); 
use Text::CSV_XS qw(); 

my $csv = Text::CSV_XS->new({binary => 1}) 
    or die "Cannot use CSV: ".Text::CSV_XS->error_diag; 
open my $fh, '>:encoding(UTF-8)', 'm.csv'; 
$csv->print($fh, [wq(
    '<!DOCTYPE html> 
    <html><head><title></title></head><body>&#x645;&#x643;&#x629; &#x623;&#x648; 
    &#x645;&#x643;&#x629; &#x627;&#x644;&#x645;&#x643;&#x631;&#x645;&#x629; 
    &#x647;&#x64a; &#x645;&#x62f;&#x64a;&#x646;&#x629; 
    &#x645;&#x642;&#x62f;&#x633;&#x629; &#x644;&#x62f;&#x649; 
    &#x627;&#x644;&#x645;&#x633;&#x644;&#x645;&#x64a;&#x646;&#x60c; 
    &#x628;&#x647;&#x627; &#x627;&#x644;&#x645;&#x633;&#x62c;&#x62f; 
    &#x627;&#x644;&#x62d;&#x631;&#x627;&#x645;&#x60c; 
    &#x648;&#x627;&#x644;&#x643;&#x639;&#x628;&#x629; &#x627;&#x644;&#x62a;&#x64a; 
    &#x62a;&#x639;&#x62f; &#x642;&#x628;&#x644;&#x629; 
    &#x627;&#x644;&#x645;&#x633;&#x644;&#x645;&#x64a;&#x646; &#x641;&#x64a; 
    &#x635;&#x644;&#x627;&#x62a;&#x647;&#x645;.</body></html>' 
)->find('body')->text]); 
close $fh; 
+0

스크립트로 수행 할 수있는 작업에 대한 간단한 설명을 제공 할 수 없습니까? – Ebikeneser

+0

간략한 설명 : 아랍어 쓰기가있는 HTML이 구문 분석되어 CSV 파일에 기록됩니다. - [질문 편집] (http://stackoverflow.com/posts/7661910/edit) 및 [부족한 정보] (http://stackoverflow.com/q/7661910#comment-9358313)를 작성하십시오. – daxim

1

Encode::Arabic을 사용해보세요. 그것이 구문 분석에 도움이되는지 확인하십시오.

+0

내가 작동하면 올바른 것으로 표시됩니다. – Ebikeneser

관련 문제