0
안녕하십니까, 텍스트 파일로 변환하려는 html 파일로 가득 찬 폴더가 있습니다. 나는 우분투 플랫폼에서 일하고 있으며 불행히도 lynx는 - 덤프는 나를 위해 설치되지 않습니다. html 파일을 텍스트 파일로 변환하는 다른 방법이 있습니까? 도와주세요! 미리 감사드립니다.여러 HTML 파일을 텍스트 파일로 변환하는 방법은 무엇입니까?
안녕하십니까, 텍스트 파일로 변환하려는 html 파일로 가득 찬 폴더가 있습니다. 나는 우분투 플랫폼에서 일하고 있으며 불행히도 lynx는 - 덤프는 나를 위해 설치되지 않습니다. html 파일을 텍스트 파일로 변환하는 다른 방법이 있습니까? 도와주세요! 미리 감사드립니다.여러 HTML 파일을 텍스트 파일로 변환하는 방법은 무엇입니까?
이 질문은 태그가 python
이므로 내 첫 번째 선택은 Aaron Swartz의 html2text입니다. 그것은 markdown 형식으로 테스트를 생성합니다.
BeautifulSoup으로 파이썬 솔루션을 사용할 수도 있습니다.
#!/usr/bin/perl -w
use HTML::Parse;
use HTML::FormatText;
my $file = $ARGV[0];
if (not -r $file) {
die "ERROR: File ($file) is not readable\n";
}
my $html = do { local $/; open(I,$file); <I> };
my $plain = HTML::FormatText->new->format(parse_html($html));
print $plain;
: 당신이
perl
을 좋아하는 경우에
, 여기에 텍스트를 HTML로 변환하는 간단한 perl
스크립트입니다