1
perl을 사용하여 HTML 특수 기호를 제거하려고합니다. 나는이 HTML :: Strip, Encode qw (_utf8_on)를 사용했다.perl을 사용하여 html의 특수 문자를 제거하십시오.
use Encode qw(_utf8_on);
_utf8_on($string);
print "$string\n\n";
Output: Clearance Subject Male control 5 1-a 21 31â ±â2 74
use HTML::Strip;
my $hs = HTML::Strip->new();
my $clean_text = $hs->parse($string);
print "$clean_text\n";
Ouput: Clearance Subject Male control 5 1-a 21 31â ñâ2 74
Expected output: Clearance Subject Male control 5 1-a 21 31±2 74
어떤 사람이 나를 도울 수 있습니까? 사전에 모든
내가'$ 어디에서 오는 string' 않습니다 볼 수 있습니까? –
그래서''HTML :: Strip''은 제대로 작동하고 있습니다. 이 경우 스 니펫에서 제 외할 수 있습니다. 그러나 그 외에도 문자열에서 제거하고 싶은 것은 무엇입니까? 잘못된 UTF-8 문자입니까? – mzedeler
$ string = "정리 제목 남성 제어 5 1-a 21 31Ã ¢ ÃÂ ± Â 2 74"; 이렇게하면 $ string이 선언되었습니다. –