2017-11-26 4 views
2

iconv를 사용하여 PHP의 일부 텍스트에서 모든 악센트 등을 제거하려고합니다. 그것은 악센트 스트립하지만 때로는 예를 들어, 추가 문자를 추가합니다 "Théâtre" 내가 여기 "Theatre"PHP Iconv 추가 문자 추가

을 원하는 반면 "Th'e^atre"로 나오는 내 코드입니다 :

setlocale(LC_ALL, "fr_FR.utf8"); 
$text = "Théâtre"; 
$text = iconv("utf-8","ascii//TRANSLIT//IGNORE",$text); 
echo $text; 

결과 : Th'e^ATRE

+1

실행중인 운영 체제는 무엇이며 어떤 PHP 버전을 실행하고 있습니까? 내게는 –

+0

이 필요합니다. 2 및 4 줄에서 ... – Spizzi

+0

PHP 7.0 및 5.6.29에서 테스트 할 때 작동합니다. 이 코드는 오타 (@)로 보이는 코드에'; '를 추가했습니다. @Spizzi. – Martin

답변

3

이 오류는 서버에 iconv()의 잘못된 구현 (glibc 대신 libiconv 대신에 012 출력에서 ​​확인할 수 있습니다.). 자세한 내용은 here을 참조하십시오.

또한 시도 할 수 있습니다 : 이것에

$text = "Théâtre"; 
$text = iconv("utf-8","ascii//TRANSLIT",$text); //$text = "Th'e^atre" 
//Replace any character not in alphabet by an empty substring. 
$text = preg_replace("#[^a-zA-z]#", "", $text); //$text = "Theatre" 

echo $text; 
+0

응답 해 주셔서 감사합니다. phpinfo()를 확인하고 iconv 아래에 : iconv 구현 = libiconv 및 iconv 라이브러리 버전 = 1.14 –

+0

이 프로젝트가 예정된 PHP 환경을 변경할 수 없기 때문에이 솔루션은 나를 위해 작동하지 않으며, 일부 텍스트에는 보존하고 싶은 문자가 포함될 수 있으므로 -alpha 문자를 사용하십시오. 그러나 링크 된 질문에는 Wordpress 구현을 언급하는 답변이 있으며 이것이 나를 위해 잘 된 것입니다. –

0

내 솔루션은 워드 프레스 구현을 사용하는 것이 었습니다. 예쁘지는 않지만 결국 아무 것도 트릭을하지 못했습니다.

function remove_accents($string) { 
if (!preg_match('/[\x80-\xff]/', $string)) 
    return $string; 

$chars = array(
// Decompositions for Latin-1 Supplement 
'ª' => 'a', 'º' => 'o', 
'À' => 'A', 'Á' => 'A', 
'Â' => 'A', 'Ã' => 'A', 
'Ä' => 'A', 'Å' => 'A', 
'Æ' => 'AE','Ç' => 'C', 
'È' => 'E', 'É' => 'E', 
'Ê' => 'E', 'Ë' => 'E', 
'Ì' => 'I', 'Í' => 'I', 
'Î' => 'I', 'Ï' => 'I', 
'Ð' => 'D', 'Ñ' => 'N', 
'Ò' => 'O', 'Ó' => 'O', 
'Ô' => 'O', 'Õ' => 'O', 
'Ö' => 'O', 'Ù' => 'U', 
'Ú' => 'U', 'Û' => 'U', 
'Ü' => 'U', 'Ý' => 'Y', 
'Þ' => 'TH','ß' => 's', 
'à' => 'a', 'á' => 'a', 
'â' => 'a', 'ã' => 'a', 
'ä' => 'a', 'å' => 'a', 
'æ' => 'ae','ç' => 'c', 
'è' => 'e', 'é' => 'e', 
'ê' => 'e', 'ë' => 'e', 
'ì' => 'i', 'í' => 'i', 
'î' => 'i', 'ï' => 'i', 
'ð' => 'd', 'ñ' => 'n', 
'ò' => 'o', 'ó' => 'o', 
'ô' => 'o', 'õ' => 'o', 
'ö' => 'o', 'ø' => 'o', 
'ù' => 'u', 'ú' => 'u', 
'û' => 'u', 'ü' => 'u', 
'ý' => 'y', 'þ' => 'th', 
'ÿ' => 'y', 'Ø' => 'O', 
// Decompositions for Latin Extended-A 
'Ā' => 'A', 'ā' => 'a', 
'Ă' => 'A', 'ă' => 'a', 
'Ą' => 'A', 'ą' => 'a', 
'Ć' => 'C', 'ć' => 'c', 
'Ĉ' => 'C', 'ĉ' => 'c', 
'Ċ' => 'C', 'ċ' => 'c', 
'Č' => 'C', 'č' => 'c', 
'Ď' => 'D', 'ď' => 'd', 
'Đ' => 'D', 'đ' => 'd', 
'Ē' => 'E', 'ē' => 'e', 
'Ĕ' => 'E', 'ĕ' => 'e', 
'Ė' => 'E', 'ė' => 'e', 
'Ę' => 'E', 'ę' => 'e', 
'Ě' => 'E', 'ě' => 'e', 
'Ĝ' => 'G', 'ĝ' => 'g', 
'Ğ' => 'G', 'ğ' => 'g', 
'Ġ' => 'G', 'ġ' => 'g', 
'Ģ' => 'G', 'ģ' => 'g', 
'Ĥ' => 'H', 'ĥ' => 'h', 
'Ħ' => 'H', 'ħ' => 'h', 
'Ĩ' => 'I', 'ĩ' => 'i', 
'Ī' => 'I', 'ī' => 'i', 
'Ĭ' => 'I', 'ĭ' => 'i', 
'Į' => 'I', 'į' => 'i', 
'İ' => 'I', 'ı' => 'i', 
'IJ' => 'IJ','ij' => 'ij', 
'Ĵ' => 'J', 'ĵ' => 'j', 
'Ķ' => 'K', 'ķ' => 'k', 
'ĸ' => 'k', 'Ĺ' => 'L', 
'ĺ' => 'l', 'Ļ' => 'L', 
'ļ' => 'l', 'Ľ' => 'L', 
'ľ' => 'l', 'Ŀ' => 'L', 
'ŀ' => 'l', 'Ł' => 'L', 
'ł' => 'l', 'Ń' => 'N', 
'ń' => 'n', 'Ņ' => 'N', 
'ņ' => 'n', 'Ň' => 'N', 
'ň' => 'n', 'ʼn' => 'n', 
'Ŋ' => 'N', 'ŋ' => 'n', 
'Ō' => 'O', 'ō' => 'o', 
'Ŏ' => 'O', 'ŏ' => 'o', 
'Ő' => 'O', 'ő' => 'o', 
'Œ' => 'OE','œ' => 'oe', 
'Ŕ' => 'R','ŕ' => 'r', 
'Ŗ' => 'R','ŗ' => 'r', 
'Ř' => 'R','ř' => 'r', 
'Ś' => 'S','ś' => 's', 
'Ŝ' => 'S','ŝ' => 's', 
'Ş' => 'S','ş' => 's', 
'Š' => 'S', 'š' => 's', 
'Ţ' => 'T', 'ţ' => 't', 
'Ť' => 'T', 'ť' => 't', 
'Ŧ' => 'T', 'ŧ' => 't', 
'Ũ' => 'U', 'ũ' => 'u', 
'Ū' => 'U', 'ū' => 'u', 
'Ŭ' => 'U', 'ŭ' => 'u', 
'Ů' => 'U', 'ů' => 'u', 
'Ű' => 'U', 'ű' => 'u', 
'Ų' => 'U', 'ų' => 'u', 
'Ŵ' => 'W', 'ŵ' => 'w', 
'Ŷ' => 'Y', 'ŷ' => 'y', 
'Ÿ' => 'Y', 'Ź' => 'Z', 
'ź' => 'z', 'Ż' => 'Z', 
'ż' => 'z', 'Ž' => 'Z', 
'ž' => 'z', 'ſ' => 's', 
// Decompositions for Latin Extended-B 
'Ș' => 'S', 'ș' => 's', 
'Ț' => 'T', 'ț' => 't', 
// Euro Sign 
'€' => 'E', 
// GBP (Pound) Sign 
'£' => '', 
// Vowels with diacritic (Vietnamese) 
// unmarked 
'Ơ' => 'O', 'ơ' => 'o', 
'Ư' => 'U', 'ư' => 'u', 
// grave accent 
'Ầ' => 'A', 'ầ' => 'a', 
'Ằ' => 'A', 'ằ' => 'a', 
'Ề' => 'E', 'ề' => 'e', 
'Ồ' => 'O', 'ồ' => 'o', 
'Ờ' => 'O', 'ờ' => 'o', 
'Ừ' => 'U', 'ừ' => 'u', 
'Ỳ' => 'Y', 'ỳ' => 'y', 
// hook 
'Ả' => 'A', 'ả' => 'a', 
'Ẩ' => 'A', 'ẩ' => 'a', 
'Ẳ' => 'A', 'ẳ' => 'a', 
'Ẻ' => 'E', 'ẻ' => 'e', 
'Ể' => 'E', 'ể' => 'e', 
'Ỉ' => 'I', 'ỉ' => 'i', 
'Ỏ' => 'O', 'ỏ' => 'o', 
'Ổ' => 'O', 'ổ' => 'o', 
'Ở' => 'O', 'ở' => 'o', 
'Ủ' => 'U', 'ủ' => 'u', 
'Ử' => 'U', 'ử' => 'u', 
'Ỷ' => 'Y', 'ỷ' => 'y', 
// tilde 
'Ẫ' => 'A', 'ẫ' => 'a', 
'Ẵ' => 'A', 'ẵ' => 'a', 
'Ẽ' => 'E', 'ẽ' => 'e', 
'Ễ' => 'E', 'ễ' => 'e', 
'Ỗ' => 'O', 'ỗ' => 'o', 
'Ỡ' => 'O', 'ỡ' => 'o', 
'Ữ' => 'U', 'ữ' => 'u', 
'Ỹ' => 'Y', 'ỹ' => 'y', 
// acute accent 
'Ấ' => 'A', 'ấ' => 'a', 
'Ắ' => 'A', 'ắ' => 'a', 
'Ế' => 'E', 'ế' => 'e', 
'Ố' => 'O', 'ố' => 'o', 
'Ớ' => 'O', 'ớ' => 'o', 
'Ứ' => 'U', 'ứ' => 'u', 
// dot below 
'Ạ' => 'A', 'ạ' => 'a', 
'Ậ' => 'A', 'ậ' => 'a', 
'Ặ' => 'A', 'ặ' => 'a', 
'Ẹ' => 'E', 'ẹ' => 'e', 
'Ệ' => 'E', 'ệ' => 'e', 
'Ị' => 'I', 'ị' => 'i', 
'Ọ' => 'O', 'ọ' => 'o', 
'Ộ' => 'O', 'ộ' => 'o', 
'Ợ' => 'O', 'ợ' => 'o', 
'Ụ' => 'U', 'ụ' => 'u', 
'Ự' => 'U', 'ự' => 'u', 
'Ỵ' => 'Y', 'ỵ' => 'y', 
// Vowels with diacritic (Chinese, Hanyu Pinyin) 
'ɑ' => 'a', 
// macron 
'Ǖ' => 'U', 'ǖ' => 'u', 
// acute accent 
'Ǘ' => 'U', 'ǘ' => 'u', 
// caron 
'Ǎ' => 'A', 'ǎ' => 'a', 
'Ǐ' => 'I', 'ǐ' => 'i', 
'Ǒ' => 'O', 'ǒ' => 'o', 
'Ǔ' => 'U', 'ǔ' => 'u', 
'Ǚ' => 'U', 'ǚ' => 'u', 
// grave accent 
'Ǜ' => 'U', 'ǜ' => 'u', 
); 

$string = strtr($string, $chars); 

return $string; 
}