2013-10-07 2 views
0

내 로컬 mysql 5.6에 페르시아어 Wikipedia 2007의 덤프 파일을 가져 왔습니다. 비 라틴 스크립트의 사용자 이름이 올바르게 저장되지 않은 것 같습니다. 어떤 방법으로 고칠 수 있습니까?위키 백과 덤프 파일

select DISTINCT rev_user_text from revision where rev_user_text like '%?%'; 

+-------------------------------+ 
| rev_user_text     | 
+-------------------------------+ 
| 1?1?       | 
| ?        | 
| ? ?       | 
| ? ? ?       | 
| ? ????      | 
| ?. ?????????     | 
| ?.????      | 
| ?.???????      | 
| ?.????????     | 
| ??       | 
| ?? ??       | 
| ?? ?? ??      | 
| ?? ???      | 
| ?? ??? ???     | 
| ???       | 
| ??? 110      | 
| ??? ?       | 
| ??? ???      | 
| ??? ??? (?? ???)   | 
| ??? ??? ????? ???    | 
| ??? ????      | 
| ??? ???? ???     | 
| ??? ???? ?????    | 
| ??? ???? ???????    | 
| ??? ?????      | 
| ??? ????? ???     | 
| ??? ????? ????    | 
| ??? ????? ??????    | 
| ??? ?????1984     | 
| ??? ??????     | 
| ??? ???????     | 
| ??? ??????? ???    | 
| ??? ????????     | 
| ??? ??????????    | 
| ???76       | 
| ????       | 
| ???? 32      | 
| ???? ?      | 
| ???? ??      | 
| ???? ?? ? ?????    | 
| ???? ???      | 
| ???? ??? ? ????? ????   | 
| ???? ??? ????     | 
| ???? ??? ?????    | 
| ???? ??? ????? ?????   | 
| ???? ????      | 
| ???? ???? ???     | 
| ???? ???? ??? (??????)  | 
| ???? ???? ????    | 
| ????.???      | 
| ????22      | 
| ????4183      | 
| ????777      | 
| ????808      | 
| ?????       | 
| ????? - ???? ???    | 
| ????? 85 8     | 
| ????? ?      | 
| ????? ???      | 
| ????? ??? ???     | 
| ????? ??? ????    | 
| ????? ????     | 
| ????? ???? (????? ????)  | 
| ????? ???? --????? ????  | 
| ????? ???? -????? ????  | 
| ????? ???? ???    | 
| ????? ???? ????    | 
| ????? ???? ??????    | 
| ????? ?????     | 
| ????? ????? ????    | 
| ????? ????? ?????    | 
| ????? ????? ????????   | 
| ????? ??????     | 
| ????? ?????? ???    | 
……. 

답변

1

아마도 utf8과 같은 적절한 문자 세트를 사용하지 않고있을 것입니다.

CREATE TABLE revisions 
(...) 
CHARACTER SET 'utf8'; 

또는 기존 테이블의 문자 세트 변경 : 사용하여 테이블을 다시 시도

ALTER TABLE revisions 
CHARACTER SET 'utf8';