iconv

    0

    1답변

    저는 현재 MySQL 데이터베이스를 사용하고 있으며 데이터베이스를 유지 관리했던 이전의 사람은 캐릭터 세트를 ISO-8859-1에서 UTF-8로 변경했습니다. 이제 모든 ä가 ¤로 변하는 문제가 있습니다. 이제 전체 데이터베이스의 모든 레코드를 변경하는 코드를 작성했습니다. 그러나 분명히 정확하게 쓰여진 단어가 있습니다. 예를 들어 Pöytäkrono과

    17

    2답변

    정서 분석을 위해 트윗을 분류 할 수 있도록 이모티콘을 어떻게 처리합니까? 방법 : 오류를 sort.list에 (Y) : 잘못된 입력 감사 이는 이모티콘이 트위터에서와 R에보고 나올 방법은 다음과 같습니다 \xed��\xed�\u0083\xed��\xed�� \xed��\xed�\u008d\xed��\xed�\u0089

    3

    2답변

    를 설치 rvm pkg install iconv를, 그것은이 오류와 함께 실패 Error running 'autoreconf -is --force', please read /usr/local/rvm/log/libiconv/autoreconf.log Configuring libiconv in /usr/local/rvm/src/libiconv-1.13.1.

    2

    1답변

    내가 사용하고 (그리고 붙어) 루비의 다음 버전 : ruby 1.8.7 (2012-06-29 patchlevel 370) [x86_64-linux] 제가 인터넷 검색을 많이했지만, 나는 내 문제에 대한 작업 답을 찾을 수 없습니다. 일반적으로 사용자의 Microsoft Excel 스프레드 시트에서 가져올 CSV 파일을 가져오고 있습니다. CSV 부분에

    1

    2답변

    도시 이름 목록이있는 파일을 처리하려고합니다. 내 목표는 표준 ASCII로 음역 된 도시 이름 목록을 출력하는 것입니다. 웬일인지, 나는 단지 계속 문제에 부딪치게된다. 나는 Perl에서 iConv와 Text :: Unidecode 라이브러리를 파고 들었고, 둘 다 실패하고있다. 다음 Måløv Magtenbølle Zvonarëvka Denver

    0

    1답변

    파일을 열어서 Windows-1251 인코딩에 있음을 알지 못했습니다. 잘못된 문자가 포함 된 utf-8로 인코딩 된 파일로 열렸습니다. 그런 다음 UTF-8 인코딩으로 많은 코드를 붙여 넣었습니다. 저장 후 (UTF-8로 폴백하는 것과 관련된 오류 메시지와 함께) 파일의 원본 컨텐츠를 복원 할 수 없습니다. 새 파일을 다시 열고 붙여 넣은 코드를 모두 잘

    3

    2답변

    "Simple HTML DOM"을 기반으로 스크립트 작업을하고 있는데 URL의 내부 텍스트를 가져온 후 문자열의 charset을 검색하여 "UTF -8 "을 입력하십시오. 많은 것을 시도했지만 그 중 Windows-1256과 작동하지 않습니다. 내가 무엇을 시도했다 : - 오류를 제공 Windows-1256 mb_detect_encoding($content

    1

    1답변

    UTF-16 문자열 (spidermonkey 19의 JSString에서 가져옴)을 UTF-8 문자열로 변환하려고합니다. 나는 변환 된 문자열이 괜찮다고 생각하지만 몇 가지 이유로 변환 루틴은 모든 유니 코드 (비 ASCII 문자)에 대해 두 개의 추가 바이트를 추가합니다. 나는 내가 틀린 일을하고 있다고 확신한다. 좋은 결과가없는 다른 인코딩을 시도했다.

    3

    1답변

    데이터가 디스크에 저장되어 너무 커서 메인 메모리에 저장할 수 없습니다. 나는이 같은 iconv를 통해 데이터 처리 파이프 라인으로 디스크에서 데이터를 스트리밍 할 : 그것은 하나를 출력하기 전에 소진 될 때까지 zcat myfile | iconv -f L1 -t UTF-8 | # rest of the pipeline goes here 를 불행하게도,

    11

    1답변

    이전 독점 데이터베이스에서 데이터를 읽습니다. 불행히도 Encoding(mychar_vector)이 "unknown"을 반환하는 것으로 끝납니다 (일부 문자열에만 해당). 불행히도 닫힌 소스 c hli (호스트 언어 인터페이스)에 래퍼를 사용하고 있으므로 여기에 대해 할 수있는 일이 많지 않습니다. 그렇다면 여기서 잘못된 것으로 입증되기 때문에 기꺼이 ..