2010-11-28 4 views
0

저는 프랑스어와 독일어로 큰 파일 작업을하고 있습니다. 기본적으로 한 파일에서 다른 파일로 문자열을 쓰고 그 파일에서 데이터를 수집하는 등의 작업을 수행합니다. 불행히도, 나는 파이썬이 이러한 문자를 처리하도록하기 위해 무엇을 가져올 지 전혀 모른다. (프랑스어로는 à © couteur ça 같은 이상한 것들을 얻을) 파이썬은 이미 변환 한 파일에서 데이터를 수집Python - 파이썬 형식으로 외국 문자를 인코딩하는 방법은 무엇입니까?

경우에도 이미 배치 된 나는을 알고 것들에 대한 dicts을 검사 할 때, 나는 키 오류가 발생할 수 그 dict지만, 항목에만 é © couteur à §의 예제에서와 같은 특수 문자가있을 때.

예를 들어 어떤 주어진 쌍의 단어가 함께 나오는 빈도를 수집하는 dict에 '튜토리얼'('couteur', '§§')을 추가하면 그 문제를 조사 할 때 주요 오류가 발생합니다 튜플 ('écouteur', '§§')에 대한 dict, 그러나 엉뚱한 문자를 포함하지 않는 다른 튜플에 대한 dict을 프로빙 할 때는 그렇지 않습니다.

누구나 모든 단계에서이 문제를 빠르게 해결할 수있는 방법을 알고 있습니까?

최저

, 조지나가

+0

당신이 정확하게 작동하지 않는 것을 예 (코드)를 제공 할 수있는, 즉 당신이 얻을 결과와 당신이 기대하는 결과. – ecik

+0

@ecik 감사합니다. 예를 들어 튜플 ('é © couteur', '§§')이 임의의 주어진 쌍의 단어가 함께 나오는 빈도를 수집하는 사전에 추가되면 키를 얻습니다. 튜플 ('é © couteur', 'ç§')에 대한 dict을 프로빙 할 때 오류가 있지만 이상한 문자가 포함되지 않은 다른 튜플에 대해 dict을 프로빙 할 때 오류가 발생하지 않습니다. – Georgina

답변

관련 문제