자세한 정보가 유용 할 것입니다. 하지만 파이썬에서 어떻게 그 문자를 사용하는지 말할 수 있습니다. 이 방법은 모든 유니 코드 문자에 대해 작동해야합니다.
짧은 대답 : 텍스트에 삽입 할 문자의 유니 코드 코드를 식별하십시오. this site (이미 Ethiopic 하위 집합을 찾았습니다)에서 살펴볼 수 있습니다.
각 문자에 대해 유니 코드와 HTML이 두 코드 (U + ...)가 필요합니다. 예를 들어, 'ha'의 문자는 U + 1200입니다. 파이썬에서 이들을 참조 할 필요가있는 것은 '\ u1200'입니다 (볼 수있는 '+'부호 없음).
예. 텍스트 파일 (UTF-8이되기를 원함)의 인코딩에도주의를 기울여야합니다. 이것이 내가 같은 성격을 위해 한 일입니다.
x = '\u1200'
with open ('text.txt', encoding='utf-8', mode='w') as text_file:
text_file.write(x)
항상 인코딩을 지정해야하는지 확실하지 않은 경우 안전한쪽으로 가기로 결정했습니다.
P. 가치 언급 : 당신처럼 긴 문자열에 또한 유니 코드 caracters을 참조하는이 방법을 사용할 수 있습니다 :이 도움이
'The Ethiopic sillable Ha: \u1200'
희망을!
어떻게 Excel 파일을 읽습니까? 정확히 어디에 물음표가 보입니까? 더 이상 알지 못하면 Python에서 문제가 발생하는지조차 확인할 수 없으며 예를 들어. 귀하의 터미널. – nnnmmm
물음표는 ethiopic 문자가 포함 된 "name"필드가있는 한 열의 모든 텍스트와 열 이름에 모두 있습니다. 나는 또한 질문을 편집했다. 분명히 pandas는 필드 이름을 출력하지만 모든 숫자 및 텍스트 데이터에 대해 NaN을 제공합니다. – Kaleab
excel (csv) 파일을'raw_data = 'hidar_2010.csv''로 읽습니다. – Kaleab