저는 파이썬과 스페인어 텍스트 텍스트로 작업 중이며 목록 화에 많은 문제가 있습니다. 모든 문장 부호를 보존하고 싶습니다. 올바른 인코딩을 사용하여 모든 텍스트를 오브젝트로 감싸는 방법이 있습니까? 어떻게 인코딩 문제를 해결할 수 있습니까? 나는 또한 이것이 문제라는 것을 모르는 방식으로 OSX에서 일하고있다. 파이썬으로 스페인어 인코딩 문제가 있습니까?
나는 모든 준비와 노력 : 내가 .txt 인 파일이 많은 폴더를 연결하여이 기능을# -*- coding: utf-8 -*-
: Adem√°s_de adem√°s_de
는 구두점 기호를 보존되지 않습니다
import os
import shutil
def concatFiles():
path = '/Users/user/Desktop/OpinionsTAG_txt/'
files = os.listdir(path)
with open("/Users/user/Desktop/output_concatFile.txt", "wb") as fo:
for f in files:
with open(os.path.join(path, f), "rb") as fi:
shutil.copyfileobj(fi, fo)
if __name__ == "__main__":
concatFiles()
문제가 출력됩니다. 올바른 출력은 Además además
입니다. output_concatFile.txt를 인코딩 오류없이 모든 스페인어 텍스트를 보존하는 객체로 포장하는 방법이 있습니까? 이 문제를 어떻게 해결할 수 있습니까?
텍스트 파일에 UTF BOM을 추가하는 것 외에 인코딩 정보를 포함 할 수있는 방법이 없습니다. –