많은 pdf 파일을 조작해야합니다. 첫 번째 단계로서 나는 단일 디렉토리에서 내 필요를 지원하는 트리로 복사하기를 원했습니다. 다음 코드를 사용했습니다.이 코드로 복사 된 PDF 파일을 열 수없는 이유는 무엇입니까?
for doc in docList:
# these steps just create the directory structure I need from the file name
fileName = doc.split('\\')[-1]
ID = fileName.split('_')[0]
basedate = fileName.split('.')[0].split('_')[-1].strip()
rdate = '\\R' + basedate + '-' +'C' + basedate
newID = str(cikDict[ID])
newpath = basePath + newID + rdate
# check existence of the new path
if not os.path.isdir(newpath):
os.makedirs(newpath)
# reads the file in and then writes it to the new directory
fstring = open(doc).read()
outref = open(newpath +'\\' + fileName, 'wb')
outref.write(fstring)
outref.close()
이 코드를 실행하면 디렉토리가 만들어지고 각 디렉토리에 올바른 이름의 파일이 있습니다. 그러나 파일을 열려고 클릭하면 파일이 손상되어 복구 할 수 없다는 Acrobat의 오류 메시지가 나타납니다.
나는 마지막 네 줄을 교체하려면shutil.copy(doc,newpath)
을 사용하여 파일을 복사 할 수 있었다 -하지만 난 문자열로 파일을 읽고 다음을 쓸 수없는 이유를 알아낼 수 없었다 새로운 위치에.
>>> newstring = open(newpath + '\\' +fileName).read()
>>> newstring == fstring
True
는 그래서 변경된 내용을 표시하지 않습니다 내가 한
것은 성경에 기록 된 후 파일 내용이 읽기 후에 무엇에 소스에서 읽은 것을 비교했다?
'fstring = open (doc, 'rb'). read()' – dawg
메시지를 지우고 나서 같은 메시지가 있지만 파일을 열었습니다. 이것은 적어도 게시해야 할 부분적인 답변이며, 시간이 있다면 rb가 어떻게 달라 지는지에 대한 의견을 보내주십시오. 감사합니다. – PyNEwbie