디렉토리 안에 SINGLE COLUMNS가있는 텍스트 파일이 여러 개 있습니다. 중복 된 줄을 제거하여 모든 텍스트 파일을 하나의 텍스트 파일로 결합해야합니다. 다음 코드를 사용하고 있습니다. 그러나 내 텍스트 파일은 매우 큽니다. 그래서 그것을하는 가장 빠르고 가장 빠른 방법은 무엇입니까?중복 된 줄이없는 여러 텍스트 파일을 결합하는 가장 빠른 방법
import os, glob
files = glob.glob('*.txt')
with open('combinedfile.txt','w') as fo:
all_lines = []
for f in files:
with open(f,'r') as fi:
all_lines.append(fi.read())
all_lines = set(all_lines)
for item in all_lines:
fo.write(item + '\n')
파이썬 2.7 – Borys