파일을 완전히 압축하지 않고 python을 사용하여 gz 압축 텍스트 파일의 행을 읽기 쉽습니까? 나는 aroud 200mb 인 text.gz 파일을 가지고있다. 추출하면 7.4gb가됩니다. 그리고 이것이 내가 읽어야 할 유일한 파일은 아닙니다. 전체 과정에서 10 개의 파일을 읽어야합니다. 이것은 순차적 인 일이긴하지만, 전체 정보를 빼 먹지 않고 그것을하는 것이 현명 할 것이라고 생각합니다. 나는 그것이 가능하다는 것도 모른다. 어떻게 파이썬을 사용하여 수행 할 수 있습니까? 텍스트 파일을 한 줄씩 읽어야합니다.python : 압축 된 텍스트 파일의 행을 읽으십시오.
32
A
답변
12
gzip.GzipFile을 사용해 보셨습니까? 인수는 open
과 유사합니다.
38
파이썬에서 표준 gzip 모듈을 사용할 수 있습니다. 파일을 다른 파일로 열고 해당 행을 읽으려면 다음을 사용하십시오.
gzip.open('myfile.gz')
여기
더 많은 정보 : Python gzip module
22
gzip.GzipFile 사용 : 1
import gzip
with gzip.open('input.gz','r') as f:
for line in f:
print('got line', line)
참고 : python3에 대해 당신이 가지고있는 파일을 지정 바이너리 읽기에 'r'
기본값으로, 'rt'
에서 열, 또는 수 그렇지 않으면 line.decode(...)
을 사용하십시오.
참고 : gzip.open(filename, mode)
은 gzip.GzipFile(filename, mode)
의 별명입니다. 압축되지 않은 파일을 여는 데 사용되는 with open(...) as f:
과 비슷한 모양의 전자를 선호합니다.
관련 문제
- 1. 파이썬을 사용하여 텍스트 파일의 행을 읽으십시오.
- 2. txt 파일의 행을 읽으십시오. [java]
- 3. Erlang에서 움라우트로 된 텍스트 파일의 내용을 읽으십시오.
- 4. Python : stdin에서 많은 수의 행을 읽으십시오.
- 5. 읽는 방법 파일의 별도 Java 패키지에있는 텍스트 파일의 내용을 읽으십시오.
- 6. 파일의 특정 줄을 읽으십시오.
- 7. Java - 다르게 압축 된 파일의 압축 해제
- 8. 알 수없는 행을 읽으십시오.
- 9. 큰 문자열에서 행을 읽으십시오.
- 10. 텍스트 파일의 각 행을 해시
- 11. Hadoop 시퀀스 파일의 압축
- 12. 자바에서 텍스트 파일을 읽으십시오.
- 13. 특정 문자가 포함 된 행에서 텍스트 파일의 행을 읽지 않게하려면?
- 14. 다른 언어로 된 zip 파일의 압축 해제
- 15. 압축 된 텍스트 파일에서 텍스트 패턴을 grep하려면 어떻게해야합니까?
- 16. 환경 변수를 확인하기 위해 파일의 텍스트를 읽으십시오.
- 17. 압축 파일의 파일을 배치 파일로 압축 해제
- 18. 보관 된 파일의 전체 텍스트 인덱싱
- 19. 텍스트 파일의 각 행을 읽지 못함
- 20. 텍스트 파일의 행을 bash 명령으로 바꾸기
- 21. 바이너리 파일의 ZLIB 압축 부분 압축 해제
- 22. 파일의 압축 방법 LZNT
- 23. 로그 파일에 계속 추가되는 행을 읽으십시오.
- 24. 텍스트 파일의 모든 행에서 문자열을 검색합니다 : Python
- 25. PYTHON 프로그래밍 : 파일의 텍스트 검색 및 바꾸기
- 26. DXT 압축 (Python
- 27. C++에서 텍스트 파일을 읽으십시오.
- 28. , 파일의 행을 바꾸려면 어떻게해야합니까?
- 29. pdf 파일에서 바이트를 찾고 행을 읽으십시오.
- 30. 압축 파일의 입력 스트림을 받습니까?
out of curiosity는 전체 파일을 메모리에로드합니까? 또는 필요에 따라 선을로드 할만큼 똑똑합니까? –
@Sachin_ruk 방금 열어 본 파일을로드하지 않습니다. 파일에서 실제로 데이터를로드하려면'''f.readline()''을 한 번에 한 줄씩 읽어야합니다. 또는''f.readlines (N)''여기서''N''은 읽고 자하는 행의 수입니다. – Tom