900000 행을 포함하는 매우 큰 텍스트 파일이 있습니다. 줄에 'year1995'와 'year1996'이없는 줄을 계산해야합니다. 나는 다음과 같이했다 :특정 문자열을 포함하지 않는 목록 요소의 수를 계산하십시오.
fname = r"data.txt"
with open(fname,'r') as fi:
lines = fi.read().splitlines()
print len(lines)
test = [l for l in lines if 'year1995' or 'year1996' not in l]
print len(test)
그러나 내 코드가 예상 결과를 내지 않는다.
아이디어가 있으십니까?
"egrep -v"year1995 | year1996 "data.txt"를 사용하는 이유는 무엇입니까? 그리고 카운트하려면 그냥 끝에 "| wc -l"을 추가하십시오 –