하나의 특정 단어가 다른 특정 단어로 끝나지 않으면 그대로 두십시오. 여기 내 문자열입니다주어진 문자열에서 두 개의 특정 단어 사이에 단어 인쇄
내가 인쇄하고died or dead or death
단어의 끝나지 않습니다
john
경우
john
사이
dead or death or died.
을 모든 단어를 계산 할
x = 'john got shot dead. john with his .... ? , john got killed or died in 1990. john with his wife dead or died'
. 그것을 남겨주세요. 존 단어로 다시 시작하십시오.
내 코드 :
x = re.sub(r'[^\w]', ' ', x) # removed all dots, commas, special symbols
for i in re.findall(r'(?<=john)' + '(.*?)' + '(?=dead|died|death)', x):
print i
print len([word for word in i.split()])
내 출력 :
got shot
2
got killed or
3
with his wife
3
내가 실수를하고있는 중이 야 어디 내가 모르는 : 내가 원하는
got shot
2
with his john got killed or
6
with his wife
3
출력. 그냥 샘플 입력입니다. 한 번에 20,000 개의 입력을 확인해야합니다.
요점이 명확하지 않다. '존이 죽었거나 존이 '6'으로 계산되기 때문에? –
@ MarlonAbeykoon'존과 그의 ....? 존이 살해 당하거나 사망했다 "는 제 1의 존 단어는'죽은 사람이나 죽음으로 끝나거나 죽지 않았다. 두 번째'존 '단어로 시작하십시오. 내가 원하는 결과물은'죽었거나'죽지 않았거나'그의 생명이 죽거나' –