단어와 숫자를 인쇄하려고합니다. 그런 :목록 생성기를 사용하여 단어 쌍과 발생 횟수를 비교하는 방법은 무엇입니까?
a aba aaa
dd ddd dd
내 밖으로 놈이야 포함 :
[[a,1],[dd,2],[aba ,1],[ddd,1],[aaa,1]]
하지만은 다음과 같습니다
: 여기[[a,1],[dd,2],[aba ,1],[dd,2],[ddd,1],[aaa,1]]
전체 코드 1.TXT에서
import re
def get_words_from_string(s):
return (re.findall(re.compile('\w+'), s.lower()))
def merge(seq):
merged = []
for s in seq:
for x in s:
merged.append(x)
return merged
fp1 = open('1.txt' , 'r');
set1 = set(line.strip() for line in fp1);
l1 =[]
for x in set1:
x.split()
x = get_words_from_string(x)
l1.append(x)
l1= merge(l1);
out = []
out = [[word , l1.count(word)] for word in l1 if (1 > out.count(word))]
단어가 첫 번째 항목에없는 경우 문제가 발생합니다. 목록에 항목이 포함되어 있는지 확인하는 안전한 방법이 있습니까?
왜 작동하지 않는지 생각해보고 나서 결과를 포함하도록 질문을 수정하십시오. –
이 코드를 실행하면 어떻게됩니까? – Blender