텍스트에서 고유 단어를 집계하고 싶지만 특수 문자가 나오는 단어가 다르게 취급되지 않으며 평가에서 대소 문자를 구분하지 않도록하고 싶습니다.고유 단어 수 계산하기
결과는 16이 될 것이다이 예
text = "There is one handsome boy. The boy has now grown up. He is no longer a boy now."
print len(set(w.lower() for w in text.split()))
을 가지고,하지만 난 그게 문제가있다 (14)를 반환하는 기대 '소년.' 및 '소년'은 구두점 때문에 다르게 평가됩니다.
을 유지
은'세 번 boy'하고, 단어'is' 및'두 번 now'. – eandersson