많은 문장이 포함 된 목록이 있습니다. 당신이 할 수Python의 문자열에서 모든 기사, 커넥터 단어 등을 제거하십시오.
def removearticles(text):
articles = {'a': '', 'an':'', 'and':'', 'the':''}
for i, j in articles.iteritems():
text = text.replace(i, j)
return text
: 내가 좋아하는 모든 문장의 단어에서 제거 목록을 반복 할 "와", "은", "A", "이다"등
나는이 시도 그러나 아마도 단어 중간에 "a"와 "an"이 제거 될 것입니다. 공백으로 구분할 때 단어의 인스턴스 만 제거해야하며 단어 내에있을 때는 제거하지 않아야합니다. 이것에 대해 가장 효율적인 방법은 무엇입니까?
Brilliant! 누군가가 솔루션으로 정규 표현식을 제출할 것이라는 것을 알고있었습니다. 나는 아마추어 다. 좋은 정규식 튜토리얼/참조를 알고 있습니까? – Parseltongue
튜토리얼 [here] (http://www.regular-expressions.info/tutorialcnt.html)이 있습니다. 모든 작업을 수행하지는 않았으므로 얼마나 좋은지 잘 모르겠습니다. 내가 정규 표현식을 디자인 할 때 사용하는 주요 도구는 [My Regex Tester] (http://www.myregextester.com)로 어디서 왜 일치하는지 쉽게 알 수 있습니다. – Nemo157
Mastering Regular Expressions (Friedl, O'reilly pub)는 소유 가치가 있습니다. http://www.amazon.com/Mastering-Regular-Expressions-Jeffrey-Friedl/dp/0596528124/ –