이 문제가 발생했습니다. RE에 대한 더 나은 처리를 위해 노력하고 있지만 작동하지 않습니다. 나는 그들이 다른 문자열에서 발견되면 지우고 싶은 문자열 목록을 가지고있다. 정규 표현식 대체 Python
이
은 제외 목록입니다exclusionList = ['\+','of','<ET>f.','to','the','<L>L.</L>','f.','in','and','see','a','<L>Fr.</L>','as','<ET>ad.','<ET>a.','<PS>v.</PS></XR>',
'from','<CF>ab</CF>','or','n.','<L>OFr.</L>','pple.','away','was','with','off,','pa.','on','is','cf.','stem','ad.','which',
'by','action','ppl.','Cf.','but','<L>Gr.</L>','be','after','=','The','form','for','an','<XR><RX>prec.</RX></XR>',
'<PS>a.</PS></XR>','<L>Eng.</L>','<PS>pref.</PS>','also','L.</L>','<XR><XL>a-</XL>','<XR><XL>-ing</XL><HO>1</HO></XR>.</ET>',
'vb.','See','In','<L>OE.</L>','used','it','see','this','not','<PS>prep.</PS><HO>1</HO></XR>','has','a','so','early','s']
그리고 이것은 내가 그 단어를 제거하기 위해 사용하고 무엇을 :
첫 번째 단어가 텍스트 파일에서 읽은 문자열입니다first_word = re.sub(r'\b'+exclusionList[a]+'\b', '',first_word)
. 이것이 간단 할 것이라는 것을 나는 안다.하지만 나는 RE를 사용하는 방법을 잘 모른다.
감사
변수 'a'의 내용은 무엇입니까? –