나는 모든 유효한 단어를 파일에서 가져 오려고합니다. 올바른 단어는 다음과 같이 표시 될 수있는 일반 문자로 정의됩니다.정규 표현식
don't won't can't
및 쉼표 기간과 느낌표를 무시해야합니다.
나는 문자를 얻는 표현식을 얻었으나 지금은 don't and can't or won't
과 같은 단어를 얻지 못할 것이다.
이것은 "[^A-Za-z]+"
을 사용하는 표현이며 "\'[^A-Za-z]+"
을 시도했지만 모든 문자가 허용됩니다. 누구든지 정상적인 단어를 얻는 데 사용할 수있는 아이디어가 없으며 그런 단어를 포함하지 않을 수도 있고하지 않을 수도 있습니다.
당신에게
[^ A-Za-z \ '] + 괜찮습니까? – mkuk
'^'을 제거하십시오, 즉 대괄호 안에있는 어떤 것도 일치하지 않습니다! –
문자와 공백을 인쇄하지 않고 추가 한 이유가 – mkuk