텍스트를 구문 분석하고 단어를 알파 문자 또는 '
문자 (ASCII로 39)로만 유지하려고합니다. exemple의 경우 : (/
가 다른 단어 보여주기 위해 단지이다)숫자를 토큰으로 사용하는 정규 표현식 분리 단어
I know that Dave's car is 'broken'.
은
I/know/that/Dave's/car/is/broken
로 해석되어야한다.
지금까지 내가 가진 :
regex e ("\\b[A-Za-z']+\\b");
그러나 이것은 내가 얻고 싶은 최종 결과가 될 것이다 abc/efg
에 abc2efg
을 분할하지 않습니다.
답장을 보내 주셔서 감사합니다.
'\ b'는 무엇을 의미 하는가? – Nim
단어 경계와 일치합니다. 이 구현이 최고인지는 모르겠지만 지금은 정확하게 주어진 예제를 파싱 할 수 있지만 두 단어를 숫자로 구분하지는 않습니다. – Daxid
정규식 e ("\\ b [A-Za-z] + (? : '[A-Za-z] +)? \\ b"); 또는 정규식 e ("(? :^[A-Za-z])() : ([A-Za-z] +) Group1의 내용을 찾으십시오. –