2016-06-23 4 views
1

여러 문장이 포함 된 Excel 파일로 작업합니다. 문장에 공백이있는 숫자가 있으면 (예 : 234 45 56) 새 속성을 생성하고 싶습니다 ("속성 생성"연산자 사용). "true 또는 false"를 반환합니다. 이렇게하려면 "nom nomal regex"함수 (matches(sentences,"\d+\s+\d))를 사용했습니다. 그러나 Rapidminer가 escape() 문자를 인식하지 못하는 문제에 직면했습니다. Regex를 어떻게 작동하도록 변경합니까?RapidMiner에서 regex를 사용하여 새 속성 생성

일부 추가 의견/예 :

내 입력 문장 : 문장의 숫자와 같은 체인이 포함 된 경우

word word 123 345 6665 23456 54 word word word 
word word word 12.3 34.5 6665 23.456 5.4 word word word 
word word word 12,3 34,5 6665 23,456 5.4 word word word 
word word word 12,3% 34,5% 6665% 23,456% 5.4% word word word 

내 출력, 참 또는 거짓의 새로운 변수가 될 것입니다.

나는 처음에 숫자 \ d + [.,]? \ d * \ s + \ d + [.,]? \ d *를 캡처하기 위해 다음 정규식을 사용하려고 생각했다.

+0

는 귀하의 의견이 얼마나 당신의 출력이 얼마나 예를 들어 줄? – parthi

+0

'match (문장, ". * \ d \ s + \ d. *")'또는'match (문장, ". * [0-9] + [0-9]. *")' –

+0

@ In777 : 내 제안을 아직 시도해 봤어? –

답변

0

\d[0-9]\s으로 공백으로 나타낼 수 있습니다. 또한, 당신이, 따라서 이것은 (가능한 한 등의) 줄 바꿈 이외의 0+ 문자와 일치 .*

match(sentences,".*[0-9] +[0-9].*") 

추가 matches로 전체 라인을 일치 할 필요는 숫자로 이어 1+ 공간과 같다 숫자 및 개행 문자 이외의 0+ 문자.

또한, \가 일치하는 두 배로 노력 \d 또는 \s (이후 정규 표현식 자바 맛) :

matches(sentences,".*\\d+\\s+\\d.*") 
+0

다행이라면 도움이됩니다. 도움이된다면 upvoting을 고려해보십시오. –

관련 문제