2013-07-24 7 views
-1

.txt 파일에 포함 된 다음 텍스트에서 추출 할 정규식은 무엇입니까? 예 : 1.09487? 또한 float가 음수 인 경우를 설명하기 위해 정규식을 어떻게 수정합니까 (예 : -1.948)?정규식을 사용하여 특정 문자열에서 플로트 추출

Google뿐만 아니라 정규 표현식 생성기에 대한 몇 가지 제안을 시도했지만 아무 것도 작동하지 않습니다. 앵커 (예 : ^)를 사용하여 "serial"이라는 단어에서 숫자 검색을 시작한 다음 "(",하지만이 기능은 작동하지 않는 것 같습니다.)이 작업은 작동하지 않는 것 같습니다. :..

엔트로피 = 문자 당 7.980627 비트 어떤 도움

Optimum compression would reduce the size 
of this 51768 character file by 0 percent. 

Chi square distribution for 51768 samples is 1542.26, and randomly 
would exceed this value less than 0.01 percent of the times. 

Arithmetic mean value of data bytes is 125.93 (127.5 = random). 
Monte Carlo value for Pi is 3.169834647 (error 0.90 percent). 
Serial correlation coefficient is 1.09487 (totally uncorrelated = 0.0). 

감사

+0

시도한 정규식을 공유하고 그들이 제공 한 결과를 공유해 주시겠습니까? 또한 어떤 프로그래밍 언어를 사용하고 있습니까? 그리고 또 하나의 질문 : 마지막 숫자 ('1.09487')가 당신이 원하는 유일한 숫자인가? – jpmc26

답변

0

검사 : 당신은 쓰레기를 기대하지 않는 한

(?<=Serial correlation coefficient is)[-\d.]+ 

이 잘 작동합니다.

+0

완벽하게 작동했습니다. 분명히 내가 뭘 묻고 있는지 알았어. :) – blashmet

0

이 시도 :

(-?\d+\.\d+)(?=\s\(totally) 

이 충분해야 here

+0

나는 '완전히'의존 할 수 있다고 생각하지 않는다. 상관 관계가있는 경우 다른 단어가 사용됩니다. – jpmc26

관련 문제