ASCII 텍스트 파일의 일부 테이블을 구문 분석해야합니다. 다음은 부분적인 샘플입니다.Regex : 반복되는 캡처 그룹
QSMDRYCELL 11.00 11.10 11.00 11.00 -.90 11 11000 1.212
RECKITTBEN 192.50 209.00 192.50 201.80 5.21 34 2850 5.707
RUPALIINS 150.00 159.00 150.00 156.25 6.29 4 80 .125
SALAMCRST 164.00 164.75 163.00 163.25 -.45 80 8250 13.505
SINGERBD 779.75 779.75 770.00 773.00 -.89 8 95 .735
SONARBAINS 68.00 69.00 67.50 68.00 .74 11 3050 2.077
표는 1 열의 텍스트와 8 열의 부동 소수점으로 구성됩니다. 정규 표현식을 통해 각 열을 캡처하고 싶습니다.
저는 정규식을 처음 접했습니다. 다음은 내가 잘못 생각한 정규식 패턴입니다 :
(\S+)\s+(\s+[\d\.\-]+){8}
그러나 패턴은 첫 번째와 마지막 열만 캡처합니다. 또한 RegexBuddy는 다음과 같은 경고를 내 보냅니다.
캡쳐 그룹 을 반복했습니다. 그룹은 마지막 반복 만 을 캡처합니다. 반복 그룹 주위에 캡처 그룹을 넣어 모든 반복을 캡처하십시오.
나는 그들의 도움 파일을 참조했지만,이 문제를 해결하는 방법에 대한 단서가 없습니다.
어떻게 각 열을 개별적으로 캡처 할 수 있습니까?
어떤 언어를 사용하고 있습니까? .NET에서는 쉽습니다. –
@Tim : 예 C#으로 프로그램을 작성하려고합니다. 하지만 지금은 파이썬으로 프로토 타이핑을하고 있습니다. – invarbrass
참고 : http : // stackoverflow.co.kr/questions/3029127/is-there-a-regex-flavor - 반복 횟수 일치 횟수/ – polygenelubricants