나는 큰 rtf 파일,> 500 메가 바이트를 처리해야했다. 이 큰 파일에서 부품을 찾아서 추출해야했습니다.거대한 데이터 블록을위한 정규식
데모 용으로 Java로 작성된 작동 프로토 타입입니다.
작은 RTF 파일 (~ 10MBb)에서 작동하는 정규 표현식을 작성하여 거대한 파일에이 표현식을 적용하려고했습니다.
그리고이 regexp 실행시 "스택 오버플로"오류가 발생합니다.
정규 표현식이 재귀적인 성격을 가지고 있다는 것을 이해한다면, 나는 예외의 이유가됩니다. regexp가 잘 작동하는 작은 파일들.
이유를 올바르게 이해하고 있습니까?
더 잘 이해하려면 정규식을 몇 가지 샘플 데이터와 함께보아야합니다. – anubhava
언어 또는 텍스트 편집기를 사용하고 있습니까? FWIW, 텍스트 편집기 인 경우 EditPad Pro regex guru Jan Goyvaerts가 멋진 정규 표현식을 사용하고 파일을 기가 바이트 단위로 처리합니다. – zx81
@anubhava 불행히도 이제는 소스 코드에 액세스 할 수 없습니다. 죄송합니다. –