필터링해야하는 형식이 올바르지 않은 텍스트가 있습니다. 따라서 텍스트의 인용문을 한 줄로 시작한 다음 두 번째 줄에서 잘라내어 끝내는 사례가 많이 있습니다. 이 경우, 부분적으로 따옴표를 완전히 제거하는 것이 좋습니다. 그러나 정규 전체 따옴표를 유지하려고합니다. 카운터를 사용하여 반복적으로 수행 할 수 있음을 알고 있지만 정규 표현식을 사용하는 것이 좋습니다. 파이썬 정규식 일치하는 부분 괄호 만
예 이물 보자"This is a quote" This is an end "partial- quote" Here is more text. This is an end "partial- quote w/o more text" This is an "embedded" quote
Here이 두 가지 상황에서 실패 나의 현재의 시도 (\"[^\"\n]+?|^[^\"\n]+?\")(\n|$)
참고로 예입니다
- 3 호선 - 부분 인용이의 나머지 부분을 진행 문장 (매우 희귀 한 사건, 그래서 우리가 해결할 수없는 경우 세계의 끝).
- 줄 6 - 포함 된 따옴표. 이것은 중요한 문제이며 내 문제로 인해 내가 취한 주된 이유입니다. 내장 된 따옴표의 마지막 인용문을 줄 끝으로 가져옵니다.
은 내가 if 문을 설정하고 부분적인 따옴표를 구문 분석을 진행 한 후 미만이 따옴표가있는 경우 확인하고,를 통해 각 라인을 실행,하지만 난 그렇게 많은 것의 마음을 생각 수 있다고 생각 클리너 솔루션.
주 원하는 출력은 다음과 같습니다
"This is a quote" This is an end Here is more text. This is an end This is an "embedded" quote다음
어쩌면 내가 제안한 정규식을 확인할 수 있습니까? – Jerry