2012-04-23 3 views
0

필자는 markdown으로 변환하는 .docx 문서가 수백 개 있습니다. 나는 textutil을 사용하여 .docx를 HTML로 변환하고 Pandoc을 사용하여 html을 Markdown으로 변환합니다.정규 표현식을 사용하여 텍스트 파일 찾기 및 바꾸기

내가 가진 문제는 원본 .docx 파일에 dropcaps가 포함되어 있다는 것입니다. 텍스트 파일에서 줄 바꿈으로 단락과 분리 된 첫 번째 글자 (dropcap)를 갖게되었습니다. 다음과 같이 보입니다 :

T 

he following five basic pre-conditions are essential... 

저는 mac (10.6.8)과 textmate를 사용하고 있습니다. Textmate는 정규식을 사용하여 찾기 및 바꾸기를 허용합니다.

줄 바꿈을 제거하고 단락의 나머지 부분과 분리 된 문자를 다시 결합하는 것이 어떻게 가능합니까?

+0

당신은 "일괄 처리 하위 폴더와 폴더"에 대한 별도의 질문을 아마해야 Textmate에서 검색/바꾸기와 관련이 있습니다. – alan

+0

많은 감사, 할 것이다 – rev

답변

0

검색의 경우,이 시도 : 대한

^([A-Z])[\r\n]+(\w+)\b 

바꾸기 : 정말 아니에요 이후

$1$2 
+0

많은 감사합니다, 훌륭하게 작동합니다. – rev

관련 문제