2016-07-17 6 views
0

나는 다른 작은 사전 파일의 무리에서 사전 파일을 컴파일 해요.영문자가 아닌 행을 삭제합니다. [메모장 + +/정규식]

apple 
banana 
carrot 

그러나 일부 파일에는 이상한 유니 코드 문자, 주석 및 공백이 포함되어 있습니다. 알파벳이 아닌 문자가 포함 된 행을 완전히 제거하고 싶습니다. 따라서이 같은 목록 :

apple 
Ϥ 
#comment 
banana carrot 
zeta 

이 될 것입니다 :

apple 
zeta 

어떻게이 작업을 수행하는 가장 좋은 방법이 있을까요?

편집 : 여기에는 빈 줄을 제거하는 것도 포함됩니다. 당신이 원하는 경우

enter image description here

당신이 다음 Replace All

을 클릭하면 다음과 같이

+0

아마도 newTable.txt에^([A-ZA를 출력을 기록 파이썬 코드 -Z] + (? : \ R | \ z)). * \ R *'? 또는 ^. * [^ a-zA-Z \ r]. * \ R *' –

+0

그 중 어떤 것도 –

+0

미안하지만 질문이 너무 불분명하다. 두 정규 표현식을 사용하면 2 개의 '사과'와 '제타'항목이 남게됩니다. –

답변

1

당신은 Replace 창을 열고 그것을 채우기 위해 Ctrl 키를 + 시간를 입력해야 빈 줄을 제거하십시오 동일한 것을 반복하십시오 : Find what^\s*으로 채우십시오 replace with

0
writeTo=open("newTable.txt","a") 
for line in open("table.txt","r"): 
    if(not line=="\n"): 
     use=True 
     for char in line.replace("\n",""): 
      if(not char.isalnum() and not char==' '): 
       use=False 
       break 
     if(use): 
      writeTo.write(line) 
writeTo.close() 

명확한 설명을 계속 :?!이 table.txt 될 입력 디렉토리를 필요로하고`

관련 문제