2016-11-10 2 views
0

방법, 예를 들어 문자열문자열을 의미있는 문자열로 바꾸려면 정규식을 사용하십시오. 파이썬

에서 비 영어 단어 (어휘)를 제거합니다 :

, 모든 비 영어 단어를 제거 어휘를 유지하는 방법
puppies monitoring_string = c1299fe10ba49eb54f197dd4f735fcdc dogtime 

: 싶습니다 결과에를 얻을 수 있습니다 :

puppies monitoring string dogtime 

또는

puppies monitoring string ....or others 

목적은 의미있는 문자열을 만드는 것입니다. 내가 뭘하려

이었다

re.sub('[^A-Za-z0-9]+', ' ', string) 
result: puppies monitoring string c1299fe10ba49eb54f197dd4f735fcdc dogtime 
+2

'영어 이외의 단어'를 지정하십시오. –

+0

부적절한 어휘 – bob90937

+2

정규식이 올바른 도구가 아닙니다. 단어 목록이 필요하고 공백으로 문자열을 분할하고 단어 목록에있는 항목을 확인하십시오. 이것은 많은 결점이있는 단순한 접근 임에도 불구하고. –

답변

0

이 아닌 단어하지 않는 것을 가지고 어떤 논리 단어를 생각 할 수 없습니다.

시작하려면 어쩌면 숫자가있는 단어를 삭제 해보세요.

정규식 \w*\d\w*은 숫자와 숫자로 된 문자 조합을 찾아야합니다.

관련 문제