2012-05-16 4 views
4

영어로 작동하는 패턴이 있지만 내 모국어가 작동하지 않아 두통이 듭니다. 우선 인코딩에 관한 많은 질문을했으며, 나는 그것을 과소 평가했다는 것을 알고 있습니다. 그것은 큰 문제였습니다. 나는 그것에 대해 읽는 데 약간의 시간을 보냈고, 문제는 여전히 거기에있다. 그래서 지금 나는 정규 표현식 문제에 직면하고있다. 패턴은 다음과 같습니다.유니 코드 findall 파이썬

exactMatch = re.compile(r"([^\.]*\bтурција\b[^\.]*)\.", re.UNICODE) 
print exactMatch.pattern 
result= exactMatch.findall("турција е на врвот од индустријата. турција е на врвот од индустријата.") 

영어로 작동합니다. 그것은 단락에서 모든 문장을 내게주는 기능입니다. 그래서 어떤 제안이라도?

나는 또한 인코딩과 디코드를 시도했지만 인코딩 오류를 제외하고는주의를 기울인다.

답변

6

이 작동합니다 :

exactMatch = re.compile(ur"([^\.]*\bтурција\b[^\.]*)\.", re.UNICODE) 
print exactMatch.pattern 
result= exactMatch.findall(u"турција е на врвот од индустријата. турција е на врвот од индустријата.") 

을 유니 코드, 다음 사용 유니 코드를 사용하는 경우.

+0

그것은 작동하지 않습니다, 나는 또한 그것을 시도했습니다. – badc0re

+1

@DameJovanoski 그것 않습니다. – wRAR

+2

어떤 오류가 발생합니까? 그것은 나를 위해 작동합니다. 또한 파일에 [올바른 인코딩 세트]가 있는지 확인하십시오 (http://www.python.org/peps/pep-0263.html). – mata

관련 문제