2014-04-12 2 views
-4

이것은 python 코드이다. 나는 re.compile 함수를 이해하지 못한다.이 정규 표현식 문법으로 나를 도와 줄 수 있을까?나는이 코드를 쓰지 않는다. - python

file = open("C:\Users\Suleiman JK\Desktop\hello-world-reverse-uri.pdf") 
    data = file.read() 
    rxcountpages = re.compile(r"$\s*/Type\s*/Page[/\s]", re.MULTILINE|re.DOTALL) 
    print rxcountpages.findall(data) 
+0

3 행에서 알 수없는 내용은 무엇입니까? 잘 작동합니까? 당신의 목표는 무엇입니까? –

+0

예 올바르게 작동합니다. 그것은 pdf 파일 의 페이지 수를 찾았지만 조합은 이해할 수 없습니다 – user3461464

+1

$ \ s */Type \ s */Page [/ \ s는 regurar expresion의 패턴입니다 "\ s"mean space " * "는 0 개 이상을 뜻합니다. "$ "는 문자열이나 라인의 엔도를 의미하지만,이 상황에서는이 동작에 대해 잘 모릅니다 (re.MULTILINE | re.DOTALL) "[] "의미 또는/"/ 유형/페이지" "/ 유형/페이지" "/ 유형/페이지"행의 끝 부분에 "/ 유형/페이지"또는" "/ 유형/페이지" "/ 유형/페이지" "/ 유형/페이지 /" "/ 유형/페이지 " "/ 형/페이지 " "/ 형/페이지/" ... 당신이 할 수있는 리드 더 https://docs.python.org/2/library/re.html에서 – inye

답변

-2

파이썬 코드는 여기에합니다 (data 변수로) 다음 open에 메모리에있는 파일의 read 내용을 파일을 시도하고 그것을 적용 regular expression을 페이지의 수를 얻기 위해 마지막을 인쇄합니다. 여기 정확히 이해하지 못 했나요? 정확한 질문을 정확히 지적하고 질문을 게시하기 전에 점등 된 비트를 검색하면 더 많은 도움이됩니다.

+0

지점이 이 부분은 "$ \ s */유형 \ s */페이지 [/ \ s]"라고 이해할 수 없습니다. – user3461464

+0

댓글로 사용하는 것이 좋습니다. –