"text"속성을 사용하여 BeautifulSoup을 사용하여 HTML에 포함 된 일부 텍스트를 구문 분석하려고합니다. 나는 이상한 뭔가를 발견하고이 방식으로 동작하는 이유 주위에 내 머리를 얻을 수 없다 "findall은"을 "발견"과 함께 주변에 재생 ... 두 번째 테스트에서Python BeautifulSoup - find와 findAll을 사용한 다른 결과
import re
import BeautifulSoup
doc = "<html><head><title>Page title</title><title>Author name</title></head>"
soup = BeautifulSoup(doc)
# find test
test1 = soup1.find('title',text=re.compile("Page"))
print test1 # Returns "Page title"
# findAll test
test2 = soup1.findAll('title',text=re.compile("Page"))
print test2 # Returns "[<title>Page title</title>, <title>Author name</title>]"
, 파서는 반환하지합니다 첫 번째 예제와 동일한 결과가 나타 납니까? 두 번째 테스트는 텍스트에 "Page"가 포함 된 모든 'title'태그를 반환해야하지만 두 번째 title 태그도 반환합니다.
이게 예상 되었습니까, 아니면 누락 되었습니까?
내가 이것을 볼 않았다 find를 사용하는 데는 문제가 없었지만 아마도 문서의 오타가있을 수 있습니다. – JasonB