2012-08-01 4 views
0

나는 잠시 둘러 보았고 urllib2에서 index 명령을 사용하여 가이드를 찾을 수없는 것 같습니다. 기본적으로이 함수는 인덱스 함수가 ​​주어진 문자를 포함하는 첫 번째 단어를 찾은 다음 해당 문자의 위치를 ​​반환합니다.urllib2 : 여러 키워드 인덱싱

page_content= urllib2.urlopen(URL).read() #Gets the website 
i1 = page_content.index(keyword) #finds keyword in the website 

여기에서 i1은 urllib2의 여러 가지 용도로 사용할 수 있지만 여기에는 관련이 없습니다.

내 문제는 .index가 키워드와 일치하는 모든 단어를 얻지는 않지만 첫 번째 단어 만 찾습니다. 어떤 종류의 웹 사이트가 있다는 것을 알고 있다면 문제가되지 않지만 모든 목록을 자신이 원하는 위치에서 가져와 사용할 수있는 목록에 할당하고 싶습니다.

답변

0

사용자 재 기능

난 내 코드가 idall에서 모든 값을 얻기 위해 변경있어 일단
import re 
page_content= urllib2.urlopen(URL).read() #Gets the website 
idall = [m.start() for m in re.finditer(keyword,page_content)] 

print idall 
+0

이 완벽하게 일했다. 고맙습니다. –