2016-08-25 3 views
0

나는이 검색에 문제가 :reddit cloudsearch가 타임 스탬프 검색에서 잘못된 결과를 반환하는 이유는 무엇입니까?

list(r.search('timestamp:{}..{}'.format(ts1,ts2), sort='new', subreddit=subreddit, syntax='cloudsearch',limit=None)) 

그것은 도착 ~ ts2

에 타임 스탬프 ts1에서 (내 경우 하위 Reddit 생성 시간) 1000 개 최신 제출 무엇 내 스크립트가 수행하는 것은 :

  1. 두 번째로 최신 제출 시간을 가져와 ts2
  2. 로 설정하십시오.
  3. 먼저 검색 후 내가 제출에게 1,2,3,4,5,6,7,8,9를 가지고 있다면 두 번째 이후 나는 불행하게도 내가 그들을 얻을하지 않습니다 3,4,5,6,7,8,9을 얻을 것으로 예상, 새로운 타임 스탬프

로 검색을 수행하지만, 7,8,9 같은 것을 얻는다. 왜 그런가?

다음은 내 스크립트 및 샘플 결과입니다.

결과 :

t3_4zh8zw, 1472107937.0 
t3_4zgl1n, 1472096403.0 
t3_4zgf34, 1472093883.0 
t3_4zg8de, 1472091260.0 
t3_4zfzun, 1472087983.0 
t3_4zfysv, 1472087571.0 
t3_4zf8hg, 1472077921.0 
t3_4zf7g6, 1472077542.0 
t3_4zf4p5, 1472076595.0 
t3_4zf0d7, 1472075090.0 
t3_4zeqeg, 1472071708.0 
t3_4zeomz, 1472071134.0 
t3_4zebse, 1472066994.0 
t3_4zduso, 1472061376.0 
t3_4zdtne, 1472061014.0 
####################### 
t3_4zebse, 1472066994.0 
t3_4zduso, 1472061376.0 
t3_4zdtne, 1472061014.0 
t3_4zdipi, 1472057168.0 
t3_4zdfj3, 1472056078.0 
t3_4zd4v3, 1472052437.0 
t3_4zd0l5, 1472051081.0 
t3_4zctiu, 1472048701.0 
t3_4zazqj, 1472016633.0 
t3_4zawm3, 1472015079.0 
t3_4zavyc, 1472014757.0 
t3_4za5hb, 1472003960.0 
t3_4z9ydt, 1472001398.0 
t3_4z9xhx, 1472001065.0 
t3_4z9ufa, 1471999935.0 

스크립트 : 지금까지 내가 당신이 created_utc을 사용해서는 안 수집 할 수 cloudsearch를 들어

import praw 
import time 

user_agent = 'clodsearch-timestamp test' 
r = praw.Reddit(user_agent=user_agent) 

subreddit = r.get_subreddit('laptops') 

ts1 = int(subreddit.created_utc)-1 
ts2 = int(time.time()) 

submissions = list(r.search('timestamp:{}..{}'.format(ts1,ts2), sort='new', subreddit=subreddit, syntax='cloudsearch',limit=None)) 

for submission in submissions[:15]: 
    print("{}, {}".format(submission.fullname, submission.created_utc)) 

ts2 = int(submissions[1].created_utc) - 1 

print('#######################') 

submissions = list(r.search('timestamp:{}..{}'.format(ts1,ts2), sort='new', subreddit=subreddit, syntax='cloudsearch',limit=None)) 

for submission in submissions[:15]: 
    print("{}, {}".format(submission.fullname, submission.created_utc)) 

답변

1

.

submission.created_utcsubmission.created으로 변경하면 필요한 동작을 정확하게 얻을 수 있습니다.

이것은 획기적인 시간을 직접 사용하는 클라우드 검색 때문입니다. UTC 또는 GMT로 변환 할 필요가 없으므로 시간대에 따라 효과가 달라집니다.

관련 문제